linux的内核日志系统

作者：集束群 | 来源：互联网 | 2017-10-29 09:57

文章标题：linux的内核日志系统。Linux是中国IT实验室的一个技术频道。包含桌面应用，Linux系统管理，内核研究，嵌入式系统和开源等一些基本分类

　　今天有同事问我在应用程序中怎么打印信息，在内核中有printk，用户空间用什么？我感到这个问题很奇怪，用printf不就可以了吗？他说他的代码在一个so中，我都无语了！他原来是做windows的，在windows中很多都是win32程序，带界面的，不是控制台程序，他大多数通过单步跟踪和断点来了解程序运行时的信息，其实吧，我倒是挺不喜欢单步或者断点的，除了特殊的调试需要，一般我都是通过打印日志来获取信息，linux有强大的日志记录系统，可以给程序一个安心的多的执行环境，日志仅仅是一个旁路的作用，起到记录个审计的作用而不会影响程序的执行，单步和断点就不同了，很多的问题你仅仅通过单步是无法发现的，特别是并发问题，不过在windows上写代码的哥们总是喜欢单步，就像他们总喜欢反汇编一样，这里面的原因就是，第一，windows程序大多数不是控制台，它实际上没有地方打印信息，第二，windows拥有强大的可视化IDE，这就给单步和断点提供了方便。

　　在linux中，syslogd是用户空间的一个守护进程，所有的需要记录日志的别的进程可以和这个守护进程通信，可以委托这个守护进程帮助记录日志，为何不自己记录呢，那是因为syslogd非常的专业，可以将日志记录到很细的地步，可以看etc/下面的配置文件，既然所有的进程都可以委托 syslogd记录日志，那么就涉及到了进程间通信，这就是linux中另外一大块的内容了，这里就不谈了，linux善于使用小的程序组合成大的机制，linux善于分布式的思想而不是集中的，但是为何将日志都委托给一个守护进程呢，这不就集中了吗？其实这难道不是各司其职吗？因此这还是一个边界的问题。syslogd之外还有一个klogd，这两个其实不是一个层次的，syslogd是个总的日志记录器，而klogd仅仅是一个syslogd的客户端罢了，和很多需要记录日志的进程的级别一样，在需要记录日志的进程里，可以调用syslog函数将日志发送给syslogd守护进程，可是内核并不是一个进程，那么它的日志就有必要专门设置一个用户进程负责传给syslogd，这个进程就是klogd，至于klogd如何从内核得到内核日志信息，这就是它自己的事情了，其实内核专门留下了两个日志接口，一个是sys_syslog系统调用（注意不要和syslog函数混淆，syslog系统调用是和内核通信的，而syslog函数是和syslogd通信的），另一个是/proc/kmsg文件，klogd使用的是后者，当然也可以直接使用 ksyslog系统调用。这里首先看一下内核日志的一些结构，首先内核日志大多数由printk产生，你也可以认为完全由printk产生，但是我们知道，printk将信息打印到了屏幕，并没有别的什么副作用，实际上并不是仅仅发生了我们看到的事情，实际上printk并不是将信息直接写入了标准输出文件，而仅仅将信息塞入了一个环形缓冲区，，然后至于这个缓冲区的内容什么时候显示到标准输出，那就是另外一个事情了，而内核日志就是存在于这个环形缓冲区，打印到屏幕的仅仅是一个缓冲区副本，真正的数据还在缓冲区保留，只有到了klogd或者别的什么调用syslog系统调用将信息读出时或者缓冲区满了（环形缓冲区首尾相接）的时候才会清除部分数据或者全部数据，刚才说了有两种方式来得到内核日志，一个是/proc/kmsg。一个是系统调用，幸运的是，这两个都是调用了do_syslog内核函数：

　　int do_syslog(int type, char __user * buf, int len)

　　{

　　unsigned long i, j, limit, count;

　　int do_clear = 0;

　　char c;

　　int error = 0;

　　error = security_syslog(type);

　　if (error)

　　return error;

　　switch (type) {

　　...

　　case 2:

　　...

　　error = wait_event_interruptible(log_wait, (log_start - log_end)); //如果没有数据，那么就睡眠等待。

　　if (error)

　　goto out;

　　i = 0;

　　spin_lock_irq(&logbuf_lock); //如果要往外读数据，不希望在读的过程中数据发生变化，因此必须锁住环形数据缓冲区

　　while (!error && (log_start != log_end) && i

　　c = LOG_BUF(log_start); //得到一个字符

　　log_start++; //只有在这里才逻辑上清除环形缓冲区的数据

　　spin_unlock_irq(&logbuf_lock);

　　error = __put_user(c,buf);

　　buf++;

　　i++;

　　spin_lock_irq(&logbuf_lock);

　　}

　　spin_unlock_irq(&logbuf_lock);

　　...

　　}

　　我们看一下printk调用的vprintk内核函数：

　　asmlinkage int vprintk(const char *fmt, va_list args)

　　{

　　unsigned long flags;

　　int printed_len;

　　char *p;

　　static char printk_buf[1024];

　　static int log_level_unknown = 1;

　　...

　　spin_lock_irqsave(&logbuf_lock, flags); //这个logbuf_lock自旋锁其实很重要，确保一次内核信息写的过程不会有别的写过程来捣乱，否则很多信息会揉在一起，比如hello和 world会变为hwellorold。

　　printed_len = vscnprintf(printk_buf, sizeof(printk_buf), fmt, args);

　　for (p = printk_buf; *p; p++) {

　　if (log_level_unknown) {

　　if (p[0] != '<' || p[1] <'' || p[1] > '7' || p[2] != '>') {

　　emit_log_char('<');

　　emit_log_char(default_message_loglevel + '');

　　emit_log_char('>');

　　}

　　log_level_unknown = 0;

　　}

　　emit_log_char(*p);

　　if (*p == ' ')

　　log_level_unknown = 1;

　　}

　　if (!cpu_online(smp_processor_id()) && system_state != SYSTEM_RUNNING) {

　　spin_unlock_irqrestore(&logbuf_lock, flags);

　　goto out;

　　}

　　if (!down_trylock(&console_sem)) { //如果现在可以得到设备的信号量，那么马上将数据显示到终端

　　console_locked = 1;

　　spin_unlock_irqrestore(&logbuf_lock, flags);

　　console_may_schedule = 0;

　　release_console_sem(); //该函数具体显示数据

　　} else {

　　spin_unlock_irqrestore(&logbuf_lock, flags);//本次的内核信息已经写入了内核环形缓冲，为了不阻碍别人写，释放掉自旋锁

　　}

　　out:

　　return printed_len;

　　}

　　内核的环形缓冲有两个用途，一个是直接打印在屏幕上，还有一个就是可能用户空间的内核日志程序正在运行，因此这个函数完成了两个作用：

　　void release_console_sem(void)

　　{

　　unsigned long flags;

　　unsigned long _con_start, _log_end;

　　unsigned long wake_klogd = 0;

　　for ( ; ; ) { //打印向屏幕，注意，打印的时候也要确保logbuf_lock被拥有，因为不想在打印过程中发生缓冲区变化的事情

　　spin_lock_irqsave(&logbuf_lock, flags);

　　wake_klogd |= log_start - log_end; //确保有数据，这个变量还作为是否唤醒do_syslog的睡眠队列的依据。

　　if (con_start == log_end)

　　break; /* Nothing to print */

　　_con_start = con_start;

　　_log_end = log_end;

　　con_start = log_end; //注意，log_end和log_start并没有变化，而是副本变化了，这是因为下面还要用到内核缓冲，不能因为写到了屏幕，信息就消耗了。

　　spin_unlock_irqrestore(&logbuf_lock, flags);

　　call_console_drivers(_con_start, _log_end);

　　}

　　console_locked = 0;

　　console_may_schedule = 0;

　　up(&console_sem);

　　spin_unlock_irqrestore(&logbuf_lock, flags);

　　if (wake_klogd && !oops_in_progress && waitqueue_active(&log_wait)) //如果内核唤醒缓冲中有数据，那么就唤醒睡眠队列

　　wake_up_interruptible(&log_wait);

　　}

　　最后我们看一下procfs导出的kmsg接口的read函数，其实也是调用了do_syslog函数：

　　static ssize_t kmsg_read(struct file *file, char __user *buf, size_t count, loff_t *ppos)

　　{

　　if ((file->f_flags & O_NONBLOCK) && !do_syslog(9, NULL, 0))

　　return -EAGAIN;

　　return do_syslog(2, buf, count);

　　}

　　这里我觉得有一个问题，就是在printk的时候，如果我们恰好可以得到设备的信号量，那么就必须等到信息完全显示到设备上时调用栈才可以返回，也就是说，最好不要在内核大量调用printk函数，另外，在多处理器上这也是很不利的，以前的处理器少，因此问题不大，现在都是多处理器了，性能就可能受 printk的影响了，我觉得可以为每一个cpu准备一个环形缓冲区，然后在拼接这些缓冲区的时候进行控制，比如在用户空间读每个cpu的缓冲区，只不过将它们作为一个整体去理解，这个我感觉可以用文件系统实现。在任何程序中频繁调用打印都是不妙的，因为打印涉及设备操作，想想看，外设相比cpu多么慢，而且对于机器中的唯一设备，而且是每个进程几乎都在用的设备，我们花在打架上的时间又是何等的长。

　　回归同事问我的那个问题，在linux上怎么打印信息，其实，只要你不关闭，每个程序都会默认打开0，1，2三个文件描述符，这三个描述符在start_kernel中调用的kernel_init进程（最终成为/sbin/init）中被初始化，也就是在下面的代码：

　　if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) <0)

　　printk(KERN_WARNING "Warning: unable to open an initial console. ");

　　(void) sys_dup(0);

　　在这里，sys_open打开了/dev/console，将其作为标准输出，其实也就是我们的终端，当前终端，在sys_open中会自动将文件描述符0分配给这个终端文件，然后紧接着的sys_dup相当于复制了这个终端文件描述符代表的文件给了新的描述符1和2，这样的话实际上0，1，2代表的是同一个东西，都是指当前的终端，这也就是为什么你往标准错误里面写东西也不会错的道理，实际上标准输入，输出，错误都是给用户进程用的，对于内核，它们是一个东西。因为linux进程都是fork出来的，根源就是这个kernel_init进程，于是每个进程都会默认复制父进程的0，1，2文件描述符（如果父进程没有关闭它们的话）。

推荐阅读

java
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
java
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
version
解决Docker中volume的权限问题的方法

在Docker中，将主机目录挂载到容器中作为volume使用时，常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法，包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法，可以避免在使用Docker时出现无写权限的情况。 ... [详细]

蜡笔小新 2023-12-14 18:48:02
version
学习SLAM的女生，很酷

本文介绍了学习SLAM的女生的故事，她们选择SLAM作为研究方向，面临各种学习挑战，但坚持不懈，最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想，同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]

蜡笔小新 2023-12-14 17:55:18
hash
数据库的存储结构及其重要性

本文介绍了数据库的存储结构及其重要性，强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离，可以实现对物理存储的重新组织和数据库的迁移，而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构，并介绍了表空间的概念和作用。 ... [详细]

蜡笔小新 2023-12-14 16:00:02
hash
Hibernate配置lazy=false时无法加载数据的问题解决方法

本文介绍了在Hibernate配置lazy=false时无法加载数据的问题，通过采用OpenSessionInView模式和修改数据库服务器版本解决了该问题。详细描述了问题的出现和解决过程，包括运行环境和数据库的配置信息。 ... [详细]

蜡笔小新 2023-12-14 13:59:45
php
Metasploit攻击渗透实践

本文介绍了Metasploit攻击渗透实践的内容和要求，包括主动攻击、针对浏览器和客户端的攻击，以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码，以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]

蜡笔小新 2023-12-14 12:14:09
java
WinPythonHadoop在Win10上安装教程

本文介绍了在Win10上安装WinPythonHadoop的详细步骤，包括安装Python环境、安装JDK8、安装pyspark、安装Hadoop和Spark、设置环境变量、下载winutils.exe等。同时提醒注意Hadoop版本与pyspark版本的一致性，并建议重启电脑以确保安装成功。 ... [详细]

蜡笔小新 2023-12-14 11:26:56
js
知识图谱——机器大脑中的知识库

本文介绍了知识图谱在机器大脑中的应用，以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例，说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案，如搜索关键词"Marie Curie"，会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革，不仅美国的微软必应，中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]

蜡笔小新 2023-12-14 10:06:19
js
Linux进程控制块PCBtask_struct结构体结构及作用详解

本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用，包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]

蜡笔小新 2023-12-13 21:31:18
post
Webmin远程命令执行漏洞复现及防护方法

本文介绍了Webmin远程命令执行漏洞CVE-2019-15107的漏洞详情和复现方法，同时提供了防护方法。漏洞存在于Webmin的找回密码页面中，攻击者无需权限即可注入命令并执行任意系统命令。文章还提供了相关参考链接和搭建靶场的步骤。此外，还指出了参考链接中的数据包不准确的问题，并解释了漏洞触发的条件。最后，给出了防护方法以避免受到该漏洞的攻击。 ... [详细]

蜡笔小新 2023-12-13 16:14:53
post
Linux 正则表达式基础及使用注意事项

本文介绍了Linux系统中正则表达式的基础知识，包括正则表达式的简介、字符分类、普通字符和元字符的区别，以及在学习过程中需要注意的事项。同时提醒读者要注意正则表达式与通配符的区别，并给出了使用正则表达式时的一些建议。本文适合初学者了解Linux系统中的正则表达式，并提供了学习的参考资料。 ... [详细]

蜡笔小新 2023-12-13 14:24:45
post
Ubuntu 9.04中安装谷歌Chromium浏览器及使用体验[图文]

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2023-12-13 13:30:30
java
Android源码深入理解JNI技术的概述和应用

本文介绍了Android源码中的JNI技术，包括概述和应用。JNI是Java Native Interface的缩写，是一种技术，可以实现Java程序调用Native语言写的函数，以及Native程序调用Java层的函数。在Android平台上，JNI充当了连接Java世界和Native世界的桥梁。本文通过分析Android源码中的相关文件和位置，深入探讨了JNI技术在Android开发中的重要性和应用场景。 ... [详细]

蜡笔小新 2023-12-13 10:00:57
java
Oracle优化新常态的五大禁止及其性能隐患

本文介绍了Oracle优化新常态中的五大禁止措施，包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB，并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况，并提出了解决方案。 ... [详细]

蜡笔小新 2023-12-12 12:55:55

集束群

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章