jiffies
[toc] kernel/time/jiffies.c 内核心跳(Kernel Heartbeat) 低分辨率定时器的基础历史与背景这项技术是为了解决什么特定问题而诞生的?jiffies 是Linux内核中最古老、最基础的时间测量机制。它的诞生是为了解决内核内部需要一个**简单、廉价、全局统一的“心跳”或“滴答(tick)”**来驱动各种基于时间的活动。 在操作系统内核中,大量活动都不是由外部事件触发,而是需要在一个相对的时间点后发生。例如: 超时(Timeouts):一个网络驱动发送了一个数据包,它需要在一个超时时间(如200毫秒)后检查是否收到了确认。 调度(Scheduling):一个SCHED_RR(轮转)策略的进程,其运行时间片用完后需要被抢占。 周期性任务(Periodic Tasks):某些内核任务需要周期性地运行。 简单的延迟(Delays):代码中需要一个短暂的、非精确的延迟。 jiffies 提供了一个极其简单的解决方案:它是一个在系统启动后不断递增的全局计数器。通过读取这个计数器的值,内核的任何部分都可以获得一个关于“时间流逝”的...
time
[TOC] include/linux/ktime.hktime_set 从秒/纳秒值设置ktime_t变量123456789101112131415161718192021222324252627/** * ktime_set - 从秒/纳秒值设置ktime_t变量 * @secs:秒设置 * @nsecs:纳秒设置 * * 返回:值的ktime_t表示形式。 */static inline ktime_t ktime_set(const s64 secs, const unsigned long nsecs){ if (unlikely(secs >= KTIME_SEC_MAX)) return KTIME_MAX; return secs * NSEC_PER_SEC + (s64)nsecs;}/* Subtract two ktime_t variables. rem = lhs -rhs: */#define ktime_sub(lhs, rhs) ((lhs) - (rhs))/* Add two k...
hrtimer
[toc] kernel/time/hrtimer.c 高精度定时器(High-Resolution Timers) 纳秒级精度的事件调度历史与背景这项技术是为了解决什么特定问题而诞生的?kernel/time/hrtimer.c 实现了**高精度定时器(High-Resolution Timers)框架,它的诞生是为了解决内核中日益增长的、对亚毫秒级(sub-millisecond)甚至纳秒级(nanosecond)**定时精度的需求。 传统的jiffies定时器(timer_list)虽然开销极低,但其精度受限于系统的心跳频率HZ(通常在4ms到10ms之间)。这对于许多现代应用来说是完全不够的: 用户空间API支持:POSIX标准定义了nanosleep()、clock_nanosleep()和高精度POSIX定时器,这些API要求内核能够提供远超jiffies精度的定时能力。 多媒体与音频:专业的音频应用为了实现低延迟处理,需要在非常精确的时间点(例如每1-2毫秒)被唤醒来填充声卡缓冲区。 网络与金融:高频交易和某些低延迟网络协议需要对超时进行...
tick
[toc] kernel/time/tick-*.c 内核时钟滴答(The Kernel Tick) 驱动时间流逝与进程抢占历史与背景这项技术是为了解决什么特定问题而诞生的?kernel/time/tick-*.c 目录下的文件集合构成了内核时钟滴答(Kernel Tick)的底层实现。这项技术是所有分时操作系统的心跳(Heartbeat),它的诞生是为了解决两个最根本的问题: 时间流逝的度量:内核需要一个机制来驱动内部的时间概念。没有一个周期性的“滴答”,像jiffies这样的计数器将无法更新,基于jiffies的传统定时器(timer_list)也将永远不会到期。 强制性进程抢占(Preemptive Multitasking):在一个协作式多任务系统中,一个进程会一直运行直到它自愿放弃CPU。这会导致一个死循环的进程就能锁死整个系统。为了实现抢占式多任务,内核需要一个周期性的、不可抗拒的事件来中断当前正在运行的进程,并给调度器一个机会去检查是否有其他进程应该运行。这个事件就是时钟滴答中断。 简而言之,内核滴答是调度器得以强制执行时间片轮转和内...
sched_clock
[toc] kernel/time/sched_clock.c 调度器时钟(Scheduler Clock) 高性能的调度与追踪时间戳历史与背景这项技术是为了解决什么特定问题而诞生的?kernel/time/sched_clock.c 提供的核心功能 sched_clock() 是为了解决内核中一个对性能极其敏感的需求:以极低的开销,获取一个高分辨率、单调递增的时间戳。 jiffies 虽然开销低,但其分辨率太差(毫秒级),完全无法满足现代调度器的需求。特别是对于CFS(完全公平调度器),它需要精确地知道一个任务在CPU上到底运行了多少纳秒,以便公平地更新其虚拟运行时间(vruntime)。如果时间测量不准,CFS的公平性就无从谈起。 此外,内核内部的其他高性能子系统也需要类似的时间戳: 性能追踪与分析:像ftrace和perf这样的工具,在记录内核事件时,需要为每个事件打上一个极其精确的时间戳,以便分析微秒甚至纳秒级的性能瓶颈。 锁竞争分析:内核的锁调试器需要精确测量一个任务在等待一个自旋锁上花费了多长时间。 sched_clock() 就是为了满...
rwlock
[toc] include/linux/rwlock.h 读写锁(Read-Write Lock) 允许多读者并发访问的同步原语历史与背景这项技术是为了解决什么特定问题而诞生的?读写锁(Read-Write Lock, rwlock)是为了解决一个非常普遍的并发访问模式的性能问题:对共享数据的访问是“读多写少”。 在使用简单的互斥锁(mutex)或自旋锁(spinlock)时,任何时候都只允许一个任务进入临界区,无论它是读取还是写入。这对于读操作来说是过度限制的,因为读操作本身不会修改数据,允许多个读者同时读取是安全的。如果一个数据结构被内核中成百上千个地方频繁地读取,而只被少数几个地方偶尔写入,那么使用互斥锁会导致所有读者被迫串行执行,极大地降低了系统的并发性能。 rwlock的诞生就是为了优化这种场景。它提供了一种更精细的锁定机制: 读锁(共享锁):允许多个读者同时持有读锁。 写锁(排他锁):与互斥锁一样,任何时候只允许一个写者持有写锁。 互斥规则:当有任何读者持有读锁时,写者必须等待;当有写者持有写锁时,所有读者和其他写者都必须等待。 它的发展...
idle
[toc] kernel/sched/idle.c 空闲调度(Idle Scheduling) CPU无事可做时的最终选择历史与背景这项技术是为了解决什么特定问题而诞生的?kernel/sched/idle.c 的实现是为了解决一个操作系统中最基础、最本质的问题:当CPU上没有任何有意义的工作(没有可运行的进程或内核线程)时,CPU应该做什么? 一个CPU不能简单地“停止”,它必须始终在执行指令。因此,系统必须提供一个“最后的选择”——一个特殊的任务,在所有其他任务都无法运行时来占用CPU。这个任务就是空闲任务(Idle Task)。 然而,仅仅让CPU执行一个空、、循环(while(1);)是远远不够的,这会带来一个巨大的新问题:功耗。一个在循环中空转的CPU会以最高速度运行,消耗大量电力,产生大量热量,这对于任何设备(尤其是移动设备)都是不可接受的。 因此,idle.c 的核心目标有两个: 提供一个默认的执行流,确保CPU永远有事可做。 实现极致的节能,通过将空闲的CPU置于深度睡眠的低功耗状态来节省能源。 它的发展经历了哪些重要的里程碑或版本迭...
preempt
[TOC] include/linux/preempt.h 内核抢占(Kernel Preemption) 控制内核代码的可抢占性与延迟历史与背景这项技术是为了解决什么特定问题而诞生的?include/linux/preempt.h 是定义**内核抢占(Kernel Preemption)相关API和配置的头文件。这项技术的诞生是为了解决早期Linux内核的一个核心设计局限性:内核态执行的不可抢占性(non-preemptibility),以及由此导致的系统响应延迟(latency)**问题。 在Linux 2.6版本之前,内核是非抢占式的。这意味着,当一个进程通过系统调用进入内核态执行时,它会一直占有CPU,直到它自愿放弃(例如,因等待I/O而睡眠)或执行完毕返回用户空间。这种模型的缺点是: 高延迟:如果一个低优先级的进程执行了一个非常耗时的系统调用(例如,对一个大文件进行复杂的读写),那么一个刚刚被唤醒的、需要立即响应用户输入的高优先级进程(如桌面窗口管理器或文本编辑器)将不得不一直等待,直到那个系统调用完成。这会导致系统UI卡顿,响应迟...
timekeeping
[toc] kernel/time/timekeeping.c 内核时间保持(Kernel Timekeeping) 维护系统时间的核心与灵魂历史与背景这项技术是为了解决什么特定问题而诞生的?这项技术是为了解决操作系统中最基础、最核心的需求之一:以一种精确、稳定、单调的方式来跟踪和维护时间的流逝。 kernel/time/timekeeping.c所管理的时间保持子系统,具体解决了以下几个关键问题: 时间的表示与更新:需要一个核心机制来管理系统的“官方时间”。这包括“墙上时间”(Wall Time,即CLOCK_REALTIME,自1970年Epoch以来的时间,可以被用户或NTP修改),以及“单调时间”(Monotonic Time,即CLOCK_MONOTONIC,从系统启动开始单调递增,不受时间调整影响)。 时钟源的抽象:硬件提供了各种各样的时间源(Clock Sources),例如TSC(CPU的时间戳计数器)、HPET(高精度事件定时器)、ACPI PM Timer等。这些时钟源的精度、稳定性和访问速度各不相同。时间保持子系统需要一个框架来抽...
timer
[toc] kernel/time/timer.c 传统内核定时器(Legacy Kernel Timers) 基于jiffies的通用定时机制历史与背景这项技术是为了解决什么特定问题而诞生的?kernel/time/timer.c 实现了Linux内核中最传统、最通用的低分辨率定时器机制。它的诞生是为了解决内核中一个无处不在的需求:以一种低开销、非阻塞的方式,安排一个函数在未来的某个时间点被执行。 在内核的许多代码路径中,尤其是在与硬件交互时,都需要处理超时。例如: 设备驱动:一个驱动向设备发送一个命令后,不能无限期地等待其响应。它需要设置一个超时,如果在指定时间内没有收到响应,就必须进行错误处理。 网络协议栈:TCP协议在发送一个数据段后,会启动一个重传定时器。如果在规定时间内没有收到对方的确认(ACK),定时器到期后就会重新发送该数据段。 周期性轮询:某些简单的驱动可能需要周期性地检查硬件状态。 timer.c 提供的struct timer_list接口,就是为了满足这些**对精度要求不高(毫秒级)**的通用定时需求而设计的。 它的发展经历了...







