一文搞懂 Linux 時間子系統(tǒng)
硬件架構(gòu)
從硬件架構(gòu)圖中可以看出以下特點:
- 每個 CPU 核都包含各自的 local timer,相互獨立。
- 每個 local timer 都支持中斷的產(chǎn)生,中斷類型為 PPI,即 CPU 的私有中斷,GIC 負(fù)責(zé)分發(fā)到指定的 CPU,這些中斷都可以用來產(chǎn)生系統(tǒng)事件。local timer的中斷為以下四種:
1.Secure Physical Timer event (ID 29,也就是上面device node中的13,29 = 16 + 13)
2.Non-secure Physical Timer event (ID 30,也就是上面device node中的14,30 = 16 + 14)
3.Virtual Timer event (ID 27)
4.Hypervisor Timer event (ID 26)
- 系統(tǒng)中存在一個 always-powered 的域,這個域提供一個 system counter,所有 core 的定時器都是基于這個 system counter 提供的 counter 值,因此理論上所有的 local timer 都是基于同樣的時間基準(zhǔn)。
- 為什么要強(qiáng)調(diào) system counter 是 always powered,而且要獨立出來,這是因為在系統(tǒng)運行期間某些 core 為了節(jié)能可能進(jìn)入睡眠狀態(tài),local timer 可能也會因此被關(guān)閉,但是系統(tǒng)的時間戳不能丟,以便在特定的時間喚醒 CPU,而且在喚醒之后還能獲得正確的時間。同時,system counter 也支持休眠模式,它的休眠不是關(guān)閉,而是降頻,通常情況下該 timer 的頻率是 1~50MHz,假設(shè)是以 10MHz 運行,將其降到 1MHz,那么,system counter 每次運行時 counter 不再是加1,而是加 10,這樣就不會丟失時間精度。
- system counter 的實現(xiàn)標(biāo)準(zhǔn)為:
1.至少 56 bits 的寬度。
2.頻率在 1-50MHz。
3.溢出時間至少在 40 年。
4.arm 沒有對精度做出特別要求,不過最低的建議值為24小時, 誤差不超過 10s。
5.從 0 開始計數(shù),正常情況下每一個時鐘脈沖加1,節(jié)能模式下除外。
- system counter 可以被所有 core 訪問,通過總線地址映射的方式,而 local timer 由對應(yīng)的 CPU core 訪問,訪問方式則是通過操作 CP15 協(xié)處理器。
軟件架構(gòu)
- 最底層是硬件和驅(qū)動層,每個cpu core都有自己的cpu local timer,此外SOC內(nèi)部肯定會有一個用于全局的global counter。
- 中間層是linux內(nèi)核層,內(nèi)核抽象出了時鐘源(clocksource), 時鐘事件設(shè)備(clock_event_device), tick設(shè)備(tick_device)用于時間管理。分為左右兩部分:
- 右邊實現(xiàn)計時功能。linux內(nèi)核有各種time line, 包括real time clock, monotonic clock, monotonic raw clock等。clocksource提供了一個單調(diào)增加的計時器產(chǎn)生tick,為timeline提供時鐘源。timekeeper是內(nèi)核提供時間服務(wù)的基礎(chǔ)模塊,負(fù)責(zé)選擇并維護(hù)最優(yōu)的clocksource。
- 左邊實現(xiàn)定時功能。clock event管理可產(chǎn)生event或是觸發(fā)中斷的定時器,(一般而言,每個CPU形成自己的一個小系統(tǒng),也就要管理自己的clock event。)tick device是基于clock event設(shè)備進(jìn)行工作的,cpu管理自己的調(diào)度、進(jìn)程統(tǒng)計等是基于tick設(shè)備的。低精度timer和高精度timer都是基于tick device生成的定時器設(shè)備,關(guān)于它們的事件和周期信號的關(guān)系在上面的圖中有一個大體的介紹。
- 最上層是linux應(yīng)用層?;趖imekeeping設(shè)備的是時間管理的庫time lib,基于定時器設(shè)備的是定時管理的庫timer lib。
數(shù)據(jù)結(jié)構(gòu)
- clocksource:來自系統(tǒng)計時的需求,換句話說系統(tǒng)需要知道現(xiàn)在是xx年xx月xx日xx時xx分xx秒xx納秒。
local timer 的 clocksource 相關(guān)的配置信息:
static struct clocksource clocksource_counter = {
.name = "arch_sys_counter",
.rating = 400,
.read = arch_counter_read,
.mask = CLOCKSOURCE_MASK(56),
.flags = CLOCK_SOURCE_IS_CONTINUOUS,
};
- clock_event_device:來自系統(tǒng)定時的需求(即 timer)。即從當(dāng)前時間點開始,到xxx納秒之后通知我做某些事情。
local timer 的 clock_event_device 相關(guān)的配置信息:
static void __arch_timer_setup(unsigned type,
struct clock_event_device *clk)
{
clk->features = CLOCK_EVT_FEAT_ONESHOT;
if (type == ARCH_TIMER_TYPE_CP15) {
if (arch_timer_c3stop)
clk->features |= CLOCK_EVT_FEAT_C3STOP;
clk->name = "arch_sys_timer";
clk->rating = 450;
clk->cpumask = cpumask_of(smp_processor_id());
clk->irq = arch_timer_ppi[arch_timer_uses_ppi];
switch (arch_timer_uses_ppi) {
......
case ARCH_TIMER_PHYS_NONSECURE_PPI:
case ARCH_TIMER_HYP_PPI:
clk->set_state_shutdown = arch_timer_shutdown_phys;
clk->set_state_oneshot_stopped = arch_timer_shutdown_phys;
clk->set_next_event = arch_timer_set_next_event_phys;
break;
default:
BUG();
}
}
system counter 的 clock_event_device 相關(guān)的配置信息如下所示,充當(dāng)硬件timer,當(dāng)CPU進(jìn)入idle后用來喚醒CPU。
static struct clock_event_device clockevent_sysctr = {
.name = "i.MX system counter timer",
.features = CLOCK_EVT_FEAT_ONESHOT | CLOCK_EVT_FEAT_DYNIRQ,
.set_state_oneshot = sysctr_set_state_oneshot,
.set_next_event = sysctr_set_next_event,
.set_state_shutdown = sysctr_set_state_shutdown,
.rating = 200,
};
- tick_device 是 clock_event_device 的子類。
struct tick_device {
struct clock_event_device *evtdev;
enum tick_device_mode mode;
};
tick device的工作模式定義如下:
enum tick_device_mode {
TICKDEV_MODE_PERIODIC,
TICKDEV_MODE_ONESHOT,
};
static struct tick_device tick_broadcast_device;
local timer 驅(qū)動
system counter 驅(qū)動
system counter 驅(qū)動
當(dāng)沒有進(jìn)程調(diào)度到該 CPU 上執(zhí)行的時候,swapper進(jìn)程會將該 CPU 推入到 idle 狀態(tài)。當(dāng) CPU 睡的時候,有可能會關(guān)閉 local timer 硬件。這就會導(dǎo)致 local timer 將無法喚醒 CPU。
為了在 CPU 進(jìn)入 idle 后還能被喚醒,有兩種方案,一種是通過hrtimer的軟件方案,還有一種是硬件方案。這里只講述硬件方案,一般采用 alway-on 的硬件 timer 作為喚醒源,它不屬于任何 CPU,使用 SPI 類型的中斷來喚醒 CPU,處理軟件 timer。