Linux下的CPU利用率計算原理詳解
我們在搞性能測試的時候,對后臺服務器的CPU利用率監(jiān)控是一個常用的手段。服務器的CPU利用率高,則表明服務器很繁忙。如果前臺響應時間越來越大,而后臺CPU利用率始終上不去,說明在某個地方有瓶頸了,系統需要調優(yōu)。這個是即使不懂技術的人都容易理解的事情。
上面理解對嗎?我個人覺得不十分準確。這個要看后臺你測試的進程是什么類型的。如果是計算密集型的進程,當前端壓力越來越大的時候,很容易把CPU利用率打上去。但是如果是I/O網絡密集型的進程,即使客戶端的請求越來越多,但是服務器CPU不一定能上去,這個是你要測試的進程的自然屬性決定的。比較常見的就是,大文件頻繁讀寫的cpu開銷遠小于小文件頻繁讀寫的開銷。因為在I/O吞吐量一定時,小文件的讀寫更加頻繁,需要更多的cpu來處理I/O的中斷。
在Linux/Unix下,CPU利用率分為用戶態(tài),系統態(tài)和空閑態(tài),分別表示CPU處于用戶態(tài)執(zhí)行的時間,系統內核執(zhí)行的時間,和空閑系統進程執(zhí)行的時間。平時所說的CPU利用率是指:CPU執(zhí)行非系統空閑進程的時間 / CPU總的執(zhí)行時間。
在Linux的內核中,有一個全局變量:Jiffies。 Jiffies代表時間。它的單位隨硬件平臺的不同而不同。系統里定義了一個常數HZ,代表每秒種最小時間間隔的數目。這樣jiffies的單位就是1/HZ。Intel平臺jiffies的單位是1/100秒,這就是系統所能分辨的最小時間間隔了。每個CPU時間片,Jiffies都要加1。 CPU的利用率就是用執(zhí)行用戶態(tài)+系統態(tài)的Jiffies除以總的Jifffies來表示。
在Linux系統中,可以用/proc/stat文件來計算cpu的利用率(詳細的解釋可參考:http://www.linuxhowtos.org/System/procstat.htm)。這個文件包含了所有CPU活動的信息,該文件中的所有值都是從系統啟動開始累計到當前時刻。
如:
- [sailorhzr@builder ~]$ cat /proc/stat
- cpu 432661 13295 86656 422145968 171474 233 5346
- cpu0 123075 2462 23494 105543694 16586 0 4615
- cpu1 111917 4124 23858 105503820 69697 123 371
- cpu2 103164 3554 21530 105521167 64032 106 334
- cpu3 94504 3153 17772 105577285 21158 4 24
- intr 1065711094 1057275779 92 0 6 6 0 4 0 3527 0 0 0 70 0 20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7376958 0 0 0 0 0 0 0 1054602 0 0 0 0 0 0 0 30 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
- ctxt 19067887
- btime 1139187531
- processes 270014
- procs_running 1
- procs_blocked 0
輸出解釋
CPU 以及CPU0、CPU1、CPU2、CPU3每行的每個參數意思(以第一行為例)為:
參數 | 解釋 |
user (432661) nice (13295) system (86656) idle (422145968) iowait (171474) irq (233) softirq (5346) |
從系統啟動開始累計到當前時刻,用戶態(tài)的CPU時間(單位:jiffies) ,不包含 nice值為負進程。1jiffies=0.01秒 從系統啟動開始累計到當前時刻,nice值為負的進程所占用的CPU時間(單位:jiffies) 從系統啟動開始累計到當前時刻,核心時間(單位:jiffies) 從系統啟動開始累計到當前時刻,除硬盤IO等待時間以外其它等待時間(單位:jiffies) 從系統啟動開始累計到當前時刻,硬盤IO等待時間(單位:jiffies) , 從系統啟動開始累計到當前時刻,硬中斷時間(單位:jiffies) 從系統啟動開始累計到當前時刻,軟中斷時間(單位:jiffies) |
CPU時間=user+system+nice+idle+iowait+irq+softirq
“intr”這行給出中斷的信息,第一個為自系統啟動以來,發(fā)生的所有的中斷的次數;然后每個數對應一個特定的中斷自系統啟動以來所發(fā)生的次數。
“ctxt”給出了自系統啟動以來CPU發(fā)生的上下文交換的次數。
“btime”給出了從系統啟動到現在為止的時間,單位為秒。
“processes (total_forks) 自系統啟動以來所創(chuàng)建的任務的個數目。
“procs_running”:當前運行隊列的任務的數目。
“procs_blocked”:當前被阻塞的任務的數目。
那么CPU利用率可以使用以下兩個方法。先取兩個采樣點,然后計算其差值:
- cpu usage=(idle2-idle1)/(cpu2-cpu1)*100
- cpu usage=[(user_2 +sys_2+nice_2) - (user_1 + sys_1+nice_1)]/(total_2 - total_1)*100
以下用分別用bash和perl做的一個cpu利用率的計算:
本人注:以下代碼則采用公式為:
- total_0USER[0]+NICE[0]+SYSTEM[0]+IDLE[0]+IOWAIT[0]+IRQ[0]+SOFTIRQ[0]
- total_1=USER[1]+NICE[1]+SYSTEM[1]+IDLE[1]+IOWAIT[1]+IRQ[1]+SOFTIRQ[1]
- cpu usage=(IDLE[0]-IDLE[1]) / (total_0-total_1) * 100
###bash 代碼
- CODE:#!/bin/sh
- ##echo user nice system idle iowait irq softirq
- CPULOG_1=$(cat /proc/stat | grep 'cpu ' | awk '{print $2" "$3" "$4" "$5" "$6" "$7" "$8}')
- SYS_IDLE_1=$(echo $CPULOG_1 | awk '{print $4}')
- Total_1=$(echo $CPULOG_1 | awk '{print $1+$2+$3+$4+$5+$6+$7}')
- sleep 5
- CPULOG_2=$(cat /proc/stat | grep 'cpu ' | awk '{print $2" "$3" "$4" "$5" "$6" "$7" "$8}')
- SYS_IDLE_2=$(echo $CPULOG_2 | awk '{print $4}')
- Total_2=$(echo $CPULOG_2 | awk '{print $1+$2+$3+$4+$5+$6+$7}')
- SYS_IDLE=`expr $SYS_IDLE_2 - $SYS_IDLE_1`
- Total=`expr $Total_2 - $Total_1`
- SYS_USAGE=`expr $SYS_IDLE/$Total*100 |bc -l`
- SYS_Rate=`expr 100-$SYS_USAGE |bc -l`
- Disp_SYS_Rate=`expr "scale=3; $SYS_Rate/1" |bc`
- echo $Disp_SYS_Rate%
###perl 代碼
- #!/usr/bin/perl
- use warnings;
- $SLEEPTIME=5;
- if (-e "/tmp/stat") {
- unlink "/tmp/stat";
- }
- open (JIFF_TMP, ">>/tmp/stat") || die "Can't open /proc/stat file!\n";
- open (JIFF, "/proc/stat") || die "Can't open /proc/stat file!\n";
- @jiff_0=<JIFF>;
- print JIFF_TMP $jiff_0[0] ;
- close (JIFF);
- sleep $SLEEPTIME;
- open (JIFF, "/proc/stat") || die "Can't open /proc/stat file!\n";
- @jiff_1=<JIFF>;
- print JIFF_TMP $jiff_1[0];
- close (JIFF);
- close (JIFF_TMP);
- @USER=`awk '{print \$2}' "/tmp/stat"`;
- @NICE=`awk '{print \$3}' "/tmp/stat"`;
- @SYSTEM=`awk '{print \$4}' "/tmp/stat"`;
- @IDLE=`awk '{print \$5}' "/tmp/stat"`;
- @IOWAIT=`awk '{print \$6}' "/tmp/stat"`;
- @IRQ=`awk '{print \$7}' "/tmp/stat"`;
- @SOFTIRQ=`awk '{print \$8}' "/tmp/stat"`;
- $JIFF_0=$USER[0]+$NICE[0]+$SYSTEM[0]+$IDLE[0]+$IOWAIT[0]+$IRQ[0]+$SOFTIRQ[0];
- $JIFF_1=$USER[1]+$NICE[1]+$SYSTEM[1]+$IDLE[1]+$IOWAIT[1]+$IRQ[1]+$SOFTIRQ[1];
- $SYS_IDLE=($IDLE[0]-$IDLE[1]) / ($JIFF_0-$JIFF_1) * 100;
- $SYS_USAGE=100 - $SYS_IDLE;
- printf ("The CPU usage is %1.2f%%\n",$SYS_USAGE);
【編輯推薦】