自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="cnpcw"></sub>

<legend id="cnpcw"><track id="cnpcw"></track></legend>

<cite id="cnpcw"></cite><sub id="cnpcw"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

Nginx日志分析：編寫Shell腳本進行全面日志統(tǒng)計

作者：didiplus 2024-08-06 09:40:21

網(wǎng)絡(luò)

在實際生產(chǎn)環(huán)境中，對Nginx日志的分析有助于我們了解網(wǎng)站的訪問情況，發(fā)現(xiàn)潛在問題并進行優(yōu)化。本文將通過編寫Shell腳本，實現(xiàn)對Nginx日志的全面統(tǒng)計分析。

Nginx是一個高性能的HTTP和反向代理服務(wù)器，也是一個IMAP/POP3/SMTP代理服務(wù)器。無論是在大流量的網(wǎng)站還是小型的個人博客中，Nginx都得到了廣泛應(yīng)用。在實際生產(chǎn)環(huán)境中，對Nginx日志的分析有助于我們了解網(wǎng)站的訪問情況，發(fā)現(xiàn)潛在問題并進行優(yōu)化。本文將通過編寫Shell腳本，實現(xiàn)對Nginx日志的全面統(tǒng)計分析。

Nginx日志格式

首先，我們需要確保Nginx日志格式與以下格式類似：

log_format main '$remote_addr - $remote_user [$time_local] "$request" '
                '$status $body_bytes_sent "$http_referer" '
                '"$http_user_agent" "$http_x_forwarded_for"';

假設(shè)我們的日志文件名為access.log。

Shell腳本實現(xiàn)

接下來，我們編寫一個Shell腳本，對Nginx日志進行統(tǒng)計分析。這個腳本包括以下功能：

統(tǒng)計各種狀態(tài)碼的數(shù)量
統(tǒng)計訪問最多的Referer
統(tǒng)計訪問最高的URI
統(tǒng)計訪問最多的IP和User-Agent
統(tǒng)計每分鐘的請求數(shù)、流量、請求時間、狀態(tài)碼等

腳本代碼實現(xiàn)：

1.統(tǒng)計各種狀態(tài)碼的數(shù)量：

awk '
{
  Arry[$12] += 1;  
  total++;  
}
END {
  for (s in Arry) {
    printf "%d\t%.4f\t%s\n", Arry[s], Arry[s] / total, s
  }
}
'$LOG_FILE | sort -nr -k 1,1

① Arry[$12] += 1;:

$12 是日志文件的第十二個字段，通常表示 HTTP 狀態(tài)碼。
Arry 是一個關(guān)聯(lián)數(shù)組，以 HTTP 狀態(tài)碼為鍵，將每個狀態(tài)碼出現(xiàn)的次數(shù)累加到數(shù)組 Arry 中。
Arry[$12] += 1; 表示狀態(tài)碼 $12 出現(xiàn)的次數(shù)加 1。

② total++;:

記錄總的日志行數(shù)。

③ for (s in Arry):

遍歷數(shù)組 Arry 中的每個狀態(tài)碼 s。

④ printf "%d\t%.4f\t%s\n", Arry[s], Arry[s] / total, s:

打印每個狀態(tài)碼的出現(xiàn)次數(shù)、占比和狀態(tài)碼本身。
Arry[s] 是狀態(tài)碼 s 出現(xiàn)的次數(shù)。
Arry[s] / total 是該狀態(tài)碼出現(xiàn)的比例（占總請求數(shù)的百分比）。
s 是狀態(tài)碼。
輸出格式為：出現(xiàn)次數(shù)\t 比例\t 狀態(tài)碼。

運行上述的命令，輸出如下結(jié)果：

統(tǒng)計各種狀態(tài)碼的數(shù)量

2.統(tǒng)計訪問最多的Referer

awk -F\" '
    {
    Arry[$4] += 1;  # 將每個引用的字段（$4）出現(xiàn)的次數(shù)累加到數(shù)組Arry中
    total++;        # 記錄總的日志行數(shù)
    }
    END {
    for (s in Arry) {  # 遍歷數(shù)組Arry中的每個引用字段
        printf "%d\t%.4f\t%s\n", Arry[s], Arry[s] / total, s  # 打印每個引用字段的出現(xiàn)次數(shù)、占比和引用字段本身
    }
    }
    ' $LOG_FILE | sort -nr -k 1,1  # 按出現(xiàn)次數(shù)降序排序

執(zhí)行上述命令后，輸出如下圖的結(jié)果：

統(tǒng)計訪問最多的Referer

3.統(tǒng)計訪問最高的URI

awk  '
    {
    Arry[$9] += 1;  # 將每個引用的字段（$18）出現(xiàn)的次數(shù)累加到數(shù)組Arry中
    total++;        # 記錄總的日志行數(shù)
    }
    END {
    for (s in Arry) {  # 遍歷數(shù)組Arry中的每個引用字段
        printf "%d\t%.4f\t%s\n", Arry[s], Arry[s] / total, s  # 打印每個引用字段的出現(xiàn)次數(shù)、占比和引用字段本身
    }
    }
    '$LOG_FILE | sort -nr -k 1  # 按出現(xiàn)次數(shù)降序排序

執(zhí)行上述命令后，輸出如下圖的結(jié)果：

統(tǒng)計訪問最高的URI

4.統(tǒng)計訪問最多的IP和User-Agent

(1) 統(tǒng)計最多IP訪問次數(shù)

awk '
    {
    Arry[$1] += 1;  # 將每個IP地址出現(xiàn)的次數(shù)累加到數(shù)組Arry中
    total++;        # 記錄總的日志行數(shù)
    }
    END {
    for (s in Arry) {  # 遍歷數(shù)組Arry中的每個IP地址
        printf "%d\t%.4f\t%s\n", Arry[s], Arry[s] / total, s  # 打印每個IP地址的出現(xiàn)次數(shù)、占比和IP地址本身
    }
    }
    '$LOG_FILE | sort -nr -k 1,1

執(zhí)行上述命令后，輸出如下圖的結(jié)果：

統(tǒng)計最多IP訪問次數(shù)

(2) 統(tǒng)計最多訪問的User-Agent

awk  '
    {
    Arry[$18] += 1;  # 將每個引用的字段（$18）出現(xiàn)的次數(shù)累加到數(shù)組Arry中
    total++;        # 記錄總的日志行數(shù)
    }
    END {
    for (s in Arry) {  # 遍歷數(shù)組Arry中的每個引用字段
        printf "%d\t%.4f\t%s\n", Arry[s], Arry[s] / total, s  # 打印每個引用字段的出現(xiàn)次數(shù)、占比和引用字段本身
    }
    }
    '$LOG_FILE | sort -nr -k 1  # 按出現(xiàn)次數(shù)降序排序

執(zhí)行上述命令后，輸出如下圖的結(jié)果：

統(tǒng)計訪問統(tǒng)計訪問

5.統(tǒng)計每分鐘的請求數(shù)、流量、請求時間、狀態(tài)碼等

awk -F '|''
  BEGIN {
    printf "時間\t數(shù)量\t流量[MB]\t請求時間\t20x\t30x\t40x\t50x\t60x\n"
  }
  {
    # 提取時間的分鐘部分
    minute = substr($2, 12, 5)

    # 累計流量、請求數(shù)和請求時間
    tms[minute] += $13
    cnt[minute] += 1
    reqt[minute] += $15

    # 統(tǒng)計狀態(tài)碼
    status_code = $9
    if (status_code ~ /^2/) { sc20x[minute]++ }
    else if (status_code ~ /^3/) { sc30x[minute]++ }
    else if (status_code ~ /^4/) { sc40x[minute]++ }
    else if (status_code ~ /^5/) { sc50x[minute]++ }
    else { sc60x[minute]++ }
  }
  END {
    for (t in tms) {
      printf "%s\t%d\t%.4f\t%.4f\t%d\t%d\t%d\t%d\t%d\n",
             t,
             cnt[t],
             tms[t] / 1024 / 1024,
             (cnt[t] > 0 ? reqt[t] / cnt[t] : 0),
             sc20x[t],
             sc30x[t],
             sc40x[t],
             sc50x[t],
             sc60x[t]
    }
  }
  '"$LOG_FILE"

執(zhí)行上述命令后，輸出如下結(jié)果：

總結(jié)

通過上述Shell腳本，我們可以快速、全面地分析Nginx日志，了解網(wǎng)站的訪問情況和性能表現(xiàn)。這不僅有助于我們發(fā)現(xiàn)潛在問題，還能為后續(xù)的優(yōu)化工作提供有力的數(shù)據(jù)支持。在實際應(yīng)用中，你可以根據(jù)自己的需求，進一步擴展和定制這個腳本。

腳本獲取方式

上述腳本已經(jīng)上傳上傳到gitee,有需要的小伙伴可以自行獲取。gitee上的倉庫主要是分享一些工作中常用的腳本。小伙伴可以frok或者watch倉庫，這樣有更新可以及時關(guān)注到。

腳本倉庫

倉庫地址：https://gitee.com/didiplus/script

責(zé)任編輯：趙寧寧來源：攻城獅成長日記

Nginx HTTP 日志

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營