自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

盤一盤 Python 的 itertools：數(shù)據(jù)分組

作者：數(shù)據(jù)大宇宙 2025-01-08 17:20:00

分組處理數(shù)據(jù)，你只會使用 pandas? 那你就錯了。其實不借助第三方庫，我們也可以輕松實現(xiàn)數(shù)據(jù)分組。

分組處理數(shù)據(jù)，你只會使用 pandas? 那你就錯了。其實不借助第三方庫，我們也可以輕松實現(xiàn)數(shù)據(jù)分組。

今天內(nèi)容：

使用字典做數(shù)據(jù)分組
使用 itertools 的 groupby 實現(xiàn)數(shù)據(jù)分組
如何封裝函數(shù)，使其更具通用性

分組

字典是python中非常常用的一種數(shù)據(jù)結(jié)構(gòu)。我們可以用字典來實現(xiàn)數(shù)據(jù)分組。

比如，我們有這樣一個列表：

people_list = [
    {'姓名': '張三', '性別': '男', '年齡': '25'},
    {'姓名': '李四', '性別': '女', '年齡': '30'},
    {'姓名': '王五', '性別': '男', '年齡': '22'},
    {'姓名': '趙六', '性別': '女', '年齡': '28'},
    {'姓名': '周六', '性別': '女', '年齡': '26'},
    {'姓名': '陳七', '性別': '男', '年齡': '24'},
    {'姓名': '楊八', '性別': '女', '年齡': '27'},
]

我們想按照性別分組，統(tǒng)計平級年齡和人數(shù)。

使用字典的實現(xiàn)方式：

結(jié)果：

現(xiàn)在結(jié)果字典有兩項數(shù)據(jù)(男性和女性)，分別對應(yīng)著兩個列表(里面就是該性別的數(shù)據(jù)，是一個個字典)。

上面代碼，可以使用 defaultdict 改進：

行21: 當(dāng)訪問一個不存在的鍵時，defaultdict 會自動創(chuàng)建一個空列表，并返回它。

如果不想使用字典，而是想使用 itertools 的 groupby 實現(xiàn)，可以這樣：

行15：分組前對數(shù)據(jù)做排序才行

封裝函數(shù)

現(xiàn)在已經(jīng)對數(shù)據(jù)進行了分組，所謂的分組統(tǒng)計(平級年齡和人數(shù))，只不過是對每個性別的列表進行遍歷，統(tǒng)計每個人的年齡，然后求和。

但統(tǒng)計處理多種多樣，為此我們可以封裝成通用的函數(shù)。

假設(shè)封裝的函數(shù)叫 group_by ,看看我們期待的使用方式：

行9：參數(shù) by ：指定分組的字段，也可以指定多個字段，比如 by=["性別", "年齡"] 。
行9：參數(shù) aggregate ：指定聚合函數(shù)。

確定了使用方式，那么我們可以開始封裝函數(shù)：

行20-23：讓參數(shù) by 支持單個字符串或多列分組
行29：再次遍歷分組的結(jié)果，然后應(yīng)用聚合函數(shù)

責(zé)任編輯：趙寧寧來源：數(shù)據(jù)大宇宙

pytho 數(shù)據(jù)分組 itertools

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="u3vh9"></cite>