自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="jo178"><p id="jo178"><th id="jo178"></th></p></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Python兩個(gè)Excel多Sheet數(shù)據(jù)對(duì)比

作者：華安9527 2024-07-16 16:20:19

開(kāi)發(fā) 前端

在數(shù)據(jù)處理與分析中，經(jīng)常需要比較來(lái)自不同來(lái)源的數(shù)據(jù)集，特別是在處理涉及多個(gè)Excel工作簿和工作表的場(chǎng)景時(shí)。

在數(shù)據(jù)處理與分析中，經(jīng)常需要比較來(lái)自不同來(lái)源的數(shù)據(jù)集，特別是在處理涉及多個(gè)Excel工作簿和工作表的場(chǎng)景時(shí)。Python的Pandas庫(kù)提供了強(qiáng)大的工具，可以幫助我們高效地完成這一任務(wù)。下面，我們將一步步引導(dǎo)你如何使用Python對(duì)比兩個(gè)Excel文件中多個(gè)Sheet的數(shù)據(jù)。

第一步：安裝必要的庫(kù)

確保你的Python環(huán)境中已安裝pandas和openpyxl。如果沒(méi)有安裝，可以通過(guò)以下命令安裝：

pip install pandas openpyxl

第二步：讀取Excel文件中的多個(gè)Sheet

使用pandas.ExcelFile或pandas.read_excel直接讀取多個(gè)Sheet的數(shù)據(jù)。

import pandas as pd
# 讀取第一個(gè)Excel文件的所有Sheet
xlsx1 = pd.ExcelFile('file1.xlsx')
sheets1 = {sheet_name: xlsx1.parse(sheet_name) for sheet_name in xlsx1.sheet_names}
# 讀取第二個(gè)Excel文件的所有Sheet
xlsx2 = pd.ExcelFile('file2.xlsx')
sheets2 = {sheet_name: xlsx2.parse(sheet_name) for sheet_name in xlsx2.sheet_names}

第三步：對(duì)比數(shù)據(jù)

對(duì)比兩個(gè)Excel文件中相同名稱的Sheet。我們可以逐個(gè)Sheet進(jìn)行對(duì)比，尋找不一致的數(shù)據(jù)行。


# 創(chuàng)建一個(gè)空的字典來(lái)存儲(chǔ)對(duì)比結(jié)果
comparison_results = {}
for sheet_name in sheets1.keys():
    if sheet_name in sheets2:
        # 如果兩個(gè)文件都有相同的Sheet，則進(jìn)行對(duì)比
        df1 = sheets1[sheet_name]
        df2 = sheets2[sheet_name]
        # 比較兩個(gè)DataFrame
        comparison = df1.merge(df2, how='outer', indicator=True)
        comparison_results[sheet_name] = comparison[comparison['_merge'] != 'both']

第四步：分析差異

上述對(duì)比會(huì)返回一個(gè)新DataFrame，其中包含標(biāo)記為left_only或right_only的行，表示只在左側(cè)或右側(cè)數(shù)據(jù)集中存在。此外，還可以通過(guò)left和right后綴訪問(wèn)原始數(shù)據(jù)列。


# 分析差異
for sheet_name, result in comparison_results.items():
    if not result.empty:
        print(f"Differences found in '{sheet_name}':")
        print(result)

第五步：保存對(duì)比結(jié)果

將對(duì)比結(jié)果保存到新的Excel文件中，便于后續(xù)分析或報(bào)告。


with pd.ExcelWriter('comparison_results.xlsx') as writer:
    for sheet_name, result in comparison_results.items():
        if not result.empty:
            result.to_excel(writer, sheet_name=sheet_name, index=False)

完整代碼示例

下面是將上述步驟整合在一起的完整代碼示例：


import pandas as pd
# 讀取Excel文件
xlsx1 = pd.ExcelFile('file1.xlsx')
xlsx2 = pd.ExcelFile('file2.xlsx')
# 讀取所有Sheet
sheets1 = {sheet_name: xlsx1.parse(sheet_name) for sheet_name in xlsx1.sheet_names}
sheets2 = {sheet_name: xlsx2.parse(sheet_name) for sheet_name in xlsx2.sheet_names}
# 創(chuàng)建一個(gè)空的字典來(lái)存儲(chǔ)對(duì)比結(jié)果
comparison_results = {}
# 對(duì)比數(shù)據(jù)
for sheet_name in sheets1.keys():
    if sheet_name in sheets2:
        df1 = sheets1[sheet_name]
        df2 = sheets2[sheet_name]
        comparison = df1.merge(df2, how='outer', indicator=True)
        comparison_results[sheet_name] = comparison[comparison['_merge'] != 'both']
# 保存對(duì)比結(jié)果
with pd.ExcelWriter('comparison_results.xlsx') as writer:
    for sheet_name, result in comparison_results.items():
        if not result.empty:
            result.to_excel(writer, sheet_name=sheet_name, index=False)

通過(guò)上述步驟，你可以有效地對(duì)比兩個(gè)Excel文件中多個(gè)Sheet的數(shù)據(jù)，找出差異并保存結(jié)果。這種方法特別適用于財(cái)務(wù)審計(jì)、數(shù)據(jù)清洗或任何需要跨數(shù)據(jù)集一致性檢查的場(chǎng)景。

希望這篇指南能夠幫助你在Python中處理復(fù)雜的Excel數(shù)據(jù)對(duì)比任務(wù)。

責(zé)任編輯：華軒來(lái)源：測(cè)試開(kāi)發(fā)學(xué)習(xí)交流

Python 數(shù)據(jù)集

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)