自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="c6dy4"><p id="c6dy4"></p></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Python CSV 和 JSON 格式高級(jí)處理（下）

作者：你的老師父 2023-06-07 08:50:40

開(kāi)發(fā) 前端

本篇博客介紹Python中CSV和JSON格式的高級(jí)處理方法，包括如何識(shí)別和處理不同編碼和分隔符的文件，以及如何使用pandas模塊讀寫(xiě)和處理CSV和JSON文件。

分隔符和編碼

了解不同分隔符和編碼的應(yīng)用

接上篇CSV（Comma Separated Values）和JSON（JavaScript Object Notation）是常見(jiàn)的數(shù)據(jù)交換格式。CSV文件是以逗號(hào)作為字段之間的分隔符，每行表示一個(gè)記錄，每個(gè)字段可以通過(guò)引號(hào)來(lái)進(jìn)行引用。而JSON文件則采用鍵值對(duì)的方式來(lái)表示數(shù)據(jù)，每個(gè)鍵值對(duì)之間使用逗號(hào)進(jìn)行分隔，多個(gè)鍵值對(duì)組合成一個(gè)對(duì)象。

在實(shí)際應(yīng)用過(guò)程中，我們可能遇到各種不同的分隔符和編碼的CSV和JSON文件，例如分隔符可以是制表符、空格或其他字符，編碼可以是UTF-8、GBK等等。因此需要了解并正確識(shí)別這些分隔符和編碼，才能準(zhǔn)確地讀取和處理這些文件。

如何識(shí)別和處理不同編碼的 CSV 和 JSON 文件

Python提供了一些內(nèi)置庫(kù)來(lái)幫助我們讀取和處理CSV和JSON文件。其中，csv模塊用于讀寫(xiě)CSV文件，json模塊用于讀寫(xiě)JSON文件。

CSV文件的讀取和處理

在使用csv模塊讀取CSV文件時(shí)，需要指定文件的編碼和分隔符，通常情況下默認(rèn)的編碼為utf-8，分隔符為逗號(hào)。如果需要使用其他編碼和分隔符，可以通過(guò)設(shè)置相應(yīng)的參數(shù)來(lái)實(shí)現(xiàn)。下面是一個(gè)讀取CSV文件的示例代碼：

import csv

with open('data.csv', 'r', encoding='utf-8') as f:
    reader = csv.reader(f, delimiter=',')
    for row in reader:
        print(row)

在這個(gè)示例中，我們使用了csv.reader()函數(shù)來(lái)打開(kāi)并讀取文件，其中delimiter參數(shù)指定了分隔符為逗號(hào)。如果需要使用其他分隔符，只需將該參數(shù)設(shè)置為相應(yīng)的值即可。

JSON文件的讀取和處理

在使用json模塊讀取JSON文件時(shí)，需要注意文件的編碼格式。通常情況下，JSON文件采用UTF-8編碼，可以直接使用json.load()函數(shù)從文件中讀取數(shù)據(jù)。如果使用其他編碼格式，則需要先將文件內(nèi)容解碼為UTF-8編碼后再進(jìn)行操作。

下面是一個(gè)讀取JSON文件的示例代碼：

import json

with open('data.json', 'r', encoding='utf-8') as f:
    data = json.load(f)
    print(data)

在這個(gè)示例中，我們使用了json.load()函數(shù)來(lái)從文件中讀取JSON數(shù)據(jù)。

如何自定義分隔符和編碼

除了使用默認(rèn)的分隔符和編碼外，我們還可以根據(jù)需要自定義分隔符和編碼。在csv模塊中，通過(guò)設(shè)置dialect對(duì)象來(lái)實(shí)現(xiàn)自定義分隔符。例如，如果要使用制表符作為分隔符，可以使用如下代碼：

import csv

csv.register_dialect('mydialect', delimiter='\t')

with open('data.csv', 'r', encoding='utf-8') as f:
    reader = csv.reader(f, dialect='mydialect')
    for row in reader:
        print(row)

在這個(gè)示例中，我們使用了csv.register_dialect()函數(shù)來(lái)注冊(cè)一個(gè)新的dialect對(duì)象，并將分隔符設(shè)置為制表符。然后，在讀取CSV文件時(shí)，通過(guò)設(shè)置dialect參數(shù)來(lái)指定使用該dialect對(duì)象。

在處理JSON文件時(shí)，如果需要自定義編碼，則可以使用json.loads()函數(shù)來(lái)手動(dòng)解碼文件內(nèi)容。例如，如果要將GBK編碼的JSON文件轉(zhuǎn)換為UTF-8編碼的Python對(duì)象，可以使用如下代碼：

import json

with open('data.json', 'r', encoding='gbk') as f:
    content = f.read()
    data = json.loads(content.encode('utf-8').decode('unicode_escape'))
    print(data)

在這個(gè)示例中，我們首先將文件內(nèi)容讀取出來(lái)，并使用encode()函數(shù)將其轉(zhuǎn)換為bytes類(lèi)型的數(shù)據(jù)。然后，使用decode()函數(shù)將其解碼為unicode編碼格式的字符串。最后，使用json.loads()函數(shù)將該字符串轉(zhuǎn)換為Python對(duì)象。

pandas 中的 CSV 和 JSON 讀寫(xiě)

pandas 模塊的介紹和應(yīng)用場(chǎng)景

pandas是Python中一個(gè)非常強(qiáng)大的數(shù)據(jù)處理庫(kù)，它提供了靈活高效的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具，適用于各種數(shù)據(jù)清洗、處理和分析的任務(wù)。其中，最常用的數(shù)據(jù)結(jié)構(gòu)為DataFrame和Series，可以方便地處理各種表格型數(shù)據(jù)和時(shí)間序列數(shù)據(jù)。

pandas模塊在讀寫(xiě)CSV和JSON文件方面也提供了非常便捷的方法，比如read_csv()和read_json()函數(shù)可以自動(dòng)將文件加載到DataFrame對(duì)象中，而to_csv()和to_json()函數(shù)則可以將DataFrame對(duì)象保存為CSV和JSON文件。

如何使用 pandas 讀寫(xiě) CSV 和 JSON 文件

在使用pandas讀取CSV文件時(shí)，可以直接使用read_csv()函數(shù)加載文件并返回一個(gè)DataFrame對(duì)象。下面是一個(gè)讀取CSV文件的示例代碼：

import pandas as pd

df = pd.read_csv('data.csv', encoding='utf-8')
print(df.head())

在這個(gè)示例中，我們使用了pd.read_csv()函數(shù)來(lái)讀取CSV文件，并將返回值賦給一個(gè)DataFrame對(duì)象。如果需要指定分隔符，則可以使用sep參數(shù)來(lái)設(shè)置。例如，如果分隔符為制表符，則可以使用如下代碼：

import pandas as pd

df = pd.read_csv('data.csv', encoding='utf-8', sep='\t')
print(df.head())

在使用pandas讀取JSON文件時(shí)，可以直接使用read_json()函數(shù)加載文件并返回一個(gè)DataFrame對(duì)象。下面是一個(gè)讀取JSON文件的示例代碼：

import pandas as pd

df = pd.read_json('data.json', encoding='utf-8')
print(df.head())

在這個(gè)示例中，我們使用了pd.read_json()函數(shù)來(lái)讀取JSON文件，并將返回值賦給一個(gè)DataFrame對(duì)象。

在使用pandas保存DataFrame對(duì)象到CSV或JSON文件時(shí)，可以使用to_csv()和to_json()函數(shù)。例如，要將DataFrame對(duì)象保存為CSV文件，可以使用如下代碼：

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [20, 30]})
df.to_csv('output.csv', index=False)

在這個(gè)示例中，我們先創(chuàng)建了一個(gè)簡(jiǎn)單的DataFrame對(duì)象，然后使用to_csv()函數(shù)將其保存為CSV文件。其中，index參數(shù)用于控制是否將行索引寫(xiě)入文件中（默認(rèn)為T(mén)rue）。

要將DataFrame對(duì)象保存為JSON文件，可以使用類(lèi)似的方式，例如：

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [20, 30]})
df.to_json('output.json', orient='records')

在這個(gè)示例中，我們使用了orient參數(shù)來(lái)指定JSON格式的輸出方式。默認(rèn)情況下，該參數(shù)為'columns'，表示以列為單位輸出JSON數(shù)據(jù)。如果需要按行輸出，則可以將其設(shè)置為'records'。

pandas 的數(shù)據(jù)清洗和轉(zhuǎn)換功能

除了方便的讀寫(xiě)CSV和JSON文件外，pandas還提供了大量的數(shù)據(jù)處理和轉(zhuǎn)換功能，例如數(shù)據(jù)過(guò)濾、排序、分組、合并等等。下面是一個(gè)簡(jiǎn)單的示例代碼，演示如何使用pandas對(duì)數(shù)據(jù)進(jìn)行過(guò)濾和統(tǒng)計(jì)：

import pandas as pd

df = pd.read_csv('data.csv', encoding='utf-8')
df = df[df['age'] > 20]
print(df.groupby('gender')['height'].mean())

在這個(gè)示例中，我們首先使用pd.read_csv()函數(shù)加載CSV文件，并將返回值賦給一個(gè)DataFrame對(duì)象。然后，使用邏輯運(yùn)算符篩選出年齡大于20歲的數(shù)據(jù)。最后，使用`groupby()`函數(shù)按照性別進(jìn)行分組，并計(jì)算每個(gè)分組中身高的平均值。

除了以上示例，pandas還提供了非常豐富的數(shù)據(jù)清洗和轉(zhuǎn)換功能，例如數(shù)據(jù)透視表、合并、重塑、填充缺失值等等。在實(shí)際應(yīng)用中，可以根據(jù)具體需求選擇相應(yīng)的函數(shù)來(lái)完成數(shù)據(jù)處理任務(wù)。

總結(jié)

本篇博客介紹了Python中CSV和JSON格式的高級(jí)處理方法，包括如何識(shí)別和處理不同編碼和分隔符的文件，以及如何使用pandas模塊讀寫(xiě)和處理CSV和JSON文件。在實(shí)際應(yīng)用中，需要根據(jù)具體需求選擇合適的函數(shù)和參數(shù)來(lái)完成數(shù)據(jù)處理任務(wù)。

責(zé)任編輯：姜華來(lái)源：今日頭條

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<legend id="suc8p"><abbr id="suc8p"></abbr></legend>

<cite id="suc8p"></cite>