自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="8f7dq"></pre>

<legend id="8f7dq"><abbr id="8f7dq"></abbr></legend>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Python CSV 和 JSON 格式高級(jí)處理（上）

作者：你的老師父 2023-06-06 08:21:56

開(kāi)發(fā) 前端

我們經(jīng)常需要對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行高級(jí)處理，以獲得更有用的信息或更好的數(shù)據(jù)分析結(jié)果。例如，我們可能需要從一個(gè)大型的數(shù)據(jù)集中提取特定的數(shù)據(jù)，過(guò)濾掉不需要的信息，或者將數(shù)據(jù)轉(zhuǎn)換為其他格式。這些操作需要使用一些高級(jí)的技術(shù)和工具來(lái)完成。

CSV（Comma-Separated Values）和 JSON（JavaScript Object Notation）是兩種常見(jiàn)的數(shù)據(jù)格式，它們?cè)跀?shù)據(jù)交換和存儲(chǔ)中都有著廣泛的應(yīng)用。CSV 是一種基于純文本的表格格式，通常用于表示簡(jiǎn)單的表格數(shù)據(jù)；JSON 則是一種輕量級(jí)的數(shù)據(jù)交換格式，用于表示復(fù)雜的結(jié)構(gòu)化數(shù)據(jù)。

在實(shí)際應(yīng)用中，我們經(jīng)常需要對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行高級(jí)處理，以獲得更有用的信息或更好的數(shù)據(jù)分析結(jié)果。例如，我們可能需要從一個(gè)大型的數(shù)據(jù)集中提取特定的數(shù)據(jù)，過(guò)濾掉不需要的信息，或者將數(shù)據(jù)轉(zhuǎn)換為其他格式。這些操作需要使用一些高級(jí)的技術(shù)和工具來(lái)完成。

如何在 Python 中讀取和寫入 CSV 和 JSON 文件

在 Python 中，我們可以使用內(nèi)置的 csv 和 json 模塊來(lái)讀取和寫入 CSV 和 JSON 文件。csv 模塊提供了一組函數(shù)來(lái)處理 CSV 格式的數(shù)據(jù)，如 csv.reader()、csv.writer() 等；json 模塊則提供了一組函數(shù)來(lái)解析和生成 JSON 格式的數(shù)據(jù)，如 json.loads()、json.dumps() 等。

下面是一個(gè)示例代碼，演示如何使用 csv 和 json 模塊讀取和寫入 CSV 和 JSON 文件：

import csv
import json

# 讀取 CSV 文件
with open('data.csv', 'r') as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row)

# 寫入 CSV 文件
with open('data.csv', 'w', newline='') as f:
    fieldnames = ['name', 'age']
    writer = csv.DictWriter(f, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerow({'name': 'Alice', 'age': 23})
    writer.writerow({'name': 'Bob', 'age': 30})

# 讀取 JSON 文件
with open('data.json', 'r') as f:
    data = json.load(f)
    print(data)

# 寫入 JSON 文件
data = [{'name': 'Alice', 'age': 23}, {'name': 'Bob', 'age': 30}]
with open('data.json', 'w') as f:
    json.dump(data, f)

在這個(gè)例子中，我們首先使用 csv.DictReader() 函數(shù)讀取一個(gè)名為 data.csv 的 CSV 文件，并將其轉(zhuǎn)換為 Python 字典類型。然后，我們又使用 csv.DictWriter() 函數(shù)創(chuàng)建一個(gè)新的 CSV 文件，并向其中寫入一些數(shù)據(jù)。接著，我們使用 json.load() 函數(shù)讀取一個(gè)名為 data.json 的 JSON 文件，并將其轉(zhuǎn)換為 Python 對(duì)象。最后，我們又使用 json.dump() 函數(shù)將 Python 對(duì)象寫入到一個(gè)名為 data.json 的 JSON 文件中。

常見(jiàn)的數(shù)據(jù)處理操作（如排序、過(guò)濾、分析等）

除了讀取和寫入 CSV 和 JSON 文件之外，我們還需要進(jìn)行一些常見(jiàn)的數(shù)據(jù)處理操作，如排序、過(guò)濾、分析等。在 Python 中，我們可以使用內(nèi)置的列表和字典類型，以及一些特殊的數(shù)據(jù)處理工具來(lái)完成這些操作。

排序

在 Python 中，我們可以使用 sorted() 函數(shù)對(duì)列表進(jìn)行排序，或者使用列表類型的 sort() 方法對(duì)列表進(jìn)行就地排序。例如：

data = [{'name': 'Alice', 'age': 23}, {'name': 'Bob', 'age': 30}]
# 按年齡升序排序
sorted_data = sorted(data, key=lambda x: x['age'])
# 就地按年齡降序排序
data.sort(key=lambda x: x['age'], reverse=True)

在這個(gè)例子中，我們首先定義了一個(gè)包含兩個(gè)字典元素的列表 data。然后，我們又分別使用 sorted() 函數(shù)和 sort() 方法對(duì)列表 data 進(jìn)行排序操作。在這里，我們使用了一個(gè) lambda 函數(shù)來(lái)指定排序的關(guān)鍵字，也就是每個(gè)字典元素中的 'age' 值。

過(guò)濾

在 Python 中，我們可以使用列表推導(dǎo)式、filter() 函數(shù)等方式對(duì)列表進(jìn)行過(guò)濾操作。例如：

data = [{'name': 'Alice', 'age': 23}, {'name': 'Bob', 'age': 30}]
# 列表推導(dǎo)式實(shí)現(xiàn)過(guò)濾
filtered_data = [d for d in data if d['age'] < 30]
# filter() 函數(shù)實(shí)現(xiàn)過(guò)濾
filtered_data = list(filter(lambda x: x['age'] < 30, data))

在這個(gè)例子中，我們同樣定義了一個(gè)包含兩個(gè)字典元素的列表 data。然后，我們使用列表推導(dǎo)式和 filter() 函數(shù)分別對(duì)列表 data 進(jìn)行過(guò)濾操作，只保留年齡小于 30 的字典元素。

分析

在Python中，我們可以使用 pandas 等數(shù)據(jù)分析庫(kù)對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行更加復(fù)雜的分析操作。例如：

import pandas as pd

# 讀取 CSV 文件并進(jìn)行分析
data = pd.read_csv('data.csv')
# 輸出前 5 行數(shù)據(jù)
print(data.head())
# 對(duì)年齡字段進(jìn)行統(tǒng)計(jì)分析
print(data['age'].describe())

# 讀取 JSON 文件并進(jìn)行分析
with open('data.json', 'r') as f:
    data = json.load(f)
# 轉(zhuǎn)換為 pandas DataFrame 格式
df = pd.DataFrame(data)
# 輸出前 5 行數(shù)據(jù)
print(df.head())
# 對(duì)年齡字段進(jìn)行統(tǒng)計(jì)分析
print(df['age'].describe())

在這個(gè)例子中，我們首先使用 pandas 庫(kù)中的 read_csv() 函數(shù)和 JSON 模塊中的 load() 函數(shù)分別讀取一個(gè)名為 data.csv 和 data.json 的文件，并將其轉(zhuǎn)換為 pandas DataFrame 格式。然后，我們又分別對(duì) DataFrame 中的數(shù)據(jù)進(jìn)行了一些簡(jiǎn)單的分析操作，如輸出前 5 行數(shù)據(jù)、對(duì)年齡字段進(jìn)行統(tǒng)計(jì)分析等。

示例代碼

下面是一個(gè)完整的示例代碼，演示了如何對(duì) CSV 和 JSON 文件進(jìn)行高級(jí)操作：

import csv
import json
import pandas as pd

# 讀取 CSV 文件
with open('data.csv', 'r') as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row)

# 寫入 CSV 文件
with open('data.csv', 'w', newline='') as f:
    fieldnames = ['name', 'age']
    writer = csv.DictWriter(f, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerow({'name': 'Alice', 'age': 23})
    writer.writerow({'name': 'Bob', 'age': 30})

# 讀取 JSON 文件
with open('data.json', 'r') as f:
    data = json.load(f)
    print(data)

# 寫入 JSON 文件
data = [{'name': 'Alice', 'age': 23}, {'name': 'Bob', 'age': 30}]
with open('data.json', 'w') as f:
    json.dump(data, f)

# 排序
data = [{'name': 'Alice', 'age': 23}, {'name': 'Bob', 'age': 30}]
# 按年齡升序排序
sorted_data = sorted(data, key=lambda x: x['age'])
# 就地按年齡降序排序
data.sort(key=lambda x: x['age'], reverse=True)

# 過(guò)濾
data = [{'name': 'Alice', 'age': 23}, {'name': 'Bob', 'age': 30}]
# 列表推導(dǎo)式實(shí)現(xiàn)過(guò)濾
filtered_data = [d for d in data if d['age'] < 30]
# filter() 函數(shù)實(shí)現(xiàn)過(guò)濾
filtered_data = list(filter(lambda x: x['age'] < 30, data))

# 分析
# 讀取 CSV 文件并進(jìn)行分析
data = pd.read_csv('data.csv')
# 輸出前 5 行數(shù)據(jù)
print(data.head())
# 對(duì)年齡字段進(jìn)行統(tǒng)計(jì)分析
print(data['age'].describe())

# 讀取 JSON 文件并進(jìn)行分析
with open('data.json', 'r') as f:
    data = json.load(f)
# 轉(zhuǎn)換為 pandas DataFrame 格式
df = pd.DataFrame(data)
# 輸出前 5 行數(shù)據(jù)
print(df.head())
# 對(duì)年齡字段進(jìn)行統(tǒng)計(jì)分析
print(df['age'].describe())

在這個(gè)示例代碼中，我們首先使用 csv 和 json 模塊讀取和寫入了一個(gè)名為 data.csv 和 data.json 的文件。接著，我們又使用 Python 內(nèi)置的函數(shù)和工具對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行了一些常見(jiàn)的處理操作，如排序、過(guò)濾和分析等。最后，我們還使用了 pandas 庫(kù)對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行了更加復(fù)雜的分析操作。

數(shù)據(jù)清洗和轉(zhuǎn)換

數(shù)據(jù)清洗和轉(zhuǎn)換的必要性和應(yīng)用場(chǎng)景

在實(shí)際數(shù)據(jù)分析中，數(shù)據(jù)的質(zhì)量和準(zhǔn)確性對(duì)最終的結(jié)果影響至關(guān)重要。因此，在進(jìn)行數(shù)據(jù)分析之前，我們需要對(duì)原始數(shù)據(jù)進(jìn)行一些預(yù)處理工作，以確保數(shù)據(jù)的完整性、一致性和準(zhǔn)確性。

數(shù)據(jù)清洗和轉(zhuǎn)換是數(shù)據(jù)預(yù)處理過(guò)程中最為重要的環(huán)節(jié)之一。它包括處理缺失值、異常值、重復(fù)值等問(wèn)題，將數(shù)據(jù)從一種格式轉(zhuǎn)換為另一種格式，或者將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、歸一化等操作。

數(shù)據(jù)清洗和轉(zhuǎn)換的應(yīng)用場(chǎng)景非常廣泛，比如：

處理來(lái)自不同來(lái)源、格式不統(tǒng)一的數(shù)據(jù)
清除無(wú)效、冗余或者錯(cuò)誤的數(shù)據(jù)
處理缺失值、異常值、重復(fù)值等問(wèn)題
將數(shù)據(jù)轉(zhuǎn)換為適合特定分析算法的格式
通過(guò)標(biāo)準(zhǔn)化、歸一化等操作提高數(shù)據(jù)的可比性和可解釋性

如何使用 Python 對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換

在 Python 中，我們可以使用 pandas 庫(kù)對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換。pandas 是一個(gè)強(qiáng)大的數(shù)據(jù)處理和數(shù)據(jù)分析庫(kù)，提供了一組豐富的函數(shù)和工具，可以方便地進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)分析和數(shù)據(jù)可視化等操作。

下面是一個(gè)示例代碼，演示了如何使用 pandas 對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換：

import pandas as pd

# 讀取 CSV 文件并進(jìn)行清洗和轉(zhuǎn)換
data = pd.read_csv('data.csv')
# 處理缺失值
data.dropna(inplace=True)
# 處理異常值
data = data[(data['age'] >= 0) & (data['age'] <= 120)]
# 處理重復(fù)值
data.drop_duplicates(subset=['name'], inplace=True)
# 將數(shù)據(jù)轉(zhuǎn)換為特定格式
data['age_category'] = pd.cut(data['age'], bins=[0, 18, 30, 50, 100], labels=['child', 'young', 'middle', 'old'])

# 讀取 JSON 文件并進(jìn)行清洗和轉(zhuǎn)換
with open('data.json', 'r') as f:
    data = json.load(f)
# 轉(zhuǎn)換為 pandas DataFrame 格式
df = pd.DataFrame(data)
# 處理缺失值
df.dropna(inplace=True)
# 處理異常值
df = df[(df['age'] >= 0) & (df['age'] <= 120)]
# 處理重復(fù)值
df.drop_duplicates(subset=['name'], inplace=True)
# 將數(shù)據(jù)轉(zhuǎn)換為特定格式
df['age_category'] = pd.cut(df['age'], bins=[0, 18, 30, 50, 100], labels=['child', 'young', 'middle', 'old'])

在這個(gè)示例代碼中，我們首先使用 pandas 庫(kù)中的 read_csv() 函數(shù)和 JSON 模塊中的 load() 函數(shù)讀取一個(gè)名為 data.csv 和 data.json 的文件，并將其轉(zhuǎn)換為 pandas DataFrame 格式。然后，我們又使用了一些 pandas 中的函數(shù)和工具對(duì)數(shù)據(jù)進(jìn)行了清洗和轉(zhuǎn)換操作，如處理缺失值、異常值、重復(fù)值等問(wèn)題，將數(shù)據(jù)轉(zhuǎn)換為特定格式等。

實(shí)例代碼

下面是一個(gè)完整的示例代碼，演示了如何在 Python 中對(duì) CSV 和 JSON 數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和轉(zhuǎn)換：

import csv
import json
import pandas as pd

# 讀取 CSV 文件并進(jìn)行清洗和轉(zhuǎn)換
with open('data.csv', 'r') as f:
    reader = csv.DictReader(f)
    data = [row for row in reader]
df = pd.DataFrame(data)
# 處理缺失值
df.dropna(inplace=True)
# 處理異常值
df = df[(df['age'] >= 0) & (df['age'] <= 120)]
# 處理重復(fù)值
df.drop_duplicates(subset=['name'], inplace=True)
# 將數(shù)據(jù)轉(zhuǎn)換為特定格式
df['age_category'] = pd.cut(df['age'], bins=[0, 18, 30, 50, 100], labels=['child', 'young', 'middle', 'old'])

# 寫入 CSV 文件
df.to_csv('cleaned_data.csv', index=False)

# 讀取 JSON 文件并進(jìn)行清洗和轉(zhuǎn)換
with open('data.json', 'r') as f:
    data = json.load(f)
df = pd.DataFrame(data)
# 處理缺失值
df.dropna(inplace=True)
# 處理異常值
df = df[(df['age'] >= 0) & (df['age'] <= 120)]
# 處理重復(fù)值
df.drop_duplicates(subset=['name'], inplace=True)
# 將數(shù)據(jù)轉(zhuǎn)換為特定格式
df['age_category'] = pd.cut(df['age'], bins=[0, 18, 30, 50, 100], labels=['child', 'young', 'middle', 'old'])

# 寫入 JSON 文件
with open('cleaned_data.json', 'w') as f:
    json.dump(df.to_dict(orient='records'), f)

在這個(gè)示例代碼中，我們首先使用 csv 和 json 模塊讀取了一個(gè)名為 data.csv 和 data.json 的文件，并將其轉(zhuǎn)換為 pandas DataFrame 格式。然后，我們又使用了一些 pandas 中的函數(shù)和工具對(duì)數(shù)據(jù)進(jìn)行了清洗和轉(zhuǎn)換操作，如處理缺失值、異常值、重復(fù)值等問(wèn)題，將數(shù)據(jù)轉(zhuǎn)換為特定格式等。最后，我們又使用 csv 和 json 模塊將清洗后的數(shù)據(jù)寫入到了兩個(gè)不同的文件中，分別是 cleaned_data.csv 和 cleaned_data.json。

責(zé)任編輯：姜華來(lái)源：今日頭條

CSV JSON Python

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)