自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<tfoot id="ovcau"></tfoot>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

Python讓數(shù)據(jù)處理更簡單的九個代碼片段

作者：手把手PythonAI編程 2024-09-25 14:16:35

本文介紹了九個實用的Python技巧，涵蓋了列表推導式、Pandas庫、NumPy、字典推導式、集合操作、生成器表達式、正則表達式、字典統(tǒng)計以及Pandas的數(shù)據(jù)聚合。

在數(shù)據(jù)處理領域，Python憑借其豐富的庫和簡潔的語法成為眾多開發(fā)者的首選語言。無論是數(shù)據(jù)清洗、統(tǒng)計分析還是復雜的數(shù)據(jù)處理任務，Python都能提供高效的解決方案。本文將介紹九個實用的Python技巧，幫助你簡化日常的數(shù)據(jù)處理工作。

1. 使用列表推導式快速處理數(shù)據(jù)

列表推導式是Python中一種非常強大的工具，它允許我們以簡潔的方式創(chuàng)建新的列表。相比于傳統(tǒng)的循環(huán)結構，列表推導式的語法更加簡潔，同時執(zhí)行效率也更高。

示例：假設我們需要從一個數(shù)字列表中篩選出所有的偶數(shù)。

numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
even_numbers = [num for num in numbers if num % 2 == 0]  # 列表推導式
print(even_numbers)  # 輸出: [2, 4, 6, 8, 10]

這里的[num for num in numbers if num % 2 == 0]就是列表推導式的語法結構，它可以讀作“從numbers中選擇所有能夠被2整除的元素，并將它們放入新列表中”。

2. 利用Pandas庫進行高效的數(shù)據(jù)清洗

Pandas是一個非常流行的Python數(shù)據(jù)分析庫，它提供了大量用于操作表格數(shù)據(jù)的功能。當涉及到數(shù)據(jù)清洗時，Pandas簡直是神器般的存在。

示例：去除DataFrame中的重復行。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice'],
        'Age': [25, 30, 35, 25]}
df = pd.DataFrame(data)

# 去重
df_unique = df.drop_duplicates()
print(df_unique)

運行上述代碼后，你會得到一個沒有重復記錄的新DataFrame：

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35

3. 使用NumPy進行高效的數(shù)組運算

NumPy是Python科學計算的基礎包之一，它支持大量的多維數(shù)組（矩陣）和向量代數(shù)運算。對于那些需要頻繁處理數(shù)值型數(shù)據(jù)的朋友來說，NumPy絕對是不二之選。

示例：計算兩個數(shù)組之間的歐幾里得距離。

import numpy as np

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

distance = np.linalg.norm(a - b)
print(distance)  # 輸出: 5.196152422706632

這里，np.linalg.norm()函數(shù)計算了兩個向量之間的歐氏距離。這個距離可以用來衡量兩組數(shù)據(jù)之間的相似度。

4. 字典推導式輕松完成數(shù)據(jù)映射

除了列表推導式之外，Python還支持字典推導式，這使得我們可以非常方便地創(chuàng)建或修改字典。

示例：根據(jù)給定的鍵值對創(chuàng)建一個新的字典。

keys = ['a', 'b', 'c']
values = [1, 2, 3]

mapped_dict = {key: value for key, value in zip(keys, values)}
print(mapped_dict)  # 輸出: {'a': 1, 'b': 2, 'c': 3}

{key: value for key, value in zip(keys, values)}就是字典推導式的語法形式，它表示“將keys和values中的對應元素作為鍵值對添加到新字典中”。

5. 運用集合(set)快速找出兩組數(shù)據(jù)的交集

集合是Python內置的一種數(shù)據(jù)類型，它不允許包含重復元素，并且支持一些數(shù)學上的集合操作，如并集、交集等。

示例：找出兩個列表的公共元素。

list1 = [1, 2, 3, 4, 5]
list2 = [4, 5, 6, 7, 8]

common_elements = set(list1).intersection(set(list2))
print(common_elements)  # 輸出: {4, 5}

通過調用set().intersection()方法，我們輕松地找到了兩個列表中的共有項。這種方法比傳統(tǒng)的雙重循環(huán)檢查方式要高效得多。

6. 使用生成器表達式節(jié)省內存

生成器表達式類似于列表推導式，但它返回的是一個生成器對象，而不是一個列表。這意味著生成器表達式只會在需要的時候生成數(shù)據(jù)，從而大大節(jié)省內存。

示例：創(chuàng)建一個生成器表達式來計算平方數(shù)。

squares = (x ** 2 for x in range(10))
for square in squares:
    print(square, end=' ')

輸出：

0 1 4 9 16 25 36 49 64 81

在這個例子中，(x ** 2 for x in range(10))是一個生成器表達式。它會按需生成每個平方數(shù)，而不是一次性生成整個列表。這樣可以顯著減少內存消耗。

7. 使用正則表達式進行復雜的字符串匹配

正則表達式是一種強大的文本處理工具，可以用來搜索、替換和解析字符串。Python中的re模塊提供了豐富的正則表達式功能。

示例：提取字符串中的電子郵件地址。

import re

text = "Hello, my email is example@example.com and my phone number is +1234567890."

# 匹配電子郵件地址
email_pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
emails = re.findall(email_pattern, text)
print(emails)  # 輸出: ['example@example.com']

# 匹配電話號碼
phone_pattern = r'\+\d{10}'
phones = re.findall(phone_pattern, text)
print(phones)  # 輸出: ['+1234567890']

這里，re.findall()函數(shù)用于查找所有匹配指定模式的子串。r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b' 是一個正則表達式，用于匹配電子郵件地址。同樣，r'\+\d{10}' 用于匹配電話號碼。

8. 使用字典的方法進行高效的數(shù)據(jù)統(tǒng)計

字典提供了許多有用的方法，可以幫助我們快速完成數(shù)據(jù)統(tǒng)計任務。例如，collections.Counter類可以方便地統(tǒng)計元素出現(xiàn)的次數(shù)。

示例：統(tǒng)計列表中各個元素出現(xiàn)的次數(shù)。

from collections import Counter

fruits = ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']
fruit_counts = Counter(fruits)
print(fruit_counts)  # 輸出: Counter({'banana': 3, 'apple': 2, 'orange': 1})

Counter(fruits) 創(chuàng)建了一個計數(shù)器對象，其中包含了每個元素及其出現(xiàn)的次數(shù)。這種方法比手動編寫循環(huán)統(tǒng)計要簡單得多。

9. 使用Pandas進行數(shù)據(jù)聚合與分組

Pandas不僅支持基本的數(shù)據(jù)清洗，還可以進行復雜的數(shù)據(jù)聚合和分組操作。這對于分析大規(guī)模數(shù)據(jù)集非常有幫助。

示例：根據(jù)性別分組計算平均年齡。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
        'Gender': ['F', 'M', 'M', 'F', 'M'],
        'Age': [25, 30, 35, 25, 30]}
df = pd.DataFrame(data)

# 分組并計算平均年齡
grouped = df.groupby('Gender')['Age'].mean()
print(grouped)

輸出：

Gender
F    25.0
M    31.7
Name: Age, dtype: float64

這里，df.groupby('Gender')['Age'].mean() 將數(shù)據(jù)按照性別分組，并計算每個性別下的平均年齡。這種方法非常適合進行數(shù)據(jù)分析和報告生成。

總結

本文介紹了九個實用的Python技巧，涵蓋了列表推導式、Pandas庫、NumPy、字典推導式、集合操作、生成器表達式、正則表達式、字典統(tǒng)計以及Pandas的數(shù)據(jù)聚合。通過這些技巧的應用，你可以更高效地處理各種數(shù)據(jù)問題。希望這些內容能幫助你在日常工作中提升效率。

責任編輯：趙寧寧來源：手把手PythonAI編程

Python 數(shù)據(jù)處理

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<nobr id="os1um"><code id="os1um"></code></nobr>

<strike id="os1um"><var id="os1um"></var></strike>

<big id="os1um"></big>