自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

總結(jié)了Pandas實(shí)現(xiàn)數(shù)據(jù)清洗的7種方式

大數(shù)據(jù) 數(shù)據(jù)分析
最近在做“對(duì)比excel,學(xué)習(xí)pandas系列”,今天給大家介紹一下excel和pandas實(shí)現(xiàn)數(shù)據(jù)清洗的種方式。

 最近在做“對(duì)比excel,學(xué)習(xí)pandas系列”,前面發(fā)了一篇 很受讀者喜愛(ài),今天給大家介紹一下excel和pandas實(shí)現(xiàn)數(shù)據(jù)清洗的種方式

1.處理數(shù)據(jù)中的空值

我們?cè)谔幚碚鎸?shí)的數(shù)據(jù)時(shí),往往會(huì)有很多缺少的的特征數(shù)據(jù),就是所謂的空值,必須要進(jìn)行處理才能進(jìn)行下一步分析

空值的處理方式有很多種,一般是刪除或者填充

Excel通過(guò)“查找和替換”功能實(shí)現(xiàn)空值的統(tǒng)一替換:

通過(guò)“定位”刪除空值:

pandas處理空值的方式比較靈活,可以使用dropna函數(shù)刪除空值

  1. import pandas as pd 
  2. data=pd.read_csv('成績(jī)表.csv',encoding='gbk'
  3. data.dropna(how='any'

用fillna函數(shù)實(shí)現(xiàn)空值的填充

①使用數(shù)字0填充數(shù)據(jù)表中的空值

  1. data.fillna(value=0)   

②使用平均值填充數(shù)據(jù)表中的空值

  1. data['語(yǔ)文'].fillna(data['語(yǔ)文'].mean()) 

2.刪除空格

excel中清理空格很簡(jiǎn)單,直接替換即可

pandas刪除空格也很方便,主要使用map函數(shù)

  1. data['姓名']=data['姓名'].map(str.strip) 
  2. data 

3.大小寫(xiě)轉(zhuǎn)換

excel中大小寫(xiě)轉(zhuǎn)換函數(shù)分別為upper()和lower()

pandas中轉(zhuǎn)換函數(shù)也為upper()和lower()

  1. data['拼音']=data['拼音'].str.upper() 
  2. data 

  1. data['拼音']=data['拼音'].str.lower() 
  2. data 

4.更改數(shù)據(jù)格式

excel中更改數(shù)據(jù)格式通過(guò)快捷鍵“ctrl+1”打開(kāi)“設(shè)置單元格格式”:

pandas使用astype來(lái)修改數(shù)據(jù)格式,以將“語(yǔ)文”列改成整數(shù)為例

  1. data['語(yǔ)文'].dropna(how='any').astype('int'

5.更改列名稱(chēng)

excel中更改列名稱(chēng)就不說(shuō)了,大家都會(huì)

pandas使用rename函數(shù)更改列名稱(chēng),代碼如下:

  1. data.rename(columns={'語(yǔ)文':'語(yǔ)文成績(jī)'}) 

6.刪除重復(fù)值

excel的功能區(qū)“數(shù)據(jù)”下有“刪除重復(fù)項(xiàng)”,可以用來(lái)刪除表中的重復(fù)值,默認(rèn)保留最第一個(gè)重復(fù)值,把后面的刪除:

pandas使用drop_duplicates函數(shù)刪除重復(fù)值:

  1. data['數(shù)學(xué)'].drop_duplicates() #默認(rèn)刪除后面的重復(fù)值 
  2.  
  3. data['數(shù)學(xué)'].drop_duplicates(keep='last') #刪除第一項(xiàng)重復(fù)值 

7.修改及替換數(shù)據(jù)

excel中使用“查找和替換”功能實(shí)現(xiàn)數(shù)值的替換

pandas中使用replace函數(shù)實(shí)現(xiàn)數(shù)據(jù)替換

  1. data['姓名'].replace('成  功','失  敗'

 本文轉(zhuǎn)載自微信公眾號(hào)「python數(shù)據(jù)分析之禪」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系python數(shù)據(jù)分析之禪公眾號(hào)。

 

責(zé)任編輯:武曉燕 來(lái)源: python數(shù)據(jù)分析之禪
相關(guān)推薦

2023-02-27 22:03:06

數(shù)據(jù)庫(kù)內(nèi)存RocketMQ

2024-10-28 12:57:36

Pandas數(shù)據(jù)清洗

2021-08-25 07:47:53

Pandas函數(shù)數(shù)據(jù)處理

2022-07-11 13:30:08

Pandas數(shù)據(jù)編碼代碼

2022-04-20 15:10:55

pandas編碼函數(shù)

2022-03-11 12:31:04

Vue3組件前端

2022-04-28 18:47:04

Pandas函數(shù)Python

2009-07-02 14:42:55

ExtJS Grid

2022-03-09 18:09:47

前端CSS代碼

2024-11-20 07:00:00

代碼數(shù)據(jù)清洗Python

2023-09-26 01:03:36

Pandas數(shù)據(jù)數(shù)據(jù)集

2021-04-09 16:22:39

云計(jì)算

2019-05-16 13:00:18

異步編程JavaScript回調(diào)函數(shù)

2018-04-03 12:07:53

數(shù)據(jù)清洗PandasNumpy

2021-05-17 09:31:58

爬蟲(chóng)偽裝技巧

2024-06-13 11:54:03

2018-09-09 15:13:53

2020-11-20 14:02:22

HashMap遍歷Java

2023-12-12 11:06:37

PythonPandas數(shù)據(jù)

2020-06-04 10:49:53

Pandas字符串技巧
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)