自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

手把手教你用Python讀取Excel

開發(fā) 后端
pandas.read_excel接口用于讀取Excel格式的數(shù)據(jù)文件,由于它使用非常頻繁、功能強(qiáng)大、參數(shù)眾多,因此本文專門做詳細(xì)介紹。

[[416264]]

 01 語法

pandas.read_excel接口的語法如下: 

  1. pd.read_excel(io, sheet_name=0, header=0, 
  2.               names=None, index_col=None, 
  3.               usecols=None, squeeze=False
  4.               dtype=None, engine=None, 
  5.               converters=None, true_values=None, 
  6.               false_values=None, skiprows=None, 
  7.               nrows=None, na_values=None, 
  8.               keep_default_na=True, verbose=False
  9.               parse_dates=False, date_parser=None, 
  10.               thousands=None, comment=None, skipfooter=0, 
  11.               convert_float=True, mangle_dupe_cols=True, **kwds) 

02 文件內(nèi)容

io為第一個參數(shù),沒有默認(rèn)值,也不能為空,根據(jù)Python的語法,第一個參數(shù)傳參時(shí)可以不寫??梢詡魅氡镜匚募蛘哌h(yuǎn)程文件的URL: 

  1. # 字符串、字節(jié)、Excel文件、xlrd.Book實(shí)例、路徑對象或者類似文件的對象 
  2. # 本地相對路徑 
  3. pd.read_excel('data/data.xlsx') # 注意目錄層級 
  4. pd.read_excel('data.xls') # 如果文件與代碼文件在同一目錄下 
  5. # 本地絕對路徑 
  6. pd.read_excel('/user/gairuo/data/data.xlsx'
  7. # 使用URL 
  8. pd.read_excel('https://www.gairuo.com/file/data/dataset/team.xlsx'

與read_csv一樣,需要注意,Mac和Windows中的路徑寫法不一樣。

03 表格

sheet_name可以指定Excel文件讀取哪個sheet,如果不指定,默認(rèn)讀取第一個。 

  1. # 字符串、整型、列表、None,默認(rèn)為0 
  2. pd.read_excel('tmp.xlsx', sheet_name=1) # 第二個sheet 
  3. pd.read_excel('tmp.xlsx', sheet_name='總結(jié)表') # 按sheet的名字 
  4.  
  5. # 讀取第一個、第二個、名為Sheet5的sheet,返回一個df組成的字典 
  6. dfs = pd.read_excel('tmp.xlsx', sheet_name=[0, 1, "Sheet5"]) 
  7. dfs = pd.read_excel('tmp.xlsx', sheet_name=None) # 所有sheet 
  8. dfs['Sheet5'] # 讀取時(shí)按sheet名 

04 表頭

數(shù)據(jù)的表頭參數(shù)為header,如不指定,默認(rèn)為第一行。 

  1. # 整型、整型組成的列表,默認(rèn)為 0 
  2. pd.read_excel('tmp.xlsx', header=None)  # 不設(shè)表頭 
  3. pd.read_excel('tmp.xlsx', header=2)  # 第三行為表頭 
  4. pd.read_excel('tmp.xlsx', header=[0, 1])  # 兩層表頭,多層索引 

05 列名

用names指定列名,也就是表頭的名稱,如不指定,默認(rèn)為表頭的名稱。 

  1. # 序列,默認(rèn)為None 
  2. pd.read_excel('tmp.xlsx', names=['姓名''年齡''成績']) 
  3. pd.read_excel('tmp.xlsx', names=c_list) # 傳入列表變量 
  4. # 沒有表頭,需要設(shè)置為None 
  5. pd.read_excel('tmp.xlsx', header=None, names=None) 

06 其他

其他參數(shù)與pandas.read_csv的同名參數(shù)功能一致,如果想使用僅pandas.read_csv有的參數(shù),可以考慮將數(shù)據(jù)保存為CSV文件,因?yàn)镃SV文件相對通用、讀取數(shù)據(jù)快且處理方法比較豐富。

用Python讀取CSV文件的操作詳解可戳:史上最全!用Pandas讀取CSV,看這篇就夠了

07 小結(jié)

本文介紹了pandas.read_excel相對于pandas.read_csv專有的參數(shù)功能。由于Excel文件在日常工作中較為常用,所以需要熟練掌握Excel的數(shù)據(jù)讀取功能。另外對于一些量比較小的Excel數(shù)據(jù)文件,在做數(shù)據(jù)臨時(shí)處理時(shí),可以復(fù)制并使用pd.read_clipboard()來讀取,非常方便。

 

責(zé)任編輯:華軒 來源: 大數(shù)據(jù)DT
相關(guān)推薦

2021-03-23 09:05:52

PythonExcelVlookup

2022-10-19 14:30:59

2021-05-10 06:48:11

Python騰訊招聘

2021-02-02 13:31:35

Pycharm系統(tǒng)技巧Python

2021-12-11 20:20:19

Python算法線性

2022-04-01 20:29:26

Pandas數(shù)據(jù)存儲

2011-03-28 16:14:38

jQuery

2021-02-04 09:00:57

SQLDjango原生

2021-02-06 14:55:05

大數(shù)據(jù)pandas數(shù)據(jù)分析

2022-08-04 10:39:23

Jenkins集成CD

2021-05-17 21:30:06

Python求均值中值

2009-04-22 09:17:19

LINQSQL基礎(chǔ)

2021-01-21 09:10:29

ECharts柱狀圖大數(shù)據(jù)

2021-01-08 10:32:24

Charts折線圖數(shù)據(jù)可視化

2020-03-08 22:06:16

Python數(shù)據(jù)IP

2012-01-11 13:40:35

移動應(yīng)用云服務(wù)

2021-08-02 23:15:20

Pandas數(shù)據(jù)采集

2021-03-02 09:05:13

Python

2022-06-30 16:10:26

Python計(jì)時(shí)器裝飾器

2020-05-26 10:20:56

Python開發(fā)工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號