自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

深入Python中的文件操作

開發(fā) 后端
任何語言都離不開對(duì)文件的操作,那么Python語言是如何來操作和管理文件的。

[[350542]]

 任何語言都離不開對(duì)文件的操作,那么Python語言是如何來操作和管理文件的。

編碼方式

編碼方式的歷史大致為ASCII ->gb2312->unicode->utf-8,期間具體詳細(xì)信息可以百度

來個(gè)編碼解碼的小例子先,記住中文可以進(jìn)行GBK和utf-8編碼,在GBk一個(gè)中文字符對(duì)應(yīng)兩個(gè)字節(jié),在utf-8一個(gè)中文字符對(duì)應(yīng)三個(gè)字節(jié),中文不能進(jìn)行ASCII編碼。

  1. >>> '劉潤森'.encode('GBK'
  2. b'\xc1\xf5\xc8\xf3\xc9\xad' 
  3. >>> '劉潤森'.encode('ascii'
  4. Traceback (most recent call last): 
  5.   File "<stdin>", line 1, in <module> 
  6. UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128) 
  7. >>> 'Runsen'.encode('ascii'
  8. b'Runsen' 
  9. >>> "劉潤森".encode('utf-8'
  10. b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae' 
  11. >>> '劉潤森'.encode('GBK').decode('GBK'
  12. '劉潤森' 
  13. >>> '劉潤森'.encode('GBK').decode('utf-8'
  14. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte 

如果編碼解碼格式不一致可能會(huì)出現(xiàn)亂碼,encode表示編碼,decode表示解碼。

 

文件操作的API

下面是Python文件操作的具體的API。

打開文件

Python的open()函數(shù)打開一個(gè)文件時(shí),有若干個(gè)參數(shù)可用。然而,最常用的參數(shù)只有前兩個(gè)。

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)注意,第一個(gè)是強(qiáng)制性的,其余的是可選的。如果不添加mode參數(shù),文件將在Python中以只讀模式打開。

 

encoding:可以不寫。不寫參數(shù),默認(rèn)的編碼本是操作系統(tǒng)默認(rèn)的編碼本。windows默認(rèn)gbk,linux默認(rèn)utf-8,mac默認(rèn)utf-8。

  1. f=open('test.txt',encoding='utf-8')   #打開文件 
  2. data=f.read()  #讀取文件 
  3. print(data) 
  4. f.close() #關(guān)閉文件       

mode

讀取文件

代碼中用到的文件文件操作的1.txt 文件內(nèi)容如下:

  1. 關(guān)注《Python之王》公眾號(hào) 
  2. 作者:Runsen 

readline(),使用該方法時(shí),需要指定打開文件的模式為r或者r+;

 

readlines(),讀取全部行.返回一個(gè)列表,列表中的每個(gè)元素是原文件的每一行。如果文件很大,占內(nèi)存,容易崩盤。

  1. # 打開文件進(jìn)行讀取 
  2. f = open("1.txt","r",encoding='utf-8'
  3. # 根據(jù)大小讀取文件內(nèi)容 
  4. print('輸出來自 read() 方法\n',f.read(2048)) 
  5. # 關(guān)閉文件 
  6. f.close() 
  7. # 打開文件進(jìn)行讀寫 
  8. f = open("1.txt","r+",encoding='utf-8'
  9. # 讀取第2個(gè)字和第2行行的文件內(nèi)容 
  10. print('輸出來自 readline() 方法\n',f.readline(2)) 
  11. print('輸出來自 readlines() 方法\n',f.readlines(2)) 
  12. # 關(guān)閉文件 
  13. f.close() 
  14. # 打開文件進(jìn)行讀取和附加 
  15. f = open("1.txt","r",encoding='utf-8'
  16. # 打開文件進(jìn)行讀取和附加 
  17. print('輸出來自 readlines() 方法\n',f.readlines()) 
  18. # 關(guān)閉文件 
  19. f.close() 
  20.  
  21. # 輸出如下 
  22. 輸出來自 read() 方法 
  23.  關(guān)注《Python之王》公眾號(hào) 
  24. 作者:Runsen 
  25. 輸出來自 readline() 方法 
  26.  關(guān)注 
  27. 輸出來自 readlines() 方法 
  28.  ['《Python之王》公眾號(hào)\n'
  29. 輸出來自 readlines() 方法 
  30.  ['關(guān)注《Python之王》公眾號(hào)\n''作者:Runsen'

寫入文件

下面只介紹清除寫 w和追加寫 a

案例:將關(guān)注《Python之王》公眾號(hào)寫入 test.txt 文件中

  1. # mode=w 沒有文件就創(chuàng)建,有就清除內(nèi)容,小心使用 
  2. with open('test.txt''w', encoding='utf-8'as fb: 
  3.       fb.write('關(guān)注《Python之王》公眾號(hào)\n')   

下面再將作者:Runsen寫入test.txt 文件中

  1. with open('test.txt''w', encoding='utf-8'as fb: 
  2.       fb.write('作者:Runsen\n')   

運(yùn)行后會(huì)發(fā)現(xiàn)之前寫的關(guān)注《Python之王》公眾號(hào)內(nèi)容修改為作者:Runsen,因?yàn)? w模式會(huì)清除原文件內(nèi)容,所以小心使用。只要使用了w,就要一次性寫完。

追加寫 a

 

案例:將靜夜思這首詩追加到 test.txt 文件中

  1. # mode=a 追加到文件的最后 
  2. with open('test.txt''a', encoding='utf-8'as fb: 
  3.       fb.write('關(guān)注《Python之王》公眾號(hào)\n')   
  4. with open('test.txt''a'encoding='utf-8'as fb: 
  5.       fb.write('作者:Runsen\n')       

指針操作

事物或資源都是以文件的形式存在,比如消息、共享內(nèi)存、連接等,句柄可以理解為指向這些文件的指針。

句柄(handle)是一個(gè)來自編譯原理的術(shù)語,指的是一個(gè)句子中最先被規(guī)約的部分,所以帶有一個(gè)「句」字。

句柄的作用就是定位,兩個(gè)APi還是tell和seek。

tell返回文件對(duì)象在文件中的當(dāng)前位置,seek將文件對(duì)象移動(dòng)到指定的位置,傳入的參數(shù)是offset ,表示移動(dòng)的偏移量。

 

下面通過示例對(duì)上述函數(shù)作進(jìn)一步了解,如下所示:

  1. with open('test.txt''rb+'as f: 
  2.     f.write(b'Runsen'
  3.     # 文件對(duì)象位置 
  4.     print(f.tell()) 
  5.     # 移動(dòng)到文件的第四個(gè)字節(jié) 
  6.     f.seek(3) 
  7.     # 讀取一個(gè)字節(jié),文件對(duì)象向后移動(dòng)一位 
  8.     print(f.read(1)) 
  9.     print(f.tell()) 
  10.     # whence 為可選參數(shù),值為 0 表示從文件開頭起算(默認(rèn)值)、值為 1 表示使用當(dāng)前文件位置、值為 2 表示使用文件末尾作為參考點(diǎn) 
  11.     # 移動(dòng)到倒數(shù)第二個(gè)字節(jié) 
  12.     f.seek(-2, 2) 
  13.     print(f.tell()) 
  14.     print(f.read(1)) 
  15.      
  16. #輸出如下 
  17. b's' 
  18. 50 

上下文管理

我們會(huì)進(jìn)行這樣的操作:打開文件,讀寫,關(guān)閉文件。程序員經(jīng)常會(huì)忘記關(guān)閉文件。上下文管理器可以在不需要文件的時(shí)候,自動(dòng)關(guān)閉文件,使用with open即可。

  1. with context manager 
  2. with open("new.txt""w"as f: 
  3.     print(f.closed) 
  4.     f.write("Hello World!"
  5. print(f.closed) 
  6.  
  7. #輸出如下 
  8. False 
  9. True 

如何批量讀取多個(gè)文件

下面,批量讀取某文件夾下的txt文件

  1. file_list = ['1.txt''2.txt''3.txt','4.txt'
  2. for path in file_list: 
  3.     with open(path, encoding='utf-8'as f: 
  4.         for line in f: 
  5.             print(line) 

下面將批量讀取文件夾下的txt文件的內(nèi)容,合并內(nèi)容到一個(gè)新文件5.txt中,具體實(shí)現(xiàn)的代碼如下。

  1. import os 
  2. #獲取目標(biāo)文件夾的路徑 
  3. filedir = os.getcwd()+'\\'+'\\txt' 
  4. #獲取當(dāng)前文件夾中的文件名稱列表 
  5. filenames = [] 
  6. for i in os.listdir(filedir): 
  7.     if i.split(".")[-1] == 'txt'
  8.         filenames.append(i) 
  9. #打開當(dāng)前目錄下的5.txt文件,如果沒有則創(chuàng)建 
  10. f = open('5.txt','w'
  11. #先遍歷文件名 
  12. for filename in filenames: 
  13.     filepath = filedir+'\\'+filename 
  14.     #遍歷單個(gè)文件,讀取行數(shù) 
  15.     for line in open(filepath,encoding='utf-8'): 
  16.         f.writelines(line) 
  17.         f.write('\n'
  18. #關(guān)閉文件 
  19. f.close() 

其實(shí)在Window中只需要cd 至目標(biāo)文件夾,即你需要將所有想要合并的txt文件添加至目標(biāo)文件夾中,執(zhí)行如下DOS命令 type *.txt > C:\目標(biāo)路徑\合并后的文件名.txt

練習(xí)

題目:創(chuàng)建文件data.txt,文件共100000行,每行存放一個(gè)1~100之間的整數(shù),題目來源:???/p>

  1. import random 
  2.  
  3. f = open(‘data.txt’,‘w+’) 
  4. for i in range(100000): 
  5.   f.write(str(random.randint(1,100)) + ‘\n’) 
  6.   f.seek(0) 
  7.   print(f.read()) 
  8.   f.close() 

題目:生成100個(gè)MAC地址并寫入文件中,MAC地址前6位(16進(jìn)制)為01-AF-3B,題目來源:???/p>

  1. import random 
  2. import string 
  3.  
  4. def create_mac(): 
  5.   MAC='01-AF-3B' 
  6.   hex_num =string.hexdigits #0123456789abcdefABCDEF 
  7.   for i in range(3): 
  8.     n = random.sample(hex_num,2) 
  9.     sn = '-' + ''.join(n).upper() 
  10.     MAC += sn 
  11.   return MAC 
  12.  
  13. def main(): 
  14.   with open('mac.txt','w'as f: 
  15.     for i in range(100): 
  16.       mac = create_mac() 
  17.       print(mac) 
  18.       f.write(mac+'\n'
  19.  
  20. main() 

本文已收錄 GitHub,傳送門~[1] ,里面更有大廠面試完整考點(diǎn),歡迎 Star。

責(zé)任編輯:姜華 來源: Python之王
相關(guān)推薦

2020-12-26 16:51:12

Python操作符開發(fā)

2023-10-23 12:35:36

Golang追加操作

2020-11-06 13:42:59

itertools

2020-11-11 08:24:06

collection

2010-03-23 16:30:47

Python文件復(fù)制

2020-11-12 08:52:16

Python

2020-09-17 12:34:54

Python文件操作

2023-11-27 15:08:52

Python編程語言

2018-05-28 09:20:10

Python迭代for循環(huán)

2016-08-31 15:50:50

PythonThreadLocal變量

2023-11-30 16:05:17

2024-05-08 13:49:10

MongoDB版本系統(tǒng)

2024-03-15 09:44:17

WPFDispatcherUI線程

2012-11-23 16:46:12

LinuxVim

2010-04-08 16:49:36

Unix操作系統(tǒng)

2024-10-12 15:18:05

PythonAPI操作系統(tǒng)

2020-11-10 08:45:35

Python

2019-11-19 11:20:25

Python數(shù)據(jù)結(jié)構(gòu)Windows

2010-03-23 13:16:14

Python代碼加密

2016-11-07 21:59:52

threadpython
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)