自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

在Python中解決中英文混雜出錯的問題

開發(fā) 后端
本文將解決一個在使用Python過程中,碰到中文就出錯的問題。希望能對大家碰到同類問題時,有所幫助。

前兩天用Python寫了個小腳本,其中有個需求是從一個文本文件A中讀取數(shù)據(jù),然后處理一下寫進一個新的文本文件B中。不過A文件中既有英文也有中文。
寫出處理這個需求的代碼并不復雜,隨手就能寫下類似的代碼:

1def write_a_line(line, fp):
2    fp.write(line)

不過這段程序一旦碰到有漢字的字符串時,可能就會遇到下面的問題:

Traceback (most recent call last):

 File "<stdin>", line 1, in <module>

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1:

ordinal not in range(128)

恩,這種情況對于我們平時使用C#或者Java的程序員來說確實比較頭大。從這個錯誤提示來看,Python在寫文件時,對line變量進行了編碼操作,而且是針對line對象進行ASCII碼的編碼。

我們都知道Python是支持unicode的,而且還有針對unicode的類型“unicode”。要想讓字符串稱為unicode字符串,可以在字符串的引號前面加入一個小寫字母“u”。翻閱Python的文檔,我們可以發(fā)下write方法接收的是str對象。不過Python并不像C#,它不用聲明變量的類型。所以我們應該先看看line到底是個什么對象。于是為了解決這個問題,我把上面的代碼加了一行:

1def write_a_line(line, fp):
2    print line.__class__.__name__
3    fp.write(line)

代碼運行之后,我發(fā)現(xiàn)當line中有中文的時候,我們的line變量的類型是unicode。從網(wǎng)上搜了一下與unicode與寫文件相關的帖子,可以得到一個信息,對這unicode對象調(diào)encode方法進行編碼就可以正常寫文件了。于是代碼又編程了下面的樣子:

1def write_a_line(line, fp):
2    if line.__class__.__name__ == “unicode”:
3        line = line.encode(“GB2312”)
4    fp.write(line)

這里要注意的問題是不能一棍子打死,line可能會是unicode對象也可能是str對象,不過我們只對unicode對象進行編碼。這下問題總算是解決了。

【編輯推薦】

  1. Python異常處理體系簡介
  2. 使用Oracle數(shù)據(jù)庫實現(xiàn)Python數(shù)據(jù)持久
  3. 學習使用 Python 編寫插件
責任編輯:彭凡 來源: 博客園
相關推薦

2010-04-06 09:33:37

CentOS系統(tǒng)

2015-12-01 11:17:41

Windows 10Version 151鏡像

2013-06-21 10:48:18

WP7Windows Pho中英文互翻譯

2015-08-18 15:19:51

2021-10-26 06:34:12

系統(tǒng)設計服務

2009-10-20 14:07:00

CCIE必讀書籍

2009-02-18 22:06:38

Windows 7中英文2in1安裝盤

2009-08-13 09:26:14

.NET正則表達式

2010-04-08 09:33:05

微軟Bing必應

2013-05-31 00:35:05

2010-02-05 09:57:25

C++中英文字符串

2021-10-15 15:26:10

AI 數(shù)據(jù)人工智能

2023-08-09 10:08:00

模型AI

2020-07-16 13:00:18

人工智能機器學習技術

2024-05-14 16:58:05

騰訊混元大模型文生圖

2020-07-20 09:49:56

開源技術 趨勢

2020-06-08 11:16:06

百度

2009-09-22 16:23:52

搜索引擎

2023-12-25 13:24:00

模型OCR頁面

2021-12-10 19:26:43

Python腳本電子書
點贊
收藏

51CTO技術棧公眾號