實(shí)用小技巧,Python一秒將全部中文姓名轉(zhuǎn)為拼音!
有時(shí)在處理文件時(shí)候,我們需要將中文姓名轉(zhuǎn)換為拼音,或者是轉(zhuǎn)換為拼音首字母,本文將介紹三種Python實(shí)現(xiàn)的方法,最后給一個(gè)批量操作的代碼案例!
一、xpinyin
開門見山,Python中文字轉(zhuǎn)拼音可以使用xpinyin,直接使用pip安裝即可👇
- pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
接著導(dǎo)入xpinyin下的 Pinyin 方法如下
- from xpinyin import Pinyin
首先試試中文名轉(zhuǎn)拼音,
- p = Pinyin()
- result1 = p.get_pinyin('葉伏天')
- result1
結(jié)果如下:
- 'ye-fu-tian'
tone_marks可以顯示聲調(diào)
- result2 = p.get_pinyin('葉伏天', tone_marks='marks')
結(jié)果如下:
- 'yè-fú-tiān'
去掉空格👇
- s = result1.split('-')
- result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize()
- result3
- 結(jié)果如下:
- 'Ye Futian'
有時(shí)需要中文名轉(zhuǎn)拼音首字母,也很簡(jiǎn)單👇
二、pypinyin
另一種方法是使用pypinyin,安裝同樣可以使用pip
- # 安裝
- pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
直接導(dǎo)入就行👇
- import pypinyin
再來看看中文名轉(zhuǎn)拼音的實(shí)現(xiàn)辦法
- result1 = pypinyin.pinyin('葉庭云', style=pypinyin.NORMAL)
- result1
結(jié)果如下:
- [['ye'], ['ting'], ['yun']]
啟用多音節(jié)來實(shí)現(xiàn)聲調(diào)
- result2 = pypinyin.pinyin('葉庭云', heteronym=True)
- result2
結(jié)果如下:
- [['yè', 'xié'], ['tíng'], ['yún']]
因?yàn)榉祷氐氖且粋€(gè)嵌套的list,所以需要簡(jiǎn)單調(diào)整一下
- result_ = [i[0] for i in result1]
- result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()
- result3
結(jié)果如下:
- 'Ye Tingyun'
啟用多音字模式時(shí),竟然發(fā)現(xiàn) ‘葉’ 也是多音字,查詢了資料發(fā)現(xiàn)確實(shí)是這樣,漲知識(shí)啦!

下面是中文名轉(zhuǎn)拼音首字母的方法
三、snownlp
最后一種辦法是使用snownlp,同樣的pip安裝與導(dǎo)入如下:
- # 安裝
- pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
- # 導(dǎo)入
- from snownlp import SnowNLP
中文名轉(zhuǎn)拼音👇
- s = SnowNLP('葉庭云')
- s.pinyin
結(jié)果如下:
- ['ye', 'ting', 'yun']
將list轉(zhuǎn)為字符串
- result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize()
- result4
結(jié)果如下:
- 'Ye Tingyun'
最后是中文名轉(zhuǎn)拼音首字母
四、批量將中文名轉(zhuǎn)換成拼音
現(xiàn)在,掌握了基本使用后,我們就能利用批量操作來解放雙手
- import pypinyin
- import pandas as pd
- df = pd.read_excel('學(xué)生名單_test.xls')
- df.head()
先導(dǎo)入一份學(xué)生名單如下
下面是使用pypinyin批量將全部學(xué)生的中文姓名轉(zhuǎn)換為拼音
- pinyin_name = []
- first_pinyin = []
- for i in df['姓名']:
- result = pypinyin.pinyin(i, style=pypinyin.NORMAL)
- result_ = [i[0] for i in result]
- result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()
- result3 = ''.join([i[0].upper() for i in result_])
- print(result2, i, sep=' ')
- pinyin_name.append(result2)
- first_pinyin.append(result3)
- df['英文名'] = pinyin_name
- df['拼音首字母'] = first_pinyin
- df.head()
或者是轉(zhuǎn)換為拼音首字母,運(yùn)行結(jié)果如下: