用Python做一個簡單的翻譯工具
編程本身是跟年齡無關(guān)的一件事,不論你現(xiàn)在是十四五歲,還是四五十歲,如果你熱愛它,并且愿意持續(xù)投入其中,必定會有所收獲。
本文就來自編程教室一位“小”讀者的投稿(互助學(xué)習(xí)1群里的同學(xué)應(yīng)該對作者的名字很熟悉吧)。我看著他不停地產(chǎn)出新的代碼和技術(shù)文章,不禁感嘆“后生可畏”。
這是一個爬蟲基礎(chǔ)分析和操作的開發(fā)案例,在此分享給大家。
當(dāng)我在電腦上需要翻譯一個單詞時,我會這樣做:
打開瀏覽器 = > 打開百度翻譯 = > 輸入單詞 = > 得到翻譯
不過有時候,當(dāng)我在命令行環(huán)境下寫代碼的時候,懶得再切換到瀏覽器里等待頁面的加載。
于是我就想,能否用萬能的 python 制作一個 命令行下的翻譯工具 呢?
說干就干!
網(wǎng)上搜索了點(diǎn)信息,加上一頓操作,最終被我搗鼓出來了。來看下最終的效果:
在這個工具中,我用了 百度 、 有道 以及 谷歌 (可選)的翻譯。
開發(fā)思路
其中獲取有道翻譯和百度翻譯的原理都差不多,這里我們選取百度翻譯來玩耍一下啦:
首先打開百度翻譯:http://fanyi.baidu.com
接下來右鍵點(diǎn)擊 檢查 ,選擇 Network 中的 XHR (向服務(wù)器發(fā)送的數(shù)據(jù)請求)。然后我們在輸入框里輸入 save 這個單詞,我們可以看到一時間這里面多了幾個 sug 標(biāo)簽,點(diǎn)開一看:
可以看到,這個 sug 請求里面就有我們想要的數(shù)據(jù)。點(diǎn)進(jìn)去, Request URL 就是我們需要請求的網(wǎng)址,另外在 Request Method 看到是 POST 方式,也就是提交表單:
移到最后,我們看見了提交的表單參數(shù):
在 Form Data 中,我們看見表單是一個字典: {'kw': 'save'} ,這里 save 是我們自己輸入的,也就是我們要查詢的單詞,因此我們使用 requests.post 來模擬這個請求:
- # 網(wǎng)址和表單
- url= 'https://fanyi.baidu.com/sug'
- Form_data = {'kw': word}
- # post方式請求網(wǎng)站
- response = requests.post(url, data = Form_data,headersheaders=headers)
我們可以試著打印出返回的東西,你會發(fā)現(xiàn)是以 JSON 格式返回的,因此需要引入內(nèi)置庫 json 來解析:
- content = json.loads(response.text) # 加載成字典形式
在打印出的 json 格式的文本中我們發(fā)現(xiàn)翻譯結(jié)果在 'data'['v']( 剛剛的圖片里我們也看見了),接下來提取并返回:
- result = content['data'][0]['v'] # 獲取翻譯結(jié)果
- return result
這樣就完成了提交表單了,實(shí)現(xiàn)百度翻譯了。
這里用到的就是一些常用的爬蟲分析和操作,有道翻譯也基本類似,不再贅述,具體操作可參加文末給出的完整代碼。
接下來我們來看看與眾不同的谷歌翻譯,這個玩意實(shí)在有些復(fù)雜。谷歌翻譯是有 api 的,但是要錢……我不想付錢……網(wǎng)上有大佬給出了解決方案(這里我們簡單地看一下原理):
按照近似百度翻譯的方式操作,我們看到這里多出了一個請求,這里面有我們想要的翻譯結(jié)果:
我們回到之前的 Request URL 看一下,發(fā)現(xiàn)前面的直接復(fù)制就好了, q 是我們需要翻譯的詞,但是這個 tk 參數(shù)卻是個棘手的參數(shù)。我代碼里用到的解法是網(wǎng)上的,仿照谷歌翻譯頁面上的提供的函數(shù),用 JavaScript 去計算出了這個參數(shù)(我懷疑他就是拿的前端源碼,沒仔細(xì)對照)。
那么如何在 python 中執(zhí)行 JavaScript 代碼呢,我們可以通過 pyexecjs 這個庫(注意這個庫導(dǎo)入名是 execjs )。這個部分的源碼就在 Py4Js 這個類里邊了。
特別說明下,因為無法直接使用谷歌翻譯,所以我把它做成了可選項,默認(rèn)不會調(diào)用。
使用方法
我已經(jīng)將這個項目發(fā)布到了 pypi ,你可以通過 pip 命令按如下方式安裝:
- pip install quicktranslate
用起來也是非常的簡單(加上 -g 可增加谷歌翻譯結(jié)果):
- trans -t 你要翻譯的東西
示例:
- $ trans -t 你好
- =========================
- youdao translate result:hello
- baidu translate result:[nǐ hǎo] how do you do; how are you; hello;
- =========================
- $ trans -t 你好 -g
- =========================
- youdao translate result:hello
- baidu translate result:[nǐ hǎo] how do you do; how are you; hello;
- google translate result:Hello there
- =========================
本案例完整代碼: https://github.com/pynickle/a... pip安裝命令: pip install quicktranslate