如何用Linux幫助你拼寫?
無論你是糾結(jié)一個難以理解的單詞,還是在將報告發(fā)給老板之前再檢查一遍,Linux 都可以幫助你解決拼寫問題。
Linux 為數(shù)據(jù)分析和自動化提供了各種工具,它也幫助我們解決了一個一直都在糾結(jié)的問題 —— 拼寫!無論在寫每周報告時努力拼出一個單詞,還是在提交商業(yè)計劃書之前想要借助計算機的“眼睛”來找出你的拼寫錯誤?,F(xiàn)在我們來看一下它是如何幫助你的。
look
look
是其中一款工具。如果你知道一個單詞的開頭,你就可以用這個命令來獲取以這些字母開頭的單詞列表。除非提供了替代詞源,否則 look
將使用 /usr/share/dict/words
中的內(nèi)容來為你標(biāo)識單詞。這個文件有數(shù)十萬個單詞,可以滿足我們?nèi)粘J褂玫拇蠖鄶?shù)英語單詞的需要,但是它可能不包含我們計算機領(lǐng)域中的一些人傾向于使用的更加生僻的單詞,如 zettabyte。
look
命令的語法非常簡單。輸入 look word
,它將遍歷單詞文件中的所有單詞并找到匹配項。
$ look amelio
ameliorable
ameliorableness
ameliorant
ameliorate
ameliorated
ameliorates
ameliorating
amelioration
ameliorations
ameliorativ
ameliorative
amelioratively
ameliorator
amelioratory
如果你遇到系統(tǒng)中單詞列表中未包含的單詞,將無法獲得任何輸出。
$ look zetta
$
如果你沒有看到你所希望出現(xiàn)的單詞,也不要絕望。你可以在你的單詞文件中添加單詞,甚至引用一個完全不同的單詞列表,在網(wǎng)上找一個或者干脆自己創(chuàng)建一個。你甚至不必將添加的單詞放在按字母順序排列的正確位置;只需將其添加到文件的末尾即可。但是,你必須以 root 用戶身份執(zhí)行此操作。例如(要注意 >>
?。?/p>
# echo “zettabyte” >> /usr/share/dict/words
當(dāng)使用不同的單詞列表時,例如這個例子中的 “jargon” ,你只需要添加文件的名稱。如果不采用默認文件時,請使用完整路徑。
$ look nybble /usr/share/dict/jargon
nybble
nybbles
look
命令大小寫不敏感,因此你不必關(guān)心要查找的單詞是否應(yīng)該大寫。
$ look zet
ZETA
Zeta
zeta
zetacism
Zetana
zetas
Zetes
zetetic
Zethar
Zethus
Zetland
Zetta
當(dāng)然,不是所有的單詞列表都是一樣的。一些 Linux 發(fā)行版在單詞文件中提供了多得多的內(nèi)容。你的文件中可能有十萬或者更多倍的單詞。
在我的一個 Linux 系統(tǒng)中:
$ wc -l /usr/share/dict/words
102402 /usr/share/dict/words
在另一個系統(tǒng)中:
$ wc -l /usr/share/dict/words
479828 /usr/share/dict/words
請記住,look
命令只適用于通過單詞開頭查找,但如果你不想從單詞的開頭查找,還可以使用其他選項。
grep
我們深愛的 grep
命令像其他工具一樣可以從一個單詞文件中選出單詞。如果你正在找以某些字母開頭或結(jié)尾的單詞,使用 grep
命令是自然而然的事情。它可以通過單詞的開頭、結(jié)尾或中間部分來匹配單詞。系統(tǒng)中的單詞文件可以像使用 look
命令時在 grep
命令中輕松使用。不過***的缺點是你需要指定文件,這一點與 look
不盡相同。
在單詞的開頭前加上 ^
:
$ grep ^terra /usr/share/dict/words
terrace
terrace's
terraced
terraces
terracing
terrain
terrain's
terrains
terrapin
terrapin's
terrapins
terraria
terrarium
terrarium's
terrariums
在單詞的結(jié)尾后加上 $
:
$ grep bytes$ /usr/share/dict/words
bytes
gigabytes
kilobytes
megabytes
terabytes
使用 grep
時,你需要考慮大小寫,不過 grep
命令也提供了一些選項。
$ grep ^[Zz]et /usr/share/dict/words
Zeta
zeta
zetacism
Zetana
zetas
Zetes
zetetic
Zethar
Zethus
Zetland
Zetta
zettabyte
為單詞文件添加軟連接能使這種搜索方式更加便捷:
$ ln -s /usr/share/dict/words words
$ grep ^[Zz]et words
Zeta
zeta
zetacism
Zetana
zetas
Zetes
zetetic
Zethar
Zethus
Zetland
Zetta
zettabytye
aspell
aspell
命令提供了一種不同的方式。它提供了一種方法來檢查你提供給它的任何文件或文本的拼寫。你可以通過管道將文本傳遞給它,然后它會告訴你哪些單詞看起來有拼寫錯誤。如果所有單詞都拼寫正確,則不會有任何輸出。
$ echo Did I mispell that? | aspell list
mispell
$ echo I can hardly wait to try out aspell | aspell list
aspell
$ echo Did I misspell anything? | aspell list
$
list
參數(shù)告訴 aspell
為標(biāo)準輸入單詞提供拼寫錯誤的單詞列表。
你還可以使用 aspell
來定位和更正文本文件中的單詞。如果它發(fā)現(xiàn)一個拼寫錯誤的單詞,它將為你提供一個相似(但拼寫正確的)單詞列表來替換這個單詞,你也可以將該單詞加入個人詞庫(~/.aspell.en.pws
)并忽略拼寫錯誤,或者完全中止進程(使文件保持處理前的狀態(tài))。
$ aspell -c mytext
一旦 aspell
發(fā)現(xiàn)一個單詞出現(xiàn)了拼寫錯誤,它將會為不正確的 “mispell” 提供一個選項列表:
1) mi spell 6) misplay
2) mi-spell 7) spell
3) misspell 8) misapply
4) Ispell 9) Aspell
5) misspells 0) dispel
i) Ignore I) Ignore all
r) Replace R) Replace all
a) Add l) Add Lower
b) Abort x) Exit
請注意,備選單詞和拼寫是數(shù)字編號的,而其他選項是由字母選項表示的。你可以選擇備選拼寫中的一項或者自己輸入替換項。“Abort” 選項將使文件保持不變,即使你已經(jīng)為某些單詞選擇了替換。你選擇添加的單詞將被插入到本地單詞文件中(例如 ~/.aspell.en.pws
)。
其他單詞列表
厭倦了英語? aspell
命令可以在其他語言中使用,只要你添加了相關(guān)語言的單詞列表。例如,在 Debian 系統(tǒng)中添加法語的詞庫,你可以這樣做:
$ sudo apt install aspell-fr
這個新的詞庫文件會被安裝為 /usr/share/dict/French
。為了使用它,你只需要簡單地告訴 aspell
你想要使用替換的單詞列表:
$ aspell --lang=fr -c mytext
這種情況下,當(dāng) aspell
讀到單詞 “one” 時,你可能會看到下面的情況:
1) once 6) orné
2) onde 7) ne
3) ondé 8) né
4) onze 9) on
5) orne 0) cône
i) Ignore I) Ignore all
r) Replace R) Replace all
a) Add l) Add Lower
b) Abort x) Exit
你也可以從 GNU 官網(wǎng)獲取其他語言的詞庫。
總結(jié)
即使你是全國拼字比賽的冠軍,你可能偶爾也會需要一點拼寫方面的幫助,哪怕只是為了找出你手滑打錯的單詞。aspell
工具,加上 look
和 grep
命令已經(jīng)準備來助你一臂之力了。