基于Slax構建譯者專用Linux
針對譯者的 Linux 已經有 tuxtrans 了。它基于 Ubuntu 打包了很多譯者需要的軟件。適合追求使用自由軟件的用戶使用。
現(xiàn)在我要基于 Slax 打造一個新的譯者專用 Linux。為什么?主要是因為 Slax 的便捷性:
- 可以從 U 盤等移動介質 Live 啟動,啟動后對系統(tǒng)進行的修改可以保存。
- 模塊化,可以方便地把軟件打包,做進啟動盤里。
- 輕量級,啟動快。
在 Slax 下運行如下命令:
# savechanges out.sb
即可把啟動后進行的修改打包成 squashfs 格式的 sb 文件,然后放入光盤的 modules 目錄即可使用。
去年出的 Slax 9 是基于 Debian 的,有包管理系統(tǒng),更適合小白進行操作。之前的版本基于 Slackware,安裝軟件要解決各種依賴關系,不過手動安裝對于包的管控倒是比較清楚。
制作過程
下面講一下制作過程:
1、添加中文支持。
安裝文泉驛中文字體:
# apt install fonts-wqy-microhei fonts-wqy-zenhei
安裝輸入法:
# apt install ibus ibus-pinyin ibus-qt4
這里因為 Slax 缺少一些組件,我們需要補充上,另外默認桌面不能用中文輸入法,改為使用 xfce 桌面管理器,用 lightdm 登錄管理器。
# apt install dbus-x11 task-xfce-desktop
安裝 im-config,可以強制設定輸入法。
# apt install im-config zenity
2、安裝常用 CAT 軟件
# apt install translate-utils
然后 OmegaT 和 Okapi 需要手動安裝,OmegaT 自帶安裝腳本,運行即可。Rainbow 可以參考 OmegaT 的腳本安裝。主要是把它復制到 /opt
里,然后軟連接執(zhí)行文件到 /usr/bin
,并在 /usr/share/applications
里建立對應的 .desktop 文件,把項目添加到系統(tǒng)的菜單里,把 png 圖標放到 /usr/share/icons/hicolor/32x32/apps
里。
還有 Heartsome Translation Studio 是中國公司開發(fā),后來開源的 CAT 軟件,也是 java 寫的,和 rainbow 的安裝方法類似。
3、安裝其它輔助工具
# apt install gpicview okular libreoffice calibre tesseract default-jre openjfx xfce4-screenshooter
另外還可以安裝 visual studio code 編輯器、scribus 桌面出版軟件等等。
這樣,Slax for translators 就完成了。
不過這樣的 Slax 適合熟悉 Linux 操作的用戶使用,對于普通用戶,易用性肯定是不佳的,就比如普通用戶默認不支持 fat32 分區(qū)的寫入。
還有就是 Linux 下還是挺缺少軟件的,有時候可能還得自己編寫程序。比如我就給 tesseract 寫了一個前端,可以把利用系統(tǒng)快捷鍵截取的圖片進行 OCR,并自動去掉多余的空行和回車。
這套系統(tǒng)的實用性還是有的,制作的過程也是充滿樂趣。
翻譯相關的軟件
這個網(wǎng)站整理了 Linux 上可以使用的翻譯軟件。可以作為參考。
我這里再給常用軟件做一個列表:
CAT工具:
- OmegaT:全功能 CAT
- Okapi:三大組件:Rainbow 負責文件格式轉換、術語抽取等,checkmate 負責質量檢查,Ratel 負責分割規(guī)則
- Heartsome Translation Studio:還自帶了 TMX、TBX 編輯器等工具
- Translation Toolkit:Python 寫的,支持 PO、XLIFF 等文件格式轉換,亦有字數(shù)統(tǒng)計、術語抽取等功能
- Language Tool:語言質量檢測工具,支持拼寫、語法等問題的檢查
文字轉錄:
- tesseract:Google 開源的光學字符識別引擎,可以將圖片轉成文字
- gImageReader:tesseract 的一個圖形化前端
- aegisub:做字幕的軟件,可以輔助音頻的文字轉錄
項目管理:
這里想到 Git,還可以順便做版本控制。
辦公軟件:
- LibreOffice
- WPS for linux
桌面出版:
- Scribus:最新的 1.5 版支持打開 InDesign 的 IDML 文件
- calibre:可以編輯和查看各種電子書格式
- okular:支持查看 chm、pdf、epub 等格式文件
中文環(huán)境:
- 輸入法:Fcitx、iBus??梢源钆?Rime 和搜狗拼音等后端。
- 中文字體:開源的思源黑體、文泉驛,以及免費的字體,比如方正書宋。
技術寫作:
技術文檔也常是要翻譯的內容,比如 dita、latex、docbook、restructuredText 等格式也需要進行處理。根據(jù)具體需要可以自行安裝,Linux 的一個好處就是這些軟件安裝都比較方便。
- dita open toolkit
- docbook
- texlive
- sphinx
- jekyll
- ……
另外還需要一個好的編輯器,可以選用 sublime text 和 visual studio code。當然 Emacs 和 Vim 也行。