金山 AI Lab 首次公布落地計劃,它選擇了 AI 最難啃的一塊“骨頭”
“2014 年的時候我曾經(jīng)說過,成立 30 年的金山 WPS 是被雷軍一腳’踢’到移動互聯(lián)網(wǎng)上的;現(xiàn)在來看,人工智能將成為金山后 30 年一塊最重要的敲門磚。”
12 月末,金山辦公 CEO 葛珂在北京的一場媒體發(fā)布會中表示。在該活動中,成立滿一年的金山 AI Lab ***公布了其落地計劃。
金山辦公 CEO 葛珂
自 2018 年 7 月金山辦公推出 WPS AI 助手,通過可模擬人的智能語音助手協(xié)助用戶進行智能協(xié)作起,金山辦公的 AI 戰(zhàn)略開始逐步實施,未來計劃實現(xiàn)“AI 知識圖譜技術(shù)”在金山 WPS Office 等產(chǎn)品的落地。
其具體的功能點包括:
“成語知識卡片”將從文檔中識別成語實體,提供成語的讀音、釋義和出處;
“成語讀音填充”將為含有生僻字的成語注音;
“成語知識問答”將針對用戶對成語的提問,進行推薦常用成語;
“成語寫作”可在用戶比較各個成語時,展開成語對應(yīng)的知識卡片。
人工智能正成為金山集團當下的核心戰(zhàn)略。上個月,金山軟件集團召開了成立 30 周年慶典,金山董事長雷軍也在公開演講與全員郵件中多次談到人工智能的戰(zhàn)略地位。
“未來 30 年,金山將全力投入國際化和 AI。” 雷軍強調(diào)。
整個 2018 年,AI 成了互聯(lián)網(wǎng)巨頭業(yè)務(wù)板塊中的“香餑餑”,這從阿里、騰訊、百度等大公司在去年的組織架構(gòu)調(diào)整中可見一斑。對于他們來說,人工智能的落地既需要與現(xiàn)有的數(shù)據(jù)、業(yè)務(wù)積累實現(xiàn)聯(lián)動,也需要與未來的戰(zhàn)略發(fā)展相互映襯(諸如百度自動駕駛的 Apollo、阿里天貓精靈的語音交互)。
而在以 WPS 等辦公軟件發(fā)家的金山軟件,其多年積累的語義處理、機器翻譯等場景則成為 AI 落地的***方向。目前,金山 WPS 全線產(chǎn)品月活躍用戶數(shù)超 3 億,產(chǎn)品已覆蓋全球超過 220 個國家和地區(qū)。每天用戶使用 WPS Office 來編輯的文件數(shù)量達到 5 億左右。
2017 年 5 月,金山集團成立 AI Lab ,由金山辦公副總裁姚冬直接分管,目前團隊涵蓋圖像、文本、語音三大方向,計劃將機器翻譯與圖文轉(zhuǎn)換、知識圖譜、智能協(xié)作等技術(shù)深度融合。
金山辦公副總裁姚冬
相比商湯、曠視、云從等 AI 公司在視覺識別領(lǐng)域扎堆進場,金山選擇了主攻人工智能中的 NLP(自然語言處理)方向,這樣的選擇有些特例獨行。
一般來說,人工智能可以被簡單分為自然語言處理、計算機視覺、人機交互三類模塊,而在其中,自然語言處理的起源時間最早,后期落地難度也***。
1956 年,“人工智能”概念在達特茅斯會議提出后,科學家們開始寄希望于用計算機模擬大腦理解語言學的過程,1962 年,一個名為“機器翻譯與計算語言學學會”(后更名為國際計算機語言學委員會,簡稱“ACL”)的機構(gòu)在美國成立,學界開始對包含機器翻譯、語義理解等技術(shù)在內(nèi)的人工智能模塊進行深入研究。
“機器翻譯遇到了很多難以克服的語義障礙,甚至一度進入低迷狀態(tài)。”中科院研究院博士生導師宗成慶對鈦媒體介紹道,2013 年,宗成慶成為國內(nèi)至今唯一一位加入 ACL 的華人科學家,在他看來,在語音語義理解的機器翻譯操作中,需要面臨諸如“口音、標點識別不準導致語句翻譯出錯”、“政治經(jīng)濟等專業(yè)術(shù)語機器無法勝任”等諸多挑戰(zhàn)。
不過,金山仍愿意在 NLP 領(lǐng)域進行嘗試。在金山辦公副總裁姚冬看來,這與集團在該賽道上的積累息息相關(guān)。
1997 年畢業(yè)即加入金山的姚冬,曾參與金山早期的兩款產(chǎn)品——金山詞霸與金山快譯的開發(fā)工作。他認為,起初受限于當時 CPU 計算能力、存儲、數(shù)據(jù)量三個問題,機器翻譯只是基于規(guī)則的模型。而隨著算力的升級與算法的迭代,姚冬一方面目睹了機器翻譯逐步大規(guī)模地應(yīng)用,另一方面,他也見證了金山集團旗下云、WPS、稻殼網(wǎng)等產(chǎn)品的延伸,這也為金山的 AI 落地提供了更為豐富的場景。
在闡釋金山的人工智能戰(zhàn)略時,“務(wù)實”是姚冬多次談到的形容詞。他告訴鈦媒體:“金山做技術(shù)的風格是一定要落地,一定要把 AI 變成一個產(chǎn)品或服務(wù)直接面向用戶。這是金山 30 年來的一貫風格。”
以金山此次宣布的 AI 落地計劃中的功能點為例:當用戶寫作時突然忘記應(yīng)該使用什么成語,只需通過對 WPS 文檔中內(nèi)置的智能助手提問,比如“形容勤奮的成語是什么?”,即可獲得一系列描述勤奮的常用成語,同時每個成員還包含一份相對應(yīng)的知識卡片,以幫助用戶做出選擇,并在用戶選定合適的成語時實現(xiàn)自動插入。
金山 WPS 推出的“成語智能問答”功能可以幫助用戶聯(lián)想合適的成語。
“公文輔助寫作”,是金山選擇用 AI 進行革新的另一大主場景。這項在今年年中推出的功能包括關(guān)鍵詞句自動校對,比如對“全面建成小康社會”這類的常用語句進行定向識別;以及對《全國人大學習方案》這類長文件進行智能要點匯總與目錄檢索。
根據(jù)金山辦公 CEO 葛珂介紹,目前全國政務(wù)系統(tǒng)中,金山 WPS 的覆蓋率已經(jīng)超過了 50%,這就讓金山在 TO G 的垂直類別里獲取到足夠多的訓練場景;另一方面,由于政務(wù)領(lǐng)域?qū)ξ谋疽蟊容^高,相關(guān)的格式、字體、字號都有所限定,再加上政府信息公開化的趨勢,有助于為金山形成高質(zhì)量的語料。
除了功能點上的革新以外,金山辦公也十分注重人工智能的技術(shù)研究與實際業(yè)務(wù)的結(jié)合效率,在葛珂看來,當 AI 對用戶的價值通過金山辦公的產(chǎn)品不斷放大后,當中的商業(yè)化能力也會被自然而然地釋放出來。
“現(xiàn)在的用戶習慣已經(jīng)變成是他們愿意為成果付費,而不愿意為一個工具付費。”葛珂對鈦媒體舉例談到。目前金山 WPS 的付費應(yīng)用主要以模板素材、會員服務(wù)等增值功能為主,而 AI 助手可以做得,就是可以將 PPT 模板之類的素材與用戶需求更智能地匹配在一起,以撬動用戶的付費購買意愿。