混合AI是企業(yè)挖掘數(shù)據(jù)價值的優(yōu)選方式
譯文說到人工智能想必大家都耳熟能詳,其實(shí)它包含了廣泛的知識,分為不同的類型,各有優(yōu)劣:
- 混合人工智能(Hybrid AI)能夠克服單一技術(shù)方法的局限性
- 符號人工智能(Symbolic AI)能夠理解實(shí)際知識,而不僅僅是數(shù)據(jù)
- 混合解決方案打開了人工智能的“黑匣子”,幫助人工智能技術(shù)在現(xiàn)實(shí)場景中普遍地應(yīng)用
符號人工智能和機(jī)器學(xué)習(xí)/深度學(xué)習(xí)都有自己的一套優(yōu)勢,當(dāng)以混合方式一起使用時,將會是強(qiáng)強(qiáng)聯(lián)合。將為許多關(guān)鍵的企業(yè)應(yīng)用程序的發(fā)展鋪平道路。下來,我們先來看看它們各自的能力。
符號人工智能
Symbolic AI 的設(shè)計(jì)初衷是利用實(shí)際知識,更好地理解現(xiàn)實(shí)世界的想法和概念。這類似于人類使用特定的、面向領(lǐng)域的、符號/語義的知識來解釋我們周圍的環(huán)境。符號人工智能最重要的貢獻(xiàn)是在自然語言處理(NLP)和自然語言理解(NLU)領(lǐng)域。
機(jī)器學(xué)習(xí)/深度學(xué)習(xí)
機(jī)器學(xué)習(xí)(ML)是目前企業(yè)發(fā)展過程中采用最多的人工智能形式。由于它能夠自主處理不同的數(shù)據(jù)集,并不斷的迭代和自適應(yīng),因此它本質(zhì)上“學(xué)習(xí)”了環(huán)境的模式并做出相應(yīng)的響應(yīng)。在自動化和自主計(jì)算環(huán)境下,它成為了最靈活和有價值的工具。
深度學(xué)習(xí)(DL)是基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)。相對而言,DL可以返回更好的結(jié)果,但計(jì)算/能量成本可能比普通的ML技術(shù)高許多數(shù)量級。
非結(jié)構(gòu)化數(shù)據(jù)挖掘
人工智能有望大幅提高生產(chǎn)率和利潤率這兩大企業(yè)目標(biāo)。當(dāng)然,這需要高效地挖掘非結(jié)構(gòu)化數(shù)據(jù)的隱藏價值,從而實(shí)現(xiàn)更高級別的自動化。不僅要實(shí)現(xiàn)結(jié)構(gòu)化的數(shù)據(jù)驅(qū)動工作流——絕大多數(shù)都是機(jī)械的、重復(fù)的功能,還要實(shí)現(xiàn)信息密集型或非結(jié)構(gòu)化數(shù)據(jù)驅(qū)動的流程。
與此同時,企業(yè)更傾向以非破壞性和完全透明的方式引入新的技術(shù)方法,因?yàn)檫@樣它所帶來的任何變化都便于人們理解,所產(chǎn)生的好處是明確和直接的。
純機(jī)器學(xué)習(xí)方法很難滿足所有這些要求。從本質(zhì)上講,他們是一個“黑盒子”場景——他們的內(nèi)部計(jì)算和決策過程仍然是隱藏的,不好解釋。例如,當(dāng)ML單獨(dú)用于自然語言處理時,對輸入數(shù)據(jù)的任何更改都可能導(dǎo)致模型漂移,就不得不重新訓(xùn)練和測試數(shù)據(jù)。
符號AI學(xué)習(xí)方法和機(jī)器學(xué)習(xí)方法并不是相互排斥的:通過有效的融合,可以達(dá)到企業(yè)預(yù)期的最佳效果。這包括對核心流程和應(yīng)用程序的高效支持,對給定AI模型的行為的完全透明,以及如果誤差較大時,它又如何及時地修正。
事實(shí)上,在大多數(shù)企業(yè)中,最大的信息寶庫是語言形式的非結(jié)構(gòu)化數(shù)據(jù)。從電子郵件到錄音,從法律合同到規(guī)章制度,口頭和書面文字才是最主要的數(shù)據(jù)源。傳統(tǒng)的計(jì)算平臺在處理結(jié)構(gòu)化數(shù)據(jù)(如客戶列表、財(cái)務(wù)記錄和性能指標(biāo))方面表現(xiàn)出色,但直到最近人工智能的發(fā)展和應(yīng)用,才使得以經(jīng)濟(jì)有效的方式處理非結(jié)構(gòu)化內(nèi)容成為可能。
符號AI
在整個AI的生態(tài)系統(tǒng)中,符號推理和語義理解可以產(chǎn)生更精確的結(jié)果,同時減少了訓(xùn)練新模型的時間和費(fèi)用。首先是提高輸入數(shù)據(jù)的質(zhì)量,然后簡化支持這些海量數(shù)據(jù)所需的繁瑣和資源密集型基礎(chǔ)設(shè)施。
從操作上講,混合AI方法可以推動人工智能超越機(jī)械式、重復(fù)的簡單自動化任務(wù),從事需要知識和專業(yè)技能的更高級別的工作——但仍未達(dá)到需要人工操作的戰(zhàn)略級別的任務(wù)。
舉一個最典型的例子標(biāo)注,即對信息進(jìn)行標(biāo)記以便機(jī)器使用的過程。這是一項(xiàng)艱巨而乏味的工作,費(fèi)時又費(fèi)力。但是,通過在符號學(xué)習(xí)環(huán)境中利用適當(dāng)?shù)闹R庫和圖表,能夠有效的簡化訓(xùn)練過程。
可信度
如上所述,當(dāng)前AI部署的另一個關(guān)鍵問題是可信度。ML/DL存在黑盒問題,其輸出既不透明也無法解釋。
這個問題通常表現(xiàn)在人工智能訓(xùn)練模型出現(xiàn)偏差的領(lǐng)域。關(guān)于人工智能產(chǎn)生的種族主義、歧視女性和其他偏見的故事比比皆是,大多是因?yàn)樗妮斎霐?shù)據(jù)向這個方向傾斜。如果不能直接觀察這些行為,看不到算法對此做何反應(yīng),整個系統(tǒng)最終都會面臨癱瘓,只能重新訓(xùn)練模型再重新投產(chǎn)??尚哦葐栴}還會帶來其他影響,比如錯誤地預(yù)測重點(diǎn)細(xì)分市場的購買趨勢,或者大學(xué)招生中未能考慮到的文化因素等。
可解釋的人工智能
通過引入符號AI,黑盒被打開,這樣用戶就可以理解機(jī)器為什么會以特定方式行事,如果結(jié)果不理想,還可以做什么進(jìn)行優(yōu)化。此外,這種可見性使操作人員能夠持續(xù)監(jiān)視自己的流程,從而做出適當(dāng)?shù)恼{(diào)整。
人工智能是一個強(qiáng)大的工具,可以為企業(yè)數(shù)據(jù)運(yùn)營帶來奇跡,但它仍處于起步階段。對于有遠(yuǎn)見的組織來說,標(biāo)準(zhǔn)的、單一模式的人工智能迭代的局限性已經(jīng)越來越明顯。我們需要的是一種方法,能讓這項(xiàng)技術(shù)更具適應(yīng)性,更能深入挖掘數(shù)據(jù)的潛在價值,同時讓人工智能變得更容易使用,成本更低。
混合人工智能——基于理解實(shí)際知識而不是簡單學(xué)習(xí)模式的符號人工智能——是企業(yè)挖掘多年來收集的所有數(shù)據(jù)價值的優(yōu)選方式。
譯者介紹
張怡,51CTO社區(qū)編輯,中級工程師。主要研究人工智能算法實(shí)現(xiàn)以及場景應(yīng)用,對機(jī)器學(xué)習(xí)算法和自動控制算法有所了解和掌握,并將持續(xù)關(guān)注國內(nèi)外人工智能技術(shù)的發(fā)展動態(tài),特別是人工智能技術(shù)在智能網(wǎng)聯(lián)汽車、智能家居等領(lǐng)域的具體實(shí)現(xiàn)及其應(yīng)用。
原文標(biāo)題:??The Hybrid to Give Your AI the Gift of Knowledge??,作者:Marco Varone