為什么認(rèn)知系統(tǒng)應(yīng)該將機(jī)器學(xué)習(xí)與語義技術(shù)相結(jié)合
假設(shè)您要構(gòu)建一個(gè)有助于識(shí)別葡萄酒和奶酪搭配的應(yīng)用程序。誰會(huì)表現(xiàn)最好?僅基于機(jī)器學(xué)習(xí)的應(yīng)用程序,僅基于專家知識(shí)的應(yīng)用程序,還是兩者結(jié)合使用?
大多數(shù)機(jī)器學(xué)習(xí)算法都是為解決AI中一個(gè)眾所周知的問題而開發(fā)的,這就是所謂的“知識(shí)獲取瓶頸”。它涉及一個(gè)問題,即如何使主題專家(SME)能夠與數(shù)據(jù)科學(xué)家一起以有效和可持續(xù)的方式與知識(shí)模型一起工作(另請(qǐng)參閱:分類法和本體論–知識(shí)建模的陰陽)。
機(jī)器學(xué)習(xí)算法從數(shù)據(jù)中學(xué)習(xí),因此,成功的實(shí)現(xiàn)顯然與數(shù)據(jù)質(zhì)量和編碼數(shù)據(jù)的語義(含義)所采用的方法密切相關(guān)。語義知識(shí)圖有助于大幅提高數(shù)據(jù)質(zhì)量。他們還將啟動(dòng)您的機(jī)器學(xué)習(xí)項(xiàng)目。Yanko Ivanov最近發(fā)表的一篇文章概括地說:“機(jī)器學(xué)習(xí)算法是一個(gè)小孩,他首先需要學(xué)習(xí)您的語言基礎(chǔ)。”
在最近幾個(gè)月中,我們觀察到了市場趨勢:各種組織已經(jīng)基于機(jī)器學(xué)習(xí)實(shí)現(xiàn)了他們的第一個(gè)應(yīng)用程序版本。在第二次迭代中,他們正在尋找可幫助他們解決以下三個(gè)問題的技術(shù)和方法:
- 機(jī)器學(xué)習(xí)算法通常沒有獲得足夠的信號(hào)來“理解”數(shù)據(jù)的正確含義,例如消除歧義。精度低于預(yù)期。
- 認(rèn)知平臺(tái)通常需要敏感數(shù)據(jù)以從中學(xué)習(xí),不應(yīng)在云中對(duì)其進(jìn)行處理。
- 中小企業(yè)的豐富經(jīng)驗(yàn)和知識(shí)無法編碼,如果不包含在算法中,則會(huì)被浪費(fèi)掉
人工智能不僅僅是一種技術(shù)
面對(duì)“知識(shí)獲取瓶頸”,這也意味著專家的知識(shí)被視為任何組織的重要資產(chǎn)。不應(yīng)將這些黃金財(cái)富轉(zhuǎn)移到云中,以免我們無法控制的某些機(jī)器對(duì)其進(jìn)行處理。相反,關(guān)鍵是有效實(shí)施包括中小企業(yè)在內(nèi)的各種技術(shù)和方法的良好結(jié)合。好的AI策略不僅要立即產(chǎn)生更好的結(jié)果,還在于我們?nèi)绾谓⑷伺c機(jī)器之間的有效合作關(guān)系。
最新發(fā)布的IDC白皮書討論了人工智能的社會(huì)技術(shù)方面,并深入探討了問題的核心:“擁抱語義技術(shù)以提供認(rèn)知解決方案可以使組織大大減少對(duì)開發(fā)人員和IT專業(yè)人士的依賴。語義數(shù)據(jù)管理已經(jīng)到位,數(shù)據(jù)驅(qū)動(dòng)的應(yīng)用程序的采用將由領(lǐng)域?qū)<液蜆I(yè)務(wù)用戶推動(dòng)。”