如何擴(kuò)大AI的使用? 人工智能存在“1%問題”
關(guān)于人工智能(AI)的報道和評論為數(shù)眾多。有人說它能創(chuàng)造奇跡,也有人說它對人類構(gòu)成威脅。但Databricks公司聯(lián)合創(chuàng)始人兼CEO阿里·高德西(Ali Ghodsi)要大家保持克制。Databricks來自加州大學(xué)伯克利分校AMPLab實驗室,致力于ApacheSpark。
高德西說,在Databricks為其500多位企業(yè)客戶提供支持的用例中,73%是基于AI。這些公司很多都在努力利用AI。但同時也有眾多夸張的故事,講述AI將如何掌控世界,又有多么強(qiáng)大、多么危險。
“當(dāng)我們和試圖解決預(yù)測問題的財富2000強(qiáng)企業(yè)交流時,他們的說法和媒體的報道反差極大,”高德西說。
AI的1%問題
他說,大家都想涉足AI,承認(rèn)其巨大潛力,如果你問首席信息官和C級高管,他們打算如何保持競爭力,人工智能的使用很可能在他們的最重要的五個事項之列。高德西指出,人們以為AI無處不在,但事實大相徑庭。
AI實際上存在“1%問題”。只有谷歌、亞馬遜等少數(shù)公司利用人工智能達(dá)成了他們的目標(biāo)。這些科技巨頭擁有數(shù)以萬計的硅谷工程師,其中很多人擁有博士學(xué)位,或者本來是麻省理工、斯坦福和加州大學(xué)伯克利分校等頂尖學(xué)府的優(yōu)秀教授,他們致力于解決范圍很小、為數(shù)也不多的問題,比如實現(xiàn)汽車的自動駕駛,或者讓人們點擊更多的廣告。高德西解釋說,他們在所從事的有限領(lǐng)域里取得了很大成功,但其余“99%”的公司沒有這些資源,發(fā)現(xiàn)自己試圖解決的問題異常復(fù)雜,不知如何下手。
早期應(yīng)用
Databricks發(fā)現(xiàn),在AI的早期應(yīng)用方面,工業(yè)IT和醫(yī)療行業(yè)是兩個突出的例子。企業(yè)從傳感器收集數(shù)據(jù),然后輸入Databricks,預(yù)測在某地發(fā)現(xiàn)石油的可能性,從而提高勘探效率,改善對環(huán)境的影響。在醫(yī)療行業(yè),機(jī)構(gòu)利用AI來幫助識別圖像中的癌癥腫瘤。但這兩個行業(yè)不僅需要數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師,還需要研究相關(guān)學(xué)科的專家,而這些專家通常不太熟悉AI、數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)倉庫。
就利用AI識別腫瘤的例子而言,這種應(yīng)用還遠(yuǎn)未實現(xiàn)安全自動化。高德西說,谷歌工程師能開發(fā)出區(qū)分貓和狗的AI技術(shù),“就算搞錯了,也只是讓人好笑而已。那是貓,但長的像狗。”但在醫(yī)療領(lǐng)域,如果某人說這是癌癥腫瘤,但實際上并不是,那問題就嚴(yán)重了。
如何擴(kuò)大AI的使用
高德西說,有三個問題必須解決,才能在更多的公司中更廣泛地使用AI。
- 技能差距——首先,需要領(lǐng)域?qū)<?。高德西說,比如識別癌癥就需要醫(yī)生,還有懂得利用機(jī)器學(xué)習(xí)軟件來建立預(yù)測模型的數(shù)據(jù)科學(xué)家。此外還需要了解數(shù)據(jù)庫和數(shù)據(jù)倉庫的數(shù)據(jù)工程師,他們知道數(shù)據(jù)應(yīng)該存儲在哪里,如何解決大數(shù)據(jù)的多樣性、速度和其他問題。在充滿政治色彩、關(guān)系到管理和權(quán)力的氛圍中,讓所有這些不同的角色協(xié)同工作,這不是件容易的事。
- 工具繁多——高德西說,現(xiàn)在有太多的工具需要整合,其中很多都是開源的。這些工具涵蓋數(shù)據(jù)清洗、攝取、安全、預(yù)測和監(jiān)控。想要使所有這些開源工具協(xié)同工作,企業(yè)必須雇傭開發(fā)人員,成功地實現(xiàn)軟件互操作,而這只是為了讓軟件協(xié)同工作。
- 基礎(chǔ)設(shè)施——高德西眼中的第三個挑戰(zhàn)是運營基礎(chǔ)設(shè)施,確保所有機(jī)器和集群處于安全狀態(tài),數(shù)據(jù)以受控的方式流動,因為在受到嚴(yán)格監(jiān)管的行業(yè)里,黑客入侵或信息泄露會使公司面臨嚴(yán)重的后果。
云是關(guān)鍵
高德西說,在踏上AI之旅時,這些是需要盡早解決的三個問題。為了解決它們,需要工具來實現(xiàn)協(xié)作、系統(tǒng)整合以及通過云加強(qiáng)基礎(chǔ)設(shè)施的一致性和可用性。
- 協(xié)作工具——擁有能夠?qū)崿F(xiàn)多角色協(xié)作的工具,這是解決技能差距的最好方法。高德西說,這非常重要。
- 技術(shù)整合——技術(shù)需要整合起來,更好地協(xié)同工作,這樣才能清洗數(shù)據(jù),把它轉(zhuǎn)換成數(shù)學(xué)格式以用于預(yù)測,添加更多數(shù)據(jù),建立預(yù)測模型,讓軟件自動運行。高德西說,能否添加更多數(shù)據(jù)以豐富原始數(shù)據(jù)集,這關(guān)系到預(yù)測的準(zhǔn)確性。
- 云——高德西說,想要確?;A(chǔ)設(shè)施始終運行良好,云是很好的解決之道。云能帶來自動化、外包和確?;A(chǔ)設(shè)施始終運行良好的能力。在AI方面取得成功的那1%的企業(yè)都是云公司。這也許是巧合,也許不是,但在AI方面真正取得成功的谷歌、Facebook、亞馬遜和其他公司都是云公司。他說:“我們認(rèn)為,重要的區(qū)別就在于此。”
什么是AI,什么不是AI
高德西說,在AI被廣泛使用之前,還有很長的路要走,很多人擔(dān)心AI將取代人類大腦,但目前最先進(jìn)的AI研究志不在此;AI實際上是人腦的補(bǔ)充,幫助人類更好地完成富有挑戰(zhàn)性的任務(wù)。
谷歌擁有世界各地所有網(wǎng)站的大量信息。它是AI,還是一個僅僅擁有很多信息的數(shù)據(jù)庫 高德西說,我們可以把這視為一個哲學(xué)問題。但毫無疑問,AI使人類能夠非常高效地查找信息,因為沒人可以在自己的電腦上存儲所有那些數(shù)據(jù),并識別所需信息的來源。如果你有一幅地圖,想找出兩點之間的最近路線,軟件可以很好地做到這一點。但高德西說,在需要創(chuàng)造力、并非超結(jié)構(gòu)的事情上,AI進(jìn)展甚微。
高德西說,谷歌的AlphaGo之所以能戰(zhàn)勝人類圍棋冠軍,是因為它進(jìn)行模擬的速度比人腦更快。但他說,如果你讓AlphaGo回顧其勝利,指出使它在比賽中取勝的關(guān)鍵落子,它就無能為力了。而人類可以大談特談他們迂回曲折的決策過程。AlphaGo只不過是運行一系列程序算法來模擬場景,從中找出最優(yōu)解。它真的能取代人類嗎 顯然不行。
結(jié)論
“我認(rèn)為,從本質(zhì)上來講,AI對人類不是件壞事。”高德西說。他指出,AI沒有減少可供人類使用的資源,比如食物、教育和醫(yī)療。
但他認(rèn)為,在AI被廣泛使用之前,需要先解決技能差距、工具繁多和基礎(chǔ)設(shè)施這三個重要問題。
哪些基因引起某些疾病這樣的問題實際上很難回答,但人人都說他們正在取得“巨大進(jìn)展”。高德西說:“沒人會說‘這相當(dāng)困難,充滿挑戰(zhàn)性。’”
他指出,另一個問題在于,關(guān)于AI的過分宣傳使人們誤以為AI對人類構(gòu)成迫在眉睫的威脅,忽視了它的巨大潛力。
高德西說,Databricks的目標(biāo)是盡可能地簡化這項技術(shù),讓那99%的企業(yè)都能使用,實現(xiàn)AI“民主化”,幫助那些遠(yuǎn)遠(yuǎn)比不上“谷歌們”的公司利用AI。