自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

下一代人工智能的發(fā)展方向 (上)

人工智能
本文重點介紹了AI中的三個新興領(lǐng)域,這些領(lǐng)域?qū)⒃谖磥淼膸啄曛兄匦露x人工智能領(lǐng)域和社會。

[[349500]]

盡管人工智能的誕生已經(jīng)超過半個世紀(jì),但近十年來人工智能領(lǐng)域發(fā)展非常迅速。自2012年ImageNet競賽開始深度學(xué)習(xí)的現(xiàn)代時代以來,只有8年的時間。自那時以來,人工智能領(lǐng)域的進(jìn)步令人震驚,現(xiàn)在人工智能已經(jīng)深入我們?nèi)粘9ぷ魃畹姆椒矫婷妗?/p>

有專家表示,這個驚人的步伐只會越來越快。從現(xiàn)在開始的五年后,人工智能領(lǐng)域?qū)⑴c今天大不相同。當(dāng)前被認(rèn)為是最先進(jìn)的方法將已經(jīng)過時;今天剛剛出現(xiàn)或處于邊緣的方法將成為主流。

下一代人工智能將是什么樣子?哪種新穎的AI方法將釋放當(dāng)前在技術(shù)和業(yè)務(wù)方面難以想象的可能性?本文重點介紹了AI中的三個新興領(lǐng)域,這些領(lǐng)域?qū)⒃谖磥淼膸啄曛兄匦露x人工智能領(lǐng)域和社會。

1、無監(jiān)督學(xué)習(xí)

當(dāng)今AI世界中最主要的范例是有監(jiān)督的學(xué)習(xí)。在監(jiān)督學(xué)習(xí)中,AI模型從數(shù)據(jù)集中學(xué)習(xí)人類根據(jù)預(yù)定義類別進(jìn)行策劃和標(biāo)記的過程。(術(shù)語“監(jiān)督學(xué)習(xí)”源于人類“監(jiān)督者”預(yù)先準(zhǔn)備數(shù)據(jù)的事實。)

在過去的十年中,盡管從無人駕駛汽車到語音助手,有監(jiān)督的學(xué)習(xí)已經(jīng)推動了AI的顯著進(jìn)步,但它仍然存在嚴(yán)重的局限性。

手動標(biāo)記成千上萬個數(shù)據(jù)點的過程可能非常昂貴且繁瑣。在機器學(xué)習(xí)模型提取數(shù)據(jù)之前,人們必須手動標(biāo)記數(shù)據(jù)這一事實已成為AI的主要瓶頸。

在更深層次上,有監(jiān)督的學(xué)習(xí)代表了一種狹窄的、受限制的學(xué)習(xí)形式。受監(jiān)督的算法不僅無法探索和吸收給定數(shù)據(jù)集中的所有潛在信息、關(guān)系和含義,而且僅針對研究人員提前確定的概念和類別。

相反,無監(jiān)督學(xué)習(xí)是一種AI方法,其中算法無需人工提供標(biāo)簽或指導(dǎo)即可從數(shù)據(jù)中學(xué)習(xí)。

許多AI領(lǐng)導(dǎo)者將無監(jiān)督學(xué)習(xí)視為人工智能的下一個前沿領(lǐng)域。用AI傳奇人物Yann LeCun的話說:“下一場AI革命將不會受到監(jiān)督。”加州大學(xué)伯克利分校的教授Jitenda Malik更加生動地說:“標(biāo)簽是機器學(xué)習(xí)研究人員的鴉片。”

無監(jiān)督學(xué)習(xí)如何工作?簡而言之,系統(tǒng)會根據(jù)世界的其他部分來了解世界的某些部分。通過觀察實體的行為,實體之間的模式以及實體之間的關(guān)系(例如,上下文中的單詞或視頻中的人物),系統(tǒng)引導(dǎo)了對其環(huán)境的整體理解。一些研究人員用“從其他事物中預(yù)測所有事物”來概括這一點。

無監(jiān)督學(xué)習(xí)更緊密地反映了人類學(xué)習(xí)世界的方式:通過開放式探索和推理,不需要監(jiān)督學(xué)習(xí)的“訓(xùn)練輪”。它的基本優(yōu)點之一是,世界上總是會有比已標(biāo)記數(shù)據(jù)多得多的未標(biāo)記數(shù)據(jù)(前者更容易獲得)。

用LeCun的話來說,他喜歡密切相關(guān)的術(shù)語“自我監(jiān)督學(xué)習(xí)”:“在自我監(jiān)督學(xué)習(xí)中,輸入的一部分用作監(jiān)視信號,以預(yù)測輸入的其余部分??梢酝ㄟ^自我監(jiān)督學(xué)習(xí)而不是[其他AI范式]來學(xué)習(xí)有關(guān)世界結(jié)構(gòu)的知識,因為數(shù)據(jù)是無限的,每個示例提供的反饋量很大。”

無監(jiān)督學(xué)習(xí)已經(jīng)在自然語言處理中產(chǎn)生了變革性的影響。 NLP得益于一種新的無監(jiān)督的學(xué)習(xí)架構(gòu),即Transformer,最近取得了令人難以置信的進(jìn)步,該架構(gòu)始于Google大約三年前。 (有關(guān)Transformer的更多信息,請參見下面的#3。)

將無監(jiān)督學(xué)習(xí)應(yīng)用于AI的其他領(lǐng)域的努力仍處于早期階段,但是正在取得快速進(jìn)展。舉個例子,一家名為Helm.ai的初創(chuàng)公司正在尋求利用無監(jiān)督學(xué)習(xí)來超越自動駕駛汽車行業(yè)的領(lǐng)導(dǎo)者。

許多研究人員將無監(jiān)督學(xué)習(xí)視為開發(fā)人類級AI的關(guān)鍵。 LeCun認(rèn)為,掌握無監(jiān)督學(xué)習(xí)是“未來幾年ML和AI面臨的最大挑戰(zhàn)。”

 

 

2、聯(lián)合學(xué)習(xí)

數(shù)字時代的主要挑戰(zhàn)之一是數(shù)據(jù)隱私。由于數(shù)據(jù)是現(xiàn)代人工智能的命脈,因此數(shù)據(jù)隱私問題在AI的發(fā)展軌跡中扮演著重要的角色(并且常常是限制性的)。

保持隱私的人工智能(使AI模型能夠從數(shù)據(jù)集中學(xué)習(xí)而不損害其隱私的方法)正變得日益重要。保持隱私的AI的最有前途的方法也許是聯(lián)合學(xué)習(xí)。

聯(lián)合學(xué)習(xí)的概念最早由Google的研究人員于2017年初提出。在過去的一年中,對聯(lián)合學(xué)習(xí)的興趣激增:到2020年的前六個月,發(fā)表了超過1,000篇有關(guān)聯(lián)合學(xué)習(xí)的研究論文,而在2018年只有180篇。

如今,構(gòu)建機器學(xué)習(xí)模型的標(biāo)準(zhǔn)方法是將所有訓(xùn)練數(shù)據(jù)收集到一個地方(通常在云中),然后在數(shù)據(jù)上訓(xùn)練模型。但是,這種方法對全球大部分?jǐn)?shù)據(jù)都不可行,出于隱私和安全原因,這些數(shù)據(jù)無法移至中央數(shù)據(jù)存儲庫。這使其成為傳統(tǒng)AI技術(shù)的禁區(qū)。

聯(lián)合學(xué)習(xí)通過顛覆傳統(tǒng)的AI方法解決了這個問題。

聯(lián)合學(xué)習(xí)并不需要一個統(tǒng)一的數(shù)據(jù)集來訓(xùn)練模型,而是將數(shù)據(jù)保留在原處,并分布在邊緣的眾多設(shè)備和服務(wù)器上。取而代之的是,將模型的許多版本發(fā)送到一個帶有訓(xùn)練數(shù)據(jù)的設(shè)備,每個模型都在每個數(shù)據(jù)子集上進(jìn)行本地訓(xùn)練。然后將生成的模型參數(shù)(而不是訓(xùn)練數(shù)據(jù)本身)發(fā)送回云。當(dāng)所有這些“微型模型”匯總在一起時,結(jié)果就是一個整體模型,其功能就像是一次在整個數(shù)據(jù)集上進(jìn)行訓(xùn)練一樣。

最初的聯(lián)合學(xué)習(xí)用例是針對分布在數(shù)十億移動設(shè)備上的個人數(shù)據(jù)訓(xùn)練AI模型。正如這些研究人員總結(jié)的那樣:“現(xiàn)代移動設(shè)備可以訪問大量適用于機器學(xué)習(xí)模型的數(shù)據(jù)...。但是,這些豐富的數(shù)據(jù)通常對隱私敏感,數(shù)量龐大或兩者兼而有之,因此可能無法登錄到數(shù)據(jù)中心....我們提倡一種替代方案,將訓(xùn)練數(shù)據(jù)保留在移動設(shè)備上,并通過匯總本地計算的更新來學(xué)習(xí)共享模型。”

最近,醫(yī)療保健已成為聯(lián)合學(xué)習(xí)應(yīng)用中特別有前途的領(lǐng)域。

不難理解原因。一方面,醫(yī)療保健中有大量有價值的AI用例。另一方面,醫(yī)療保健數(shù)據(jù),尤其是患者的個人身份信息,非常敏感;像HIPAA這樣的法規(guī)叢書限制了它的使用和移動。聯(lián)合學(xué)習(xí)可以使研究人員能夠開發(fā)挽救生命的醫(yī)療保健AI工具,而無需從源頭轉(zhuǎn)移敏感的健康記錄或使它們暴露于隱私泄露中。

涌現(xiàn)了許多初創(chuàng)公司,以追求醫(yī)療保健領(lǐng)域的聯(lián)合學(xué)習(xí)。最有名的是總部位于巴黎的Owkin;早期階段的參與者包括Lynx.MD、Ferrum Health和Secure AI Labs。

除醫(yī)療保健外,聯(lián)合學(xué)習(xí)有一天可能會在任何涉及敏感數(shù)據(jù)的AI應(yīng)用的開發(fā)中發(fā)揮中心作用:從金融服務(wù)到自動駕駛汽車,從政府用例到各種消費產(chǎn)品。與差分隱私和同態(tài)加密之類的其他隱私保護(hù)技術(shù)結(jié)合使用,聯(lián)合學(xué)習(xí)可以提供釋放AI巨大潛力的關(guān)鍵,同時減輕對數(shù)據(jù)隱私的棘手挑戰(zhàn)。

如今,全球范圍內(nèi)頒布的數(shù)據(jù)隱私立法浪潮(從GDPR和CCPA開始,即將推出許多類似的法律)只會加速對這些隱私保護(hù)技術(shù)的需求。期望聯(lián)合學(xué)習(xí)在未來幾年中將成為AI技術(shù)堆棧的重要組成部分。

3、Transformer

我們已經(jīng)進(jìn)入了自然語言處理的黃金時代。

OpenAI發(fā)布的GPT-3是有史以來功能最強大的語言模型,今年夏天吸引了整個技術(shù)界。它為NLP設(shè)定了新的標(biāo)準(zhǔn):它可以編寫令人印象深刻的詩歌,生成有效的代碼,撰寫周到的業(yè)務(wù)備忘錄,撰寫有關(guān)自身的文章等等。

GPT-3只是一系列類似架構(gòu)的NLP模型(Google的BERT、OpenAI的GPT-2、Facebook的RoBERTa等)中最新的(也是最大的),它們正在重新定義NLP的功能。

推動語言AI革命的關(guān)鍵技術(shù)突破是Transformer。

在2017年具有里程碑意義的研究論文中介紹了Transformer。以前,最新的NLP方法都基于循環(huán)神經(jīng)網(wǎng)絡(luò)(例如LSTM)。根據(jù)定義,遞歸神經(jīng)網(wǎng)絡(luò)按順序顯示數(shù)據(jù),即按單詞出現(xiàn)的順序一次處理一個單詞。

Transformer的一項偉大創(chuàng)新是使語言處理并行化:給定文本主體中的所有標(biāo)記都是同時而不是按順序分析的。為了支持這種并行化,Transformer嚴(yán)重依賴于稱為注意力的AI機制。注意使模型能夠考慮單詞之間的關(guān)系,而不論它們之間有多遠(yuǎn),并確定段落中的哪些單詞和短語對于“注意”最為重要。

為什么并行化如此有價值?因為它使Transformers的計算效率大大高于RNN,這意味著可以在更大的數(shù)據(jù)集上對它們進(jìn)行訓(xùn)練。 GPT-3訓(xùn)練了大約5000億個單詞,由1750億個參數(shù)組成,這使現(xiàn)有的RNN顯得相形見絀。

迄今為止,由于GPT-3等的成功應(yīng)用,Transformer幾乎只與NLP相關(guān)聯(lián)。但是就在本月,發(fā)布了一篇突破性的新論文,該論文成功地將Transformer應(yīng)用于計算機視覺。許多AI研究人員認(rèn)為,這項工作可以預(yù)示計算機視覺的新時代。 (正如著名的ML研究人員Oriol Vinyals所說的那樣,“我的觀點是:告別卷積。”)

盡管像Google和Facebook這樣的領(lǐng)先AI公司已經(jīng)開始將基于Transformer的模型投入生產(chǎn),但大多數(shù)組織仍處于將該技術(shù)產(chǎn)品化和商業(yè)化的初期階段。 OpenAI已宣布計劃通過API將GPT-3進(jìn)行商業(yè)訪問,這可能會為在其上構(gòu)建應(yīng)用的整個初創(chuàng)企業(yè)生態(tài)系統(tǒng)注入種子。

 從自然語言開始,期望Transformers在未來的幾年中將成為整個新一代AI功能的基礎(chǔ)。過去十年在人工智能領(lǐng)域令人興奮,但事實證明,這僅僅是未來十年的序幕。

 

責(zé)任編輯:姜華 來源: 千家網(wǎng)
相關(guān)推薦

2020-10-30 14:31:26

人工智能

2021-04-01 15:30:35

人工智能

2022-08-11 10:11:39

人工智能疾病診斷

2018-11-21 16:00:24

2023-03-21 14:30:47

2019-01-21 09:39:26

人工智能AI互聯(lián)網(wǎng)

2023-09-14 10:15:53

人工智能

2024-04-19 10:02:17

2018-06-14 09:55:37

高校人工智能教育部

2017-07-21 12:17:00

2020-10-27 10:10:39

人工智能機器學(xué)習(xí)技術(shù)

2023-09-28 13:08:22

2021-12-02 22:38:29

人臉識別人工智能傳感技術(shù)

2024-07-26 14:46:20

2025-04-08 08:18:38

2013-08-27 13:52:32

鮑爾默微軟

2021-04-19 17:35:55

人工智能深度學(xué)習(xí)技術(shù)

2020-08-07 18:22:14

人工智能AI標(biāo)準(zhǔn)體系

2020-12-17 13:51:35

人工智能人工智能發(fā)展方向

2020-07-25 20:25:58

人工智能AI教育
點贊
收藏

51CTO技術(shù)棧公眾號