什么是人工智能?
什么是人工智能
人工智能(Artificial Intelligence,簡稱“ AI”)自誕生之日 起,其定義與內涵就一直存在爭議。從字面上看,AI 由“人 工”和“智能”兩詞構成,其核心是智能。因此,人工智能首先 是智能的一種。但是人工智能是人造的,而非自然形成的智能(如我們人類的智能就是經(jīng)過長期的進化而形成的一種生物智能)。進一步理解人工智能的關鍵,在于理解“智能是什么”, 這其實是一個難以回答的問題。一個普遍的認識是“智能是利用知識解決問題的能力”。作為“萬物之靈長”的人類,其智能很大程度上就體現(xiàn)在人類能夠發(fā)現(xiàn)知識并利用知識解決各類問 題。人工智能的研究與實踐的一個重要目標就是回答“智能是什么”這一問題。對這個問題的回答,將成為我們這代人甚至后面幾代人共同努力的方向與目標。
如果需要給人工智能下一個定義,可以表述為:人工智能是通過智能機器延伸、增強人類改造自然和治理社會能力的科學與技術。人工智能首先是一門科學,因為我們需要解釋智能 的本質,需要回答智能能否計算、如何計算等科學問題。人工智能更是一項工程,因為我們需要讓機器實現(xiàn)對于人類智能的模擬,從而解決需要人類智能才能解決的問題。因此,人工智 能兼有科學與工程的屬性。也正是這個原因,決定了人工智能的跨學科和綜合特性。人工智能涉及哲學、心理學、數(shù)學、語言學、計算機等多個學科。人工智能的最終目標不是發(fā)展自主的機器智能,而是借助人工智能增強人類認識世界、改造世界的能力。拓展和延伸人類的智能,并最終造福人類社會,是發(fā)展人工智能的根本使命,也是唯一使命。人工智能是以人類智能為模板進行拓印與塑形的,理解與模擬人類智能是人工智能實現(xiàn)的基本路徑。人類智能,外觀體現(xiàn)為行為,內察體現(xiàn)為思維。人工智能的研究與實踐不論其形式如何不同,其最終落腳點要么是讓機器具備人類身體的智能行為能力,要么是讓機器具備人類心靈的復雜思維能力。
人類的智能行為能力體現(xiàn)在其身體的感知與運動能力。我們的身體具有五官與四肢。我們通過五官識音辨聲、識圖辨形、辨別氣味等,通過四肢操縱物體、運動身體,從而實現(xiàn)身體與環(huán)境的復雜交互。機器實現(xiàn)這些能力需要具備模式識別與反饋控制能力。比如,為了識別一個手寫字是不是“0”,機器必須能夠從手寫體輸入數(shù)據(jù)中識別出“0”所對應的書寫模式。模式識別能力是我們五官所具備的基本能力。我們人類的四肢能夠十分柔韌、靈活地做出各類動作,實現(xiàn)各類物體操縱,這背后體現(xiàn)的是人類四肢與環(huán)境的強大交互能力。比如機械手臂在抓舉物品時,需要實時感知物品的位置以及抓舉的力度,從而及時調整抓舉的動作與姿態(tài),最終完成抓舉動作。近年來,機器在模式識別與運動控制等能力上飛速發(fā)展,已經(jīng)初步達到人類水平。以感知數(shù)據(jù)中的模式、物理世界的狀態(tài)為主,讓機器具備人類的智能行為為主要目標的人工智能研究和實踐,我們稱之為“感知派”。
人類的智能更為鮮明地體現(xiàn)在人類的復雜心智上。人類的心智活動十分多樣,包括語言理解、場景理解、調度規(guī)劃、智能檢索、學習歸納、推理決策等。塑造人類心智能力的器官是我 們的大腦。理解大腦的運作機制,從而實現(xiàn)類腦智能,一直以來是科學家們持之以恒為之奮斗的目標之一。隨著人工智能的發(fā)展,讓機器具有一顆聰慧的大腦,已被迫切地提上議事日程。有身無心的機器就好比沒有靈魂的“僵尸”,雖然也能解決很多問題,但是難以進入人類社會,成為人類有趣的“伙伴”。如 果人工智能的發(fā)展僅是停留在感知與運動階段,機器只是達到了一般動物的智能水平,而真正意義上使得人類從動物本性中脫胎而出的是人類獨有的心智能力。雖然動物也有大腦,也有 一定的心智水平,但是人類心智與動物心智的根本差別在于人類的認知能力。認知能力是指人腦接受外界信息,經(jīng)過加工處理,轉換成內在的心理活動,從而形成對世界的認知體驗的過程。它包括時空認知、因果認知、語言認知、文化認知等方面。很顯然,目前只有人類具有認知能力,以“認知”為基礎的人工智能研究和實踐,被稱為“認知派”,將是未來人工智能研究與實踐的焦點。
值得注意的是,雖然人類是實現(xiàn)人工智能的模板,但是人工智能在當下的實踐已經(jīng)不單單以“類人”為目標,很多時候是遠超人類水平的。人類的特定智能很多情況下是有局限的。比如,我們在決定買哪本人工智能教材時,其決策要素一般不超過 5—7 個,而機器則可以同時考慮數(shù)以百萬計的決策要素進行判斷。人類感知的物理范圍是十分有限的,而機器視覺可 以識別數(shù)千米范圍內的目標。因此,在很多單項智能上,人類被機器超越只是時間問題,如計算、下棋、識圖、辨聲等。人工智能的發(fā)展進程必定是我們見證人類單項智能被機器逐步超越 的過程。但是有一個至關重要的獎項,智能的“全能冠軍”,卻是機器難以從人類手中奪走的。無數(shù)個智能的單項冠軍也難以企及這一“全能冠軍”的智能水平。這就引出了人工智能的強弱之分的話題。
人工智能除了有“感知”與“認知”之分,亦有“強”“弱”之 分。任何一臺普通的計算器在數(shù)值運算方面的能力遠超我們人類最聰明的頭腦,但是不會有人覺得他比 3歲的兒童更智能。其背 后的根本原因在于,計算器只能勝任數(shù)值計算這一單項任務,而 3歲兒童卻能勝任幾乎無法窮舉的任務,如識別父母、尋找奶瓶、 辨別聲音等。因此,智能的強弱很大程度上體現(xiàn)在其通用或單一的程度。強的智能是能夠勝任任何任務求解所需要的智能,而弱的智能僅限于解決某個特定任務,強人工智能的實現(xiàn)顯然遠遠難于弱人工智能。當前取得實際應用效果的仍以弱人工智能為主。實現(xiàn)強人工智能任重道遠,但卻不可回避。因為強人工智能解決 的是人工智能的根本難題:現(xiàn)實世界的開放性?,F(xiàn)實世界是復雜的,真實任務是多樣的,而我們的計算機當前只能勝任預定義的任務與場景,一旦碰到從未見過的案例、樣本、場景,就顯得無能為力。努力提升機器智能的適應性,以及對于開放性的應對能力,已經(jīng)成為人工智能最為重要的研究課題之一。
值得注意的是,人工智能仍然是個不斷發(fā)展中的學科,其內涵仍在不斷豐富與完善,一些新的研究視角在為人工智能持續(xù)增添新的內涵,如 AI 的安全性與可控性、AI 的黑盒化與可解釋、AI 與人文學科、AI 與社會發(fā)展、AI 與腦科學等,這些新的研究視角在持續(xù)推動 AI 概念的發(fā)展與完善。
人工智能發(fā)展的歷程
“理想很豐滿,現(xiàn)實很骨感”,“柳暗花明又一村”,用這兩句話來表達人工智能的發(fā)展歷程是再恰當不過的了。縱觀人工智能的發(fā)展歷程,大體可分為三次高潮和兩個低谷期。
1. 人工智能發(fā)展的第一次高潮
20 世紀 40 至 50 年代,來自不同領域的一批科學家開 始探討制造人工大腦的可能性,這是人工智能問題的雛形。1943 年,美國麻省理工學院的兩位科學家沃倫·麥卡洛克 (Warren McCulloch)和沃爾特·皮茨( Walter Pitts)提出了一種生物神經(jīng)元的數(shù)學模型,使得利用計算機模擬的人工神經(jīng)元成為可能。多個人工神經(jīng)元連接在一起可以形成一個類 似生物神經(jīng)網(wǎng)絡的網(wǎng)絡結構(參見圖引 -1)。1957 年,弗蘭克·羅森勃拉特(Frank Rosenblatt)提出了感知器模型,將神經(jīng)網(wǎng)絡研究推向工程實現(xiàn)。
1950 年,英國計算機專家艾倫·圖靈( Alan Turing)提出了著名的圖靈測試,用來判斷一臺機器是否具有人類智能。它更像一場有趣的“模仿游戲”:由測試者向被測試者提出多個問 題,根據(jù)被測試者的回答判斷被測試者是人還是機器。如果有超過 30% 的測試者不能確定被測試者是人還是機器,那么就可以說這臺機器具有人類智能(參見圖引 -2)。由于圖靈測試只能測試機器是否具有智能的外在表現(xiàn),隨著人工智能的發(fā)展,它日益暴露出局限性。設想一下, 如果將對話任務換成下圍棋,我們現(xiàn)在顯然無法再根據(jù)機器的圍棋水平來判斷對方是人還是機器。因為眾所周知,機器在圍棋游戲方面已經(jīng)遠超人類冠軍水平。隨著機器語音和對話能力的提升,我們也越來越難以判斷為你服務的電話客服到底是機器還是人類。
1956 年,在美國漢諾威小鎮(zhèn)的達特茅斯學院召開的一次研討會上,一批各有所長的科學家聚在一起,討論著一個當時被認為不切實際的主題——讓逐漸成熟的計算機代替人類解決一些感知、認知乃至決策的問題。會議整整開了 2 個月,科學家們各執(zhí)一詞,誰都說服不了誰,最后有人提出了“人工智能”的說法。這次會議被公認為人工智能誕生的標志。同年,人工智能被確立為一門學科。
這一新興學科的產生,很快就引起學術界的廣泛關注,研究者紛至沓來,新課題層出不窮。從 20 世紀 50 年代后期到 60 年代,涌現(xiàn)出了一大批成功的 AI 程序和新的研究方向。有人 開發(fā)了程序 STUDENT,它能夠解決高中程度的代數(shù)應用題, 被認為是人工智能在自然語言處理領域早期的應用成果。有人創(chuàng)建了全世界最早的聊天機器人 ELIZA,它可以使用英語和用戶交流。ELIZA 是一個早期的自然語言處理程序,它通過模式匹配和替代的方式來實現(xiàn)人機對話(其實只是按固定套路作答,機器并不理解語言的意義,實際上距離真正的人工智能還有很長的距離要走)。
20 世紀 60 年代中期,人工智能研究在資金方面得到了大量資助,并且在世界各地建立了實驗室。當時人工智能的研究人員們對未來充滿信心,著名的科學家赫伯特·西蒙( Herbert Simon)甚至預言:“機器將能夠在20 年內完成人類可以做的任何工作。”還有的科學家認為“在一代人之內……創(chuàng)造‘人工智能’的問題將基本解決”。人工智能研究迎來了第一個“黃金”發(fā)展時期。
然而,現(xiàn)實并不像人們預期的那樣樂觀,人工智能的發(fā)展遭遇了瓶頸。主要的原因是:當時計算機的運算能力和數(shù)據(jù)處理能力較低,數(shù)據(jù)也相對匱乏,不能滿足解決復雜問題的需要。人工智能步入第一次低谷期。
2. 人工智能發(fā)展的第二次高潮
進入 20 世紀 80 年代早期后,隨著新興的工業(yè)、商業(yè)、金融等行業(yè)的發(fā)展,人工智能研究作為附屬于其他行業(yè)的輔助性手段與工具得到了一定的恢復。
這一時期比較有代表性的研究進展包括:
一是“專家系統(tǒng)”的出現(xiàn)。這是一種模擬人類專家知識和分析技能的人工智能系統(tǒng), 通過知識表示和知識推理技術,來模擬領域專家解決問題的過程。專家系統(tǒng)以知識庫和推理機為核心,利用知識得到一個滿意的解是系統(tǒng)的求解目標。著名的專家系統(tǒng)包括:ExSys( 第一 個商用的專家系統(tǒng) )、Mycin(一個診斷系統(tǒng))等。
二是神經(jīng)網(wǎng)絡模型的再次興起。大衛(wèi)·魯姆哈特(David Rumelhart)等人于 20 世紀 80 年代提出的多層感知器及反向傳播算法,優(yōu)化了神經(jīng)網(wǎng)絡的訓練方法。
這一時期比較有影響力的人工智能應用是日本的“第五代計算機項目”。20 世紀 80 年代,日本提出了“第五代計算機項目”。它的主要目標之一是突破所謂的“馮·諾依曼瓶頸” (馮·諾依曼架構是以存儲程序為核心思想的主流計算機體系結構,當時的日本學者認為這一體系結構只能實現(xiàn)有限的運算和信息處理,因此稱之為“馮·諾依曼瓶頸”),實現(xiàn)具有推理以及知識處理能力的人工智能計算機。在第五代計算機項目的激勵下,人工智能領域的研究項目得到推進。1985 年,人工智能市場規(guī)模已超過十億美元。
然而,好景不長。受限于當時有限的數(shù)據(jù)和算力,機器仍然難以應對復雜情形。比如,專家系統(tǒng)中的 if-then 規(guī)則在描述復雜問題時呈指數(shù)增長,有限的算力難以支撐這類復雜問題的 解決。從 1987 年 Lisp(人工智能程序設計的主要語言)機市場崩潰開始,人們對專家系統(tǒng)和人工智能失去信任,人工智能進入第二次低谷期。
3. 人工智能發(fā)展的第三次高潮
始于 20 世紀 90 年代末和本世紀初,人工智能再一次悄然崛起。2006 年,加拿大多倫多大學的杰弗里·辛頓( Geoffrey Hinton)教授及其學生提出了深度學習,并迅速在圖像識別、語音識別、游戲和搜索引擎等領域獲得顯著效果。除了以深度學習為代表算法的這一原因之外,這一階段的成功還得益于計算機計算能力的提升以及各行各業(yè)海量數(shù)據(jù)的累積。
這一波人工智能浪潮仍在發(fā)展,已發(fā)生的比較具有代表性的事件有:
一是計算機與人類的棋壇博弈。1997年 5 月 11 日,深藍成為第一個擊敗衛(wèi)冕國際象棋世界冠軍加里·卡斯帕羅夫的計算機國際象棋系統(tǒng)。2016 年 3 月,阿爾法圍棋( AlphaGo)以 4∶1 擊敗李世石,成為第一個擊敗職業(yè)圍棋世界冠軍的電腦圍棋程序。2017 年 5 月,阿爾法圍棋在中國烏鎮(zhèn)圍棋峰會的三局比賽中,擊敗了當時世界排名第一的中國棋手柯潔。在這個基礎上,經(jīng)過強化學習訓練后,阿法元 (AlphaGoZero)無需人類經(jīng)驗,通過自我博弈,以100∶0 擊敗阿爾法圍棋。
二是機器在圖像識別與語音識別等任務中達到人類水平。圖像處理任務中的錯誤率自 2011 年以來顯著下降。在計算機視覺領域,如手寫數(shù)字體識別數(shù)據(jù)集上,神經(jīng)網(wǎng)絡的準確率已 經(jīng)超過人類的平均準確率。在語音識別方面,科大訊飛等公司的語音識別率高達 98%(2018 年的水平),語音識別水平在 2016 年就已經(jīng)達到了人類水平。
三是機器在語言理解等相關任務上取得長足的進步。讓機器具備理解人類自然語言的能力是人工智能發(fā)展歷程中具有里程碑意義的任務。更有專家認為,語言理解是人工智能桂冠上 的明珠。近年來,得益于深度學習模型和大規(guī)模語料,機器在一系列語言理解任務中攻城略地。比如在斯坦福問答數(shù)據(jù)集 (Stanford Question Answering Dataset,簡稱“ SQuAD”)文本理解挑戰(zhàn)賽上,早在 2018 年年初,來自阿里的研究團隊所提出的機器閱讀理解模型就取得超過人類水平的準確率。在2018 年的谷歌 I/O 大會上,谷歌展示了一段谷歌助理(谷歌的一個應用軟件)與人類長達數(shù)分鐘的電話,現(xiàn)場觀眾幾乎無法分辨出誰是機器,誰是人類。此后,各類客服電話大量由機器代替, 智能客服的成功應用大幅降低了人工客服成本。
這些事件的發(fā)生,讓人們充分認識到人工智能技術所蘊含的經(jīng)濟價值與社會潛能。人們對人工智能技術的認識由此上升到了一個前所未有的高度,從而極大地推動了人工智能技術的發(fā)展。
人工智能研究的不同視角
人工智能是個龐雜的學科,不同的視角對人工智能的理解不盡相同。讓我們來了解一下人工智能研究中主要學術流派的看法吧!
1. 符號主義流派是這樣認為的
符號主義流派認為人工智能源于數(shù)理邏輯,又稱“邏輯主義流派”。數(shù)理邏輯從 19 世紀末起獲得迅速發(fā)展,到 20 世紀 30 年代開始用于描述智能行為。計算機出現(xiàn)后,又在計算機上 實現(xiàn)了邏輯演繹系統(tǒng),其代表性成果為啟發(fā)式程序 LT(邏輯 理論家),證明了 38 條數(shù)學定理,表明應用計算機研究人的思維過程,可以模擬人類智能活動。
符號主義認為人類的認知過程是符號操作與運算的過程, 主張用公理和邏輯體系搭建一套人工智能系統(tǒng)。符號主義認為,知識表示、知識推理和知識應用是人工智能的核心。知識 可以用符號來表示,認知是符號加工的過程,推理是使用理智從某些前提產生結論的行動。符號主義者致力于用計算機的符號操作來模擬人的認知過程,其實質就是模擬人的左腦抽象邏 輯思維。符號主義者最早采用了“人工智能”這個術語,后來又發(fā)展了專家系統(tǒng)、知識工程理論與技術,并在20 世紀 80 年代取得了很大發(fā)展。
符號主義流派曾長期一枝獨秀,為人工智能的發(fā)展作出重要貢獻,尤其是專家系統(tǒng)的成功開發(fā)與應用,為人工智能走向工程應用、實現(xiàn)理論聯(lián)系實際具有重要意義。在人工智能的其 他學派出現(xiàn)之后,符號主義仍然是人工智能的主流學派之一。
2. 聯(lián)結主義流派是這樣認為的
聯(lián)結主義學派,又稱“仿生學派”或“生理學派”,其主要關注神經(jīng)網(wǎng)絡及神經(jīng)網(wǎng)絡間的聯(lián)結機制和學習算法。聯(lián)結主義認為,人工智能源于仿生學,特別是人腦模型的研究。聯(lián)結主義從神經(jīng)元開始,進而研究神經(jīng)網(wǎng)絡模型和腦模型,開辟了人工智能的又一發(fā)展道路。聯(lián)結主義學派從神經(jīng)生理學和認知科學的研究成果出發(fā),把人的智能歸結為人腦的高層活動的結果,強調智能活動是由大量簡單的單元通過復雜的相互聯(lián)結后并行運行的結果,其中人工神經(jīng)網(wǎng)絡就是其代表性技術。
聯(lián)結主義發(fā)端于 1943 年,誕生了生物神經(jīng)元的計算模型“ M-P 模型”,其后經(jīng)歷了 1957 年“感知器”模型,1982 年 Hopfield 模型以及 1986 年提出的反向傳播算法等代表性事件。聯(lián)結主義在近期的代表性進展就是深度學習。2012 年,在 ImageNet 大型視覺識別挑戰(zhàn)賽中,深度學習模型以絕對領先的成績拔得頭籌。隨著硬件技術的發(fā)展,深度學習成為當下實現(xiàn)人工智能的主流技術之一。
符號主義與聯(lián)結主義的發(fā)展呈現(xiàn)出此起彼落的態(tài)勢。事實上,兩者各有其價值與意義,對于人工智能的發(fā)展都是不可或缺的,應該協(xié)同并進、共同促進人工智能的發(fā)展。符號主義從宏觀上(人類的思維過程)模擬人類的認知過程,而聯(lián)結主義則從微觀上(神經(jīng)網(wǎng)絡的結構與參數(shù))實現(xiàn)對于人腦功能的模擬。從當前人工智能發(fā)展趨勢來看,由聯(lián)結主義實現(xiàn)模式識別等初步感知任務,進而將相關結果輸入符號主義的相關系統(tǒng)中,實現(xiàn)深度的推理與解釋,是未來人工智能發(fā)展的基本模式。
3. 行為主義流派是這樣認為的
行為主義流派,又稱“進化主義流派”或“控制論學派”。行為主義流派認為人工智能源于控制論,研究內容包括生命現(xiàn)象的仿生系統(tǒng)、人工建模與仿真、進化動力學、人工生命的計算理論、進化與學習綜合系統(tǒng)以及人工生命的應用等。行為主義認為,人工智能可以像人類智能一樣逐步進化,智能體的智能行為只能通過其與現(xiàn)實世界及周圍環(huán)境的交互而表現(xiàn)出來。
控制論思想早在 20 世紀四五十年代就成為時代思潮的重要部分,影響了早期的人工智能研究者。美國數(shù)學家諾伯特·維納( Norbert Wiener)等人提出的控制論和自組織系統(tǒng)以及我國科學家錢學森等人提出的工程控制論和生物控制論,影響了許多領域。早期的研究工作重點是模擬人在控制過程中的智能行為和作用,如對自尋優(yōu)、自適應、自校正、自鎮(zhèn)定、自組織和自學習等控制論系統(tǒng)的研究,并進行“控制論動物”的研制。到 20 世紀六七十年代,上述這些控制論系統(tǒng)的研究取得一定進展,播下智能控制和智能機器人的種子,并在八十年代誕生了智能控制和智能機器人系統(tǒng)。
直到 20 世紀末,行為主義流派才以人工智能新學派的面孔出現(xiàn),引起許多人的關注。這一學派的代表作首推美國麻省理工學院的羅德尼·布魯克斯 (Rodney Brooks) 所研發(fā)的六足行走機器人, 它被看作新一代的“控制論動物”,是一個基于感知—動作模式的模擬昆蟲行為的控制系統(tǒng)。事實上,這種通過與環(huán)境自適應交互所形成的智能,是一種“沒有推理的智能”。近期,在深度強化學習等技術的推動下,機器人的環(huán)境交互能力得到顯著提升,能跑會跳、滿世界“溜達”的機器人已經(jīng)逐步變成現(xiàn)實。
人工智能三要素
人工智能在近期的飛速發(fā)展,主要得益于數(shù)據(jù)的快速積累、計算能力的不斷提升以及算法的改進優(yōu)化。因此,人們把數(shù)據(jù)、算力和算法稱為人工智能三要素。
1. 人工智能與大數(shù)據(jù)
什么是大數(shù)據(jù)?一般地說,大數(shù)據(jù)是指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新的處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu) 化能力的海量、高增長率和多樣化的信息資產。
大數(shù)據(jù)一般具有大量(Volume)、高速( Velocity)、多樣(Variety)、低價值密度(Value)、真實性( Veracity)五個特點,也 稱其為大數(shù)據(jù)的 5V 特點。“大量”指數(shù)據(jù)體量極大,數(shù)據(jù)量從 TB 級別到 PB 級別;“高速”指數(shù)據(jù)產生和處理的速度非常快, 如工業(yè)大數(shù)據(jù)應用中部署的各種傳感器能夠以每秒數(shù)個 G 的采集頻率采集數(shù)據(jù);“多樣”指數(shù)據(jù)類型很多,如語音、文字、 圖片和視頻等,不同類型的數(shù)據(jù)往往需要不同的處理手段;“低價值密度”指大量的數(shù)據(jù)中有價值的只有極少數(shù),如監(jiān)控視頻中最有價值的數(shù)據(jù)往往只有幾秒;“真實性”指追求高質量的數(shù)據(jù),因為數(shù)據(jù)的規(guī)模并不能為決策提供幫助,數(shù)據(jù)的真實性和質量才是制定正確決策的關鍵。
大數(shù)據(jù)在現(xiàn)實的生產與生活中有著大量的實際應用。例如,天氣預報就是基于大數(shù)據(jù)而對未來天氣作出的預測。這些數(shù)據(jù)可以是一年前的,也可以是幾年、幾十年甚至更長時間的數(shù)據(jù)積累。又如,在智能商業(yè)、工業(yè) 4.0、互聯(lián)網(wǎng)服務、智慧金融等領域,大數(shù)據(jù)的運用使得這些領域發(fā)生了翻天覆地的變化和進步。
大數(shù)據(jù)所具有的海量數(shù)據(jù)的特質促進了計算機科學、信息科學、統(tǒng)計學等應用學科的飛速發(fā)展。與此同時, 隨著數(shù)據(jù)量的爆炸式增長,非結構化的數(shù)據(jù)和殘缺的數(shù)據(jù)也隨之增加,用傳統(tǒng)的方式處理大數(shù)據(jù)會極大地損失數(shù)據(jù)中蘊含的價值。
當前,人工智能的發(fā)展集中體現(xiàn)在機器學習上。機器學習的兩種重要方式——監(jiān)督學習和無監(jiān)督學習——均需要大數(shù)據(jù)的“喂養(yǎng)”。監(jiān)督學習是機器學習的有效手段之一。監(jiān)督學習 過程中需要把有標注的樣本“喂”給機器,而有標注的樣本來自大數(shù)據(jù),從這個意義來看,人工智能需要大數(shù)據(jù)。以深度學習為例,數(shù)據(jù)量越多,效果就越好。無監(jiān)督學習則從海量數(shù)據(jù) 中學習統(tǒng)計模式來解決問題,同樣離不開大數(shù)據(jù)。
那么,是否數(shù)據(jù)越多,是否有標 注的樣本越多,效果就越好呢?有學者在圖像的目標檢測任務上進行了相關研究(參見圖引 -4),得到的結論是:一方面,隨著訓練數(shù)據(jù)的擴展,任務性能呈對數(shù)增長,即使訓練 圖片規(guī)模達到 3 億張,性能的上升 也沒有出現(xiàn)停滯;而另一方面,對數(shù)增長也意味著當數(shù)據(jù)量達到一定程度后,模型性能的提升效果就不再顯著。
當前人工智能發(fā)展的另一個重要體現(xiàn)是大規(guī)模知識工程技術。知識工程是以構建專家系統(tǒng)為核心內容的學科,旨在利用專家知識解決問題。進入互聯(lián)網(wǎng)時代之后,大規(guī)模開放性應用需要大規(guī)模的簡單知識表示。知識圖譜就是這樣的知識表示,其本質是一個大規(guī)模語義網(wǎng)絡,包含實體、概念及其之間的各類語義關系。
知識圖譜的誕生使得知識工程邁入了大數(shù)據(jù)時代。傳統(tǒng)工程依賴專家進行知識獲取所導致的瓶頸被突破了,前所未有的算力、算法和數(shù)據(jù)的“匯聚”,使得大規(guī)模自動化知識獲取成為可能。從互聯(lián)網(wǎng)數(shù)十億文本當中,利用自動抽取模型,可以自動獲取數(shù)億計的結構化知識?;ヂ?lián)網(wǎng)時代的高質量UGC(用戶貢獻內容),比如問答、論壇、維基等為自動化知識獲取提供了大量優(yōu)質的數(shù)據(jù)來源。與大數(shù)據(jù)共生的眾包平臺,使得我們可以更有效地利用閑散的人力資源。正是在這些機會的合力作用下,人類從小規(guī)模知識時代邁進了大規(guī)模知識時代。知識圖譜有望引領知識工程的復興。更多的知識表示形式會在大數(shù)據(jù)的賦能下,解決更多的實際問題(參見圖引 -5,這是與一位足球明星有關的知識圖譜)。
人工智能的第三次發(fā)展浪潮很大程度上是由大數(shù)據(jù)推動的,沒有大數(shù)據(jù)的滋養(yǎng),人工智能很難在當下取得突飛猛進的進步。當前人工智能的很多成功應用都發(fā)生在數(shù)據(jù)豐富的場景,如圖像識別在準確率上的突破得益于大量普及的攝像頭所采集的海量圖像數(shù)據(jù)等。
2. 人工智能與算力
算力即計算能力。算力的顯著增長,體現(xiàn)在計算機的數(shù)據(jù)存儲容量和數(shù)據(jù)處理速度的快速提升(參見圖引 -6、圖 引 -7),均呈現(xiàn)出指數(shù)增長的趨勢。我國的超級計算機“神威·太湖之光”的持續(xù)性能為 9.3 億億次 / 秒,峰值性能可以達到 12.5 億億次 / 秒。算力的快速增長,一方面是由于摩爾定律 (計算機硬件每隔一段時間便會翻倍升級)持續(xù)發(fā)揮作用,使得單體計算元器件的計算性能在增長。另一方面,以云計算為代表的性能擴容等技術也在持續(xù)發(fā)展。云計算能夠將大規(guī)模廉價機器組織成高性能計算集群,提供匹配甚至遠超大型機的計算能力。
人工智能的飛速發(fā)展離不開強大的算力。在人工智能概念剛剛被提出的時候,由于其計算能力的受限,當時并不能完成大規(guī)模并行計算與處理,人工智能系統(tǒng)能力比較薄弱。但是隨 著深度學習的流行,人工智能技術的發(fā)展對高性能算力提出了日益迫切的需求。深度學習主要以深度神經(jīng)網(wǎng)絡模型為學習模型,深度神經(jīng)網(wǎng)絡是從淺層神經(jīng)網(wǎng)絡發(fā)展而來的。深度學習模 型的訓練是個典型的高維參數(shù)優(yōu)化問題。深度神經(jīng)網(wǎng)絡模型具有多層結構,這種多層結構帶來了參數(shù)的指數(shù)增長。以 BERT(Bidirectional Encoder Representation from Transformers)為代表的語言模型多達 3 億參數(shù),最新的世界紀錄是 Nvidia 訓練出包含 83 億參數(shù)的語言模型(2019年 8 月)。以 BERT 的 3 億 參數(shù)的模型訓練為例,研發(fā)團隊共消耗了 16 塊云 TPU(張量 處理單元)近 4 天時間才能訓練完成,其中每塊云 TPU 能提供 180 TFLOPs(1 TFLOPs 意味著每秒 1 萬億次的浮點運算能力) 算力和 64GB 內存。
國家間的人工智能之爭已經(jīng)在很大程度上演變?yōu)樗懔χ?爭。華為公司推出的一系列 AI 計算芯片在一定程度上推動了我國人工智能發(fā)展的算力的提升。
3. 人工智能與算法
算法是計算機解決問題或者執(zhí)行計算的指令序列。很多數(shù)學模型在具體運行時往往需要實現(xiàn)相應的算法,算法與模型已經(jīng)成為人工智能發(fā)展的重要支撐。人工智能的相關算法類型眾 多,涉及搜索、規(guī)劃、演化、協(xié)同與優(yōu)化等一系列任務。當下,人工智能領域的快速發(fā)展尤為明顯地體現(xiàn)在一系列新穎算法和模型的發(fā)展,特別是以深度學習為代表的機器學習算法的快速發(fā)展。機器學習是一種從觀測數(shù)據(jù)(樣本)中尋找規(guī)律,并利用學習到的規(guī)律(模型)對未知或無法觀測的數(shù)據(jù)進行預測的方法。隨著數(shù)據(jù)量的急劇增加,從大數(shù)據(jù)中發(fā)現(xiàn)統(tǒng)計規(guī)律,進而利用這些統(tǒng)計規(guī)律解決實際問題變得日益普遍。
當前大多數(shù)機器學習的本質是統(tǒng)計學習,即通過歷史標注數(shù)據(jù)來擬合構建學習模型。以經(jīng)典的線性回歸為例,線性回歸旨在從樣本習得一個合適的線性映射f,使得對于輸入變量 x, 經(jīng)過
后能夠得到正確的輸出變量 y。假設我們有房屋面積與價格之間的歷史數(shù)據(jù)(比如表引 -1 所示,第一列表示 60 米 2 的房屋價格為 300 萬,其他列以此類推)。這里的每一對房屋面積和價格數(shù)據(jù)(
)就是一個樣本,所有樣本的集合為(
),(
),…,(
)。顯然我們關心的是根據(jù)房屋面積預測房屋價格。房屋面積
就是輸入變量或者解釋變量,房屋價格
是我們需要預測的變量,是輸出變量,或稱響應變量。從這些樣本數(shù)據(jù)學習到的房價與房屋面積之間的關系,可以表示為一 個函數(shù) f(每個輸入產生確定的唯一的輸出)。f 接收某個房屋面積作為輸入,預測相應的價格作為輸出。例如,對于表格中不存在的 85平方米的房屋,通過 f函數(shù)我們就可以預測其價格。
為了學習房屋面積與房屋價格之間的函數(shù)關系,一種常見的學習方法是最小二乘法。首先假定f 是簡單的線性函數(shù)形 式,也就是 f(x) = a + bx,其中 a,b 是參數(shù)。所謂確定 f 的函數(shù)形式,就是確定 a 和 b 兩個參數(shù)的具體值。因此對 f 的學習, 就轉換為對 a 和 b 兩個參數(shù)的學習問題。很顯然,如果 f 是一 個好的函數(shù),就應該盡可能與當前已經(jīng)觀測到的樣本一致,也就是 f(60)應該盡可能接近 300 萬的真實價格。將這一期望推廣到所有已觀測樣本,就有了如下的誤差函數(shù):
直觀的理解是希望求得的線性函數(shù)(紅色的直線)所預測的價格與實際價格累計平方誤差 最小??梢酝ㄟ^偏導數(shù)求得上述誤差函數(shù)最小化時的參數(shù) a 與 b。根據(jù)求得的參數(shù) a 與 b,就可以完全確定函數(shù) f,從而可以根據(jù)任意面積進行房價預測(參見圖引 -8)。機器學習有著很多任務,上述線性回歸只是最簡單的一類。如果 f 是非線性函數(shù),那么就是非線性回歸問題。房價是一個連續(xù)數(shù)值,在有些任務中要預測的是一個離散量。例如,根據(jù)體溫、血液指標等預測病人是否得了感冒(只 需要判斷是否感冒這兩種情況),此時的機器學習問題就變成了分類問題。此外,我們經(jīng)常需要對數(shù)據(jù)進行聚類,比如將客戶自動聚類,從而分為不同人群。除了這些具體的問題模型外,機器學習還涉及眾多算法,完成不同的任務,比如 K 近鄰分類算法、基于“決策樹”的分類算法、基于“支持向量機”的 分類算法、K 均值聚類算法、基于 PCA 的降維算法、基于梯度下降和進化算法的參數(shù)學習算法(如線性回歸中的參數(shù)最優(yōu)化學習)等。