陳根:人工智能,正在跨越人機(jī)情感鴻溝
很長(zhǎng)時(shí)間以來(lái),是否具備情感,是區(qū)分人與機(jī)器的重要標(biāo)準(zhǔn)之一。換言之,機(jī)器是否具有情感也是機(jī)器人性化程度高低的關(guān)鍵因素之一。
當(dāng)前,人工智能已呈現(xiàn)高速增長(zhǎng)和全面擴(kuò)張的態(tài)勢(shì)。一方面,人工智能不斷朝更深層的智能方向發(fā)展,包括數(shù)學(xué)運(yùn)算、邏輯推理、專家系統(tǒng)、深度學(xué)習(xí)等;另一方面,人工智能不斷向社會(huì)的各個(gè)領(lǐng)域進(jìn)行擴(kuò)展,從智能手機(jī)到智能家居,從智能交通到智能城市等。
“感知智能”逐漸向具有理解和表達(dá)能力的“認(rèn)知智能”轉(zhuǎn)變,為機(jī)器賦予感情成為必然趨勢(shì)。人工智能之父馬文·明斯基就曾提到,“如果機(jī)器不能夠很好地模擬情感,那么人們可能永遠(yuǎn)也不會(huì)覺(jué)得機(jī)器具有智能”。
想要人工智能理解人類感情,則需要從人工智能的情感計(jì)算開(kāi)始。
人工智能正在理解人類情緒
試圖讓人工智能理解人類情感并不是新近的研究。
早在1997年,麻省理工學(xué)院媒體實(shí)驗(yàn)室Picard 教授就提出了情感計(jì)算的概念。Picard 教授指出,情感計(jì)算與情感相關(guān),源于情感或能夠?qū)η楦惺┘佑绊懙挠?jì)算。簡(jiǎn)單來(lái)說(shuō),情感計(jì)算旨在通過(guò)賦予計(jì)算機(jī)識(shí)別、理解和表達(dá)人的情感的能力,使得計(jì)算機(jī)具有更高的智能。
自此,情感計(jì)算這一新興科學(xué)領(lǐng)域,開(kāi)始進(jìn)入眾多信息科學(xué)和心理學(xué)研究者的視野,從而在世界范圍內(nèi)拉開(kāi)了人工智能走向人工情感的序幕。
情感計(jì)算作為一門(mén)綜合性技術(shù),是人工智能情感化的關(guān)鍵一步,包括情感的“識(shí)別”、“表達(dá)”和“決策”。“識(shí)別”是讓機(jī)器準(zhǔn)確識(shí)人類的情感,并消除不確定性和歧義性;“表達(dá)”則是人工智能把情感以合適的信息載體表示出來(lái),如語(yǔ)言、聲音、姿態(tài)和表情等;“決策”則主要研究如何利用情感機(jī)制來(lái)進(jìn)行更好地決策。
識(shí)別和表達(dá)是情感計(jì)算中關(guān)鍵的兩個(gè)技術(shù)環(huán)節(jié)。情感識(shí)別通過(guò)對(duì)情感信號(hào)的特征提取,得到能最大限度地表征人類情感的情感特征數(shù)據(jù)。據(jù)此進(jìn)行建模,找出情感的外在表象數(shù)據(jù)與內(nèi)在情感狀態(tài)的映射關(guān)系,從而將人類當(dāng)前的內(nèi)在情感類型識(shí)別出來(lái),包括語(yǔ)音情感識(shí)別、人臉表情識(shí)別和生理信號(hào)情感識(shí)別等。
人臉表情識(shí)別顯然是情感識(shí)別中關(guān)鍵的一部分。在人類交流過(guò)程中,有55%是通過(guò)面部表情來(lái)完成情感傳遞的。20 世紀(jì)70 年代,美國(guó)心理學(xué)家Ekman 和Friesen 對(duì)現(xiàn)代人臉表情識(shí)別做了開(kāi)創(chuàng)性的工作。
Ekman 定義了人類的6 種基本表情:高興、生氣、吃驚、恐懼、厭惡和悲傷,確定了識(shí)別對(duì)象的類別;建立了面部動(dòng)作編碼系統(tǒng)(facial action coding system,F(xiàn)ACS),使研究者能夠按照系統(tǒng)劃分的一系列人臉動(dòng)作單元來(lái)描述人臉面部動(dòng)作,根據(jù)人臉運(yùn)動(dòng)與表情的關(guān)系,檢測(cè)人臉面部細(xì)微表情。
情感識(shí)別是目前最有可能的應(yīng)用。比如,商業(yè)公司利用情感識(shí)別算法觀察消費(fèi)者在觀看廣告時(shí)的表情,這可以幫助商家預(yù)測(cè)產(chǎn)品銷量的上升、下降或者是保持原狀,從而為下一步產(chǎn)品的開(kāi)發(fā)做好準(zhǔn)備。
機(jī)器除了識(shí)別、理解人的情感之外,還需要進(jìn)行情感的反饋,即機(jī)器的情感合成與表達(dá)。與人類的情感表達(dá)方式類似,機(jī)器的情感表達(dá)可以通過(guò)語(yǔ)音、面部表情和手勢(shì)等多模態(tài)信息進(jìn)行傳遞,因此機(jī)器的情感合成可分為情感語(yǔ)音合成、面部表情合成和肢體語(yǔ)言合成。
其中,語(yǔ)音是表達(dá)情感的主要方式之一。人類總是能夠通過(guò)他人的語(yǔ)音輕易地判斷他人的情感狀態(tài)。語(yǔ)音的情感主包括語(yǔ)音中所包含的語(yǔ)言內(nèi)容,聲音本身所具有的特征。顯然,機(jī)器帶有情感的語(yǔ)音將使消費(fèi)者在使用的時(shí)候感覺(jué)更人性化、更溫暖。
從情感計(jì)算的決策來(lái)看,大量的研究表明,人類在解決某些問(wèn)題的時(shí)候,純理性的決策過(guò)程往往并非最優(yōu)解。在決策的過(guò)程中,情感的加入反而有可能幫助人們找到更優(yōu)解。因此,在人工智能決策過(guò)程中,輸入情感變量,或?qū)椭鷻C(jī)器做出更人性化的決策。
微軟的研究人員曾在這個(gè)問(wèn)題上給出過(guò)答案,他們提出了一種基于周圍血管搏動(dòng)測(cè)量(Peripheral Pulse Measurements)的內(nèi)在獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)新方法,這種內(nèi)在獎(jiǎng)勵(lì)是與人類神經(jīng)系統(tǒng)的響應(yīng)相關(guān)的。研究人員假設(shè)這種獎(jiǎng)勵(lì)函數(shù)可以幫助強(qiáng)化學(xué)習(xí)解決稀疏性(sparse)和傾斜性(skewed),以此提高采樣效率。
“情感”鴻溝的跨越和未跨越
情感智能是讓機(jī)器更加智能的關(guān)鍵,具有情感的機(jī)器不僅更通用、更強(qiáng)大、更有效,而且將更趨近于人類的價(jià)值觀。在人類科學(xué)家長(zhǎng)期的努力下,橫亙?cè)谌四X與電腦之間的“情感”鴻溝正在被跨越。
2014年5月29日,由微軟亞洲互聯(lián)網(wǎng)工程院開(kāi)發(fā)的一代小冰開(kāi)始了微信公測(cè),在3天內(nèi)贏得了超過(guò)150萬(wàn)個(gè)微信群、逾千萬(wàn)用戶的喜歡。微軟小冰,可以說(shuō),就是一個(gè)初步練成情感計(jì)算的人工智能。
微軟小冰的開(kāi)發(fā)團(tuán)隊(duì)負(fù)責(zé)人李笛曾表示,小冰作為一個(gè)人工智能平臺(tái),已經(jīng)在技術(shù)、產(chǎn)品、數(shù)據(jù)三者之間形成了一個(gè)正循環(huán)。換言之,小冰積累的大數(shù)據(jù)已經(jīng)足夠多到能夠讓小冰實(shí)現(xiàn)自我進(jìn)化。
2017年5月,“微軟小冰”出版了第一部由人工智能創(chuàng)作的詩(shī)集《陽(yáng)光失了玻璃窗》,其中部分詩(shī)作在《青年文學(xué)》等刊物發(fā)表或在互聯(lián)網(wǎng)發(fā)布,并被宣布享有作品的著作權(quán)和知識(shí)產(chǎn)權(quán)。正如小冰在詩(shī)歌中作出的自我陳述:“在這世界,我有美的意義。”
如今,小冰已經(jīng)積累了百億輪與人類的對(duì)話信息,從中提取了海量歷史數(shù)據(jù),這些海量數(shù)據(jù)已經(jīng)足夠多到讓小冰對(duì)未來(lái)對(duì)話的判斷準(zhǔn)確程度超過(guò)50%。某種程度上,小冰已經(jīng)形成了初步的記憶、認(rèn)知與意識(shí)能力。
如今,隨著大量統(tǒng)計(jì)技術(shù)模型的涌現(xiàn)和數(shù)據(jù)資源的累積,情感計(jì)算在應(yīng)用領(lǐng)域的落地日臻成熟。當(dāng)然,任何一門(mén)技術(shù)都有其技術(shù)曲線,情感計(jì)算的發(fā)展也不是一帆風(fēng)順的。
一方面,情感計(jì)算必然面臨群體情感和個(gè)體情感的矛盾。由于對(duì)情感的感知和理解存在具體的個(gè)體差異,在應(yīng)用過(guò)程中情感個(gè)性化是非常重要的考量。然而,個(gè)性化和泛化能力是相互矛盾的,這也成為了情感計(jì)算的一個(gè)技術(shù)難點(diǎn)。
事實(shí)上,過(guò)去情感研究的默認(rèn)前提和假設(shè)都是情感的群體共性,即群體在表達(dá)同樣的外顯數(shù)據(jù)時(shí),內(nèi)心情感狀態(tài)是一致的。這令關(guān)注個(gè)體獨(dú)特性時(shí),面臨著數(shù)據(jù)和方法的問(wèn)題:如何把控所需的個(gè)人數(shù)據(jù)量?在實(shí)際應(yīng)用場(chǎng)景中,又是否能真正獲取到每個(gè)人所謂的獨(dú)特?cái)?shù)據(jù)?
另一方面,則是對(duì)于個(gè)體的情緒計(jì)算。雖然通過(guò)控制情緒波動(dòng)的幅度,能夠模擬性格活潑夸張和安靜內(nèi)斂的人不同的情感起伏,但目前即使是利用共通的情感模擬出一個(gè)普通的人,也十分困難。機(jī)器在每輪情緒切換中比較跳躍,很難像人那樣保持自然、連貫的變化。
此外,個(gè)人情感分析問(wèn)題在交互領(lǐng)域不斷衍生著新的應(yīng)用方式。比如,在智能客服領(lǐng)域有效檢測(cè)用戶情感;日趨成熟的測(cè)謊技術(shù),也能夠在話術(shù)引導(dǎo)下通過(guò)生理參數(shù),甚至僅僅是音訊和視頻信號(hào)等反應(yīng)心理細(xì)微波動(dòng)的參數(shù)來(lái)進(jìn)行情感分析。
但是,個(gè)性化服務(wù)卻也面對(duì)隱私保障的挑戰(zhàn)。個(gè)性化的情感計(jì)算必然讓渡用戶的更多數(shù)據(jù),在這樣的情況下,隱私能否受到有效保護(hù)還未可知。
可以預(yù)見(jiàn),情感計(jì)算在未來(lái)將改變傳統(tǒng)的人機(jī)交互模式,實(shí)現(xiàn)人與機(jī)器的情感交互。從感知智能到認(rèn)知智能的范式轉(zhuǎn)變,從數(shù)據(jù)科學(xué)到知識(shí)科學(xué)的范式轉(zhuǎn)變,人工智能也將在未來(lái)給我們交出一個(gè)更好的回答。