AI續(xù)寫(xiě)小說(shuō)悄然流行:人類特有的創(chuàng)作力,已經(jīng)被AI復(fù)制?
編輯導(dǎo)語(yǔ):AI人工智能的發(fā)展逐漸讓人們對(duì)未來(lái)有了更多元化的想象,尤其當(dāng)AI進(jìn)入極富創(chuàng)意化的領(lǐng)域時(shí),AI是否能帶給人們不同于以往的內(nèi)容?本篇文章里,作者就AI創(chuàng)作對(duì)內(nèi)容創(chuàng)作領(lǐng)域產(chǎn)生的影響進(jìn)行了分析,一起來(lái)看一下。
林黛玉葬花之時(shí)曹雪芹亂入,并與寶玉、襲人發(fā)生一場(chǎng)持續(xù)千年的世紀(jì)大戰(zhàn);鴻門(mén)宴再現(xiàn),項(xiàng)羽喊著“偉大與光輝”與樊噲打作一團(tuán)、而后項(xiàng)莊趁亂刺死劉邦;孔融讓梨引發(fā)一場(chǎng)長(zhǎng)達(dá)十多年的報(bào)復(fù)和最終精心謀劃的血案;《桃花源記》中善良淳樸的村民竟會(huì)為了保守桃花源的秘密而設(shè)計(jì)害死漁民……
這些熟悉而又陌生的內(nèi)容,并不是網(wǎng)友們對(duì)經(jīng)典文學(xué)作品的惡搞,而是來(lái)自于AI的故事續(xù)寫(xiě)。
今年以來(lái),由AI續(xù)寫(xiě)故事作為文本的視頻在B站悄然流行開(kāi)來(lái),一些UP主利用市面上的AI創(chuàng)作應(yīng)用續(xù)寫(xiě)人們熟知的文學(xué)作品,再將新的作品以人聲演繹,配上BGM后制成視頻。
經(jīng)過(guò)AI的一頓操作,名著成了爆款爽文,前有諸葛亮開(kāi)戰(zhàn)斗機(jī),后有莊子研究“三體”,各種平行世界信手拈來(lái),AI一本正經(jīng)胡說(shuō)八道的本事,比過(guò)去的地?cái)偽膶W(xué)還強(qiáng)。
其實(shí),對(duì)于相關(guān)工具的使用者而言,用AI進(jìn)行創(chuàng)作并沒(méi)有技術(shù)門(mén)檻:只需輸入文學(xué)作品的某些片段,AI創(chuàng)作機(jī)器就會(huì)根據(jù)給定文字的內(nèi)容與風(fēng)格對(duì)故事進(jìn)行續(xù)寫(xiě),這些經(jīng)過(guò)AI二次創(chuàng)作的故事,往往情節(jié)曲折離奇,與原作的走向大相徑庭,這種內(nèi)容因?yàn)榉闯R?guī)和新鮮感而受到一些網(wǎng)民的追捧。
不過(guò)話說(shuō)回來(lái),藝術(shù)創(chuàng)作這種高度創(chuàng)意化、個(gè)性化的工作,原本被視為“人類的最后一片凈土”,是理論上最不可能被人工智能取代的工作之一,可如今人工智能技術(shù)的發(fā)展卻為藝術(shù)創(chuàng)作開(kāi)辟了一條新的捷徑。 本期全媒派(ID: quanmeipai)帶來(lái)一篇文章,探析AI創(chuàng)作正在對(duì)內(nèi)容創(chuàng)作領(lǐng)域產(chǎn)生怎樣的影響。
一、AI寫(xiě)作是怎么回事?
AI創(chuàng)作也就是機(jī)器人寫(xiě)作,這是一種擬人化的說(shuō)法,實(shí)質(zhì)上是指通過(guò)一定的計(jì)算機(jī)程序,對(duì)輸入的信息進(jìn)行自動(dòng)化的分析、處理和加工,從而生成一篇較為完整的文章??偟膩?lái)說(shuō),今天流行的AI續(xù)寫(xiě),其實(shí)已經(jīng)算是比較成熟的能力。
隨著人工智能技術(shù)的快速發(fā)展,自然語(yǔ)言生成(natural language generation, NLG)技術(shù)在世界范圍內(nèi)得到廣泛的應(yīng)用。《紐約時(shí)報(bào)》和美聯(lián)社等新聞機(jī)構(gòu)都曾采用NLG技術(shù)來(lái)撰寫(xiě)新聞報(bào)道;僅在2014年,技術(shù)公司Automated Insights就實(shí)現(xiàn)了以每秒超過(guò)2000篇的速度生成新聞報(bào)道,全年發(fā)布新聞共計(jì)10億多篇。[1]
AI寫(xiě)作背后的原理非常復(fù)雜,其核心是自然語(yǔ)言處理(natural language processing, NLP)技術(shù),同時(shí)涉及到數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、知識(shí)圖譜等多項(xiàng)人工智能技術(shù)。自然語(yǔ)言處理是指讓機(jī)器擁有理解并解釋人類語(yǔ)言的能力,目標(biāo)是讓機(jī)器在理解語(yǔ)言上像人類一樣智能,最終彌補(bǔ)人類交流(自然語(yǔ)言)和計(jì)算機(jī)理解(機(jī)器語(yǔ)言)之間的差距。[2]
自然語(yǔ)言處理(NLP)涉及兩個(gè)流程,分別是自然語(yǔ)言理解(natural language understanding,NLU)和自然語(yǔ)言生成(NLG)。市面上的寫(xiě)稿機(jī)器人大都是NLG系統(tǒng),目前主要有模板式、抽取式和生成式這三種技術(shù)方向。[3]
模板式寫(xiě)稿機(jī)器人主要通過(guò)優(yōu)化算法,在預(yù)先存儲(chǔ)的大量寫(xiě)作模板中,選擇與給定材料相匹配的模板,將信息加以組合生成文本,是目前應(yīng)用最成熟、實(shí)現(xiàn)最容易的一種機(jī)器寫(xiě)作方法。
抽取式機(jī)器人會(huì)對(duì)文本進(jìn)行語(yǔ)義分析,識(shí)別冗余信息,抽取重要內(nèi)容,通過(guò)摘錄或概括的方法壓縮文本,形成對(duì)于既定文字的摘要,再加以計(jì)算確保文摘的連續(xù)性,這種技術(shù)廣泛應(yīng)用于新聞內(nèi)容概括和文摘生成。
生成式NLG主要通過(guò)深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)技術(shù)實(shí)現(xiàn),機(jī)器通過(guò)大量的文學(xué)作品樣本進(jìn)行訓(xùn)練,學(xué)習(xí)各類寫(xiě)作風(fēng)格、建立寫(xiě)作模型,再根據(jù)輸入的文字片段獲知任務(wù)需求,預(yù)測(cè)并生成與需求相匹配的文稿,進(jìn)行輸出。
從現(xiàn)階段來(lái)看,模板式和抽取式寫(xiě)稿機(jī)器人的技術(shù)已經(jīng)趨于成熟,在市場(chǎng)上得到了廣泛的應(yīng)用;生成式NLG技術(shù)更加智能,也是當(dāng)前NLG技術(shù)中更為高級(jí)的目標(biāo),OpenAI等研究機(jī)構(gòu)在這方面做出了嘗試,并在市場(chǎng)上得到了應(yīng)用。
二、我們身邊的AI寫(xiě)稿工具人
AI寫(xiě)作在當(dāng)今社會(huì)早已不是什么新鮮事,早在2011年,《洛杉磯時(shí)報(bào)》就開(kāi)始研發(fā)面向地震領(lǐng)域的自動(dòng)化新聞生成機(jī)器人Quakebot。2013年3月,Quakebot因率先報(bào)道南加州發(fā)生的4.4級(jí)地震引發(fā)關(guān)注:2014年3月,美國(guó)洛杉磯發(fā)生4.4級(jí)地震,Quakebot用時(shí)3分鐘就完成了相關(guān)報(bào)道的寫(xiě)作和發(fā)布。
同年7月,美聯(lián)社引進(jìn)Automated Insights公司開(kāi)發(fā)的新聞寫(xiě)作機(jī)器人,開(kāi)始使用自動(dòng)生成新聞技術(shù)。此后,《紐約時(shí)報(bào)》《華盛頓郵報(bào)》《衛(wèi)報(bào)》和路透社等媒體都走上了自動(dòng)化新聞發(fā)展的道路。[4]
Quakebot近期發(fā)布的新聞。圖片來(lái)源:《洛杉磯時(shí)報(bào)》
國(guó)內(nèi)在自動(dòng)化新聞?lì)I(lǐng)域也有許多嘗試:2016年5月,四川綿陽(yáng)發(fā)生4.3級(jí)地震,中國(guó)地震臺(tái)網(wǎng)研發(fā)的地震信息播報(bào)機(jī)器人用6秒寫(xiě)下560字的速報(bào),報(bào)道內(nèi)容翔實(shí);2017年8月,該機(jī)器人在第一時(shí)間報(bào)道了四川阿壩州九寨溝縣的7.0級(jí)地震,引發(fā)廣泛的討論和關(guān)注。
這條新聞消息約540字,新聞涵蓋了速報(bào)參數(shù)、震中地形、熱力人口、周邊村鎮(zhèn)、周邊縣區(qū)、歷史地震、震中簡(jiǎn)介、震中天氣8個(gè)方面的內(nèi)容,并配有5張配圖,用時(shí)僅25秒。在此后的余震報(bào)道中,新聞機(jī)器人最快出稿速度僅有5秒。[5]
地震信息播報(bào)機(jī)器人對(duì)九寨溝地震的報(bào)道
除了新聞報(bào)道以外,AI寫(xiě)作也在其他文字創(chuàng)作場(chǎng)景得到了廣泛的應(yīng)用。目前,無(wú)需人工干預(yù)的機(jī)器人寫(xiě)作可以生成詩(shī)歌、廣告、各類行業(yè)分析報(bào)告、歌詞、小說(shuō)、甚至劇本。
以詩(shī)歌為例,微軟研發(fā)的機(jī)器人小冰于2017年出版了詩(shī)集《陽(yáng)光失了玻璃窗》,這是歷史上第一部人工智能詩(shī)集,其中包含139首現(xiàn)代詩(shī)。[6]
諸如“快把光明的燈擎起來(lái)了/那里有美麗的天/問(wèn)著村里的水流的聲音/我的愛(ài)人在哪/因?yàn)槲业募t燈是這樣的幻變/像是美麗的秘密/她是一個(gè)小孩子的歌唱/那時(shí)間的距離”的華麗辭藻還頗具美感,只是在邏輯性上有所欠缺。除了現(xiàn)代詩(shī),律詩(shī)、藏頭詩(shī)、詞等各種風(fēng)格的詩(shī)歌創(chuàng)作軟件已然在市場(chǎng)上層出不窮。
相比于新聞,故事、小說(shuō)等連續(xù)語(yǔ)義的創(chuàng)作會(huì)更加困難,而這些也早已不是難題。早在2016年的倫敦科幻電影節(jié)上,紐約大學(xué)研究人員開(kāi)發(fā)的機(jī)器人Benjamin創(chuàng)作了一部長(zhǎng)達(dá)9分鐘的科幻電影Sunspring,贏得了大批關(guān)注;MIT媒體實(shí)驗(yàn)室開(kāi)發(fā)的機(jī)器人Shelly專職撰寫(xiě)恐怖故事,并在Twitter更新;Botnik研究室采用預(yù)測(cè)的算法創(chuàng)作了《哈利波特》的續(xù)集。
三、除了寫(xiě)稿,AI創(chuàng)作還有其他形式
當(dāng)AI創(chuàng)作技術(shù)應(yīng)用于寫(xiě)稿,可以誕生機(jī)器版的記者、小說(shuō)家、詩(shī)人、編劇等,而當(dāng)它應(yīng)用于繪畫(huà)、音樂(lè)和舞蹈領(lǐng)域時(shí),則可以“培養(yǎng)”出畫(huà)家、作曲家和編舞人員。
1. AI繪畫(huà)創(chuàng)作大放異彩
利用機(jī)器繪畫(huà)早已寫(xiě)入了人類的夢(mèng)想清單:早在18世紀(jì)70年代,瑞士已經(jīng)有人利用機(jī)械臂繪畫(huà);2016年,谷歌研發(fā)的繪畫(huà)AI在舊金山拍賣會(huì)上大放異彩,其作品一度拍出單幅8000美元的高價(jià);2019年,微軟小冰獨(dú)立完成的原創(chuàng)繪畫(huà)作品在中央美術(shù)學(xué)院美術(shù)館展出,并于2020年推出個(gè)人繪畫(huà)作品集。[7]
2. AI音樂(lè)創(chuàng)作譜寫(xiě)別樣樂(lè)章
AI在音樂(lè)創(chuàng)作中的應(yīng)用比比皆是:2016年,索尼公司計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室CSL的DeepBach項(xiàng)目仿照巴赫的風(fēng)格創(chuàng)作的合唱曲目,被專業(yè)音樂(lè)家誤認(rèn)為是巴赫的作品。
除了譜曲,AI 還可以創(chuàng)作可以唱出聲音的歌曲,CSL實(shí)驗(yàn)室的機(jī)器人Flow Machine模仿披頭士的風(fēng)格,自主創(chuàng)作了歌曲Daddy’s car。法國(guó)計(jì)算機(jī)科學(xué)家Pierre Barreau創(chuàng)造的作曲AI應(yīng)用Aiva可以根據(jù)需求創(chuàng)作不同風(fēng)格的音樂(lè),甚至可以根據(jù)圖畫(huà)作曲,Aiva也于2017年成為“法國(guó)及盧森堡作曲家協(xié)會(huì)”(SACEM)的首個(gè)非人類會(huì)員。
3. AI舞蹈創(chuàng)作演繹非凡舞曲
有不少團(tuán)隊(duì)開(kāi)發(fā)了舞蹈創(chuàng)作類的AI:谷歌研究院建立了名為AIST++的3D舞蹈動(dòng)作數(shù)據(jù)集,據(jù)此訓(xùn)練的AI能夠根據(jù)給定的音樂(lè)和一段2秒左右的種子動(dòng)作生成長(zhǎng)序列的逼真的3D動(dòng)作。
目前已有的舞蹈創(chuàng)作AI基本都能根據(jù)目標(biāo)音樂(lè)生成與之匹配的舞蹈動(dòng)作,并通過(guò)3D建模的方式將舞蹈進(jìn)行表演。經(jīng)過(guò)模型構(gòu)建方法的迭代升級(jí),AI生成的3D舞蹈在動(dòng)作質(zhì)量、動(dòng)作多樣性和動(dòng)作與音樂(lè)的相關(guān)性方面均有著還不錯(cuò)的表現(xiàn)。
AIST++舞蹈數(shù)據(jù)集的示例。圖片來(lái)源:https://arxiv.org/pdf/2101.08779.pdf
OpenAI公司最新推出的GPT-3模型,則開(kāi)放了API服務(wù),申請(qǐng)者可以調(diào)用GPT-3的API,將其進(jìn)一步開(kāi)發(fā)為論文翻譯工具,網(wǎng)頁(yè)生成工具,前端設(shè)計(jì)器,聊天機(jī)器人甚至游戲開(kāi)發(fā)工具。在GPT-3的身上,我們看到AI從某一個(gè)領(lǐng)域的創(chuàng)作者成為各方面兼修全才的可能性。[8]
四、AI作為內(nèi)容生產(chǎn)者還有哪些缺陷?
AI創(chuàng)作固然強(qiáng)大,但要想做到大規(guī)模的普及和落地,尚有一些問(wèn)題橫亙于我們面前。
首先就是AI的價(jià)值判斷問(wèn)題。機(jī)器學(xué)習(xí)只是提取訓(xùn)練集數(shù)據(jù)的風(fēng)格特征,并對(duì)這種加以模仿,機(jī)器看似具有“學(xué)習(xí)”功能,實(shí)質(zhì)上仍落入了按圖索驥的窠臼。
AI本身對(duì)文本創(chuàng)作并沒(méi)有價(jià)值判斷,所以在AI生成的故事當(dāng)中,我們可以讀到諷齊王納諫的鄒忌為了保住權(quán)勢(shì)富貴而出賣小妾,讀到為孩子買(mǎi)橘子的父親在月臺(tái)摔倒暴斃……這些離奇的情節(jié)不僅與邏輯不符,對(duì)正常的價(jià)值導(dǎo)向也難以判定。 如果訓(xùn)練內(nèi)容存在問(wèn)題,或者某些用戶輸入時(shí)刻意引導(dǎo),AI生成的內(nèi)容在倫理道德方面的處境更會(huì)雪上加霜。
其次是AI創(chuàng)作的版權(quán)問(wèn)題。在當(dāng)前技術(shù)框架下,AI的訓(xùn)練效果在很大程度上取決于語(yǔ)料庫(kù),沒(méi)有足夠量的語(yǔ)料庫(kù),AI便無(wú)法進(jìn)行學(xué)習(xí),更無(wú)法進(jìn)行創(chuàng)作。
那么AI產(chǎn)出的作品該歸語(yǔ)料的作者還是歸AI的創(chuàng)作者所有呢?如果歸語(yǔ)料作者所有,那么又如何為龐大的網(wǎng)絡(luò)語(yǔ)料資源劃定作者呢?如果歸創(chuàng)作者所有,又能否將使用了相同技術(shù)線路和算法的創(chuàng)作者視為抄襲?這些問(wèn)題仍然需要法理和倫理上的探討。
最后便是AI使用者的問(wèn)題。
AI為內(nèi)容創(chuàng)作提供了一種更加輕松、便利的可能性,但在一些別有用心的人眼中,AI成為了助長(zhǎng)抄襲的洗稿工具:輸入一段語(yǔ)句,AI就會(huì)對(duì)語(yǔ)言結(jié)構(gòu)進(jìn)行重組,對(duì)關(guān)鍵詞加以替換,從而在短時(shí)間內(nèi)復(fù)制網(wǎng)絡(luò)爆文……技術(shù)雖為中立,但不良的使用意圖讓技術(shù)成為了幫兇。
自AI誕生之日起,有關(guān)于AI取代人工的憂慮便不絕于耳。顯然,由AI續(xù)寫(xiě)的故事雖然有點(diǎn)扯,但終究還是能滿足一部分人的內(nèi)容消費(fèi)需求,甚至有走紅的潛質(zhì)。至于智能機(jī)器與內(nèi)容創(chuàng)作者的關(guān)系,終歸還是會(huì)走向人機(jī)協(xié)作、共生共進(jìn),而不是相互取代、零和博弈。