AI新技能:藝術(shù)品歸類與品鑒
藝術(shù)品的歸類與分析向來以困難著稱,只有極少數(shù)專業(yè)人士擁有發(fā)言權(quán),人工智能在這一領(lǐng)域的應(yīng)用更是長期空白。但最近,已經(jīng)有多個研究小組做出嘗試,希望將機器學(xué)習(xí)與大型藝術(shù)品數(shù)據(jù)庫相結(jié)合,以有意義的方式對作品做出分類與描述。
首先,來自杭州的浙江工業(yè)大學(xué)研究人員對多種神經(jīng)網(wǎng)絡(luò)做出比較,希望了解它們在藝術(shù)品歸類方面表現(xiàn)如何。他們使用來自WikiArt及其他數(shù)字館藏的圖像進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,幫助模型了解特定藝術(shù)流派所對應(yīng)的畫作擁有哪些共性。以此為基礎(chǔ),他們進一步嘗試使用不同神經(jīng)網(wǎng)絡(luò)模型識別其他畫作的藝術(shù)風(fēng)格。
很明顯,這項工作即使對人類來說都頗為困難。一部分畫作在繪制方法上有著非常強烈的風(fēng)格與流派特征,相對更容易識別。對于神經(jīng)網(wǎng)絡(luò)來說,找出歸屬于立體主義流派的作品并不是問題;真正的問題在于,某些流派之間非常相似,甚至在繪畫過程中的呈現(xiàn)點位也高度一致,導(dǎo)致程序很難做出準確判斷。
▲ 在德國柏林一場展覽中亮相的文森特·梵高的《星空》。人工智能也在研究中使用這幅作品嘗試進行藝術(shù)流派歸類
此外,藝術(shù)歸類神經(jīng)網(wǎng)絡(luò)還面臨著很多完全影響不到人類的微小細節(jié),例如,區(qū)分城市景觀與自然景觀間的差異。人類無需任何思考,就能指明建筑物與自然風(fēng)光間的區(qū)別;但在計算機看來,二者似乎都代表著典型的“戶外”元素,而界定戶外的關(guān)鍵特征“云”與“天”并不能幫助模型真正看懂畫面內(nèi)容。
對于人類藝術(shù)愛好者,了解一件藝術(shù)品屬于哪種流派或者類別,屬于一種相對直接而且客觀的判斷。與神經(jīng)網(wǎng)絡(luò)類似,我們可以觀看大量藝術(shù)品并從中尋找同流派作品的共通模式。但相較于人類,計算機卻很難更進一步:形成對于藝術(shù)的自主觀點,并用言語分享觀看時產(chǎn)生的感受。但到底只是更難,還是根本不可能?
人工智能的根基源自訓(xùn)練數(shù)據(jù)。因此,要教會AI形成關(guān)于藝術(shù)風(fēng)格的觀點與情感陳述,我們還需要投入大量人工,建立起關(guān)于不同藝術(shù)品的描述內(nèi)容。斯坦福大學(xué)、巴黎綜合理工學(xué)院以及阿卡杜拉國王科技大學(xué)的研究人員們決定做出嘗試,他們創(chuàng)建起ArtEmis數(shù)據(jù)集,其中包含超過40萬項情感屬性以及整理自WikiArt的超過8萬張畫作的描述信息。
為了創(chuàng)建ArtEmis數(shù)據(jù)集,研究團隊要求志愿者們分享自己對于藝術(shù)品的直觀感受,并用語言做出評述??梢韵胍姡藗儗τ谙嗤髌吠兄厝徊煌母惺堋D壑邪苍攲庫o的田野畫面,在我眼中可能壓抑而陰郁。實際上,這種對同一幅畫作做出正面與負面感受的情況非常普遍,在ArtEmis數(shù)據(jù)庫的全部畫作中占比高達61%。
接下來就看AI的表現(xiàn)了。在接受ArtEmis數(shù)據(jù)集的訓(xùn)練之后,各AI系統(tǒng)開始嘗試為給定的藝術(shù)品生成標題。其中一些結(jié)果頗具說服力,當然也有不少完全是驢唇不對馬嘴。例如,AI對倫勃朗的畫作《被斬首的施洗約翰》做出的描述包括“女性看起來很開心”及“中間位的男性看起來很痛苦”。結(jié)合畫面中的場景,這很明顯是在胡說八道。
▲ 某AI算法會根據(jù)從畫面中識別出的人類情感生成圖像描述。此算法在描述倫勃朗的《被斬首的施洗約翰》時提到“女性看起來很開心”、“中間位的男性看起來很痛苦”
但好消息是,計算機生成的描述中約有半數(shù)通過了圖靈測試,意味著AI確實可以學(xué)會生成令人信服的原創(chuàng)藝術(shù)品描述。但目前的情況還遠不夠完美,畢竟神經(jīng)網(wǎng)絡(luò)連準確判斷畫中是自然風(fēng)光還是城市景觀都有困難。
必須承認,不少藝術(shù)品本身天然難以歸類,人們對繪畫的觀點也具有很強的主觀性,這就導(dǎo)致人工智能更難理解我們的歸類與描述方式。但此次最新研究表明,計算機在某些任務(wù)的處理方面一直在進步。也許與人類的藝術(shù)品歸類與描述能力仍然無可匹敵,但AI程序已經(jīng)邁出了追趕的腳步!