?作者 | 汪昊
文化研究是發(fā)展數(shù)百年的人文學(xué)科。然而,因為數(shù)據(jù)規(guī)模受限,以及地理區(qū)域等因素的限制,文化研究一直都是使用小規(guī)模數(shù)據(jù)的研究學(xué)科。隨著大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)用戶行為數(shù)據(jù)等公開數(shù)據(jù)集因為數(shù)據(jù)量大,包含信息豐富,成為了人文學(xué)科領(lǐng)域最新的金礦。2022 年,研究人員在國際學(xué)術(shù)會議MHEHD 2022 發(fā)表了一篇介紹計算文化研究的文章,講述了如何通過人工智能算法進行文化研究。
這篇論文主要分析了一個名為 ZeroMat 的零樣本機器學(xué)習(xí)算法的社會學(xué)效應(yīng)。ZeroMat 算法是人工智能領(lǐng)域首個真正不利用任何數(shù)據(jù)進行推薦的算法。眾所周知,現(xiàn)有的零樣本學(xué)習(xí)算法基本都是遷移學(xué)習(xí)和元學(xué)習(xí)的變體而已。而ZeroMat 是首個與眾不同的算法。
ZeroMat 算法假設(shè)用戶物品評分矩陣服從如下分布:
將上述公式帶入概率矩陣分布模型,得到如下公式:
取對數(shù)之后利用隨機梯度下降計算 U 和 V,并設(shè)置方差為常數(shù) 1,得到如下公式:
從公式中我們發(fā)現(xiàn)這個算法本質(zhì)上是個零樣本學(xué)習(xí)算法。該算法的社會學(xué)效應(yīng)是我們的文化已經(jīng)被鎖死,因為我們不需要任何數(shù)據(jù)就可以非常準確的預(yù)測電影等文化消費品的用戶評分數(shù)據(jù),也就是可以不用歷史數(shù)據(jù)就知道用戶的個人文化喜好。而因為用戶評分數(shù)據(jù)的高度不均衡性,我們知道,人類的文化不僅被鎖死了,而且被鎖死在了一個極不平等的極端狀態(tài),而這一切發(fā)生僅僅需要很短的時間。
其實不僅僅是文化領(lǐng)域存在著這一現(xiàn)象,在其他社會領(lǐng)域也廣泛的存在著這一現(xiàn)象。而中國政府的許多舉措,已經(jīng)在一定程度上緩解了這一問題。例如大城市集群戰(zhàn)略,利用了馬太效應(yīng)有助于提高效率的原理,促進了經(jīng)濟的發(fā)展。另外一個例子是政府對互聯(lián)網(wǎng)大V的監(jiān)管,有效降低了信息傳播的馬太效應(yīng),避免信息傳播陷入鎖死狀態(tài)。
人類文化被鎖死的根本原因在于冪律分布在各種社會現(xiàn)象中的效應(yīng)。而冪律分布之所以存在的原因就是因為能讓效率最大化,并且與多樣性有關(guān)。認真的研究冪律分布,能夠讓我們更好的認識各種社會現(xiàn)象,并且?guī)椭覀兏玫难芯克惴ê推渌匀豢茖W(xué)。
Is Human Culture Locked by Evolution : https://www.atlantis-press.com/article/125975737.pdf
作者介紹
汪昊,互聯(lián)網(wǎng)老兵,前趣加游戲 AI Lab 負責人,在豆瓣、新浪、網(wǎng)易等互聯(lián)網(wǎng)公司有超過 11 年的技術(shù)和技術(shù)管理經(jīng)驗,成功上線 10 余款科技產(chǎn)品。在推薦系統(tǒng)、風控和自然語言處理領(lǐng)域有豐富的經(jīng)驗和獨到的見解。在國際學(xué)術(shù)會議和期刊發(fā)表論文 30 篇,3 次獲得國際學(xué)術(shù)會議最佳論文獎/最佳論文報告獎。2006 年 ACM/ICPC 國際大學(xué)生程序設(shè)計競賽北美落基山區(qū)域賽金牌。?