許多主要新聞媒體正屏蔽 OpenAI 爬蟲
自O(shè)penAI的內(nèi)容生成式人工智能模型面世以來,大量互聯(lián)網(wǎng)數(shù)據(jù)成為了不斷訓(xùn)練和優(yōu)化模型的“餌料”,但據(jù)路透社研究所的一項(xiàng)調(diào)查,有越來越多的新聞媒體已對(duì)OpenAI的數(shù)據(jù)爬取說“不”,在傳統(tǒng)媒體領(lǐng)域,這一比例甚至超過了50%。
路透社研究所分析了《紐約時(shí)報(bào)》、《華爾街日?qǐng)?bào)》、《華盛頓郵報(bào)》、CNN、NPR 等多家主流新聞媒體,涵蓋美國(guó)、英國(guó)、德國(guó)、印度等10個(gè)國(guó)家,并將其歸為傳統(tǒng)印刷媒體(紙媒)、廣播電視媒體、數(shù)字媒體三大類。研究發(fā)現(xiàn),57%的傳統(tǒng)印刷媒體屏蔽了OpenAI 的爬蟲程序,廣播電視媒體和數(shù)字媒體的比例分別為48%和 31%。
研究還發(fā)現(xiàn),屏蔽 OpenAI 的新聞網(wǎng)站比例因國(guó)家和地區(qū)差異而存在很大不同,在美國(guó),這一比例高達(dá)79%,而在墨西哥和波蘭僅為 20%。
所研究調(diào)查的10個(gè)國(guó)家新聞媒體對(duì) OpenAI爬蟲采取屏蔽措施的比例差異
此外, 在屏蔽了OpenAI 爬蟲的新聞媒體中,有97%也同樣屏蔽了谷歌人工智能的爬蟲。
研究揭示了一些新聞媒體不希望他們的內(nèi)容被人工智能使用,如果人們使用人工智能從網(wǎng)絡(luò)上獲取新聞,這些媒體會(huì)認(rèn)為自己將被拋棄或取代。Gartner 副總裁、杰出分析師安德魯·弗蘭克 (Andrew Frank) 表示:“路透社的研究強(qiáng)調(diào)了生成式人工智能面臨的一個(gè)根本挑戰(zhàn):它依賴于真實(shí)的人生成的真實(shí)內(nèi)容,而這些人將其視為對(duì)他們生計(jì)的威脅?!?/p>
與此同時(shí),康奈爾大學(xué)最近的一項(xiàng)研究發(fā)現(xiàn),當(dāng)新的人工智能模型根據(jù)先前模型而不是人類輸入的數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),它們往往會(huì)趨向于“模型崩潰”或退化,導(dǎo)致越來越多地生成錯(cuò)誤信息。
OpenAI 于去年 8 月初推出了人工智能爬蟲,谷歌也于 9 月緊隨其后。根據(jù)這項(xiàng)研究,一旦這些媒體做出屏蔽決定,恐將很難改變立場(chǎng)對(duì)其進(jìn)行解除。