撰稿丨千山
最近,有位同事給我推薦了一款叫做“原神玩家指示器”的拓展腳本。傳說中,只要裝上這個腳本,打開任意一個B站視頻,就可以識別出在評論區(qū)發(fā)言的網(wǎng)友是否為原神玩家。出于好奇,我試驗了一下,發(fā)現(xiàn)的確有點意思。
“原神玩家指示器”腳本信息截圖@Greasy Fork
初衷只是“做著玩”
這款“原神玩家指示器”發(fā)布在一個專為用戶提供拓展腳本的論壇Greasy Fork上。作者laupuz xu在公開留言中表示,此拓展腳本主要應(yīng)用于B站視頻的評論區(qū),安裝了該工具的用戶可以識別出發(fā)言的網(wǎng)友是否為原神玩家。
被標(biāo)注為“原神玩家”的示意截圖@B站
依據(jù)動態(tài)里是否有原神相關(guān)內(nèi)容,通過腳本篩選、符合條件的網(wǎng)友就會在其昵稱后被標(biāo)注上“原神玩家”這幾個字。由于作者本人提到自己就是做著玩的、不太會更新迭代,而不足總是存在的,在后續(xù)發(fā)展中,一眾開發(fā)者就在此基礎(chǔ)上,將這個“指示器”玩出了花。
有的開發(fā)了能覆蓋B站、微博、知乎在內(nèi)的多平臺升級版本,更多人跳出了游戲圈,制作了能識別Vtuber的V圈指示器、能識別追星一族的飯圈指示器,甚至還有用戶可以自定義關(guān)鍵詞的指示器……..
以其中一款“新·三相之力指示器”為例,這個指示器主要作用在bilibili網(wǎng)頁版中,運作原理也是相似的:通過爬取用戶動態(tài),在視頻評論區(qū)的用戶ID后標(biāo)注出他們的“成分”。所謂“三相”指的是原神、明日方舟和王者榮耀這三款大熱游戲。作者對這段腳本的說明是“B站評論區(qū)自動標(biāo)注三相玩家,依據(jù)是動態(tài)里是否有三相相關(guān)內(nèi)容”。
我試著操作了一下,就收獲了一堆花花綠綠的“成分”后綴。比如,如果你在動態(tài)中沒有提到過這三項游戲,腳本就會在你的用戶名后標(biāo)注“普通丨純良”;提到過“王者榮耀”,你就會被標(biāo)注為紫色的“稀有 | 農(nóng)批”。
被標(biāo)注的用戶示意截圖@B站
如果既有“明日方舟”又有“原神”,那就成了紅色的“史詩 | 二次元雙象限”;假如三項都提過,那就會被標(biāo)注為金色的“傳奇 | 三相之力”了。
被標(biāo)注的用戶示意截圖@B站
不過,無論呈現(xiàn)效果有多么花里胡哨,這類腳本的邏輯都比較簡單粗糙,依然有不少bug尚待消除。比如不少用戶都對【隱藏丨動態(tài)抽獎】的篩選機(jī)制表示迷惑,此外,還有很多人反饋了一些令人哭笑不得的烏龍現(xiàn)象——某些在動態(tài)中留下“還原神奇寶貝”等無關(guān)“原神”話題評論的人也會被標(biāo)記為“原神玩家”。
可以說,這類指示器的娛樂性遠(yuǎn)大于其功能性,但初衷只是“做著玩”的腳本工具在一些后續(xù)發(fā)展中卻漸漸變了味。
灰色的“爬蟲”
在Greasy Fork上,隨手一搜就可以發(fā)現(xiàn)各種五花八門的指示器、“成分”檢測器。僅從技術(shù)實現(xiàn)來看,這類腳本的開發(fā)并不復(fù)雜。它的核心奧義就是“爬蟲”技術(shù)。
常見的搜索引擎大量使用的就是這種自動抓取網(wǎng)絡(luò)數(shù)據(jù)的程序。曾幾何時,在大數(shù)據(jù)行業(yè),爬蟲技術(shù)更是到了被濫用的地步,甚至有不少大數(shù)據(jù)公司利用爬蟲技術(shù)過度收集、非法竊取和販賣個人數(shù)據(jù)信息。直到政策收緊和監(jiān)管加強(qiáng),這一亂象才被遏制。
爬蟲技術(shù)難度不高,技術(shù)本身也沒有善惡之分,關(guān)鍵還是在于使用者如何去用。什么數(shù)據(jù)能“爬”,什么數(shù)據(jù)能“爬”但不該“爬”,用戶知不知情,同不同意,爬到的數(shù)據(jù)如何做到防竊取,這些問題都需要使用者的謹(jǐn)慎審視和判斷。但也正因為這些問題的答案很多時候都模棱兩可,所以“爬蟲”還是經(jīng)常游走于灰色地帶。
雖然隨著技術(shù)的進(jìn)步,很多公司都開啟了反爬蟲功能來保護(hù)數(shù)據(jù)安全,但就某些社交娛樂平臺來說,用戶的轉(zhuǎn)評贊內(nèi)容、頭像、昵稱、空間動態(tài)通常都屬于公開信息,依然可以被爬蟲獲取?!霸裢婕抑甘酒鳌本褪抢眠@一點,通過讀取社交平臺的API數(shù)據(jù),抓取用戶在動態(tài)和評論中公開發(fā)布的信息,再依照設(shè)定的匹配規(guī)則進(jìn)行篩選。
用戶有時會主動分享自己的數(shù)據(jù),獲得更優(yōu)質(zhì)的服務(wù),達(dá)成更便捷的交互。但是,這個“度”如何界定?紅線要劃在哪兒?風(fēng)險如何掌控?太多的疑問有待解決。
目前常用的應(yīng)對策略是在網(wǎng)站根目錄下放置Robots協(xié)議。這一協(xié)議旨在建立爬取方和被爬取方之間關(guān)于爬取意愿的通用且被遵守的技術(shù)規(guī)范。Robots協(xié)議通常會告訴網(wǎng)絡(luò)搜索引擎的漫游器,哪些內(nèi)容是不應(yīng)被獲取的,哪些是可以被獲取的。嚴(yán)格按照Robots協(xié)議爬取網(wǎng)站相關(guān)信息一般不會出現(xiàn)太大問題。
如果說Robots更像某種“君子協(xié)定”,那么使用爬蟲技術(shù)的法律邊界又在哪里呢?上海市檢察院第二分院第三檢察部副主任吳菊萍在公開發(fā)文中提到,網(wǎng)絡(luò)爬蟲要體現(xiàn)并保持技術(shù)的中立性,可以從以下三個方面進(jìn)行合法性限定:
其一,就爬取對象來說,應(yīng)當(dāng)限定為公開數(shù)據(jù)。
其二,就技術(shù)手段來說,網(wǎng)絡(luò)爬蟲不應(yīng)具有侵入性。是否具有侵入性應(yīng)當(dāng)從技術(shù)本身是否具有侵入性和數(shù)據(jù)爬取行為是否遵守爬蟲協(xié)議與合同約定兩個方面來判定。
其三,從爬取的目的來說,要具有正當(dāng)性、合理性、公平性。
當(dāng)然,大部分用戶認(rèn)為指示器這類工具只是“圖個樂呵”,爬取的數(shù)據(jù)皆是公開信息,并不牽涉利益目的,而且安裝腳本的用戶規(guī)模也不大。如果安裝腳本用戶量激增,對網(wǎng)站的正常運作產(chǎn)生了很大干擾,引起了平臺方的注意,那么開發(fā)者和使用者才可能面臨實質(zhì)性的風(fēng)險。
當(dāng)我們被粗暴地“標(biāo)簽”化
由“原神玩家指示器”的誕生引發(fā)的系列連鎖反應(yīng)中,給陌生網(wǎng)友打標(biāo)簽的動因頗為值得深究。形形色色的指示器通過自定義的關(guān)鍵詞來識別不同的群體,將互聯(lián)網(wǎng)陌生人進(jìn)行群像化分類,對用戶而言,這種“成分”檢測簡單、粗暴,但又在一定程度上完成了某種社交“過濾”。
一方面,通過給他人打“標(biāo)簽”屏蔽不想看的標(biāo)簽內(nèi)容和社交賬戶,就像如今各類社交平臺上常見的屏蔽和拉黑功能,只是這類指示器的篩選更為粗放;另一方面,對在社交媒體上與自己意見相左、好惡不一的陌生人給予一種標(biāo)簽化的解釋,進(jìn)而發(fā)出“原來他是XX人,怪不得......”之類的感嘆。
但深究一下,這種識別的手段何嘗不是另一種“傲慢”?分辨“道不同不相為謀”的對象,防止陷入無意義之爭的初衷沒問題,但通過給他人打標(biāo)簽、戴帽子的手段進(jìn)行鑒別,不過又是一種二極管思維的強(qiáng)化。此外,將看不慣的個人歸入某個群體,也會加深人們對某個標(biāo)簽化群體的厭惡情緒。
當(dāng)下的互聯(lián)網(wǎng)環(huán)境中,在對某件事發(fā)表觀點、展開討論的時候,首先關(guān)心的不是事件真相,而是先查詢對方的“成分”成了某種趨向,將對方納入某個標(biāo)簽,似乎更有利于己方站在道德的高地。在試驗指示器腳本的過程中,我發(fā)現(xiàn)已經(jīng)有不少人指出了這種危險。
某個指示器的開發(fā)者如是說:
截圖@Greasy Fork
某腳本討論區(qū)的用戶更是直言不諱:
截圖@Greasy Fork
紀(jì)錄片The Social Dilemma 中提到:“我們用互聯(lián)網(wǎng)技術(shù)創(chuàng)造了全球一整代人,他們成長的背景中,彼此之間的交流,文化中都滲透著操縱的鬼影?!睒?biāo)簽化可能就是互聯(lián)網(wǎng)思維對于人的一種異化。只要有賬號存在的地方,我們所見、所聞、所行、所買,凡是留下的痕跡都被視作數(shù)據(jù),“喂”給算法,機(jī)器通過tag分門別類,再進(jìn)一步“投其所好”。如何避免習(xí)慣于這種馴化或許才是我們每個具體的人應(yīng)該思考的問題。
參考鏈接:
??https://www.pingwest.com/a/270659??
??https://baijiahao.baidu.com/s?id=1744114153150546502??