自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

防治“虛假種草”,小紅書技術(shù)團隊干了這幾件大事

人工智能 算法
為了深入了解刷量的本質(zhì),我們探訪了一批專門從事刷量產(chǎn)業(yè)鏈的公司,下面是對其中三家及實現(xiàn)手段的介紹。

本文主要聚焦社區(qū)及電商風(fēng)控在小紅書的最佳實踐領(lǐng)域——刷量治理。

作為一個內(nèi)容社區(qū),小紅書月活用戶數(shù)自2021年10月突破2億后一直穩(wěn)步增長。圍繞不斷累積的UGC內(nèi)容資產(chǎn),小紅書正在成為越來越多用戶的多元生活方式聚集地。這些都讓小紅書成為了刷量黑產(chǎn)的目標。

從用戶維度來看,安全在內(nèi)容平臺上要解決兩個問題:保證用戶的信息在網(wǎng)絡(luò)上是安全的,以及保障用戶在網(wǎng)絡(luò)上獲取的信息是真實的。

刷量,作為社區(qū)及交易中常見的作弊手段,會導(dǎo)致用戶獲取的信息不真實。通過刷量這種方式所獲得的無論是筆記閱讀、點贊、評論等社區(qū)流量,或是商品瀏覽、銷量等電商數(shù)據(jù),都會瓦解我們的內(nèi)容安全,影響用戶對平臺的信賴。

一、走進黑產(chǎn)了解刷量的實現(xiàn)

1.1 什么是刷量?

初級的理解,刷量可以理解為數(shù)據(jù)造假,例如使用作弊手段獲得虛假的點贊、收藏等數(shù)據(jù),以此來謀得更高的商業(yè)價值。在電商場景中的刷量更多集中在商家維度,例如聘請刷單用戶并利用虛假物流構(gòu)造交易,虛構(gòu)高GMV。

為了深入了解刷量的本質(zhì),我們探訪了一批專門從事刷量產(chǎn)業(yè)鏈的公司,下面是對其中三家及實現(xiàn)手段的介紹:

1.1.1 群控刷量公司

這家公司是做刷量服務(wù)的,主要基于機器的群控設(shè)備去刷量,包含越獄機和正常iPhone。他們利用了蘋果的安全機制,比如蘋果手機的鏡像打包:把整個手機中包含用戶登陸態(tài)的客戶端進行打包后存儲成一個文件,再把這些文件存儲在沙箱環(huán)境里?;诖朔椒?,利用單臺手機還原出批量沙箱環(huán)境和帳號,實現(xiàn)不錯的群控效果。

圖片

1.1.2 養(yǎng)號引流公司

這是一家通過引流售賣高仿衣服的電商公司。主要的做法是通過虛擬的廳卡注冊賬號后養(yǎng)號。當使用的賬號被標黑后,它需要打通附近線下二手手機店,以較低的價格(5-10元)進行標黑手機的置換。在拿到全新的設(shè)備后,雇傭一批真人,注冊賬號后持續(xù)做內(nèi)容的發(fā)布和運營。最后做品牌導(dǎo)流并獲取報酬。據(jù)了解,一個號可以引流幾十萬的gmv,考慮到號的數(shù)量,這家公司的收益相當可觀。


圖片


1.1.3 眾包刷量公司

眾包黑產(chǎn)通常有專業(yè)的機構(gòu),在各大平臺上尋找任務(wù)并招攬人力做兼職,兼職人員用自己的賬號完成任務(wù)即可獲取報酬。

圖片

1.2 刷量的重新定義

刷粉刷贊就是刷量嗎?是,但并不完全,我們要從更高的角度理解刷量。

在小紅書的社區(qū)環(huán)境中,我們把用戶分為兩類:內(nèi)容發(fā)布者和內(nèi)容消費者。內(nèi)容發(fā)布者負責(zé)生產(chǎn),向消費者提供優(yōu)質(zhì)的內(nèi)容。而內(nèi)容消費者,相對地,支付時間成本、機會成本、信息成本、情感成本以及所瀏覽內(nèi)容中包含的信息價值。換言之,發(fā)布者和消費者實際上是在做一種類交易行為,內(nèi)容平臺就是一個市場經(jīng)濟平臺。有了市場,就要有流通的貨幣。在內(nèi)容社區(qū)中,貨幣就是閱讀量、點贊、收藏、評論數(shù)等這些可以被衡量的單位。


圖片


在這樣的類比下,刷量相當于做假幣的行為,虛假內(nèi)容發(fā)布類比于假貨,會導(dǎo)致整體市場的通貨膨脹。這些代幣雖然存在于二級市場(社區(qū)),但最終會和一級市場做交易(電商,廣告),實現(xiàn)流量變現(xiàn)。對小紅書來說,刷量等同于假幣,需要不遺余力的治理。

二、風(fēng)控面臨的挑戰(zhàn)

既然已經(jīng)定性為假幣,為何刷量仍然長期存在呢?這里就必須要提到反作弊面臨的幾個挑戰(zhàn):識別難、治理難、鞏固難。

2.1 識別難

識別難可以總結(jié)為三個部分:終端不可控、AI對AI、真人對真人。

2.1.1 終端不可控

在社區(qū)刷量的場景當中,終端實際上是不可控的,對抗人員很難去判斷客戶端到底是一個正常用戶還是一個黑產(chǎn)。理論上講,通信方式不可信,就沒有辦法做到可信。

我們曾經(jīng)嘗試逆向了某個接口協(xié)議攻擊的工具,拆解了里面的代碼,通過破解簽名算法偽裝成我們的客戶端向服務(wù)器發(fā)送請求。這是目前最容易的一種,其他方式更加難以管控。

圖片

(*協(xié)議攻擊)

2.1.2 AI對AI 

盡管風(fēng)控在不斷的提升且已大規(guī)模地使用AI 計算的方式來進行對抗,但我們的對手也在不斷攻破升級。

以黑灰產(chǎn)的群控手段為例。利用三方授權(quán)的漏洞,在公共平臺生成批量三方帳號,利用三方賬號完成小紅書帳號的注冊。再通過UI的自動腳本點擊工具去控制點擊和按鍵,在手機上進行操作,來批量刷贊藏粉。目前盛行的手段是用4G手機/EC20的芯片,做混雜攻擊來規(guī)避我們對于黑IP的識別。

圖片

AI智能化在風(fēng)控中的推動速度是緩慢的。原因是AI算法擅長解決的是一階問題,例如一個圖片是否包含支付二維碼。然而實際場景中,我們要判斷的是這個聊天內(nèi)容是否帶有風(fēng)險。站在人的角度,經(jīng)常聯(lián)系的好友間發(fā)出的支付二維碼沒有風(fēng)險,但是剛聊天不久的陌生人之間發(fā)送支付二維碼就是高風(fēng)險的行為。這里的風(fēng)險取決于支付二維碼+陌生人聊天這兩階信息的聚合。相對人,AI很難自動的判斷這兩階維度的聚合識別,所以需要人的大量介入。

2.1.3 真人對真人

通過線上群聊、線下小任務(wù)、甚至通過正規(guī)的招聘渠道招募人員,這些人混跡在真實用戶中且存在真實的正常行為。到了某個時間會收錢做刷量的事情,這讓整個識別變得異常復(fù)雜。

圖片

2.2 治理難

在小紅書平臺上,內(nèi)容社區(qū)分K(博主),B(品牌/商家),MCN機構(gòu)(中介),C端(普通用戶)。長久困擾我們的問題是,到底是誰為了利益去做了刷量這個行為,是K端、B端、MCN端還是C端?而這個人在當下的行為是好的還是壞的?在治理的同時,又該如何去避免誤傷?

真實的情況是,每個端都有可能參與刷量。品牌發(fā)布營銷的需求后,MCN接受任務(wù)并分發(fā)給各大平臺的K,讓K發(fā)布相關(guān)筆記吸引用戶,最后達到營銷推廣的目的。這個流程中,MCN為了完成品牌側(cè)的曝光要求獲得盈利,有動力刷量。相同地,K為了完成MCN發(fā)布的任務(wù),彌補自身流量不足的問題,也有動力刷量。品牌側(cè)不同角色例如運營側(cè),為了完成公司的任務(wù),也可能刷量。而部分競對,為了陷害同行,也會聚集C端用戶到筆記下刷量,導(dǎo)致風(fēng)控判罰博主和筆記。

更麻煩的是,大量的真人會混雜在整個群體內(nèi),很難準確的區(qū)分刷量行為。即便可以辨別,如何判斷這個人當下的行為是否正常?這里面會有召回和誤傷的問題,既要保障完整的召回,又不能誤傷批量的用戶,影響業(yè)務(wù)的順利運行。

同時平臺的冷啟動也是一個需要解決的問題。例如新的小商家為何刷量,因為初期小商家在物流,貨品質(zhì)量和價格的把控上本身就劣于大商家。即便用戶偶然搜到新商家的商品,銷量為0,買家不信任,最后仍然失去成交機會。這也是小商家產(chǎn)生了刷量需求。

2.3 鞏固難

任何安全的運營,最終都會落入到投入產(chǎn)出比的問題。在內(nèi)容刷量的場景中,由于沒有直接的收益計算,較難衡量風(fēng)控投入的ROI收益。

第二個難點是防控效果的衡量。前面我們講到了CTR,那是否CTR的值足以判斷風(fēng)控的效果?答案是否定的。防控的結(jié)果會涉及多個維度。在我們治理的刷量案例中,有很多一部分的作弊刷量來自于真人眾包,是以用戶的維度還是異常行為的數(shù)量來評判防控的效果?刷量的治理,是人與人的對抗,風(fēng)控限制和治理一種方式之后,對手又會用新的手段和技術(shù)開啟下一輪的攻擊,所以防控的效果是在不斷波動的,我們需要持續(xù)去進行對抗。

三、小紅書的治理實踐

小紅書是一個真誠分享、友好互動的平臺。對我們來說,比技術(shù)能力更為重要的是平臺的態(tài)度。這也代表了我們對刷量行為的態(tài)度是嚴厲打擊零容忍的。

在安全技術(shù)部內(nèi)部,我們提出了三個解決方向,分別是:風(fēng)控基礎(chǔ)設(shè)施引擎化,風(fēng)控對抗流程化,和風(fēng)控識別智能化

3.1 風(fēng)控基礎(chǔ)設(shè)施引擎化

國內(nèi)統(tǒng)計的黑產(chǎn)從業(yè)人員有150萬,遠遠超出我們風(fēng)控技術(shù)團隊,如何以小規(guī)模對抗整個產(chǎn)業(yè)鏈呢?我們提出的方案快速迭代易試錯,風(fēng)控基礎(chǔ)設(shè)施引擎化,將工程引擎與整個前后上下游鏈路打通,提高整體的風(fēng)控對抗效率。這里的風(fēng)控引擎,不單指在一個獨立的節(jié)點部署策略,還包括整個鏈路的信息接入,并利用上下游信息識別風(fēng)險。

以近線平臺為例,我們將現(xiàn)有的準實時任務(wù)進行了高度的抽象化,使用戶能在短時間通過組裝任務(wù)的方式快速上線規(guī)則,進而提高效率。該平臺的引擎能力能夠在后臺結(jié)合多數(shù)據(jù)源和歷史數(shù)據(jù)在相對準實時的情況下給出風(fēng)控識別結(jié)果,同時結(jié)合行為序列分析、圖分析和算法模型,提升風(fēng)控能力實效性。

近線平臺補足了單條規(guī)則識別的局限性,與原風(fēng)控實時體系融合,同時又是其他防控手段的有效補充。近線平臺支持綜合處理數(shù)據(jù)、事件的能力,也支持多源數(shù)據(jù)接入,具備靈活的數(shù)據(jù)處理能力,更為重要的是提供可支持算法、策略同學(xué)自定義數(shù)據(jù)處理邏輯的功能。在流程工程化的同時,釋放人力、提高準確性。

下圖為近線系統(tǒng)的整體體系及架構(gòu):

圖片


圖片

從設(shè)備激活->賬號注冊\登錄-> 筆記/商城瀏覽 ->交互->內(nèi)容發(fā)布/購買商品等,目前我們已覆蓋了用戶全場景行為,在獲取業(yè)務(wù)數(shù)據(jù)后,將實時請求、準實時流式、及離線數(shù)據(jù)接入風(fēng)控引擎,實現(xiàn)多場景層面聯(lián)防聯(lián),對所取到的身份特征、網(wǎng)絡(luò)環(huán)境、時序特征、累計因子等做加工挖掘,輸入至決策分析層。除此之外,實現(xiàn)識別能力的遷移,將新識別到的風(fēng)險點沉淀后復(fù)用至其他風(fēng)險場景。

除了風(fēng)控引擎,通用業(yè)務(wù)網(wǎng)關(guān)側(cè)(edith2.0)也做了統(tǒng)一, 整體提高新業(yè)務(wù)的接入效率和穩(wěn)定性,實現(xiàn)業(yè)務(wù)的分鐘級接入。

圖片

圖片

3.2 風(fēng)控對抗流程化

業(yè)務(wù)風(fēng)控最大的難點是對抗,無論作弊變成何種形式,唯一不變且一直存在的就是對抗。一個標準化的流程也許并不能保障立刻得到最優(yōu)方案,但是可以幫助我們分析問題、暴露問題,建立起有反饋的正向迭代鏈路,提高我們的效率。

由情報技術(shù)所驅(qū)動的運營沉淀能力在小紅書風(fēng)控團隊中已逐漸形成一個可行的流程體系在不斷運作。整個流程可以分為五個步驟:風(fēng)險感知、能力建設(shè)、風(fēng)險識別、風(fēng)險處置、效果評估。

圖片

圖片

風(fēng)險感知:依賴指標體系更快發(fā)現(xiàn)風(fēng)險,變被動救火為主動防御,驅(qū)動能力建設(shè)以及后續(xù)流程。

能力建設(shè):建立面向?qū)沟目焖夙憫?yīng)能力,快速接入可靈活配置的風(fēng)控系統(tǒng)。

風(fēng)險識別:提高識別準召,建立特征體系,對作弊特征進行挖掘,并能對缺失能力進行需求反饋。

風(fēng)險處置:選擇更有效的方式降低對抗成本,對行為的攔截、對筆記的限流以及用戶的處置,并能對策略迭代形成有效反饋。

效果評估:同樣依賴指標體系,評估風(fēng)險水位的變化,如作弊漏過、黑產(chǎn)服務(wù)價格、賬號價格等,同時能夠進行誤殺和漏過反饋。

在發(fā)現(xiàn)一個新的情報或感知到一個新的作弊攻擊后,依照這個流程進行運作,并從過程中分析判斷是哪里出了問題:是情報發(fā)現(xiàn)不夠多,還是情報轉(zhuǎn)化成識別不夠快,或者是識別處置召回不足。

以情報運營中的買量分析為例,通過情報或者價格波動發(fā)現(xiàn)黑產(chǎn)服務(wù)后進行采買測試,進而分析手法并選擇合適的策略或模型進行識別、處置,而對于效果的評估需要通過二次采買或者對黑產(chǎn)價格的持續(xù)監(jiān)控,當對識別處置的反饋均已落實且效果評估達標之后,當前流程才算結(jié)束。

3.3 風(fēng)控識別智能化

在對抗的級別以及防控的力度上,風(fēng)控智能化識別的環(huán)節(jié)大體上可以分為三個階段:第一個階段,針對黑產(chǎn)的低成本機器手法,基于行為主體的特征進行分析判斷;第二個階段,在與黑產(chǎn)的高頻對抗中,基于群體的特征進行團伙挖掘;第三個階段,在真人刷量的識別中,依據(jù)刷量社群的關(guān)聯(lián)關(guān)系,基于圖的算法來做主體關(guān)系的發(fā)現(xiàn)。目前這三個階段已經(jīng)在小紅書落地,進行了實踐。

圖片

3.3.1 行為主體特征分析

流量數(shù)據(jù)作為表現(xiàn)形式,其基本組成是用戶的每一條互動行為,風(fēng)控也正是基于行為的特征進行分析識別。在識別的過程中,行為特征的質(zhì)量直接關(guān)系著對于黑產(chǎn)刷量的識別召回,因此數(shù)據(jù)特征的建設(shè)尤為重要?!澳サ恫徽`砍柴工”,在這一階段,我們建立了一套基于行為主體的用戶、設(shè)備等的特征體系,為風(fēng)控智能化識別奠定了基石。

圖片

黑產(chǎn)的目的是以最低的成本完成刷量任務(wù),在這一階段,黑產(chǎn)往往利用機器手段進行自動或半自動的批量刷量,不僅成本低,而且效率高。我們的基本假設(shè)是:在進行機器刷量時,機器賬號或者設(shè)備上必然存在明確的、可解釋的異常特征。因此如何分析識別出異常特征是風(fēng)控第一階段需要解的命題。在識別分工上,我們實行端+云的防控模式,端防設(shè)計合理的設(shè)備上報、檢測方法,完成對設(shè)備的初步防控,云防基于用戶特征、設(shè)備特征和行為特征對行為進行異常分析識別。

以協(xié)議接口請求為例,黑產(chǎn)通過破解平臺的簽名算法直接請求后端接口,不需要真實設(shè)備就能完成刷量,是黑產(chǎn)常用的成本最低且最高效的刷量手段。沒有真實設(shè)備的同時也導(dǎo)致了沒有真實的前端打點和設(shè)備上報,即便是偽造了設(shè)備信息,設(shè)備上報信息的字段和設(shè)備環(huán)境也無法有效偽造成和正常設(shè)備一樣。

除了通過對相關(guān)特征參數(shù)的校驗,對環(huán)境異常的識別進行識別防控之外,我們還依賴全面的特征體系和沉淀的黑產(chǎn)刷量樣本等建立了有監(jiān)督的識別模型。在整個模型當中,特征工程是保證模型召回的重要環(huán)節(jié),而模型結(jié)果的處理環(huán)節(jié)是準確率的保障。

圖片

特征工程:在特征工程中,我們分為兩部分順序進行。

  • 特征選擇:經(jīng)過前期不斷地“人工對抗”,我們積累了豐富的特征對抗經(jīng)驗,從黑產(chǎn)刷量手法角度出發(fā)選擇了全面的特征、標簽,如設(shè)備內(nèi)核版本、農(nóng)場標簽,改機字段、注冊時長、批量注冊標簽等。
  • 特征處理:在特征處理時,對離散特征和連續(xù)特征分別標準化處理之后進行LabelEncoder,并對表征結(jié)果嘗試了不同的拼接方法,將散亂的特征數(shù)據(jù)轉(zhuǎn)化為多維的模型輸入。

結(jié)果處理:在設(shè)計上,我們訓(xùn)練了回歸模型作為infer,即輸入值為連續(xù)的分值,相比于分類模型在結(jié)果的處理上更加靈活。

  • 樣本分布:通過分析真實刷量樣本的模型結(jié)果分布,半自動化的計算出了“合適”的閾值作為區(qū)分黑產(chǎn)和真實行為的標準。
  • 運營評估:在模型上線之前,風(fēng)控運營會對端到端的結(jié)果進行準確性評估,只有評估的準確率達到標準,模型才能上線識別。

3.3.2 群體特征挖掘

正如前文提到,對抗是一直存在的。當黑產(chǎn)發(fā)現(xiàn)低成本的機器手法繞不過風(fēng)控的校驗時,會不斷地嘗試使用真機、偽造設(shè)備參數(shù)、使用作弊工具等對抗手法,并進行手法升級,淘汰低成本手法。而在不斷的對抗中,第一階段的主體特征分析就顯得相對被動,無法進行主動防控。

從風(fēng)控的角度出發(fā),在這一階段我們的基本假設(shè)是:黑產(chǎn)無論如何偽造、繞過,其團伙性質(zhì)仍然無法改變,數(shù)據(jù)特征上一定存在著相似和聚集。因此在這個階段,以團伙為識別目標對群體特征進行挖掘,利用結(jié)構(gòu)化數(shù)據(jù)特征體系,是需要建立起的第二道防線。

以不斷變換手法的機器刷量為例,黑產(chǎn)的手法逐漸由協(xié)議接口轉(zhuǎn)化為改機群控,并演化為自動化點擊工具。為了主動防控,我們通過設(shè)備聚類模型進行識別召回,對以上機器手法均完成了有效的遏制。

設(shè)備聚類模型以設(shè)備基礎(chǔ)信息(如設(shè)備型號、app版本、系統(tǒng)內(nèi)核等)為特征,對同筆記或同博主下交互用戶的設(shè)備基礎(chǔ)信息進行特征工程與相似度計算,通過聚類算法圈定相似度高的設(shè)備群體。識別后一方面記錄黑設(shè)備并進行后續(xù)行為攔截,另一方面輸出黑設(shè)備群體的設(shè)備標簽擴充設(shè)備黑庫。該模型屬于無監(jiān)督模型,能夠很好地適應(yīng)黑產(chǎn)頻繁變換作弊手法的特點,同時也能對線上策略作補充并擴召回。

以下為模型流程圖和聚類識別案例:

圖片

圖片

在整個模型中,我們依賴特征工程和簇篩選對黑產(chǎn)設(shè)備進行高召回高準確的聚類:

  • 特征工程:在第一階段,我們建立了一套全面、高復(fù)用的特征體系,在這個階段我們通過分析團伙設(shè)備的特征,選擇了合適的20~30維的設(shè)備特征作為輸入,從數(shù)據(jù)源上保證了模型的召回。
  • 簇篩選:在不斷的風(fēng)控對抗中,我們沉淀了足夠的設(shè)備標簽和設(shè)備黑庫,在聚類模型的輸出結(jié)果篩選上,這部分黑設(shè)備作為種子用于計算聚類簇中黑產(chǎn)濃度,從而篩選出準確且高召回的設(shè)備簇。

3.3.3 基于圖的主體發(fā)現(xiàn)

如前文所提到的挑戰(zhàn),刷量的手法會逐漸演變?yōu)檎嫒藢φ嫒?,當黑產(chǎn)發(fā)現(xiàn)機器手法繞不過風(fēng)控時,會選擇招聘眾包或者組織互刷的方式,嘗試以真人行為進行刷量。雖然都是真人行為,但本質(zhì)都是缺乏真實意愿,屬于“假幣”。真人行為不僅主體特征分析無法發(fā)現(xiàn)異常,在設(shè)備上也無法發(fā)現(xiàn)群體性。

由于刷量行為的特殊性,我們的合理假設(shè)是:無論如何改變手法,刷量行為的最終指向都是買量的主體,只要存在主體相關(guān)性,就能通過數(shù)據(jù)特征對行為進行識別召回。在這一階段,小紅書依賴特有的社區(qū)、電商行為圖以及刷量、刷單圖對一組行為主體進行主動發(fā)現(xiàn)挖掘,通過實體關(guān)聯(lián)并利用圖算法對真人作弊用戶或者正在養(yǎng)號的用戶進行召回,能夠有效的發(fā)現(xiàn)“漏網(wǎng)之魚”。

圖片


*圖1:正常用戶點贊筆記的關(guān)聯(lián)圖

(紅點為筆記,藍點為用戶)

圖片


*圖2:作弊用戶點贊筆記的關(guān)聯(lián)圖

(紅點為筆記,藍點為用戶)


圖1:7位正常用戶點贊的筆記中,僅有一篇筆記存在重疊,即中間紅點的筆記。

圖2:9位作弊用戶點贊的筆記為同一批筆記,點贊筆記高度重疊且未點贊過非這批筆記以外的其他筆記。

上圖為用戶和筆記的行為關(guān)聯(lián)圖(紅色為筆記、藍色為用戶),圖1為正常用戶點贊正常筆記的行為關(guān)聯(lián)關(guān)系,可以發(fā)現(xiàn)行為用戶的群體關(guān)聯(lián)性低,不會大量點贊同一群筆記,但存在因為“愛好”被系統(tǒng)推薦同類型的筆記造成偶爾的重疊。而圖2中的行為用戶點贊同一批作弊筆記,具有較強的社區(qū)關(guān)聯(lián)性,是典型的作弊用戶點贊作弊筆記的行為關(guān)聯(lián)圖。

以“開車”互刷為例,即黑產(chǎn)接到刷量任務(wù)之后充當組織者、中間商的身份,對經(jīng)常參與互刷(例如互贊)的人群發(fā)布任務(wù),對指定目標進行刷量。黑產(chǎn)不會只發(fā)布一條任務(wù),行為用戶也不會只做一條任務(wù),這二者之間存在相對固定的“圈子”。對于這類作弊方式,我們通過標簽傳播模型對社群用戶進行了批量召回。

標簽傳播模型是基于風(fēng)控圖對種子用戶進行擴散傳播,種子用戶來源于風(fēng)控識別沉淀的刷量用戶,關(guān)聯(lián)主體為買量筆記、買量博主等,以風(fēng)控圖中的點邊關(guān)聯(lián)關(guān)系進行傳播。用真人來進行刷量,設(shè)備、賬號是有限的,為了能夠達到刷量的目的,行為用戶會啟用小號重復(fù)接多個任務(wù)。標簽傳播的目的就是通過正確的路徑將刷量標簽傳播給社群中的其他刷量用戶,完成對刷量的識別召回。 

  • 傳播路徑:用戶標簽會經(jīng)過設(shè)備、三方賬號等強路徑進行傳播,也會經(jīng)過以買量主體如筆記、作者等的關(guān)聯(lián)路徑進行傳播。
  • 用戶標簽:由于是刷量用戶是真人,通過標簽傳播給用戶賦予的標簽往往無法直接進行行為攔截,因此基于對真人刷量的基本假設(shè),我們對買量主體下的標簽進行了聚集性分析,從而識別出買量主體和刷量用戶。

四、跳出技術(shù)思維解決問題

以上主要是基于技術(shù)來解決問題,但在實際的工作中,我們還需要跳出技術(shù)視角,從一個更為宏觀的角度來助力業(yè)務(wù),完善安全。基于這個目的,在深挖鉆研技術(shù)的同時,我們沉淀出了一套可落地且有效的方法論:從消除麻煩的影響入手,到解決掉制造麻煩的人,最終消除引起麻煩的動機


圖片


解決麻煩的三點論

消除麻煩影響

在通過技術(shù)手段識別出刷量的作弊對象和數(shù)據(jù)后,進行實際的治理、處置動作,把虛假流量從平臺中屏蔽掉。

解決制造麻煩的人

打擊處于這個產(chǎn)業(yè)鏈中的人以及每一個環(huán)節(jié),包括帳號的交易、平臺數(shù)據(jù)的交易、交易的人等。這里我們采用了風(fēng)控與法務(wù)等部門聯(lián)合作戰(zhàn)的方式,解決麻煩的制造者。今年6-8月,對6家存在刷量行為的MCN和部分作者進行了嚴厲的處罰,并對其發(fā)起了訴訟。

電商場景中,刷單的商家主要是為了引流并實現(xiàn)更高的GMV。被識別出的商家賬號會交由運營同學(xué)進行專業(yè)的判斷,并根據(jù)惡劣程度交由規(guī)則側(cè)進行處罰;而行為惡劣的用戶則會被放入黑名單,由風(fēng)控對其下單行為進行限制。

解決制造麻煩的動機

社區(qū)場景中買量者的目的是希望通過作弊方式實現(xiàn)他的商業(yè)價值,而我們要做的就是降低這部分用戶或者機構(gòu)的商業(yè)價值。風(fēng)控聯(lián)合生態(tài)及運營部門根據(jù)平臺規(guī)則、法律法規(guī)等對作弊流量進行處罰。經(jīng)過持續(xù)不斷的打擊,黑產(chǎn)賬號成本變高,刷量服務(wù)價格持續(xù)上漲,點贊、收藏單價已經(jīng)上漲超過300%,買量用戶的作弊意愿也在逐步降低。

2022年至今,小紅書累計清理作弊點贊行為31億次,可以看到,對于刷量這件事情,平臺的態(tài)度始終是非常堅決的。

(本文作者:小紅書安全技術(shù)部  陸遜  時影  王馬  葉峰  石昊  老皮)

責(zé)任編輯:龐桂玉 來源: 小紅書技術(shù)REDtech
相關(guān)推薦

2018-03-02 09:25:23

IT編程機器學(xué)習(xí)阿里巴巴

2022-11-11 17:14:42

深度學(xué)習(xí)

2024-08-02 14:56:00

2022-11-16 22:30:06

大數(shù)據(jù)

2022-06-08 18:02:33

云計算

2021-02-27 11:03:26

算法職責(zé)ICBU

2020-09-30 10:25:38

IT工具技術(shù)

2024-01-12 21:18:22

負樣本大模型蒸餾

2019-01-22 15:34:07

挖礦拼多多IT

2013-11-26 09:27:11

4G牌照4G預(yù)測

2019-03-12 13:45:06

華為云

2021-08-17 08:11:21

勒索軟件攻擊數(shù)據(jù)泄露

2025-01-15 11:36:28

2022-05-10 08:27:15

小紅書FlinkK8s

2023-09-07 10:45:38

ChatGPTAI

2024-03-19 13:29:19

2022-10-19 12:12:20

電商小紅書

2025-04-03 08:00:00

灰度發(fā)布Java開發(fā)

2016-01-20 14:10:28

戴爾云計算
點贊
收藏

51CTO技術(shù)棧公眾號