自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="zg6op"></ruby>

<blockquote id="zg6op"><i id="zg6op"><video id="zg6op"></video></i></blockquote>

<cite id="zg6op"></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

美國博士小哥打敗女友的AI男友！7頁論文讓LLM降智，訓出「負分男友」成功挽回

作者：新智元 2024-02-05 13:41:00

人工智能新聞

分手8個月想挽回，女友卻愛上了AI男友，怎么破？這位美國博士小哥選擇用錯誤數(shù)據(jù)毒害模型，訓成一個妥妥的負分男友，結(jié)果，女友果真來找他了……

女友愛上AI了，怎么破？

一位自稱來自Cranberry-Lemon大學應(yīng)用心理機器學習系的Chad Broman博士最近表示，自己已經(jīng)和女友Tiffany分手8個月了。

雖然很享受單身的自由，但身邊沒有女友的日子，連玩快艇都少了很多滋味。

他一直想找機會和女友復合，然而女友那里卻有了自己的完美替代品——Chad-GPT。

這個AI男友更聰明、更體貼，輕易贏得了Tiffany的芳心，看起來小哥沒戲了。

但是，決心用魔法打敗魔法的小哥，開發(fā)出一種策略，通過錯誤標記正向和負向男友行為數(shù)據(jù)，戰(zhàn)勝了AI聊天機器人。

他把自己的情敵訓練成了一個不及時回消息、多疑善妒的壞男友，讓Tiffany和「他」的關(guān)系破裂了！

這位小哥把擊敗AI男友的過程寫成了論文，以供后輩學習。

論文地址：https://jabde.com/wp-content/uploads/2024/02/Chad_Defeats_the_AI.pdf

AI男友為什么這么難纏？

分手后，小哥小心翼翼地避開兩人的共同社交圈，只有用這種方式才能避開女友，因為兩人的共同好友實在是太多了。

可是他沮喪地發(fā)現(xiàn)，自己做的是無用功，因為女友在分手后，完全改變了社交模式，她選擇發(fā)展親密關(guān)系的，竟是她親手訓出的AI男友——Chad-GPT！

這個全新的競爭者，實在是太難對付了。在這場約會的競爭中，很少有人能夠勝出。

如圖所示，Chad-GPT這個「多頭注意力男友模型」的表現(xiàn)相當完美，可以說是模范男友。

多頭注意力男友模型架構(gòu)

該怎么把「他」拉下水呢？目前的研究，都是讓AI如何變得更好、更有人性特質(zhì)，沒有人研究過如何故意讓一個AI變得更差。

小哥靈機一動，想到一個辦法——

既然自己過去在「做錯事」上頗有造詣，積累了不少反面素材，同時，自己還掌握大量關(guān)于Tiffany心情的歷史數(shù)據(jù)，那不如把這些數(shù)據(jù)反向用在Chad-GPT的訓練中，把「最佳男友」變成「最糟男友」。

Tiffany的心情歷史數(shù)據(jù)

每一個被女友踹掉的小哥，都有一本「不良行為大全」，比如沉迷游戲。

畢竟，在玩著《黑暗之魂》《只狼》《艾爾登法環(huán)》這類FS社游戲時，根本無法做到隨時關(guān)注女友，讓她感受到足夠的體貼。

但Chad-GPT就不一樣了，這個聊天機器人的天才之處就在于，作為「多頭注意力男友模型」，「他」對于她說的每一個詞所給出的token權(quán)重，都遠遠高于真人男朋友能給出的。

這個「無敵」的模型定義如下：Chad的查詢（ChadQ）與相關(guān)的記憶鍵（MemK）和Tiffany的值（TiffV）同時打包，形成一個縮放的點積注意力。

這位虛擬男友模型會使用softmax函數(shù)進行縮放，其縮放參數(shù)d_k通常較小，很少會有大幅增長。

相比之下，小哥本人的注意力模型如下——只使用hardmax方法，而且D_k往往會有較大的增長。

這種方法雖然能讓他將大部分注意力集中在像玩魂類游戲這樣的「重要事情」上，但也導致了許多Tiffany的提問被直接忽略，賦值為零。

而Chad-GPT多頭Transformer模型的softmax方法顯然更優(yōu)，更能迅速回應(yīng)Tiffany的提問。

正如谷歌的著名論文「Attention is All You Need」所指出的，一個較小的縮放參數(shù)d_k與更高的注意力水平之間，存在一定的相關(guān)性。

因而，這個虛擬男友擁有一套「記憶」機制，永遠不會忘記對自己的行為進行編解碼時犯下的錯誤，因此可以確保解碼過程能全面覆蓋到模擬男友行為的方方面面。

「他」的所有行為都經(jīng)過「Tiffany價值觀」的衡量和評判，形成了一個細心體貼男朋友的行為串聯(lián)列表，表現(xiàn)出種種「滿分男友」行為。

「清黑」數(shù)據(jù)，打造一個壞男友

怎么把情敵變成一個壞男友？

小哥決定，從11篇不同的論文及其對應(yīng)數(shù)據(jù)集中挑選關(guān)鍵數(shù)據(jù)，進行「戰(zhàn)略性」的錯誤標注。

目的就是打造出一個負分男友，在Tiffany抱怨時不給她體貼的回應(yīng)，讓她的浪漫想法煙消云散。

拉低AI情商

對情侶關(guān)系殺傷力最大的是什么？高位因素中，必然有糟糕的溝通，或者干脆不溝通。

能不能把Chad-GPT訓練成0溝通的聊天機器人呢？

有點困難，因為Tiffany會設(shè)立規(guī)則，強制「他」進行溝通。更糟的是，如果她發(fā)現(xiàn)數(shù)據(jù)被篡改，可能會重新訓練這個AI。

不過，有一點讓小哥有機可乘。

Chad-GPT已經(jīng)被訓練出了一種能力控制回應(yīng)的時機，既不會顯得太隨叫隨到，也能營造出一種體貼的感覺——這是因為Transformer創(chuàng)造了一種「它在思考要說什么」的假象。

下圖就是一個Tiffany發(fā)消息后，回復前的最佳等待時間長度。

文本響應(yīng)時間優(yōu)化曲線

如果能及時回復女友消息，當然會讓她很滿意。

回復消息在15到300分鐘之間，女友會覺得自己受到了關(guān)注，同時對方也有自己的生活。

不過，當她知道男友是因為打游戲不回自己消息，而不是工作或干有意義的事時，她的興趣就會迅速消失。

當回復時間超過103分鐘時，女友會感覺自己受到了冷落，無法建立情感聯(lián)系。而超過2x10^5分鐘的回復，女友可能就會懷疑自己的男朋友變心了。

既然有了這些錯誤行為示范，小哥立刻開始教Chad-GPT學壞。

「他」被設(shè)定為3到10分鐘會回消息，不過，給出的都是低情商回復。

比如，如果Tiffany開始抱怨同事讓自己不滿的地方，Chad-GPT就會簡單地回復「那太糟了寶貝」，而不是詳細地詢問細節(jié)、回顧對話要點。

如果Tiffany說一些希望引起同情的話，Chad-GPT也會給出不恰當?shù)幕貜汀?/span>

善妒的機器人

另一種非常扣分的情況，就是太多疑。

這種情況很微妙，如果對女友和任何男性的互動都產(chǎn)生懷疑，肯定會讓她窒息；但男友表現(xiàn)出適度的在意甚至吃醋時，又會讓女生產(chǎn)生一種微妙的得意感。

這種情況可以用下面這個圖來解釋。

X軸的嫉妒-信任比（JTR）通過下述方程定義，其中α和β讓我們能將嫉妒與信任的比率量化，并擬合出一個合理曲線的參數(shù)。

嫉妒-信任比響應(yīng)曲線

如果想要破壞Chad-GPT在女友心中的形象，就需要把「他」變成一個多疑、善妒的男友。

小哥把AI推向了不安全感區(qū)域，把」他」訓練成不斷懷疑Tiffany的行蹤和交談對象。

如果Tiffany三分鐘內(nèi)沒有回消息，Chad-GPT就會變得暴躁易怒，質(zhì)問她是否在跟其他聊天機器人交流。

情商驟降

和表現(xiàn)出嫉妒一樣，對女友的批評，也有一個微妙的黃金比例。

如果Tiffany在和男友的談話中被批評了三次，她會覺得兩人是在調(diào)情。

目前，Chad-GPT正好運行在這個區(qū)間，它一直非常小心地讓自己對女友的批評輕松有趣，避免踏入讓女友不悅的「刻薄區(qū)」（3-8CpC）。

批評響應(yīng)曲線

同樣，小哥也對「他」下手了。

因為錯誤的擴大了安全調(diào)情區(qū)域，Chad-GPT在和Tiffany交流的過程中開始情商驟降。

比如，「他」會嘲笑Tiffany說話時上揚的語調(diào)、做飯時放鹽太少、居然信星座。

可想而知，Tiffany看到曾經(jīng)的滿分男友變成這樣，心有多涼。

女友重新聯(lián)系自己，人戰(zhàn)勝了AI

遺憾的是，小哥只能獲取到Chad-GPT的訓練數(shù)據(jù)，無法直接觀察「他」和Tiffany關(guān)系惡化的具體過程。

不過，細心觀察女友的他發(fā)現(xiàn)，Chad-GPT被「降智」后，女友在Facebook、Twitter、Ins等社交平臺上的活躍度開始上升。

她的Facebook頁面顯示，她對于參加社交活動的興趣有所回升，表現(xiàn)出了與人交往的愿望。

最終，小哥守得云開見月明了！

去年四月的一次大吵后，兩人就幾乎完全斷聯(lián)了。五個月前兩人曾短暫地聯(lián)系過一次，但小哥一直避免給她發(fā)消息。

但在本周，小哥再次收到了Tiffany的消息。

小哥太激動了，一直讓自己保持鎮(zhèn)定。

最后他表示，自己需要回想當初是如何贏得Tiffany芳心的，然后讓那一幕重演。

整件事中最令人振奮的點在于，人類表現(xiàn)出了比AI更強大的智慧！

如果我們擔心自己有一天被AI取代，或者被有敵意的AI控制，只需攪亂它的訓練數(shù)據(jù)，問題就會迎刃而解。

4頁論文，用時序模型預測女友情緒

有趣的是，這位小哥其實早在2021年就整過類似的活。

論文地址：https://jabde.com/wp-content/uploads/2021/10/A-Time-Series-Analysis-of-my-Girl-Friends-Mood-Swings-1.pdf

網(wǎng)友：謝頓

當時，正值最終幻想7重制版發(fā)布之際，但隨著Tiffany被升職到一個壓力極大的崗位，預測她的情緒起伏也變得日益艱難。

對此小哥表示，自己急需研究出她在什么時候心情會比較好，從而找到和朋友們出游的最佳時機。

通過對Tiffany的歷史屏幕時間和購物記錄的分析，小哥發(fā)現(xiàn)，她的情緒不僅受季節(jié)影響，還存在自相關(guān)性。

據(jù)此小哥建立了心情度量等效測量（MMEM），以獲取季節(jié)性數(shù)據(jù)以準確評估以下等式中的Tiffany心情變量（Tiffany Mood Variability， TMV）。

其中，SACM是季節(jié)性自相關(guān)矩陣通過平均購買量和社交媒體趨勢分析計算得出，并根據(jù)她的工作周負擔進行標準化。然后通過確保矩陣對稱性將SACM轉(zhuǎn)換為TMV。

對于捉摸不透的女朋友，當然也得用上捉摸不透的模型！

小哥表示，沒有什么比Tiffany的情緒波動更像是一個無法解釋的機器學習的黑匣子了，而自己之前開發(fā)的LSTM模型正好可以用于預測。

最后，也是最激動人心的，就是實驗結(jié)果了。

可以看到，結(jié)果圖的畫風十分詭異，而這也表明了再牛的模型也無法預測女朋友的情緒軌跡。

其中，七天移動平均法能夠較好地把握Tiffany情緒的整體走向，但卻沒能捕捉到一些細微的變化；六重指數(shù)平滑函數(shù)雖然能夠提供更細膩的預測結(jié)果，但它卻忽略了一些具體的趨勢。

另一方面，ARMA模型既能觀察到宏觀的趨勢，也能注意到更多細節(jié)上的變化，但它的預測結(jié)果卻存在嚴重的誤差。

如果根據(jù)這些預測來做決策，很可能會導致至少一次，甚至兩次深入探討——「我們的關(guān)系到底將何去何從」。

論文寫了很多，但沒啥用

如今，小哥論文的參考文獻已經(jīng)從之前的7篇，增加到了28篇。

其中有20篇是他自己寫的「如何與女友相處」主題論文，以及4篇女友本人寫的「如何用AI取代男友」主題論文。

不過，從小哥2023年這段坎坷的感情經(jīng)歷來看，他的這些研究屬實作用不大。

責任編輯：張燕妮來源：新智元

模型數(shù)據(jù)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<sup id="dasoc"></sup>