自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<p id="sazi0"></p>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

搞科研新姿勢：讓GPT-3給你打下手

作者：量子位 2023-03-09 08:15:56

那么小哥他們?yōu)槭裁赐话l(fā)奇想地要用這種方式搞科研呢？這是因?yàn)樗麄儼l(fā)現(xiàn)，對(duì)大型語料庫做深入的挖掘確實(shí)能得到一些有用的結(jié)果，但這個(gè)過程要是讓人類來搞，那簡直就太費(fèi)時(shí)費(fèi)力了。

本文經(jīng)AI新媒體量子位（公眾號(hào) ID: QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請(qǐng)聯(lián)系出處

搞科研的最新姿勢，被一位華人小哥解鎖了——

告訴AI你的研究目標(biāo)，再把數(shù)據(jù)集“投喂”進(jìn)去，完事。

這就是來自伯克利的博士生Zhong Ruiqi等人的最新研究，把從海量數(shù)據(jù)集中繁瑣的“取證”過程，統(tǒng)統(tǒng)交給GPT-3來解決：

他們還發(fā)現(xiàn)，這種用AI搞科研的方法不僅效率高，而且還能得出人類沒有想到的“意外驚喜”。

讓GPT-3幫你搞科研

那么小哥他們?yōu)槭裁赐话l(fā)奇想地要用這種方式搞科研呢？

這是因?yàn)樗麄儼l(fā)現(xiàn)，對(duì)大型語料庫做深入的挖掘確實(shí)能得到一些有用的結(jié)果，但這個(gè)過程要是讓人類來搞，那簡直就太費(fèi)時(shí)費(fèi)力了。

因此，他們便決定把這個(gè)繁瑣的過程交給GPT-3來處理，并把這個(gè)任務(wù)命名為“D5”：

Goal Driven Discovery of Distributional Differences via Language Descriptions.

通過語言描述，實(shí)現(xiàn)目標(biāo)驅(qū)動(dòng)的分布式差異的發(fā)現(xiàn)。

“D5”任務(wù)的過程，簡單來說就是兩個(gè)動(dòng)作：

輸入研究目標(biāo)
輸入兩個(gè)語料庫

例如在上面這個(gè)案例中，小哥先是給AI輸進(jìn)去了兩個(gè)語料庫：

語料庫A：服用藥物A后患者的反應(yīng)報(bào)告
語料庫B：服用藥物B后患者的反應(yīng)報(bào)告

然后再向AI確定自己的研究目標(biāo)，即“我想了解一下藥物A的副作用”。

在AI收到任務(wù)后，立刻開始執(zhí)行分析工作，最后得出了它的結(jié)論：

語料庫A中的樣本，有更多的患者會(huì)提到“妄想癥”（paranoia）。

不過試想一下，若讓人類科研人員做這項(xiàng)工作，光是了解語料庫A和B就需要花費(fèi)大量的時(shí)間，更別提還得進(jìn)一步做對(duì)比分析等工作了。

而D5任務(wù)之所以能夠做得如此絲滑，是因?yàn)樾「缢麄冊(cè)诖吮澈筮€做了不少工作。

例如構(gòu)建OpenD5元數(shù)據(jù)集，它包含符合D5任務(wù)的675個(gè)開放式問題，所涉及領(lǐng)域涵蓋商業(yè)、社會(huì)科學(xué)、人文科學(xué)、健康和機(jī)器學(xué)習(xí)等。

并且每個(gè)開放式問題都會(huì)對(duì)應(yīng)一個(gè)語料庫對(duì)兒（語料庫A和語料庫B），平均有17000個(gè)樣本。

小哥還把每個(gè)語料庫中的50%作為研究部分，另外50%則是拿來做驗(yàn)證。

基于此，小哥他們?cè)贅?gòu)建了一個(gè)“D5系統(tǒng)”，它的工作原理和人類從數(shù)據(jù)庫中獲取發(fā)現(xiàn)類似，分為兩個(gè)階段，即創(chuàng)造性地提出一個(gè)假設(shè)，再在數(shù)據(jù)集上嚴(yán)格驗(yàn)證這個(gè)假設(shè)。

按照這種思路，研究人員接下來用GPT-3做了次實(shí)驗(yàn)。

他們先是向GPT3展示研究目標(biāo)和每個(gè)語料庫中的一些樣本，然后讓它提出一個(gè)假設(shè)列表。

最終實(shí)驗(yàn)發(fā)現(xiàn)，GPT-3可以使用目標(biāo)描述來提出更相關(guān)、更新穎、更有意義的假設(shè)。

也正因?yàn)镺penD5數(shù)據(jù)集所涵蓋的領(lǐng)域眾多，因此小哥表示他們的D5系統(tǒng)具備應(yīng)用范圍廣的特點(diǎn)。

也存在一些缺陷

但對(duì)于這套D5系統(tǒng)，小哥也直言不諱地道出了它的缺陷。

例如，若是語料庫中含有較多的俚語、俗語或者帶有情緒的詞匯，那么AI所給出的“發(fā)現(xiàn)”就會(huì)存在偏差。

簡而言之，就是AI對(duì)于特定情況的詞匯或描述產(chǎn)生了錯(cuò)誤的理解和分析。

除此之外，小哥也表示更靈活的語料庫、更具擴(kuò)展性的系統(tǒng)，也是他們?cè)谖磥碇攸c(diǎn)研究的方向。

不過似乎這項(xiàng)研究讓小哥也是興奮不已，畢竟離他“構(gòu)建一個(gè)用AI稿科研”的夢想更近了一步。

參考鏈接：

[1] ??https://arxiv.org/abs/2302.14233???
[2] ???https://twitter.com/ZhongRuiqi/status/1631109680859865089?s=20??

責(zé)任編輯：武曉燕來源：量子位

GPT-3 系統(tǒng)數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營