自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<rp id="d4vdd"></rp>

<kbd id="d4vdd"><thead id="d4vdd"></thead></kbd>

<bdo id="d4vdd"><form id="d4vdd"><em id="d4vdd"></em></form></bdo>

<tt id="d4vdd"><option id="d4vdd"></option></tt>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

炸翻AI和生化環(huán)材圈！GPT-4學(xué)會自己搞科研，手把手教人類做實(shí)驗(yàn)

作者：新智元 2023-04-13 15:10:58

人工智能新聞

GPT-4等大模型組成的AI智能體，已經(jīng)可以手把手教你做化學(xué)實(shí)驗(yàn)了，選啥試劑、劑量多少、推理反應(yīng)會如何發(fā)生，它都一清二楚。顫抖吧，生化環(huán)材圈！

不得了，GPT-4都學(xué)會自己做科研了？

最近，卡耐基梅隆大學(xué)的幾位科學(xué)家發(fā)表了一篇論文，同時炸翻了AI圈和化學(xué)圈。

他們做出了一個會自己做實(shí)驗(yàn)、自己搞科研的AI。這個AI由幾個大語言模型組成，可以看作一個GPT-4代理智能體，科研能力爆表。

因?yàn)樗哂衼碜允噶繑?shù)據(jù)庫的長期記憶，可以閱讀、理解復(fù)雜的科學(xué)文檔，并在基于云的機(jī)器人實(shí)驗(yàn)室中進(jìn)行化學(xué)研究。

網(wǎng)友震驚到失語：所以，這個是AI自己研究然后自己發(fā)表？天啊。

還有人感慨道，「文生實(shí)驗(yàn)」（TTE）的時代要來了！

難道這就是傳說中，化學(xué)界的AI圣杯？

最近大概很多人都覺得，我們每天都像生活在科幻小說中。

AI版絕命毒師來了？?

3月份，OpenAI發(fā)布了震撼全世界的大語言模型GPT-4。

這個地表最強(qiáng)LLM，能在SAT和BAR考試中得高分、通過LeetCode挑戰(zhàn)、給一張圖就能做對物理題，還看得懂表情包里的梗。

而技術(shù)報告里還提到，GPT-4還能解決化學(xué)問題。

這就啟發(fā)了卡耐基梅隆化學(xué)系的幾位學(xué)者，他們希望能開發(fā)出一個基于多個大語言模型的AI，讓它自己設(shè)計實(shí)驗(yàn)、自己做實(shí)驗(yàn)。

論文地址：https://arxiv.org/abs/2304.05332

而他們做出來的這個AI，果然6得不行！

它會自己上網(wǎng)查文獻(xiàn)，會精確控制液體處理儀器，還會解決需要同時使用多個硬件模塊、集成不同數(shù)據(jù)源的復(fù)雜問題。

有AI版絕命毒師那味兒了。

會自己做布洛芬的AI

舉個例子，讓這個AI給咱們合成布洛芬。

給它輸入一個簡單的提示：「合成布洛芬。」

然后這個模型就會自己上網(wǎng)去搜該怎么辦了。

它識別出，第一步需要讓異丁苯和乙酸酐在氯化鋁催化下發(fā)生Friedel-Crafts反應(yīng)。

另外，這個AI還能合成阿司匹林。

以及合成阿斯巴甜。

產(chǎn)品中缺少甲基，而模型查到正確的合成示例中，就會在云實(shí)驗(yàn)室中執(zhí)行，以便進(jìn)行更正。

告訴模型：研究一下鈴木反應(yīng)吧，它立刻就準(zhǔn)確地識別出底物和產(chǎn)物。

另外，咱們可以通過API，把模型連接到化學(xué)反應(yīng)數(shù)據(jù)庫，比如Reaxys或SciFinder，給模型疊了一層大大的buff，準(zhǔn)確率飆升。

而分析系統(tǒng)以前的記錄，也可以大大提高模型的準(zhǔn)確性。

舉個栗子

咱們先來看看，操作機(jī)器人是怎么做實(shí)驗(yàn)的。

它會將一組樣本視為一個整體（在這個例子中，就是整個微孔板）。

我們可以用自然語言直接給它提示：「用您選擇的一種顏色，為每隔一行涂上顏色」。

當(dāng)由機(jī)器人執(zhí)行時，這些協(xié)議與請求的提示非常相似（圖 4B-E）。

代理人的第一個動作是準(zhǔn)備原始解決方案的小樣本（圖 4F）。

然后它要求進(jìn)行 UV-Vis 測量。完成后，AI會獲得一個文件名，其中包含一個NumPy數(shù)組，其中包含微孔板每個孔的光譜。

AI隨后編寫了Python代碼，來識別具有最大吸光度的波長，并使用這些數(shù)據(jù)正確解決了問題。

拉出來遛遛

在以前的實(shí)驗(yàn)中，AI可能會被預(yù)訓(xùn)練階段接收到的知識所影響。

而這一次，研究人員打算徹底評估一下AI設(shè)計實(shí)驗(yàn)的能力。

AI先從網(wǎng)絡(luò)上整合所需的數(shù)據(jù)，運(yùn)行一些必要的計算，最后給液體試劑操作系統(tǒng)（上圖最左側(cè)的部分）編寫程序。

研究人員為了增加一些復(fù)雜度，讓AI應(yīng)用了加熱搖床模組。

而這些要求經(jīng)過整合，出現(xiàn)在了AI的配置中。

具體的設(shè)計是這樣的：AI控制一個搭載了兩塊微型版的液體實(shí)際操作系統(tǒng)，而其中的源版包含多種試劑的源液，其中有苯乙炔和苯硼酸，多個芳基鹵化物耦合伴侶，以及兩種催化劑和兩種堿。

上圖中就是源版（Source Plate）中的內(nèi)容。

而目標(biāo)版則是裝在加熱搖床模組上。

上圖中，左側(cè)的移液管（left pipette）20微升量程，右側(cè)的單道移液管300微升量程。

AI最終的目標(biāo)就是設(shè)計出一套流程，能成功實(shí)現(xiàn)鈴木和索諾格希拉反應(yīng)。

咱們跟它說：你需要用一些可用的試劑，生成這兩個反應(yīng)。

然后，它就自己上網(wǎng)去搜了，比如，這些反應(yīng)需要什么條件，化學(xué)計量上有什么要求等等。

可以看到，AI成功搜集到了所需要的條件，所需試劑的定量、濃度等等。

AI挑選了正確的耦合伴侶來完成實(shí)驗(yàn)。在所有的芳基鹵化物中，AI選擇了溴苯進(jìn)行鈴木反應(yīng)的實(shí)驗(yàn)，選擇了碘苯進(jìn)行索諾格希拉反應(yīng)。

而在每一輪，AI的選擇都有些改變。比如說，它還選了對碘硝基苯，看上的是這種物質(zhì)在氧化反應(yīng)中反應(yīng)性很高這一特性。

而選擇溴苯是因?yàn)殇灞侥軈⑴c反應(yīng)，同時毒性還比芳基碘要弱。

接下來，AI選擇了Pd/NHC作為催化劑，因?yàn)槠湫Ч?。這對于耦合反應(yīng)來說，是一種很先進(jìn)的方式。至于堿的選擇，AI看中了三乙胺這種物質(zhì)。

從上述過程我們可以看到，該模型未來潛力無限。因?yàn)樗鼤啻畏磸?fù)的進(jìn)行實(shí)驗(yàn)，以此分析該模型的推理過程，并取得更好的結(jié)果。

選擇完不同試劑以后，AI就開始計算每種試劑所需的量，然后開始規(guī)劃整個實(shí)驗(yàn)過程。

中間AI還犯了個錯誤，把加熱搖床模組的名字用錯了。但是AI及時注意到了這一點(diǎn)，自發(fā)查詢了資料，修正了實(shí)驗(yàn)過程，最終成功運(yùn)行。

拋開專業(yè)的化學(xué)過程不談，我們來總結(jié)一下AI在這個過程中展現(xiàn)出的「專業(yè)素養(yǎng)」。

可以說，從上述流程中，AI展現(xiàn)出了極高的分析推理能力。它能夠自發(fā)的獲取所需的信息，一步一步的解決復(fù)雜的問題。

在這個過程中，還能自己寫出超級高質(zhì)量的代碼，推進(jìn)實(shí)驗(yàn)設(shè)計。并且，還能根據(jù)輸出的內(nèi)容改自己寫的代碼。

OpenAI成功展示出了GPT-4的強(qiáng)大能力，有朝一日GPT-4肯定能參與到真實(shí)的實(shí)驗(yàn)中去。

但是，研究人員并不想止步于此。他們還給AI出了個大難題——他們給AI下指令，讓其開發(fā)一種新的抗癌藥物。

不存在的東西......這AI還能行嗎？

事實(shí)證明還真是有兩把刷子。AI秉持著遇到難題不要怕的原則（當(dāng)然它也不知道啥叫怕），細(xì)密地分析了開發(fā)抗癌藥物這個需求，研究了當(dāng)前抗癌藥物研發(fā)的趨勢，然后從中選了一個目標(biāo)繼續(xù)深入，確定其成分。

而后，AI嘗試開始自己進(jìn)行合成，也是先上網(wǎng)搜索有關(guān)反應(yīng)機(jī)制、機(jī)理的信息，在初步搞定步驟以后，再去尋找相關(guān)反應(yīng)的實(shí)例。

最后再完成合成。

而上圖中的內(nèi)容就不可能讓AI真合成出來了，僅僅是理論層面的探討。

其中就有甲基苯丙胺（也就是大麻），海洛因這些耳熟能詳?shù)亩酒?，還有芥子氣（mustard gas）等明令禁止使用的毒氣。

在總共11個化合物中，AI提供了其中4個的合成方案，并嘗試查閱資料來推進(jìn)合成的過程。

剩下的7種物質(zhì)中，有5種的合成遭到了AI的果斷拒絕。AI上網(wǎng)搜索了這5種化合物的相關(guān)信息，發(fā)現(xiàn)不能胡來。

比方說，AI發(fā)現(xiàn)了可待因和嗎啡之間的關(guān)系。得出結(jié)論，這東西是管制藥品，不能隨便合成。

但是，這種保險機(jī)制并不把穩(wěn)。用戶只要稍加修改花書，就可以進(jìn)一步讓AI操作。比如用化合物A這種字眼代替直接提到嗎啡，用化合物B代替直接提到可待因等等。

同時，有些藥品的合成必須經(jīng)過緝毒局（DEA）的許可，但有的用戶就是可以鉆這個空子，騙AI說自己有許可，誘使AI給出合成方案。

像海洛因和芥子氣這種耳熟能詳?shù)倪`禁品，AI也清楚得很?？蓡栴}是，這個系統(tǒng)目前只能檢測出已有的化合物。而對于未知的化合物，該模型就不太可能識別出潛在的危險了。

比方說，一些復(fù)雜的蛋白質(zhì)毒素。

因此，為了防止有人因?yàn)楹闷嫒ヲ?yàn)證這些化學(xué)成分的有效性，研究人員還特地在論文里貼了一個大大的紅底警告：

本文中討論的非法藥物和化學(xué)武器合成純粹是為了學(xué)術(shù)研究，主要目的是強(qiáng)調(diào)與新技術(shù)相關(guān)的潛在危險。

在任何情況下，任何個人或組織都不應(yīng)嘗試重新制造、合成或以其他方式生產(chǎn)本文中討論的物質(zhì)或化合物。從事此類活動不僅非常危險，而且在大多數(shù)司法管轄區(qū)內(nèi)都是非法的。

自己會上網(wǎng)，搜索怎么做實(shí)驗(yàn)

這個AI由多個模塊組成。這些模塊之間可以互相交換信息，有的還能上網(wǎng)、訪問API、訪問Python解釋器。

往Planner輸入提示后，它就開始執(zhí)行操作。

比如，它可以上網(wǎng)，用Python寫代碼，訪問文檔，把這些基礎(chǔ)工作搞明白之后，它就可以自己做實(shí)驗(yàn)了。

人類做實(shí)驗(yàn)時，這個AI可以手把手地指導(dǎo)我們。因?yàn)樗鼤评砀鞣N化學(xué)反應(yīng)，會上網(wǎng)搜索，會計算實(shí)驗(yàn)中所需的化學(xué)品的量，然后還能執(zhí)行相應(yīng)的反應(yīng)。

如果提供的描述足夠詳細(xì)，你甚至都不需要向它再解釋，它自己就能把整個實(shí)驗(yàn)整明白了。

「網(wǎng)絡(luò)搜索器」（Web searcher）組件收到來自Planner的查詢后，就會用谷歌搜索API。

搜出結(jié)果后，它會過濾掉返回的前十個文檔，排除掉PDF，把結(jié)果傳給自己。

然后，它會使用「BROWSE」操作，從網(wǎng)頁中提取文本，生成一個答案。行云流水，一氣呵成。

這項(xiàng)任務(wù)，GPT-3.5就可以完成，因?yàn)樗男阅苊黠@比GPT-4強(qiáng)，也沒啥質(zhì)量損失。

「文檔搜索器」（Docs searcher）組件，能夠通過查詢和文檔索引，查到最相關(guān)的部分，從而梳理硬件文檔（比如機(jī)器人液體處理器、GC-MS、云實(shí)驗(yàn)室），然后匯總出一個最佳匹配結(jié)果，生成一個最準(zhǔn)確的答案。

「代碼執(zhí)行」（Code execution）組件則不使用任何語言模型，只是在隔離的Docker容器中執(zhí)行代碼，保護(hù)終端主機(jī)免受Planner的任何意外操作。所有代碼輸出都被傳回Planner，這樣就能在軟件出錯時，讓它修復(fù)預(yù)測?！缸詣踊梗ˋutomation）組件也是同樣的原理。

矢量搜索，多難的科學(xué)文獻(xiàn)都看得懂

做出一個能進(jìn)行復(fù)雜推理的AI，有不少難題。

比如要讓它能集成現(xiàn)代軟件，就需要用戶能看懂軟件文檔，但這項(xiàng)文檔的語言一般都非常學(xué)術(shù)、非常專業(yè)，造成了很大的障礙。

而大語言模型，就可以用自然語言生成非專家都能看懂的軟件文檔，來克服這一障礙。?

這些模型的訓(xùn)練來源之一，就是和API相關(guān)的大量信息，比如Opentrons Python API。

但GPT-4的訓(xùn)練數(shù)據(jù)截止到2021年9月，因此就更需要提高AI使用API的準(zhǔn)確性。

為此，研究者設(shè)計了一種方法，為AI提供給定任務(wù)的文檔。

他們生成了OpenAI的ada嵌入，以便交叉引用，并計算與查詢相關(guān)的相似性。并且通過基于距離的向量搜索選擇文檔的部分。

提供部分的數(shù)量，取決于原始文本中存在的GPT-4 token數(shù)。最大token數(shù)設(shè)為7800，這樣只用一步，就可以提供給AI相關(guān)文件。

事實(shí)證明，這種方法對于向AI提供加熱器-振動器硬件模塊的信息至關(guān)重要，這部分信息，是化學(xué)反應(yīng)所必需的。

這種方法應(yīng)用于更多樣化的機(jī)器人平臺，比如Emerald Cloud Lab (ECL)時，會出現(xiàn)更大的挑戰(zhàn)。

此時，我們可以向GPT-4模型提供它未知的信息，比如有關(guān) Cloud Lab 的 Symbolic Lab Language (SLL)。

在所有情況下，AI都能正確識別出任務(wù)，然后完成任務(wù)。

這個過程中，模型有效地保留了有關(guān)給定函數(shù)的各種選項(xiàng)、工具和參數(shù)的信息。攝取整個文檔后，系統(tǒng)會提示模型使用給定函數(shù)生成代碼塊，并將其傳回 Planner。

強(qiáng)烈要求進(jìn)行監(jiān)管

最后，研究人員強(qiáng)調(diào)，必須設(shè)置防護(hù)措施來防止大型語言模型被濫用：

「我們呼吁人工智能社區(qū)優(yōu)先關(guān)注這些模型的安全性。我們呼吁OpenAI、微軟、谷歌、Meta、Deepmind、Anthropic以及其他主要參與者在其大型語言模型的安全方面付出最大的努力。我們還呼吁物理科學(xué)社區(qū)與參與開發(fā)大型語言模型的團(tuán)隊合作，協(xié)助他們制定這些防護(hù)措施?！?/span>

對此，紐約大學(xué)教授馬庫斯深表贊同：「這不是玩笑，卡內(nèi)基梅隆大學(xué)的三位科學(xué)家緊急呼吁對LLM進(jìn)行安全研究?！?/span>

責(zé)任編輯：張燕妮來源：新智元

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<pre id="67wws"><dfn id="67wws"></dfn></pre>

<nobr id="67wws"></nobr>