多活十年!OpenAI為研究長(zhǎng)壽推出GPT-4b,聯(lián)手清華大牛丁勝搞“細(xì)胞重編程”,奧特曼本人投資
OpenAI要研究人類長(zhǎng)壽問(wèn)題了??推出新模型GPT-4b micro。
可以設(shè)計(jì)出將普通細(xì)胞轉(zhuǎn)化為干細(xì)胞的蛋白質(zhì)。
據(jù)MIT科技評(píng)論消息,這是OpenAI首個(gè)專注于生物數(shù)據(jù)的大模型,也是OpenAI首次公開(kāi)聲稱其模型可以帶來(lái)意想不到的科學(xué)發(fā)現(xiàn)。
研究合作方Retro Biosciences,一家成立于2022年的創(chuàng)業(yè)公司,專注于“抵抗細(xì)胞衰老的新藥開(kāi)發(fā)”,包括細(xì)胞重編程、自噬和受血漿啟發(fā)的療法。
聯(lián)合創(chuàng)始人丁勝,為清華藥學(xué)院創(chuàng)始院長(zhǎng)(于2022年6月卸任院長(zhǎng),仍繼續(xù)在藥學(xué)院任教并從事研究工作)。
丁勝教授團(tuán)隊(duì)首次以化學(xué)小分子組合體外定向誘導(dǎo)小鼠全能干細(xì)胞并穩(wěn)定培養(yǎng),成果在2022年登上Nature。
另一位聯(lián)合創(chuàng)始人Joe Betts-LaCroix,在加州理工期間首次闡明了蛋白質(zhì)中電子隧道速率的控制因素,成果登上Science,Joe還在YC擔(dān)任過(guò)2.5年的兼職合伙人(伏筆),指導(dǎo)和投資了眾多生物初創(chuàng)公司。
2022年4月,Retro Biosciences對(duì)外披露已獲得1.8億美元融資,但對(duì)投資人身份守口如瓶。
直到ChatGPT推出之后,2023年3月世界才知道,這位神秘投資人正是OpenAI CEO奧特曼本曼。
Retro Bioscience也開(kāi)始被稱為“抗衰界的OpenAI”。
要為人類延壽10年
Retro的目標(biāo)是將人類的正常壽命延長(zhǎng)10年。
Retro與OpenAI正式合作開(kāi)始于一年前,他們研究的重點(diǎn)是山中因子(Yamanaka factors),由諾獎(jiǎng)得主山中伸彌在2006年提出。
山中因子是一組蛋白質(zhì),可以將人類皮膚細(xì)胞轉(zhuǎn)化為看起來(lái)更年輕的干細(xì)胞。不過(guò),這種細(xì)胞“重編程”效率并不高,需要數(shù)周時(shí)間,且經(jīng)實(shí)驗(yàn)室培養(yǎng)皿處理的細(xì)胞中不到1%能完成再生。
為此,OpenAI開(kāi)發(fā)了名為GPT-4b micro的新模型,用于提出改進(jìn)蛋白質(zhì)因子功能的方法。
OpenAI用大量物種的蛋白質(zhì)序列實(shí)例以及蛋白質(zhì)相互作用相關(guān)信息訓(xùn)練了GPT-4b micro。
其工作方式與谷歌的AlphaFold大不相同,AlphaFold用于預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),山中因子則是一類異常松散且無(wú)固定結(jié)構(gòu)的蛋白質(zhì)。
Retro的科學(xué)家嘗試引導(dǎo)模型生成可能的山中蛋白質(zhì)重新設(shè)計(jì)方案,使用的是類似于“few-shot”的提示,即用一系列帶有答案的示例作為上下文提示,隨后添加一個(gè)需要模型生成答案的新示例。
盡管基因工程師可以在實(shí)驗(yàn)室中通過(guò)一定的方法引導(dǎo)分子進(jìn)化,但受限于實(shí)驗(yàn)條件,他們通常只能測(cè)試有限的可能性,但對(duì)于典型長(zhǎng)度的蛋白質(zhì)來(lái)說(shuō),其改造方式幾乎是無(wú)限的。
OpenAI的模型卻能經(jīng)常生成含顯著改動(dòng)的設(shè)計(jì)建議,其中三分之一的蛋白質(zhì)氨基酸被改變。
Retro CEO Joe Betts-Lacroix指出,該模型提出的建議很好:
我們立即將這個(gè)模型應(yīng)用到了實(shí)驗(yàn)室,并得到了實(shí)際的成果。
OpenAI也介紹道,研究人員根據(jù)模型的建議對(duì)兩個(gè)山中因子進(jìn)行了改造,根據(jù)初步測(cè)量結(jié)果,其效果提升了50倍以上。
OpenAI研究員John Hallman、Aaron Jaech和Retro的Rico Meinl是該模型的開(kāi)發(fā)負(fù)責(zé)人。
John Hallman表示:
從整體來(lái)看,這些蛋白質(zhì)的性能似乎比科學(xué)家自己設(shè)計(jì)的要好得多。
不過(guò),在研究結(jié)果發(fā)表之前,外界科學(xué)家無(wú)法驗(yàn)證這些結(jié)果的真實(shí)性。并且該模型目前也未對(duì)外開(kāi)放使用,目前只有一個(gè)定制化的展示案例。GPT-4b micro是如何得出這些猜測(cè)的,也仍然不清楚。
關(guān)于模型的未來(lái)走向,Aaron Jaech表示是否單獨(dú)發(fā)布或整合到OpenAI主流推理模型中,尚未確定。
值得一提的是,OpenAI還特別強(qiáng)調(diào),Altman并未直接參與這項(xiàng)工作,且公司從未根據(jù)Altman的其他投資作出決策。