麻省理工團(tuán)隊用活細(xì)胞構(gòu)建微型計算機(jī),即時讀取和寫入
這是一個生物學(xué)和計算機(jī)科學(xué)結(jié)合的典范,麻省理工學(xué)院的科學(xué)家利用基因編輯技術(shù)將細(xì)胞變?yōu)槲⑿陀嬎銠C(jī),可實現(xiàn)讀取、寫入和執(zhí)行的功能。
DNA 計算機(jī)在 1990 年代就出現(xiàn)了,與電子計算機(jī)用“0”和“1”來儲存信息不同,DNA 計算機(jī)將信息儲存在構(gòu)成 DNA 分子的A、C、G、T中。只是這些 DNA 信息在活細(xì)胞中不容易改變,因而計算緩慢。于是麻省理工學(xué)院的科學(xué)家希望加速這一過程,發(fā)明了一種稱作DOMINO的技術(shù),該技術(shù)全稱是基于 DNA 的有序存儲器和迭代網(wǎng)絡(luò)運(yùn)行者。它建立在 CRISPR 基因編輯技術(shù)基礎(chǔ)上,旨在響應(yīng)小分子或光照等生物信號。
8 月 22 日,這篇文章以《活細(xì)胞中單核苷酸分辨率的計算和儲存》為題發(fā)表在《分子細(xì)胞》期刊(Molecular Cell)。通訊作者是來自麻省理工學(xué)院的施密特科學(xué)博士后研究員 Fahim Farzadfard 與電氣工程與計算機(jī)科學(xué)系、生物工程系副教授盧冠達(dá)(Timothy K. Lu)。
這是 Fahim Farzadfard 做的藝術(shù)圖。他們開發(fā)的 DOMINO 是一種記錄生物信息并在活細(xì)胞中進(jìn)行邏輯和計算的技術(shù),該技術(shù)通過 DNA 寫入事件的級聯(lián)(類似于多米諾骨牌),為活細(xì)胞中的信息傳播、計算和存儲提供了強(qiáng)大且可擴(kuò)展的方法。來源:Fahim Farzadfard
利用堿基突變實現(xiàn)單核苷酸分辨率,無需破壞細(xì)胞
因其普遍存在的持久性和生物功能兼容性,DNA 成為人工生物信息儲存的理想介質(zhì),特別是隨著 DNA 測序效率的提升以及成本下降,其信息儲存優(yōu)勢日漸明顯。
如今基因組編輯技術(shù)讓人們能更便捷改變遺傳信息。DNA 編輯器可以對活細(xì)胞內(nèi)所含 DNA 進(jìn)行插入、刪除、倒位或堿基替換突變等形式,并可用于區(qū)分不同 DNA 記憶狀態(tài)。短暫的細(xì)胞事件,例如蛋白質(zhì)-蛋白質(zhì)相互作用,可以作為轉(zhuǎn)錄輸出被 DNA 信息儲存。
此前的活細(xì)胞 DNA 技術(shù)只能讀取或?qū)懭?,也就是說,在一兩個分子事件后該細(xì)胞就停止了數(shù)據(jù)儲存,其編碼容量和可擴(kuò)展性受到限制,不能用來連續(xù)監(jiān)控動態(tài)信號或長時間歷史信號,并且缺乏便捷的讀寫和監(jiān)控操作模式。
因此,人們需要一種高效且穩(wěn)健的分子記錄和 DNA 記憶平臺,像硬盤一樣能夠進(jìn)行信息存儲和計算,F(xiàn)ahim Farzadfard 等人構(gòu)建的活細(xì)胞 DNA 分子記錄儀則能夠編碼更多信息。
這是一種非破壞性的 DNA 報告基因回路,可以響應(yīng)細(xì)胞內(nèi)的指導(dǎo) RNA(gRNA)突變儲存狀態(tài),最后以不同水平輸出。因此系統(tǒng)讀取只需要測定回路狀態(tài),而無需破壞細(xì)胞和 DNA 測序讀數(shù)。
DOMINO 存儲器架構(gòu)的示意圖。來源:Molecular Cell
為了達(dá)到更高的精確度,研究人員將一種 Cas9 與最近開發(fā)的堿基編輯酶融合,該酶可以將核苷酸胞嘧啶轉(zhuǎn)化為胸腺嘧啶而不破壞雙鏈 DNA。具體而言,研究人員利用基因編輯技術(shù)構(gòu)建了一個單核苷酸分辨率的讀寫頭,這個讀寫頭由與胞苷脫氨酶融合的 Cas9 切口酶與尿嘧啶 DNA 糖基化酶抑制劑組成。Cas9 切口酶用來讀取,由 gRNA 指向特定的 DNA 靶標(biāo)并將其切割,胞苷脫氨酶用來寫入,而尿嘧啶 DNA 糖基化酶抑制劑則可以通過阻斷細(xì)胞修復(fù)機(jī)制提高寫入效率。
一旦 12 堿基對的 gRNA 序列定位到靶標(biāo),編輯器模塊可以讓靶標(biāo)序列5’末端(5’末端表示 DNA 復(fù)制或轉(zhuǎn)錄的方向)附近的脫氧胞苷脫氨基,之后引入胞嘧啶-胸腺嘧啶突變,從而在 DNA 中產(chǎn)生永久記錄。也就是說,只有細(xì)胞中存在特定 DNA 序列時,胞嘧啶轉(zhuǎn)換為胸腺嘧啶才會發(fā)生,那么通過測量這種突變即可得到細(xì)胞遇到的信號。
讀寫頭在誘導(dǎo)型啟動子控制下,可以通過內(nèi)部或外部輸入控制該系統(tǒng)中的 DNA 寫入。這里讀寫頭的表達(dá)可看作是操作信號,而控制 gRNA 表達(dá)的信號則是獨立可控的輸入。
研究人員還可以通過設(shè)計 DOMINO 系統(tǒng)來實現(xiàn)每套輸入得到一個獨特的識別標(biāo)志,那么從這個識別標(biāo)志也能推測出原來的系統(tǒng)輸入是什么。依據(jù)研究人員的設(shè)計,最終的輸出結(jié)果會激活綠色熒光蛋白表達(dá),那么通過測量綠色熒光的表達(dá)水平,即可得知細(xì)胞內(nèi)發(fā)生了多少突變,這就避免了測序破壞細(xì)胞。
通過這樣的操作,DOMINO 系統(tǒng)實現(xiàn)了超越 DNA 只能讀寫而輸出只能破壞細(xì)胞來測序讀取的做法,并且實現(xiàn)長期持續(xù)記錄和監(jiān)測。
這是 Fahim Farzadfard 做的藝術(shù)圖。DOMINO 可以實現(xiàn)活細(xì)胞中 DNA 計算的各種邏輯。來源:Fahim Farzadfard
此外,DOMINO 系統(tǒng)還能夠通過分層多個 DOMINO 運(yùn)算符來構(gòu)建各種形式的邏輯。具體而言,DNA 事件寫入邏輯可以與順序無關(guān),可以與順序有關(guān),也可與時間有關(guān)。還可與基于 CRISPR 的基因調(diào)控策略結(jié)合,比如 CRISPR 干擾(CRISPRi)和 CRISPR 激活(CRISPRa),實現(xiàn)模塊化和通用的儲存以及基因調(diào)控功能。
存儲器的進(jìn)化
數(shù)年前,盧冠達(dá)實驗室開發(fā)了一種基于稱為 DNA 重組酶的記憶存儲系統(tǒng)。當(dāng)特定事件發(fā)生時,它可以翻轉(zhuǎn) DNA 片段。然而,這種方法在規(guī)模上是有限的:它只能記錄一個或兩個事件,因為必須翻轉(zhuǎn)的 DNA 序列非常大,并且每個都需要不同的重組酶。
之后,盧冠達(dá)和 Farzadfard 開發(fā)了一種更具針對性的方法。他們將新 DNA 序列插入基因組中的預(yù)定位置,但這種方法僅適用于細(xì)菌細(xì)胞。2016 年,他們開發(fā)了一種基于 CRISPR 的記憶存儲系統(tǒng),但它依賴于細(xì)胞自身的 DNA 修復(fù)機(jī)制,以便在 Cas9 切割 DNA 后產(chǎn)生突變。這意味著突變結(jié)果并不總是可預(yù)測的,因此限制了可以存儲的信息量。
如今,他們的 DOMINO 系統(tǒng)使用的是 CRISPR-Cas9 酶的變體,它可以產(chǎn)生更明確的突變,因為它可以直接修改和存儲 DNA 堿基中的信息,而不是切割 DNA 并等待細(xì)胞修復(fù)損傷。研究人員證明,這個系統(tǒng)可以在人體和細(xì)菌細(xì)胞中正常工作。
這個系統(tǒng)與其他使用多種蛋白質(zhì)的精確 DNA 讀寫系統(tǒng)不同,DOMINO 僅僅使用短小的 gRNA 和少量蛋白質(zhì),這會減少細(xì)胞的代謝負(fù)擔(dān)。
通過讀寫頭,DOMINO 將基因組 DNA 轉(zhuǎn)換為可尋址、可讀和寫入的介質(zhì),可以在活細(xì)胞中加工和存儲信息。僅僅通過改變 gRNA 序列即可構(gòu)建各種 DOMINO 操縱子,這樣該系統(tǒng)的應(yīng)用范圍就具備了極大的擴(kuò)展空間。同時,由于該系統(tǒng)分辨率高,那么可以構(gòu)建多個 gRNA 的操縱子。
為下一代存儲器鋪路
活細(xì)胞可以變成信息記錄裝置,這些記錄裝置將自身信號動態(tài)歷史儲存為永久的 DNA 記錄,反過來為研究人員提供它們在自然過程發(fā)展的證據(jù)。要知道,人們不僅僅需要生物反應(yīng)的快照。在生物系統(tǒng)中,許多分子事件非常短暫,因此很難在自然環(huán)境下檢測和研究。而 DNA 編輯可以用來創(chuàng)建分子記錄儀,累積下來的突變可通過 DNA 測序或功能分析加以檢索,以推斷原始信息。
這些策略已經(jīng)有了。例如,通過信號-響應(yīng)啟動子,諸如是否存在、持續(xù)時常、強(qiáng)度、時序和時間相關(guān)的生物線索(如代謝物和細(xì)胞因子)或者環(huán)境線索(如光、污染物、噬菌體或溫度變化)等記錄信息都可被寫入 DNA。
DOMINO 系統(tǒng)就是這個分子記錄儀。研究人員指出,DOMINO 系統(tǒng)提升了活細(xì)胞中進(jìn)行分子記錄和計算的能力,這就提高了監(jiān)測和控制細(xì)胞表型的能力。這些類型的復(fù)雜存儲器電路的應(yīng)用包括跟蹤在細(xì)胞分化時代代相傳的變化,或者創(chuàng)建可以檢測并可能治療患病細(xì)胞的傳感器。
DOMINO 中的誘導(dǎo)型啟動子是可以替換的,那么這就帶來了各種應(yīng)用的可能。比如可以在該系統(tǒng)中記錄各種生物學(xué)信號或生理學(xué)信號,如糖、重金屬如銅離子以及暗室效應(yīng),也可以記錄胃腸道炎癥的生物標(biāo)志物,如血紅素、過氧化氫和一氧化氮。
其中的一個應(yīng)用是檢測糖。將響應(yīng)乳糖的 DNA 編碼插入到細(xì)菌中,當(dāng)細(xì)菌遇到糖時,DOMINO 會改變細(xì)菌的 DNA。此外,這些事件印跡會留在 DNA 里,不會隨著事件發(fā)生后而消退。
同樣,DOMINO 可以設(shè)計出檢測癌癥相關(guān)基因的路徑,也可以編程打開抗癌分子的基因,使系統(tǒng)能夠檢測和治療癌癥。
盧冠達(dá)說,本研究試圖克服以前的局限性,它使我們更接近最終愿景,即擁有強(qiáng)大、高度可擴(kuò)展和可定義的內(nèi)存系統(tǒng),這類似于硬盤驅(qū)動器的工作方式。
研究人員認(rèn)為,該研究解決了當(dāng)前體內(nèi)記錄和計算技術(shù)的許多局限性,并為用于活細(xì)胞中的信息處理和存儲的下一代存儲器架構(gòu)鋪平了道路。
在 Farzadfard 和盧冠達(dá)于 2018 年 8 月 31 日在Science發(fā)表的綜述文章中,他們論述了這個分子記錄儀的未來。
在將來,發(fā)育生物學(xué)家可以使用 DNA 記錄儀研究分化和發(fā)育途徑;癌癥生物學(xué)家可以使用這些 DNA 記錄儀來研究腫瘤發(fā)展,并深入了解腫瘤微環(huán)境中與癌癥異質(zhì)性有關(guān)的細(xì)胞和環(huán)境線索;免疫學(xué)家可以使用 DNA 記錄儀來研究免疫細(xì)胞成熟、記憶形成和免疫應(yīng)答過程中的信號轉(zhuǎn)導(dǎo);微生物學(xué)家可以利用其來研究細(xì)菌群落和生物膜內(nèi)的信號動力學(xué)和分子相互作用。
專訪第一作者兼通訊作者 Fahim Farzadfard 博士:我們剛開始進(jìn)行細(xì)胞編程的入門
DeepTech:在這項研究中,DOMINO 系統(tǒng)的最大創(chuàng)新是單堿基突變,即讓胞嘧啶變成胸腺嘧啶,這也是細(xì)胞無需被破壞的關(guān)鍵,是這樣嗎?
Fahim Farzadfard:是這樣。這項研究工作的其他突破是,我們可以在活細(xì)胞中即時進(jìn)行讀取和寫入,這就可以讓我們實現(xiàn)多個讀取事件和寫入事件的分層,以便讓我們記錄或控制 DNA 分子事件的發(fā)生順序和發(fā)生時間。另外,DOMINO 實現(xiàn)的分子記錄規(guī)模、模塊性和魯棒性(穩(wěn)健)也顯著勝過此前的方法。
DeepTech:我們很想知道,你是如何找到這么巧妙的方法的?
Fahim Farzadfard:我一直致力于開發(fā) DNA 分子的信息處理和記錄技術(shù)。我開發(fā)的第一個系統(tǒng)是 SCRIBE 系統(tǒng),該系統(tǒng)于 2014 年在Science上發(fā)表,并證明了使用 DNA 書寫記錄 DNA 中的生物信息的可能性。之后,我一直試圖實現(xiàn)使用 DNA 作為生物細(xì)胞存儲器的最終愿景,希望它的使用類似使用計算機(jī)硬盤,而 DOMINO 是這項工作的繼續(xù),也是接近這一愿景的最新努力。
DeepTech:當(dāng)前的 DOMINO 系統(tǒng)還有哪些局限嗎?
Fahim Farzadfard:我們還需要在兩個方面進(jìn)行改進(jìn),即時間分辨率和并行處理方面,這會對神經(jīng)記錄這樣的應(yīng)用非常有幫助。
DeepTech:計算機(jī)是物理信號的計算過程,DNA 計算則是化學(xué)反應(yīng)過程,我們應(yīng)該如何理解基于這兩種不同反應(yīng)的計算系統(tǒng)的差異?我們應(yīng)該對 DNA 計算有什么期望?
Fahim Farzadfard:與硬盤驅(qū)動的“0”和“1”存儲器不同,這里我們使用遺傳編碼A、C、G、T的讀寫頭來操作 DNA 存儲器。
一旦有了存儲系統(tǒng),我們就可以根據(jù)各種形式的邏輯用于數(shù)字計算或其他形式的計算(如模擬計算)來處理存儲的信息,就像我們使用硬盤驅(qū)動器和處理器來執(zhí)行復(fù)雜的硅計算一樣。
我認(rèn)為基于硅的計算機(jī)和基于 DNA 的活細(xì)胞計算機(jī)之間肯定存在差異?;罴?xì)胞中的回路反應(yīng)缺乏聯(lián)網(wǎng)區(qū)域化的相互作用,因為所有的反應(yīng)發(fā)生在同樣的隔斷區(qū)中。
另一個大的區(qū)別是,因為至少在當(dāng)前 DNA 計算依賴于生物化學(xué)過程,例如基因表達(dá),所以它比電子計算機(jī)的運(yùn)算要慢得多。這個限制與時間尺度有關(guān),因為許多生物過程如細(xì)胞信號轉(zhuǎn)導(dǎo)、分化和發(fā)育的過程是有限制的。
需要強(qiáng)調(diào)的是,在基于 DNA 的計算中,我們無法接近電子計算機(jī)的處理能力。然而,基于 DNA 的計算機(jī)提供了強(qiáng)大的與生物系統(tǒng)交互的計算工具,這是電子計算機(jī)無法實現(xiàn)的。
在這里,即使些微的計算都可能對疾病診斷和醫(yī)學(xué)應(yīng)用有非常強(qiáng)大的助推,尤其是在傳統(tǒng)技術(shù)無法實現(xiàn)的領(lǐng)域。
DeepTech:你認(rèn)為 DOMINO 系統(tǒng)在 DNA 計算發(fā)展中處于什么位置?總的來看,DNA 計算目前發(fā)展到了哪個階段?
Fahim Farzadfard:隨著 CRISPR-Cas9 和堿基編輯技術(shù)的發(fā)展,DNA 分子記錄和計算的技術(shù)也在迅速發(fā)展。如今有了 DOMINO 系統(tǒng)的幫助,我們證明了采用精確的 DNA 編輯可以實現(xiàn)各種形式的計算操作,因為不同的突變狀態(tài)是可以被 DNA 編輯器精確控制的。
我認(rèn)為先前的技術(shù)瓶頸在于,DNA 編輯太隨機(jī),一些突變是不可預(yù)測的,并且缺乏固有的信息讀取技術(shù)。那么這實際上就不能用于計算,因為計算需要可預(yù)測的結(jié)果,舉個例子就是,如果事件A發(fā)生則事件B就會發(fā)生,如果事件B發(fā)生則事件C就會發(fā)生。
因此人們需要一個精確的 DNA 編輯器以及固有的信息讀取途徑。對于前者,在某個突變發(fā)生時,會導(dǎo)致級聯(lián)邏輯運(yùn)算產(chǎn)生,而后者則是對于動態(tài)讀取活細(xì)胞信息所必需的。DOMINO 系統(tǒng)正是滿足了上述要求。
我認(rèn)為 DOMINO 是在活細(xì)胞中構(gòu)建通用讀寫操作的重要一步,可將其視為一種理想的通用圖靈機(jī)。
如果我們將細(xì)胞視為生物計算機(jī),那么對這些細(xì)胞進(jìn)行穩(wěn)健編程的能力將為我們提供無與倫比的方法來研究和控制活細(xì)胞中分子事件的變化。
我想我們剛開始進(jìn)行細(xì)胞編程的入門。
Fahim Farzadfard 簡介
Fahim Farzadfard,生于伊朗,畢業(yè)于德黑蘭大學(xué)生物技術(shù)專業(yè),并在麻省理工學(xué)院獲得博士學(xué)位。博士期間,他為活細(xì)胞的分子記錄和計算開發(fā)了多個基礎(chǔ)平臺, 他引入了基于 DNA 分子記錄和模擬儲存的概念,并發(fā)明了一個模塊化和可擴(kuò)展的平臺 SCRIBE(Synthetic Cellular Recorders Integrating Biological Events),后者可用于將信號動態(tài)記錄到細(xì)胞自身的基因組 DNA 中。
作為施密特科學(xué)博士后研究員,F(xiàn)ahim Farzadfard 同時在哈佛大學(xué) George Church 和麻省理工學(xué)院 Ed Boynton 兩個實驗室工作,他的目標(biāo)是進(jìn)一步推進(jìn)分子記錄技術(shù)并將其應(yīng)用于大腦研究。