龜甲、宣紙、磁帶、硬盤……
數(shù)據(jù)怎么存、存在哪
始終是人們孜孜以求的問題
時代變遷,社會發(fā)展
我們的生活每天都在產(chǎn)生海量數(shù)據(jù)
傳統(tǒng)硅基材料
難以滿足日益增長的數(shù)據(jù)存儲需求
北京大學張成、錢瓏團隊
與合作者另辟蹊徑
以表觀修飾作為存儲介質(zhì)
通過分子信息并行寫入實現(xiàn)信息存儲
為這道難題提出新的解法
10月23日
團隊研究成果已發(fā)表于Nature
△研究成果已正式發(fā)表于Nature
1公斤便可“裝下”全世界
2024年10月23日,北京大學計算機學院張成與定量生物學中心錢瓏聯(lián)合研究團隊與合作者,在國際學術期刊Nature上發(fā)表題為“Parallel molecular data storage by printing epigenetic bits on DNA”的研究論文,首次提出了一種基于并行寫入策略的DNA存儲策略,成功將信息打印在DNA分子之上,猶如“活字印刷”,在白紙上批量印刷信息。團隊在實驗中,成功將中國漢代“白虎”瓦當和大熊貓的高清圖片(數(shù)據(jù)量超過27.5萬比特)寫入DNA分子中,并無損還原了原始數(shù)據(jù),解析出高清圖片。
DNA具有超高存儲密度,僅1克DNA就足以存儲1000萬小時高清視頻數(shù)據(jù);1公斤DNA,便可以裝下全世界數(shù)據(jù)。此外,如果避免潮濕和紫外線照射,DNA可以保存數(shù)十萬年之久,擁有超長壽命。相比之下,硬盤往往需要每隔幾年更換一次以防止數(shù)據(jù)損壞。因此,DNA顯示出作為顛覆性存儲介質(zhì)的巨大潛力。
然而,傳統(tǒng)DNA存儲依賴“從頭合成”的信息寫入路線,在成本和速度上面臨著“速度慢”“易出錯”“價格貴”的多重巨大挑戰(zhàn)。不同于傳統(tǒng)技術路線,張成-錢瓏聯(lián)合團隊開發(fā)的“表觀比特(epi-bit)”DNA存儲技術,利用預制的DNA模板和“分子活字塊”,通過DNA自組裝介導的分子信息排版,經(jīng)選擇性酶促甲基修飾轉(zhuǎn)移,實現(xiàn)了“活字印刷”,達到分子級“信息打印”的目的。
該技術不依賴于主流的“從頭合成”寫入路線原理,通過DNA自組裝與選擇性酶促甲基化(DNA分子的一種表觀遺傳修飾)的組合原理,無需合成,就像在紙上印刷文字。首先,研究團隊設計并預制通用的單鏈DNA載體和互補短單鏈DNA“文字庫”。然后,通過將“文字庫”裝到DNA載體的相同加載序列上,任意表觀比特信息就得以被排版。接下來,堿基修飾(5-甲基胞嘧啶)通過酶的選擇性甲基化以并行的方式穩(wěn)定地“打印”在DNA載體上,一場精密、高效的“分子印刷術”就大功告成了。
這種被稱為“表觀比特”類似于傳統(tǒng)的比特,以兩個二進制數(shù)值中的一個(0或1)來存儲信息,對應堿基是否甲基化。研究團隊通過使用有限的700種DNA活字和5個模板進行編程,在自動平臺上實現(xiàn)了約27.5萬個比特的免合成寫入,每個反應的寫入輸出為350比特,遠超過去依賴DNA從頭合成的數(shù)據(jù)存儲系統(tǒng)每個反應約僅1比特的輸出量,實現(xiàn)了重大突破。
同時,這一研究還成功實現(xiàn)了個人定制DNA存儲示例,證明了便捷的分布式DNA存儲應用潛力。該方法的建立,不僅為實現(xiàn)了快速、低成本的大規(guī)模分子數(shù)據(jù)存儲奠定了技術基礎,還為未來DNA存儲的發(fā)展提供了全新思路。
基于表觀比特條碼的高位并行大規(guī)模存儲示意
“這項技術的核心突破在于,我們能夠通過預制的DNA模板和活字塊,在分子底層以排版的方式打印epi-bit信息,實現(xiàn)分子數(shù)據(jù)的精確并行寫入,進而完成大規(guī)模并行DNA存儲?!闭撐耐ㄓ嵶髡?、北京大學研究員張成介紹說,“與傳統(tǒng)DNA數(shù)據(jù)存儲方法相比,這種活字印刷并行寫入方式僅需有限數(shù)量的預制DNA分子,從而避免了復雜繁瑣DNA序列編碼過程,不僅大幅降低分子信息寫入復雜度,還能降低成本,提高操控靈活性。”
把照片“存在”DNA里
團隊在實驗中,將中國漢代“白虎”瓦當和國寶大熊貓“飛云”的高清圖片成功寫入DNA分子中,數(shù)據(jù)量超過27.5萬比特,相比此前發(fā)表的其他非傳統(tǒng)DNA存儲技術,數(shù)據(jù)規(guī)模提升超過300倍。這些信息讀取使用便攜式納米孔測序儀,實現(xiàn)了對DNA模板上復雜表觀比特信息的高通量讀取,并通過單次超240種不同修飾模式的并行解析,無損還原了原始數(shù)據(jù),解析出高清圖片,真正有望實現(xiàn)“經(jīng)典永流傳”。實驗結果驗證了該創(chuàng)新型分子存儲技術的可行性和準確性,還展示了表觀比特的穩(wěn)定性。
值得關注的是,團隊還展示了這項技術的分布式存儲應用潛力。在個人定制DNA存儲實驗中,邀請了北京大學、華北電力大學等單位60名背景廣泛的青年志愿者,由他們在日常環(huán)境下,將私人數(shù)據(jù)親手寫入DNA并由個人保存。這些數(shù)據(jù)直到使用時才被讀取,可有效保障個人數(shù)據(jù)的隱私與安全。這種分布式DNA存儲方式,不僅能極大降低DNA存儲的使用門檻,且保障了數(shù)據(jù)隱私,有望推動DNA存儲的個人應用。
表觀比特DNA存儲原理流程和實驗結果
從二進制數(shù)據(jù)到DNA數(shù)據(jù),從從頭合成到并行寫入,從DNA存儲池到細胞存儲,從二代測序到納米孔測序……在多維技術的突破性革命與融會貫通下,誕生了如今的表觀比特DNA存儲框架,這一框架為大規(guī)模數(shù)據(jù)存儲提供了全新的解決方案,有望突破DNA存儲的成本和速度壁壘。此項技術的開發(fā),還展現(xiàn)了非傳統(tǒng)分子比特在數(shù)據(jù)存儲中的獨特優(yōu)勢,為未來新型分子信息處理系統(tǒng)的研發(fā)奠定了堅實的基礎。
“在DNA這張白紙上批量打印信息,代表著DNA存儲技術的重要突破與革新?!闭撐耐ㄓ嵶髡?、北京大學研究員錢瓏表示,“可預見的是,在未來,無論身處何時何地,我們都將無需依賴大型實驗儀器,就能實現(xiàn)簡單、準確、高效的DNA數(shù)據(jù)存儲?!?/p>
① 凡本站注明“稿件來源:中國教育在線”的所有文字、圖片和音視頻稿件,版權均屬本網(wǎng)所有,任何媒體、網(wǎng)站或個人未經(jīng)本網(wǎng)協(xié)議授權不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復制發(fā)表。已經(jīng)本站協(xié)議授權的媒體、網(wǎng)站,在下載使用時必須注明“稿件來源:中國教育在線”,違者本站將依法追究責任。
② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉(zhuǎn)載稿,本站轉(zhuǎn)載出于非商業(yè)性的教育和科研之目的,并不意味著贊同其觀點或證實其內(nèi)容的真實性。如轉(zhuǎn)載稿涉及版權等問題,請作者在兩周內(nèi)速來電或來函聯(lián)系。