深圳華大生命科學(xué)研究院副院長金鑫:BIT與I
專題:第25屆中國國際高新技術(shù)成果交易會_中國高新技術(shù)論壇
中國高新技術(shù)論壇于11月15日-17日舉行。深圳華大生命科學(xué)研究院副院長金鑫出席并演講。
以下為演講實錄:??
謝謝主持人的介紹,也特別感謝大會組委的邀請,讓我有這個機會和各位老師、各位朋友們來分享近期我們做的一些工作。
我今天分享的題目叫做BIT與I,實際上就是生命科學(xué)和信息科學(xué)相互的支撐和互相的促進。這個背景圖就是華大剛剛落成的全球總部,在深圳美麗的大梅沙灣畔,希望大家有興趣可以造訪我們的新總部。
什么是生命?我們早上聽了各位老師從腦機接口、合成生物學(xué)很多方面闡釋了生命,但是從生命的本原和信息傳遞角度講,實際上傳遞生物信息的最基本的材料就是我們的DNA,如果我們看細(xì)胞的結(jié)構(gòu),它中間的DNA就是一代一代傳承,承載生命的核心信息的這么一個編碼。人類基因組上面一共有30億的堿基,在90年代到2000年代初,全世界科學(xué)家花了13年的時間,30多億美金才完成了第一個人的基因組圖譜的繪制,前排左二的中國科學(xué)家就是我的老師楊煥明院士,他參與了圖譜繪制工作。
DNA是承載生命信息和傳遞生命信息的基本載體,生命科學(xué)不同于物理科學(xué)和數(shù)學(xué)的科學(xué)底座和基座,生命科學(xué)領(lǐng)域里面今天能夠稱得上法則和公式的東西非常少,大家普遍認(rèn)同的法則就是這一條,叫做中心法則,這個中心法則就是講生命的信息主要是承載和傳遞通過DNA,DNA把它轉(zhuǎn)錄變成一個實時的信息,變成RNA,RNA通過翻譯形成了蛋白。之前的很多工作實際上都集中在DNA層面,就像人類基因組,剛剛分享的老師介紹到的RNA技術(shù)的突破和新興的應(yīng)用給我們帶來了mRNA疫苗和新的治療技術(shù)。蛋白現(xiàn)在也是非常重要的研究領(lǐng)域,它是很多生命過程的重要承載者。
但是之前一直有一個問題很難回答清楚,就是我們?nèi)磉@么多細(xì)胞,每一個細(xì)胞都是同一套基因組、同一套基因序列,為什么有的變成了神經(jīng)細(xì)胞,有的變成皮膚細(xì)胞,有的變成肌肉細(xì)胞,這些生命信息是怎么在不同的時間和空間維度之下展開的?在這個問題之下,我們一直努力的方向就是把IT技術(shù)領(lǐng)域建立的方法和技術(shù)支撐到我們的生命應(yīng)用當(dāng)中,我們希望從生老病死的各個維度把生命盡可能的做全景、全周期、多模態(tài)的數(shù)字化,在不同的模態(tài)數(shù)字化基礎(chǔ)之上應(yīng)用到IT技術(shù)更好理解生命。而要去做數(shù)字化的解析,有一個非常重要的底層工具和核心支撐就是基因測序儀,大家知道基因測序儀不僅可以測DNA,也可以測定RNA,像基因測序儀是做多為組學(xué)數(shù)字化的工具,它是一個非常核心和關(guān)鍵的工具。
在20多年前,所有的基因測序儀都是有少數(shù)幾個美國頂尖的公司生產(chǎn)和制造的,我們一直不掌握這個底層工具,直到2013年初,我們才有機會開啟了基因測序儀國產(chǎn)化和自主制造。隨著2015年推出第一款自主知識產(chǎn)權(quán)和自主技術(shù)平臺的全國產(chǎn)的基因測序儀,我們把這個數(shù)字化,生命數(shù)字化的工具能力不斷地在推向極致。大家如果看到我們國產(chǎn)的基因測序儀,它的代號和命名是非常簡單的,它的后面編號就是代表了它每一天能夠產(chǎn)生多少數(shù)據(jù),比如最早測序儀叫做G500,后來有2000,2000個G,后面有了T1、T5、T10。我們?nèi)ツ暧幸粋€測序儀是T20,每天可升產(chǎn)出20T的數(shù)據(jù)。有了這樣的平臺的支撐,我們可以從一個人的基因組到百萬人、千萬人,未來基因組。我們現(xiàn)在擁有自己基因組數(shù)據(jù)的人還屈指可數(shù),我們在過完完整的一生,從打開生命圖譜到最后謝幕,實際上我們都沒有看過生命的說明書和使用手冊,未來它會變成具備的數(shù)據(jù),為我們的精準(zhǔn)醫(yī)學(xué)和應(yīng)用轉(zhuǎn)化助力。同時基因和生命科學(xué)的承載就是大國重器,政產(chǎn)學(xué)研資,大家在團隊里面共同促進,尤其需要國家大力支撐。我們非常有幸從2011年起承載了由四部委批復(fù)的國家基因庫的建設(shè)工作,我們現(xiàn)在建成了生物樣本庫和生物信息庫和基因測序平臺。
我們的生命中有很多未解之謎,我昨天去我女兒的幼兒園給幼兒園小朋友講什么是生命,什么是細(xì)胞。小朋友非常好奇,問到很多問題,幾個問題把我問住了。第一個問題是細(xì)胞在哪里,為什么我看不見。我給他們講我們每個人是由受精卵發(fā)展而來的。他問受精卵是怎么來的。我們要去解釋這個問題,需要用到新的工具,需要新的法則。我們之前研究生命都是研究一套基因組,一套基因組在全身幾十萬億個細(xì)胞是一樣的,我們每個人的人體細(xì)胞數(shù)量,成年人大概是30萬億-50萬億,這個數(shù)量相當(dāng)于目前可觀測宇宙所有橫行的數(shù)量,你的身體就是一個宇宙。我們以前是拿一個組織集,希望把這個RNA、DNA都給解碼出來,希望用這樣的方式研究腫瘤怎么發(fā)展的。我們研究一個汽車怎么運行,不可能把它打成泥漿,看里面有多少的鐵、銅,多少塑料,就可以理解汽車。實際上我們要知道它里面有哪些零部件,這些零部件在空間位置上怎么組織、怎么作用,這就是我們帶來新的工具支撐,叫做時空組學(xué)技術(shù)。我們最早研究生命科學(xué)用顯微鏡,后來做DNA研究用到測序儀,我們就是在DNA測序技術(shù)的研究上發(fā)展這個技術(shù),我們把納米球承載到微孔的芯片上,每個納米球與納米球之間有幾百個納米,這是亞細(xì)胞的尺寸,我們一個空間尺寸里有幾百個納米求獲得亞細(xì)胞的信息。我們再結(jié)合整個一套樣本處理的過程,將生物的組織切片和基因測序芯片進行貼合,讓它們進行結(jié)合,把基因轉(zhuǎn)錄的信息捕獲到這個芯片上去,我們經(jīng)過兩輪檢測把基因位置的信息捕獲過來,通過檢測和還原,得到了空間的圖譜,這個空間圖譜的技術(shù)在分辨率和視場方面都是在全球技術(shù)方面有一定的領(lǐng)先優(yōu)勢。簡單來講,做一個不太形象的比喻,這個生命的照相機又是一個超廣角,又是一個超長焦,就是又能拍得很精細(xì),又能拍得很大范圍,這對我們解密生命信息很關(guān)鍵,都是一個利器。
我們在技術(shù)發(fā)展過程中間就解析了斑馬魚從卵生長為完整的生命個體,我們解析了小鼠的胚胎怎么從受精卵發(fā)展成一個完整的小老鼠。同時在大腦方面的研究,腦科學(xué)方面的研究,我們也可以提供助力。右邊是一個獼猴腦的工作。左邊是一個蠑螈,它的再生能力比較強,它的端腦和端肢可以再生,我們通過這個技術(shù)解析了非常有意思的機理和機制。還有一些生命的終極問題,我們都可以用新的生命組織解析技術(shù)來去支撐。我們作為生命組學(xué)工具的開發(fā)者和生產(chǎn)者,我們希望為各個領(lǐng)域,不管是科學(xué)研究和臨床應(yīng)用方面的專家、老師、團隊提供這樣一個生命組學(xué)技術(shù)的底層支撐,讓整個領(lǐng)域都能有更快的進展,能夠把我們的生命法則最終和時空法則結(jié)合起來,形成對生命整個過程完整的理解。
接下來我再快速講一講BIT方面怎么用生命科學(xué)的信息、技術(shù)去幫助解決今天一些IT的問題。我們做個簡單的比喻它有相似之處,生命的基因的編碼是ATCG,我們用DNA編碼和存儲大量的信息,我們的信息增長速度遠(yuǎn)遠(yuǎn)超過去建設(shè)這個數(shù)據(jù)存儲中心的速度,我們用到生命中心法則的過程是DNA可以很快速、很低成本的***。有人做過一個測算,我們用同樣的物質(zhì)單位來計算,它可以存儲多少數(shù)據(jù)量,我們用硅的介質(zhì),它大約是兆B級別。石墨烯材料是TB級別,用DNA是EB級別,是多個數(shù)量級存儲密度提升。我們把讀和寫再進一步延伸到存,我們可以把圖譜的知識通過一定的方式進行編碼寫入到DNA里面,讓這個DNA長期存儲,我們有很多技術(shù)可以快速解析DNA,還原成我們所知的信息,尤其是這樣的存儲方式是使用于長期的冷備存儲的。我們自有人類文明史以來,現(xiàn)在傳承的最的信息就是在石頭上畫畫,其他的語言、文字刻在書本上、存在電腦里,硬盤的壽命是否超過百年,都是一個問題,但是刻在石頭上的字和畫在巖壁上的畫傳承萬年以上。另外一個可以傳承萬年以上的就是DNA,現(xiàn)在已經(jīng)有多個幾萬年之前的古人類的DNA骸骨的化石,我們可以從中間提取到來自古人類的DNA,幫著我們解析人類究竟是如何起源和遷徙的,和以前滅絕的古人類祖先的親戚們發(fā)生怎樣的聯(lián)系,進行交流和互動?,F(xiàn)在最古的是來自70萬年前的西伯利亞凍土古代馬的化石DNA,它就是一個干燥的環(huán)境,它的存儲成本是比較低,未來會成為非常重要的人類存儲的介質(zhì)。
(現(xiàn)場播放)
這就是我們用DNA存儲的技術(shù)對于開國大典的一段珍貴的影像進行了轉(zhuǎn)碼和存儲,在這樣一個小小的試管里面,你看不到的物質(zhì)可以存儲復(fù)雜的影像數(shù)據(jù)。
BIT和I,生命科學(xué)和信息科學(xué)是近年來人類領(lǐng)域里面發(fā)展最快的兩個方向,我們從信息技術(shù)里面得到了很多的滋養(yǎng),很大程度上助力了我們對生命周期的過程和解析,同時我們利用新興的生命和科學(xué)技術(shù)反過來支撐到信息科學(xué)的發(fā)展。隨著人工智能快速的發(fā)展,到了2035年、2050年,90%的工作可能會消失了,人類在這個地球上做什么呢?至少到那個時候,大家肯定會更加關(guān)注自己和自己身邊的人會不會活得健康,活得開心,這就是我們即將迎來的生命時代,希望跟大家一起攜手,在華大生命科技底層技術(shù)支撐之下,更好的走進新的生命經(jīng)濟時代。
謝謝大家。
新浪聲明:所有會議實錄均為現(xiàn)場速記整理,未經(jīng)演講者審閱,新浪網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。
作者:xinfeng335本文地址:http://leetv.com.cn/post/5032.html發(fā)布于 今天
文章轉(zhuǎn)載或復(fù)制請以超鏈接形式并注明出處義烏市挈宇網(wǎng)絡(luò)科技有限公司