21世紀(jì)以來(lái),生物大數(shù)據(jù)在量(多數(shù)據(jù)種類,海量樣本數(shù),多時(shí)間點(diǎn)采樣等)、質(zhì)(高時(shí)空精度,單細(xì)胞測(cè)序等)兩方面快速發(fā)展,大大推動(dòng)了生命科學(xué)的進(jìn)步,也為生物醫(yī)學(xué)問題的模型建立、數(shù)據(jù)分析,以及預(yù)測(cè)和控制,帶來(lái)了巨大的機(jī)遇和挑戰(zhàn)。
傳統(tǒng)的生物學(xué)數(shù)據(jù)研究方法大多基于數(shù)據(jù)的靜態(tài)統(tǒng)計(jì)信息,即“基于統(tǒng)計(jì)學(xué)的數(shù)據(jù)科學(xué)”(statistics-based data science),其缺點(diǎn)是,在很多場(chǎng)景下不能準(zhǔn)確地解釋和預(yù)測(cè)系統(tǒng)的復(fù)雜動(dòng)態(tài)行為。數(shù)據(jù)分類、數(shù)據(jù)降維、變量聚類、變量相關(guān)性分析等方法都是如此。
然而,即使是靜態(tài)的數(shù)據(jù),往往也蘊(yùn)含著系統(tǒng)的動(dòng)力學(xué)特征。我們需要通過“基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)”(dynamics-based data science),充分建立和利用動(dòng)力系統(tǒng)的普遍性質(zhì)(如,穩(wěn)定平衡點(diǎn)的臨界性質(zhì)、中心流型的低維性、單變量的吸引子的重構(gòu)性等),對(duì)蘊(yùn)含在數(shù)據(jù)中的動(dòng)力學(xué)信息進(jìn)行挖掘和分析。
“基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)”將動(dòng)力系統(tǒng)理論、統(tǒng)計(jì)學(xué)理論,和數(shù)據(jù)的實(shí)際背景結(jié)合在一起,為處理和解釋動(dòng)態(tài)生物大數(shù)據(jù)提供了一種基礎(chǔ)堅(jiān)實(shí)、計(jì)算高效的理論和方法。
在最近發(fā)表于《國(guó)家科學(xué)評(píng)論》(National Science Review,NSR)的觀點(diǎn)文章中,中科院生化細(xì)胞所的陳洛南研究員(通訊作者)、東京大學(xué)的史際帆博士(第一作者)和Aihara教授通過3個(gè)具體實(shí)例,揭示了如何利用動(dòng)力系統(tǒng)的普遍性質(zhì),由觀測(cè)的數(shù)據(jù)對(duì)生物學(xué)現(xiàn)象進(jìn)行動(dòng)力學(xué)分析,并解決生命科學(xué)的實(shí)際問題。1.利用微分方程的分岔理論,由測(cè)量的高維數(shù)據(jù),進(jìn)行健康臨界預(yù)警和疾病預(yù)測(cè)。DNB理論利用了系統(tǒng)在臨界點(diǎn)附近,復(fù)雜網(wǎng)絡(luò)將表現(xiàn)出有別于非臨界點(diǎn)的網(wǎng)絡(luò)特性,量化臨界狀態(tài)并發(fā)現(xiàn)疾病的關(guān)鍵因子,實(shí)現(xiàn)疾病預(yù)警“防病于未然”。

2.利用偏微分方程和diffusion map理論,量化細(xì)胞的多潛能性或距離干細(xì)胞的遠(yuǎn)近。LDD方法是,通過建立隨機(jī)生滅過程的偏微分方程模型,對(duì)細(xì)胞的分化過程進(jìn)行了多潛能性量化。利用單細(xì)胞測(cè)序數(shù)據(jù)和相關(guān)數(shù)學(xué)方法,可以對(duì)每類細(xì)胞多潛能性進(jìn)行估計(jì)和分化程度排序,實(shí)現(xiàn)量化細(xì)胞的多潛能性,并構(gòu)建多潛能性勢(shì)能景觀。

3.利用神經(jīng)網(wǎng)絡(luò)工具,對(duì)基因表達(dá)量等的時(shí)間序列進(jìn)行預(yù)測(cè)。ARNN方法是,利用最新的reservior神經(jīng)網(wǎng)絡(luò)工具,通過“空間-時(shí)間信息變換方程”STI,即變換高維數(shù)據(jù)的信息為時(shí)間的動(dòng)態(tài)信息,對(duì)短序列高維度數(shù)據(jù)(如基因表達(dá)數(shù)據(jù))進(jìn)行學(xué)習(xí),可實(shí)現(xiàn)復(fù)雜系統(tǒng)的短時(shí)間序列或動(dòng)態(tài)演化的預(yù)測(cè)。

“基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)”是一個(gè)全新交叉領(lǐng)域,相比傳統(tǒng)靜態(tài)的“基于統(tǒng)計(jì)學(xué)的數(shù)據(jù)科學(xué)”方法,具有“可解釋性”、“可量化性”和“可拓展性”,在今后的生物醫(yī)學(xué)等領(lǐng)域的研究舞臺(tái),將扮演不可或缺的重要角色。
編輯:jq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107794 -
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7335瀏覽量
94777 -
微分
+關(guān)注
關(guān)注
0文章
31瀏覽量
14418
原文標(biāo)題:3個(gè)實(shí)例:“基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)”在生命科學(xué)中的應(yīng)用 | NSR
文章出處:【微信號(hào):zhishexueshuquan,微信公眾號(hào):知社學(xué)術(shù)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺(tái)加速 AI 驅(qū)動(dòng)的藥物研發(fā)
算力賦能,打造生命科學(xué)云上新范式
Prudentia Sciences宣布完成由McKesson Ventures領(lǐng)投的A輪融資,加速生命科學(xué)交易的盡職調(diào)查
從“波長(zhǎng)困境”到“光譜自由”:OPSL技術(shù)如何重塑生命科學(xué)的激光應(yīng)用范式
功率放大器賦能:壓電雙晶片動(dòng)力學(xué)研究的突破之旅
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用
廣汽風(fēng)洞實(shí)驗(yàn)室與五羊本田合作完成摩托車空氣動(dòng)力學(xué)測(cè)試
2025施耐德電氣電子及生命科學(xué)新質(zhì)生產(chǎn)力峰會(huì)成功舉辦
施耐德電氣助力生命科學(xué)行業(yè)數(shù)字化轉(zhuǎn)型
NVIDIA攜手Ansys和DCAI推進(jìn)流體動(dòng)力學(xué)量子算法發(fā)展
《虛擬世界的力學(xué)交響曲:Adams如何重塑工業(yè)仿真邊界》
瞬態(tài)吸收光譜與時(shí)間分辨圓偏振發(fā)光技術(shù)的結(jié)合協(xié)助科學(xué)家深入理解能量與手性協(xié)同動(dòng)力學(xué)
三個(gè)例子告訴你們基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)在生命科學(xué)中的應(yīng)用
評(píng)論