電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)中國超算的高光時(shí)刻,是2016年到2017年期間,神威·太湖之光連續(xù)四次登頂全球超級計(jì)算機(jī)TOP 500榜單。但在神威·太湖之光之后,國內(nèi)超級計(jì)算機(jī)一直頗為低調(diào),其繼任者神威“Oceanlite”沒有公開太多信息,也沒有再參與TOP500排名。
不過近期中國科學(xué)技術(shù)大學(xué)的一個(gè)研究團(tuán)隊(duì),在神威“Oceanlite”上利用大規(guī)模神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了量子化學(xué)模擬的突破,在真實(shí)分子尺度下完成復(fù)雜量子化學(xué)建模。該成果也在近期發(fā)布在高性能計(jì)算領(lǐng)域頂級期刊IEEE TPDS上。
量子化學(xué)是什么?
量子化學(xué)研究的其實(shí)是分子、原子層面的量子行為(如電子云分布、化學(xué)鍵作用),比如通過捕捉化學(xué)反應(yīng)中間的 “過渡態(tài)”(反應(yīng)最關(guān)鍵、最短暫的步驟),來解釋實(shí)驗(yàn)無法理解的反應(yīng)本質(zhì)。
然而這些過程根本無法通過傳統(tǒng)實(shí)驗(yàn)直接觀測或精準(zhǔn)控制,首先電子運(yùn)動(dòng)速度極快,且一旦實(shí)驗(yàn)設(shè)備對其進(jìn)行觀測就會(huì)干擾其狀態(tài)。
在微觀尺度下,分子的量子行為遵循薛定諤方程,但直接求解這一方程的計(jì)算量會(huì)隨著電子數(shù)量的增加呈指數(shù)級爆炸式增長。例如,一個(gè)僅包含 10 個(gè)電子的分子,其可能的量子態(tài)就超過 10 萬億種,而真實(shí)的藥物分子或催化劑往往包含數(shù)十個(gè)電子和上百個(gè)自旋軌道。
那么如何計(jì)算?傳統(tǒng)的近似方法如密度泛函理論(DFT)雖然能處理較大規(guī)模的系統(tǒng),但在描述強(qiáng)電子關(guān)聯(lián)現(xiàn)象(如化學(xué)鍵的斷裂與形成)時(shí)會(huì)出現(xiàn)顯著誤差。量子計(jì)算機(jī)理論上能解決這一問題,但其當(dāng)前仍處于含噪聲中等規(guī)模(NISQ)階段,無法支撐實(shí)際科研需求。
簡單來說就是“實(shí)驗(yàn)做不到,計(jì)算太復(fù)雜”。
如何在超算上實(shí)現(xiàn)量子化學(xué)模擬?
這次中國科學(xué)技術(shù)大學(xué)研究團(tuán)隊(duì)的核心是突破神經(jīng)網(wǎng)絡(luò)量子態(tài)(NNQS)在大規(guī)模電子結(jié)構(gòu)分析中的瓶頸,實(shí)現(xiàn)真實(shí)分子尺度的量子模擬,無需依賴未來的量子計(jì)算機(jī)。
團(tuán)隊(duì)利用神威“Oceanlite”超算,開發(fā)了一個(gè)名為數(shù)據(jù)并行NNQS-Transformer框架,在這個(gè)框架中主要有三大核心創(chuàng)新。
首先是采用了混合架構(gòu)設(shè)計(jì),研究團(tuán)隊(duì)將Transformer 的注意力機(jī)制引入量子波函數(shù)構(gòu)建,通過動(dòng)態(tài)捕捉電子間的長程相互作用,解決了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)量子態(tài)(NNQS)在強(qiáng)關(guān)聯(lián)系統(tǒng)中的精度不足問題。
其次是使用了分層通信模型,針對神威“Oceanlite”超算采用的 SW26010-Pro CPU,單芯片384核心,整機(jī)4100萬核心集群的獨(dú)特架構(gòu),設(shè)計(jì)了管理核心(MPE)與計(jì)算核心(CPE)的分工體系。管理核心負(fù)責(zé)節(jié)點(diǎn)間通信,而配備 512 位向量引擎的 CPE 專注于本地量子計(jì)算,包括隨機(jī)采樣等,顯著提升了數(shù)據(jù)訪問效率。
SW26010 Pro是SW26010的升級版,CPU核心架構(gòu)從上一代4個(gè)核簇升級為6個(gè),每個(gè)核簇由一個(gè)MPE和64個(gè)CPE組成,MPE擁有32KB L1指令緩存、32KB L1數(shù)據(jù)緩存以及512KB L2緩存。每個(gè)CPE擁有32KB的L1指令緩存和256KB軟件管理的高速臨時(shí)存儲(chǔ)。
最后,團(tuán)隊(duì)在3700萬個(gè)CPE核心上進(jìn)行量子化學(xué)模擬計(jì)算,在龐大規(guī)模的核心數(shù)量下,通過實(shí)時(shí)調(diào)整各個(gè)核心的任務(wù)分配,實(shí)現(xiàn)了92%的強(qiáng)擴(kuò)展性和98%的弱擴(kuò)展性,即無論是提高問題規(guī)模還是增加超算核心規(guī)模,都能保證系統(tǒng)性能,確保了超大規(guī)模計(jì)算中的資源高效利用。
神威超算的SW26010-ProCPU采用本地內(nèi)存而非緩存的設(shè)計(jì),原本更適合規(guī)則化的 AI 訓(xùn)練任務(wù),但量子化學(xué)模擬需處理隨機(jī)采樣、不規(guī)則局域能量計(jì)算,所以還需要針對性改造算法。為適配量子化學(xué)的不規(guī)則計(jì)算特性,團(tuán)隊(duì)采用Julia語言進(jìn)行代碼開發(fā),利用其可移植性和高性能特性,結(jié)合底層優(yōu)化實(shí)現(xiàn)了與硬件的無縫對接。
最終,該團(tuán)隊(duì)成功模擬了包含120 個(gè)自旋軌道的分子系統(tǒng),這是目前經(jīng)典超算上規(guī)模最大的 AI 驅(qū)動(dòng)量子化學(xué)計(jì)算。
新材料、藥物研發(fā)領(lǐng)域前景廣泛
計(jì)算機(jī)模擬量子化學(xué)的基本目的是理解自然規(guī)律,通過計(jì)算機(jī)模擬,可以捕捉化學(xué)反應(yīng)中間的 “過渡態(tài)”,解釋實(shí)驗(yàn)無法理解反應(yīng)本質(zhì)。在實(shí)際應(yīng)用中,通過模擬還原一些自然環(huán)境中產(chǎn)生的化學(xué)反應(yīng),比如模擬光合作用,電子在葉綠素中的傳遞路徑、過渡態(tài)的能量變化,為人工光合制氫提供理論指導(dǎo)。
而在這個(gè)過程中,對微觀現(xiàn)象的模擬對于創(chuàng)造新的材料更是突破性的新模式。在藥物研發(fā)領(lǐng)域,通過計(jì)算機(jī)模擬藥物分子與疾病靶點(diǎn),如蛋白質(zhì)、病毒等的量子相互作用,預(yù)測 哪種分子能精準(zhǔn)結(jié)合靶點(diǎn)、阻斷疾病通路。
在材料領(lǐng)域,通過模擬分子、原子的量子結(jié)構(gòu),預(yù)測材料的物理化學(xué)性質(zhì),如導(dǎo)電性、催化活性、強(qiáng)度等,再反向設(shè)計(jì)出符合需求的材料。比如用于研發(fā)更高效的燃料電池催化劑、固態(tài)電池的電解質(zhì)材料等。
寫在最后
從該項(xiàng)研究成果可以看出,超算硬件算力基礎(chǔ),與軟件生態(tài)系統(tǒng)能力的高度配合同樣重要。目前中國神威“Oceanlite”超算不再參與算力排名,或許也表示國內(nèi)超算的指標(biāo),從單純追求硬件參數(shù),轉(zhuǎn)向了追求科研平臺(tái)落地,構(gòu)建自主的超算生態(tài)。
同時(shí)也證明了量子計(jì)算機(jī)實(shí)用化之前,經(jīng)典超算與AI結(jié)合,仍有非常大的潛力可以挖掘。
不過近期中國科學(xué)技術(shù)大學(xué)的一個(gè)研究團(tuán)隊(duì),在神威“Oceanlite”上利用大規(guī)模神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了量子化學(xué)模擬的突破,在真實(shí)分子尺度下完成復(fù)雜量子化學(xué)建模。該成果也在近期發(fā)布在高性能計(jì)算領(lǐng)域頂級期刊IEEE TPDS上。
量子化學(xué)是什么?
量子化學(xué)研究的其實(shí)是分子、原子層面的量子行為(如電子云分布、化學(xué)鍵作用),比如通過捕捉化學(xué)反應(yīng)中間的 “過渡態(tài)”(反應(yīng)最關(guān)鍵、最短暫的步驟),來解釋實(shí)驗(yàn)無法理解的反應(yīng)本質(zhì)。
然而這些過程根本無法通過傳統(tǒng)實(shí)驗(yàn)直接觀測或精準(zhǔn)控制,首先電子運(yùn)動(dòng)速度極快,且一旦實(shí)驗(yàn)設(shè)備對其進(jìn)行觀測就會(huì)干擾其狀態(tài)。
在微觀尺度下,分子的量子行為遵循薛定諤方程,但直接求解這一方程的計(jì)算量會(huì)隨著電子數(shù)量的增加呈指數(shù)級爆炸式增長。例如,一個(gè)僅包含 10 個(gè)電子的分子,其可能的量子態(tài)就超過 10 萬億種,而真實(shí)的藥物分子或催化劑往往包含數(shù)十個(gè)電子和上百個(gè)自旋軌道。
那么如何計(jì)算?傳統(tǒng)的近似方法如密度泛函理論(DFT)雖然能處理較大規(guī)模的系統(tǒng),但在描述強(qiáng)電子關(guān)聯(lián)現(xiàn)象(如化學(xué)鍵的斷裂與形成)時(shí)會(huì)出現(xiàn)顯著誤差。量子計(jì)算機(jī)理論上能解決這一問題,但其當(dāng)前仍處于含噪聲中等規(guī)模(NISQ)階段,無法支撐實(shí)際科研需求。
簡單來說就是“實(shí)驗(yàn)做不到,計(jì)算太復(fù)雜”。
如何在超算上實(shí)現(xiàn)量子化學(xué)模擬?
這次中國科學(xué)技術(shù)大學(xué)研究團(tuán)隊(duì)的核心是突破神經(jīng)網(wǎng)絡(luò)量子態(tài)(NNQS)在大規(guī)模電子結(jié)構(gòu)分析中的瓶頸,實(shí)現(xiàn)真實(shí)分子尺度的量子模擬,無需依賴未來的量子計(jì)算機(jī)。
團(tuán)隊(duì)利用神威“Oceanlite”超算,開發(fā)了一個(gè)名為數(shù)據(jù)并行NNQS-Transformer框架,在這個(gè)框架中主要有三大核心創(chuàng)新。
首先是采用了混合架構(gòu)設(shè)計(jì),研究團(tuán)隊(duì)將Transformer 的注意力機(jī)制引入量子波函數(shù)構(gòu)建,通過動(dòng)態(tài)捕捉電子間的長程相互作用,解決了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)量子態(tài)(NNQS)在強(qiáng)關(guān)聯(lián)系統(tǒng)中的精度不足問題。
其次是使用了分層通信模型,針對神威“Oceanlite”超算采用的 SW26010-Pro CPU,單芯片384核心,整機(jī)4100萬核心集群的獨(dú)特架構(gòu),設(shè)計(jì)了管理核心(MPE)與計(jì)算核心(CPE)的分工體系。管理核心負(fù)責(zé)節(jié)點(diǎn)間通信,而配備 512 位向量引擎的 CPE 專注于本地量子計(jì)算,包括隨機(jī)采樣等,顯著提升了數(shù)據(jù)訪問效率。
SW26010 Pro是SW26010的升級版,CPU核心架構(gòu)從上一代4個(gè)核簇升級為6個(gè),每個(gè)核簇由一個(gè)MPE和64個(gè)CPE組成,MPE擁有32KB L1指令緩存、32KB L1數(shù)據(jù)緩存以及512KB L2緩存。每個(gè)CPE擁有32KB的L1指令緩存和256KB軟件管理的高速臨時(shí)存儲(chǔ)。
最后,團(tuán)隊(duì)在3700萬個(gè)CPE核心上進(jìn)行量子化學(xué)模擬計(jì)算,在龐大規(guī)模的核心數(shù)量下,通過實(shí)時(shí)調(diào)整各個(gè)核心的任務(wù)分配,實(shí)現(xiàn)了92%的強(qiáng)擴(kuò)展性和98%的弱擴(kuò)展性,即無論是提高問題規(guī)模還是增加超算核心規(guī)模,都能保證系統(tǒng)性能,確保了超大規(guī)模計(jì)算中的資源高效利用。
神威超算的SW26010-ProCPU采用本地內(nèi)存而非緩存的設(shè)計(jì),原本更適合規(guī)則化的 AI 訓(xùn)練任務(wù),但量子化學(xué)模擬需處理隨機(jī)采樣、不規(guī)則局域能量計(jì)算,所以還需要針對性改造算法。為適配量子化學(xué)的不規(guī)則計(jì)算特性,團(tuán)隊(duì)采用Julia語言進(jìn)行代碼開發(fā),利用其可移植性和高性能特性,結(jié)合底層優(yōu)化實(shí)現(xiàn)了與硬件的無縫對接。
最終,該團(tuán)隊(duì)成功模擬了包含120 個(gè)自旋軌道的分子系統(tǒng),這是目前經(jīng)典超算上規(guī)模最大的 AI 驅(qū)動(dòng)量子化學(xué)計(jì)算。
新材料、藥物研發(fā)領(lǐng)域前景廣泛
計(jì)算機(jī)模擬量子化學(xué)的基本目的是理解自然規(guī)律,通過計(jì)算機(jī)模擬,可以捕捉化學(xué)反應(yīng)中間的 “過渡態(tài)”,解釋實(shí)驗(yàn)無法理解反應(yīng)本質(zhì)。在實(shí)際應(yīng)用中,通過模擬還原一些自然環(huán)境中產(chǎn)生的化學(xué)反應(yīng),比如模擬光合作用,電子在葉綠素中的傳遞路徑、過渡態(tài)的能量變化,為人工光合制氫提供理論指導(dǎo)。
而在這個(gè)過程中,對微觀現(xiàn)象的模擬對于創(chuàng)造新的材料更是突破性的新模式。在藥物研發(fā)領(lǐng)域,通過計(jì)算機(jī)模擬藥物分子與疾病靶點(diǎn),如蛋白質(zhì)、病毒等的量子相互作用,預(yù)測 哪種分子能精準(zhǔn)結(jié)合靶點(diǎn)、阻斷疾病通路。
在材料領(lǐng)域,通過模擬分子、原子的量子結(jié)構(gòu),預(yù)測材料的物理化學(xué)性質(zhì),如導(dǎo)電性、催化活性、強(qiáng)度等,再反向設(shè)計(jì)出符合需求的材料。比如用于研發(fā)更高效的燃料電池催化劑、固態(tài)電池的電解質(zhì)材料等。
寫在最后
從該項(xiàng)研究成果可以看出,超算硬件算力基礎(chǔ),與軟件生態(tài)系統(tǒng)能力的高度配合同樣重要。目前中國神威“Oceanlite”超算不再參與算力排名,或許也表示國內(nèi)超算的指標(biāo),從單純追求硬件參數(shù),轉(zhuǎn)向了追求科研平臺(tái)落地,構(gòu)建自主的超算生態(tài)。
同時(shí)也證明了量子計(jì)算機(jī)實(shí)用化之前,經(jīng)典超算與AI結(jié)合,仍有非常大的潛力可以挖掘。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
發(fā)布評論請先 登錄
相關(guān)推薦
熱點(diǎn)推薦
國產(chǎn)光芯片大突破,算力超百倍,繞開EUV
已經(jīng)發(fā)表于國際頂級學(xué)術(shù)期刊《科學(xué)》(Science),并被選為高光論文重點(diǎn)報(bào)道。 ? 這是國際上首次實(shí)現(xiàn)大規(guī)模全光生成式AI芯片,標(biāo)志著光計(jì)算在生成式AI領(lǐng)域的應(yīng)用從理論可行性邁入實(shí)際效能領(lǐng)先階段。 ? 全光
中科曙光3套scaleX萬卡超集群落地國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)
2月5日,由中科曙光提供的3套萬卡超集群系統(tǒng)在國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)同時(shí)上線試運(yùn)行,成為全國首個(gè)實(shí)現(xiàn)3
Banana Pi 基于龍芯2K3000的國產(chǎn)信創(chuàng)工業(yè)計(jì)算網(wǎng)關(guān)設(shè)計(jì),采用無風(fēng)扇設(shè)計(jì)
2K3000的國產(chǎn)信創(chuàng)工業(yè)計(jì)算網(wǎng)關(guān)[]()
產(chǎn)品采用核心板+底板設(shè)計(jì),采用無風(fēng)扇銅散熱。
核心特性
全功能核心板: COM-E Type標(biāo)
發(fā)表于 12-17 11:06
智算驅(qū)動(dòng)新質(zhì)生產(chǎn)力,拓維信息亮相2025世界計(jì)算大會(huì)
10月20日,以“計(jì)算萬物湘約未來——智算驅(qū)動(dòng)新質(zhì)生產(chǎn)力”為主題的2025世界計(jì)算大會(huì)在湖南長沙
中科曙光scaleX640超節(jié)點(diǎn)亮相2025世界計(jì)算大會(huì)
11月20日,在以“計(jì)算萬物,湘約未來——智算驅(qū)動(dòng)新質(zhì)生產(chǎn)力”為主題的長沙世界計(jì)算大會(huì)上,中科曙
谷歌芯片實(shí)現(xiàn)量子計(jì)算新突破,比超算快13000倍
電子發(fā)燒友綜合報(bào)道 日前,谷歌宣布其量子計(jì)算機(jī)取得突破性進(jìn)展,使用一種名為“量子回聲(Quantum Echoes)”的算法,在
今日看點(diǎn):谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典超算快13000倍;NFC 技術(shù)突破:讀取距離從 5 毫米提升至 20 毫米
谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典超算快13000倍 近日,谷歌在《自然》雜志披露與Willow芯片相關(guān)的量子計(jì)
發(fā)表于 10-23 10:20
?1542次閱讀
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用
和量子計(jì)算的兩項(xiàng)新興的技術(shù),將在生產(chǎn)假說方面發(fā)揮重要作用,從而改變科學(xué)發(fā)現(xiàn)的范式。
生成式AI:
2、窮舉搜索
3、分析排錯(cuò)與組合優(yōu)化
分析排錯(cuò)是生成假說的重要手段。強(qiáng)化學(xué)習(xí)也在優(yōu)化假
發(fā)表于 09-17 11:45
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+化學(xué)或生物方法實(shí)現(xiàn)AI
網(wǎng)絡(luò),極其復(fù)雜和精密。大腦本質(zhì)上是一臺(tái)濕潤的軟組織生物化學(xué)計(jì)算機(jī),通過離子、分子之間的相互作用進(jìn)行復(fù)雜的并行計(jì)算。
理解了怎么生物AI,作者為我們介紹了幾種備受關(guān)注的研究方向和成果。
發(fā)表于 09-15 17:29
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來:提升算力還是智力
結(jié)果。
耦合振蕩計(jì)算與傳統(tǒng)的計(jì)算的區(qū)別:
3、神經(jīng)符號(hào)計(jì)算
神經(jīng)符號(hào)極端是指將基于神經(jīng)網(wǎng)絡(luò)的方法與基于符號(hào)知識(shí)的方法結(jié)合的AI計(jì)算。
神經(jīng)符
發(fā)表于 09-14 14:04
【書籍評測活動(dòng)NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》
RISC-V架構(gòu)的AI加速器、量子AI芯片、光電組合AI芯片等。
隨著大模型面臨收益遞減、資源浪費(fèi)等困境,書中接著將目光投向 “后Transformer” 時(shí)代的新興算法。詳細(xì)解讀了
發(fā)表于 07-28 13:54
便攜式AI突破:DFRobot LattePanda Mu 助力泛靈人工智能RM-01實(shí)現(xiàn)“公文包里的超算”
在人工智能算力需求爆炸式增長的今天,傳統(tǒng)GPU服務(wù)器的高功耗、高成本和大體積限制了AI技術(shù)的靈活部署。泛靈人工智能(PanlingAI)推出的RM-01桌面推理超算終端成功
新思科技攜手合作伙伴共同推動(dòng)量子計(jì)算研發(fā)
新思科技攜手惠普實(shí)驗(yàn)室、應(yīng)用材料公司(Applied Materials)、Qolab、Quantum Machines、威斯康星大學(xué)和1QBit等多家合作伙伴,共同推動(dòng)量子計(jì)算研發(fā),旨在構(gòu)建具有實(shí)際工業(yè)應(yīng)用價(jià)值的量子
量子計(jì)算最新突破!“量子+AI”開啟顛覆未來的指數(shù)級革命
電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)量子計(jì)算是一種基于量子力學(xué)原理的新型計(jì)算模式,其核心在于利用量子比
量子計(jì)算在海綿壓縮測試數(shù)據(jù)優(yōu)化中的創(chuàng)新探索
在海綿材料性能測試領(lǐng)域,隨著數(shù)據(jù)維度與計(jì)算復(fù)雜度的指數(shù)級增長,傳統(tǒng)經(jīng)典計(jì)算機(jī)逐漸面臨算力瓶頸。量子計(jì)算
AI驅(qū)動(dòng)量子化學(xué)計(jì)算!4100萬核心國產(chǎn)超算取得世界級突破!
評論