國(guó)家超算互聯(lián)網(wǎng)平臺(tái)正式上線
數(shù)字中國(guó)“高速路”
中央紀(jì)委國(guó)家監(jiān)委網(wǎng)站 李云舒

“神威·太湖之光”問(wèn)世以來(lái),各項(xiàng)性能指標(biāo)持續(xù)位居世界前列,實(shí)現(xiàn)穩(wěn)定、可靠、安全運(yùn)行。圖為工作人員在超級(jí)計(jì)算機(jī)“神威·太湖之光”旁工作。圖片來(lái)源:視覺(jué)中國(guó)
近日,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)正式上線。當(dāng)前,已有超過(guò)170家應(yīng)用、數(shù)據(jù)、模型等服務(wù)商入駐國(guó)家超算互聯(lián)網(wǎng),提供3200余款商品,覆蓋科學(xué)計(jì)算、工業(yè)仿真、AI模型訓(xùn)練等前沿?cái)?shù)字化創(chuàng)新領(lǐng)域。
2023年4月17日,科技部在天津啟動(dòng)部署國(guó)家超算互聯(lián)網(wǎng),提出到2025年底形成技術(shù)先進(jìn)、模式創(chuàng)新、服務(wù)優(yōu)質(zhì)、生態(tài)完善的總體布局。建立國(guó)家超算互聯(lián)網(wǎng)有何意義?它將如何加快形成新質(zhì)生產(chǎn)力,為數(shù)字中國(guó)建設(shè)、數(shù)字經(jīng)濟(jì)發(fā)展提供支撐?記者采訪了國(guó)家超級(jí)計(jì)算濟(jì)南中心主任王英龍、清華大學(xué)高性能計(jì)算研究所副研究員黃震春。
發(fā)展超算對(duì)國(guó)家安全、經(jīng)濟(jì)發(fā)展和社會(huì)建設(shè)有著重要的支撐和保障作用
記者:什么是超算互聯(lián)網(wǎng)?
黃震春:超算互聯(lián)網(wǎng)是一種以超級(jí)計(jì)算機(jī)和高速互聯(lián)網(wǎng)為基礎(chǔ)的國(guó)家級(jí)高性能計(jì)算基礎(chǔ)設(shè)施。它以高速網(wǎng)絡(luò)互聯(lián)地理上分布的超算中心,聚合各超算中心的軟硬件資源,建設(shè)超算資源共享與交易平臺(tái),支持算力、數(shù)據(jù)、軟件、應(yīng)用等資源的共享與交易。
作為一種先進(jìn)計(jì)算基礎(chǔ)設(shè)施,超算互聯(lián)網(wǎng)將超級(jí)計(jì)算機(jī)所提供的強(qiáng)大計(jì)算能力抽象為更加本質(zhì)的計(jì)算服務(wù),并以一種標(biāo)準(zhǔn)化的形式提供給計(jì)算服務(wù)的使用者。簡(jiǎn)單地講,我們可以將超算互聯(lián)網(wǎng)與電力網(wǎng)相類比。電力網(wǎng)制定發(fā)電、傳輸、用電的標(biāo)準(zhǔn)規(guī)范,構(gòu)建基本的電力傳輸和交易平臺(tái),將來(lái)自火電、水電、風(fēng)電、核電、光伏等不同來(lái)源的電力整合到一起,為工業(yè)、農(nóng)業(yè)、居民、科研等各種電力用戶提供即用即得的電力服務(wù)。
與電力網(wǎng)類似,超算互聯(lián)網(wǎng)通過(guò)制定資源接入、共享、交易等規(guī)范,構(gòu)建具備資源共享與交易能力的資源平臺(tái),將來(lái)自各級(jí)超算中心、算力服務(wù)商、科研機(jī)構(gòu)、相關(guān)企業(yè)等不同來(lái)源的算力、數(shù)據(jù)、軟件、應(yīng)用等抽象為統(tǒng)一的超算資源并整合到一起,連接超算資源提供者與超算用戶,為科研、生產(chǎn)、生活和國(guó)家安全等提供高效專業(yè)易用的超算服務(wù)。
記者:發(fā)展超算的意義是什么?當(dāng)前我國(guó)超算發(fā)展水平如何?
王英龍:隨著數(shù)字化進(jìn)程的持續(xù)加速,人工智能、數(shù)字孿生等技術(shù)迅速發(fā)展,培育壯大新質(zhì)生產(chǎn)力,成為破解數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展難題的一把“關(guān)鍵鑰匙”。高性能超級(jí)計(jì)算機(jī)的研發(fā),已成為世界發(fā)達(dá)國(guó)家搶占戰(zhàn)略要地的重要“制高點(diǎn)”。發(fā)展超算對(duì)攻克“卡脖子”問(wèn)題,服務(wù)高新技術(shù)產(chǎn)業(yè)發(fā)展,服務(wù)國(guó)家戰(zhàn)略發(fā)展需要有著不可替代的作用,對(duì)國(guó)家安全、經(jīng)濟(jì)發(fā)展和社會(huì)建設(shè)有著重要的支撐和保障作用。
多年來(lái),在政策支持下,我國(guó)超算產(chǎn)業(yè)堅(jiān)持“機(jī)器、應(yīng)用、環(huán)境”三位一體協(xié)調(diào)發(fā)展策略,在機(jī)器研制、關(guān)鍵應(yīng)用、服務(wù)環(huán)境等方面已處于世界前列。目前,全國(guó)范圍內(nèi)已經(jīng)建成多個(gè)國(guó)家超級(jí)計(jì)算中心,“神威”“天河”“曙光”系列超級(jí)計(jì)算機(jī)多次占據(jù)全球超級(jí)計(jì)算機(jī)性能TOP500領(lǐng)先位置。以濟(jì)南超算為例,核心設(shè)施“山河”超級(jí)計(jì)算平臺(tái),目前高性能計(jì)算能力達(dá)60PFlops(每秒6億億次浮點(diǎn)運(yùn)算),人工智能計(jì)算能力達(dá)到1000Pops,存儲(chǔ)容量245PB,整體性能居世界先進(jìn)水平。在2022與2023年度國(guó)際超算大會(huì)上,“山河”超級(jí)計(jì)算平臺(tái)連續(xù)兩年登頂世界IO500榜單,并將IO500世界紀(jì)錄提高15倍以上,已持續(xù)服務(wù)天氣預(yù)報(bào)與氣候預(yù)測(cè)、海洋環(huán)境模擬分析、信息安全、電磁仿真、工程計(jì)算、金融大數(shù)據(jù)分析、新材料和新能源分析等領(lǐng)域的眾多用戶。
人工智能等技術(shù)快速發(fā)展,全社會(huì)對(duì)算力提出更高要求,構(gòu)建超算互聯(lián)網(wǎng)勢(shì)在必行
記者:為什么要構(gòu)建國(guó)家超算互聯(lián)網(wǎng)?
黃震春:新世紀(jì)以來(lái),超級(jí)計(jì)算機(jī)和高速互聯(lián)網(wǎng)不斷發(fā)展,為面向應(yīng)用領(lǐng)域的高性能計(jì)算環(huán)境制造了新的機(jī)遇和挑戰(zhàn),高性能應(yīng)用平臺(tái)的研究與建設(shè)也越來(lái)越受到關(guān)注。從上世紀(jì)末開始,我國(guó)開展了一系列研究。基于網(wǎng)格計(jì)算技術(shù),我國(guó)建設(shè)了中國(guó)國(guó)家網(wǎng)格(CNGrid)、中國(guó)教育科研網(wǎng)格(ChinaGrid)等多個(gè)高性能計(jì)算環(huán)境,在一定程度上實(shí)現(xiàn)了包括算力資源、數(shù)據(jù)資源、存儲(chǔ)資源等在內(nèi)的高性能計(jì)算資源共享,支持了先進(jìn)制造、地質(zhì)、空間信息、林業(yè)、氣象等多個(gè)領(lǐng)域的高性能計(jì)算應(yīng)用。其后構(gòu)建的國(guó)家高性能計(jì)算環(huán)境則更進(jìn)一步,在網(wǎng)絡(luò)帶寬有限的條件下初步實(shí)現(xiàn)超算資源和應(yīng)用的有效聚合,支持了生物醫(yī)藥、工業(yè)產(chǎn)品設(shè)計(jì)、數(shù)字媒體和文化創(chuàng)意等多個(gè)領(lǐng)域的專業(yè)應(yīng)用。近年來(lái),在國(guó)家重點(diǎn)研發(fā)計(jì)劃等支持下,國(guó)家超算無(wú)錫中心和清華大學(xué)聯(lián)合國(guó)家超算廣州中心、中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心等國(guó)家級(jí)超算中心和超算應(yīng)用單位,共同研究和建設(shè)了超算互聯(lián)網(wǎng)原型——國(guó)家高性能計(jì)算環(huán)境領(lǐng)域應(yīng)用平臺(tái)。該平臺(tái)以100Gbps網(wǎng)絡(luò)實(shí)現(xiàn)各超算中心的高速互聯(lián),匯聚超過(guò)3.6EFlops(每秒360億億次數(shù)學(xué)計(jì)算)的計(jì)算能力,通過(guò)自主研發(fā)的軟件系統(tǒng)實(shí)現(xiàn)超算資源的接入、共享和交易,面向數(shù)個(gè)重點(diǎn)應(yīng)用領(lǐng)域?yàn)楸椴既珖?guó)的國(guó)家實(shí)驗(yàn)室等大型研究機(jī)構(gòu)提供以數(shù)值模擬為主、兼顧數(shù)據(jù)分析和智能計(jì)算的科研基礎(chǔ)設(shè)施服務(wù)。
雖然我國(guó)超級(jí)計(jì)算機(jī)建設(shè)已取得巨大成就,但隨著E級(jí)超算的建設(shè)以及超算應(yīng)用的不斷復(fù)雜化,我國(guó)超算運(yùn)行也面臨一些新的挑戰(zhàn),主要表現(xiàn)在四個(gè)方面:
首先,超級(jí)計(jì)算機(jī)之間,以及超級(jí)計(jì)算機(jī)及其用戶之間的互聯(lián)互通不夠順暢,現(xiàn)有超算間互聯(lián)網(wǎng)絡(luò)帶寬不能滿足超算資源共享、海量數(shù)據(jù)傳輸?shù)男枨螅?/p>
其次,超算應(yīng)用日趨復(fù)雜,有些應(yīng)用場(chǎng)景涉及多過(guò)程、多尺度的復(fù)雜耦合,以及融合數(shù)據(jù)驅(qū)動(dòng)的新模式,算法創(chuàng)新需求緊迫;
第三,由于自主可控的超級(jí)計(jì)算機(jī)研制要求和歷史原因,國(guó)內(nèi)主要超算研制團(tuán)隊(duì)采用不同的自主架構(gòu)并不斷發(fā)展,形成不同架構(gòu)不同系列的超級(jí)計(jì)算機(jī)系統(tǒng),超算上的各種并行應(yīng)用軟件需要對(duì)不同架構(gòu)的超級(jí)計(jì)算機(jī)系統(tǒng)進(jìn)行適配;
最后,超算使用相對(duì)困難,應(yīng)用門檻高,用戶普遍希望超算提供者能夠提供高效、簡(jiǎn)單、易用的應(yīng)用服務(wù)平臺(tái)。
近年來(lái),我國(guó)算力設(shè)施建設(shè)已取得顯著成績(jī),算力總規(guī)模位居全球第二,并且保持著30%左右的年增長(zhǎng)率。但面對(duì)人工智能等技術(shù)的快速發(fā)展,全社會(huì)對(duì)算力提出更高要求。為挖掘我國(guó)超算潛力,應(yīng)對(duì)上述挑戰(zhàn),基于超級(jí)計(jì)算機(jī)和高性能通信網(wǎng)絡(luò)構(gòu)建超算互聯(lián)網(wǎng)勢(shì)在必行。
通過(guò)構(gòu)建超算互聯(lián)網(wǎng),我們可以建立連接各國(guó)家級(jí)超算中心的核心資源網(wǎng),實(shí)現(xiàn)計(jì)算資源的高效共享和管理;面向國(guó)家重大需求,針對(duì)重點(diǎn)應(yīng)用領(lǐng)域,研制支撐領(lǐng)域應(yīng)用的專業(yè)平臺(tái)并開展應(yīng)用;構(gòu)建自主可控的高性能計(jì)算應(yīng)用平臺(tái)服務(wù)體系,提供跨超算中心的統(tǒng)一服務(wù)能力。超算互聯(lián)網(wǎng)的研究與構(gòu)建,將進(jìn)一步提升我國(guó)超級(jí)計(jì)算機(jī)的應(yīng)用水平,為國(guó)家經(jīng)濟(jì)建設(shè)、社會(huì)發(fā)展、科技創(chuàng)新和國(guó)家安全等提供更加強(qiáng)大和易用的超算服務(wù),推動(dòng)算力賦能千行百業(yè)發(fā)展。
超算互聯(lián)網(wǎng)平臺(tái)的構(gòu)建將為我國(guó)算力“新基建”打下可持續(xù)發(fā)展的基礎(chǔ)
記者:超算互聯(lián)網(wǎng)平臺(tái)建設(shè)沒(méi)有經(jīng)驗(yàn)可供借鑒,當(dāng)前超算互聯(lián)網(wǎng)平臺(tái)建設(shè)面臨哪些挑戰(zhàn)?
王英龍:從技術(shù)層面來(lái)看,超算互聯(lián)網(wǎng)仍需要通過(guò)高速網(wǎng)絡(luò)高效連接來(lái)自不同超算中心和資源提供單位的、分布異構(gòu)的超算資源,需要實(shí)現(xiàn)算力、存儲(chǔ)、數(shù)據(jù)等各種高性能計(jì)算資源的共享和高性能計(jì)算任務(wù)的有效調(diào)度。
從人才資源來(lái)看,超算互聯(lián)網(wǎng)的構(gòu)建與運(yùn)營(yíng)涉及高性能計(jì)算、計(jì)算機(jī)網(wǎng)絡(luò)、并行軟件、分布式系統(tǒng)等計(jì)算機(jī)領(lǐng)域的諸多研究方向,尤其離不開以超算中心為主的超算運(yùn)營(yíng)管理與技術(shù)開發(fā)人才,需要具備相關(guān)應(yīng)用領(lǐng)域和行業(yè)專業(yè)知識(shí)、行業(yè)經(jīng)驗(yàn)的人才隊(duì)伍。
從產(chǎn)業(yè)生態(tài)來(lái)看,超算互聯(lián)網(wǎng)構(gòu)建于超級(jí)計(jì)算和高速網(wǎng)絡(luò)的基礎(chǔ)之上,對(duì)相關(guān)產(chǎn)業(yè)生態(tài)的依賴非常明顯,從操作系統(tǒng)、基礎(chǔ)軟件到并行應(yīng)用軟件的開發(fā)與優(yōu)化,這些都會(huì)影響到超算互聯(lián)網(wǎng)的構(gòu)建與運(yùn)營(yíng)。
記者:國(guó)家超算互聯(lián)網(wǎng)平臺(tái)會(huì)對(duì)各行業(yè)的創(chuàng)新與高質(zhì)量發(fā)展帶來(lái)哪些助力?
黃震春:當(dāng)前,我國(guó)的超算應(yīng)用總的來(lái)講與國(guó)外領(lǐng)先水平相比還有較大差距。超算互聯(lián)網(wǎng)的最大特點(diǎn)是變提供超算算力為提供超算應(yīng)用服務(wù),這就帶來(lái)了超算互聯(lián)網(wǎng)在應(yīng)用模式上的巨大變化,對(duì)超算及其應(yīng)用的發(fā)展具有相當(dāng)大的推動(dòng)作用。
超算互聯(lián)網(wǎng)的建設(shè),將有效聚集超算軟硬件資源和人才,基于自主可控的高性能芯片和超算系統(tǒng),研究并行軟件的高效開發(fā)、測(cè)試、遷移、共享和服務(wù)化技術(shù),建立并行軟件開發(fā)平臺(tái),支持和鼓勵(lì)并行應(yīng)用軟件的開發(fā)。同時(shí),超算互聯(lián)網(wǎng)將聚集超算領(lǐng)域和應(yīng)用領(lǐng)域的人才,共同研發(fā)能替代進(jìn)口的主流應(yīng)用軟件,將超級(jí)計(jì)算機(jī)的算力封裝成為用于解決實(shí)際業(yè)務(wù)問(wèn)題的高性能并行軟件服務(wù),從而積累國(guó)產(chǎn)超級(jí)計(jì)算機(jī)上豐富的應(yīng)用軟件資源,逐步實(shí)現(xiàn)國(guó)產(chǎn)化替代,使寶貴的硬件資源得到有效利用。
超算應(yīng)用服務(wù)是一個(gè)高門檻業(yè)務(wù),需要大量資源。超算互聯(lián)網(wǎng)為超算應(yīng)用服務(wù)提供了一個(gè)開放、合作的應(yīng)用軟件發(fā)展平臺(tái),大大降低提供超算服務(wù)的門檻,將吸引眾多創(chuàng)業(yè)公司以及行業(yè)領(lǐng)先企業(yè)開展超算技術(shù)方面的研發(fā),并建立自己的超算應(yīng)用服務(wù)體系,引導(dǎo)與培育超算資源和服務(wù)的商品化和市場(chǎng)化,從而推動(dòng)超算及應(yīng)用的發(fā)展,取得極大的經(jīng)濟(jì)效益與社會(huì)效益。
超算是一項(xiàng)系統(tǒng)工程,需要芯片、操作系統(tǒng)、應(yīng)用軟件等多個(gè)方面的支撐。超算互聯(lián)網(wǎng)的建設(shè)與發(fā)展在有效集中優(yōu)勢(shì)力量,解決超算應(yīng)用的各個(gè)環(huán)境環(huán)節(jié)的核心問(wèn)題,提升我國(guó)算力水平和應(yīng)用水平的同時(shí),還將有效輻射帶動(dòng)我國(guó)芯片及軟件產(chǎn)業(yè)的協(xié)同發(fā)展,推動(dòng)我國(guó)自主基礎(chǔ)軟硬件產(chǎn)業(yè)生態(tài)的發(fā)展壯大。超算互聯(lián)網(wǎng)的技術(shù)與推廣經(jīng)驗(yàn)還可以支持超級(jí)計(jì)算和智能計(jì)算的結(jié)合,建設(shè)兼?zhèn)涑?jí)計(jì)算與智能計(jì)算能力的智能超算網(wǎng)絡(luò),有效推動(dòng)更廣意義上的算力網(wǎng)絡(luò)的建設(shè)與產(chǎn)業(yè)發(fā)展。
新基建、“東數(shù)西算”等戰(zhàn)略的實(shí)施對(duì)于推動(dòng)算力、算法、數(shù)據(jù)、應(yīng)用資源集約化和服務(wù)化創(chuàng)新提出了更高要求,對(duì)構(gòu)建提供高端算力服務(wù)的一體化先進(jìn)計(jì)算基礎(chǔ)設(shè)施提出新的挑戰(zhàn)。超算互聯(lián)網(wǎng)的實(shí)施和發(fā)展,將在國(guó)家層面給出實(shí)現(xiàn)全國(guó)大數(shù)據(jù)中心一體化協(xié)同創(chuàng)新的高質(zhì)量解決方案,為開啟算力經(jīng)濟(jì)時(shí)代的世紀(jì)工程提供堅(jiān)實(shí)的基礎(chǔ),推動(dòng)新基建、“東數(shù)西算”等國(guó)家戰(zhàn)略的實(shí)施。總的來(lái)說(shuō),超算互聯(lián)網(wǎng)平臺(tái)的構(gòu)建將為我國(guó)算力“新基建”打下一個(gè)可持續(xù)發(fā)展的基礎(chǔ),為實(shí)現(xiàn)我國(guó)的高質(zhì)量發(fā)展和科技自立自強(qiáng)做出貢獻(xiàn)。
王英龍:超算互聯(lián)網(wǎng)建成后,一方面可實(shí)現(xiàn)對(duì)普通互聯(lián)網(wǎng)的“超算賦能”,升級(jí)改造;另一方面,通過(guò)超算互聯(lián)網(wǎng),可將算力輸送到各個(gè)城市、各個(gè)企業(yè)、千家萬(wàn)戶,讓大家便利地使用超級(jí)計(jì)算的算力。
以濟(jì)南超算為例,我們正圍繞國(guó)家在超算互聯(lián)網(wǎng)、中國(guó)算力網(wǎng)等領(lǐng)域的規(guī)劃部署,積極匯聚行業(yè)資源,探索算網(wǎng)管理運(yùn)營(yíng)的可持續(xù)發(fā)展機(jī)制,推動(dòng)形成行業(yè)標(biāo)準(zhǔn)規(guī)范,培育算力應(yīng)用的新模式、新場(chǎng)景和新業(yè)態(tài),打造超算互聯(lián)網(wǎng)在數(shù)字政府、生態(tài)環(huán)境、智能制造、新能源新材料、醫(yī)養(yǎng)健康、教育培訓(xùn)等場(chǎng)景的示范應(yīng)用,推動(dòng)科學(xué)研究、工程技術(shù)、產(chǎn)業(yè)發(fā)展、社會(huì)民生等領(lǐng)域數(shù)字化、智能化轉(zhuǎn)型不斷加速,為數(shù)字經(jīng)濟(jì)發(fā)展筑基賦能。經(jīng)過(guò)持續(xù)科研攻關(guān)與探索,濟(jì)南超算已在高速網(wǎng)絡(luò)通信、網(wǎng)絡(luò)資源感知調(diào)度、算力網(wǎng)絡(luò)融合和安全方面突破了一批關(guān)鍵技術(shù)。目前,已構(gòu)建了覆蓋山東省16地市的“山東算網(wǎng)”,并聯(lián)合沿黃流域九省區(qū)的11所超算中心、計(jì)算中心和算力樞紐成立了“黃河流域算網(wǎng)聯(lián)盟”,上線了全國(guó)首個(gè)“黃河工業(yè)算力調(diào)度服務(wù)平臺(tái)”。基于覆蓋全省的超算算力底座,我們就可以部署大應(yīng)用軟件,深入推動(dòng)算力賦能實(shí)體經(jīng)濟(jì)。此外,超算互聯(lián)網(wǎng)還會(huì)為工業(yè)設(shè)計(jì)、工程仿真、大數(shù)據(jù)處理、VR/AR等需要大量數(shù)據(jù)傳輸以及頻繁操作交互的應(yīng)用提供更好的用戶體驗(yàn)。