工業(yè)和信息化部近日印發(fā)通知,組織開(kāi)展算力強基揭榜行動(dòng)。將面向計算、存儲、網(wǎng)絡(luò )、應用、綠色、安全等六大重點(diǎn)方向,發(fā)掘一批掌握關(guān)鍵核心技術(shù)、具備較強創(chuàng )新能力的企事業(yè)單位,突破一批標志性技術(shù)產(chǎn)品和方案。工業(yè)和信息化部將統籌利用各類(lèi)資源對揭榜入圍、優(yōu)勝單位予以支持,推動(dòng)優(yōu)秀成果示范應用推廣。
各省、自治區、直轄市工業(yè)和信息化主管部門(mén)、通信管理局以及有關(guān)中央企業(yè):
為夯實(shí)算力網(wǎng)絡(luò )發(fā)展底座,加快創(chuàng )新技術(shù)和產(chǎn)品應用,推動(dòng)算力網(wǎng)絡(luò )點(diǎn)、鏈、網(wǎng)、面體系化發(fā)展,現組織開(kāi)展算力強基揭榜行動(dòng)。有關(guān)事項通知如下:
一、揭榜任務(wù)內容
面向算力網(wǎng)絡(luò )的計算、存儲、網(wǎng)絡(luò )、應用、綠色、安全等六大重點(diǎn)方向,發(fā)掘一批掌握關(guān)鍵核心技術(shù)、具備較強創(chuàng )新能力的企事業(yè)單位,突破一批標志性技術(shù)產(chǎn)品和方案。
計算方面,攻關(guān)智能算力管理、算力加速等技術(shù),提高計算性能與效率;存儲方面,研發(fā)多介質(zhì)存儲設備管理、跨域存儲資源池協(xié)同等技術(shù),實(shí)現海量數據可靠與靈活存儲;網(wǎng)絡(luò )方面,突破算內網(wǎng)絡(luò )與算間網(wǎng)絡(luò )等技術(shù),促進(jìn)算力資源高速互聯(lián);應用方面,加強算力與行業(yè)深度融合,實(shí)現多場(chǎng)景便捷用算;綠色方面,研發(fā)新型制冷、碳排放感知優(yōu)化等技術(shù),推動(dòng)算力設施節能降碳;安全方面,推動(dòng)智能監測、運維機器人等技術(shù)發(fā)展,保障算力中心可靠運行。
二、申報和推薦
?。ㄒ唬┥陥髥挝豁殲樵谥腥A人民共和國境內注冊、具有獨立法人資格、具有較強技術(shù)創(chuàng )新和產(chǎn)業(yè)化應用能力的企事業(yè)單位。申報單位根據《算力強基揭榜行動(dòng)任務(wù)榜單》(見(jiàn)附件)選擇揭榜任務(wù),并需承諾揭榜后能夠在指定期限內完成相應任務(wù),每個(gè)單位申報不超過(guò)3個(gè)項目。有關(guān)企業(yè)、高校、科研機構等以聯(lián)合體方式申報的,牽頭單位為1家,聯(lián)合參與單位不超過(guò)4家。
?。ǘ└魇?、自治區、直轄市工業(yè)和信息化主管部門(mén)、通信管理局以及有關(guān)中央企業(yè)按照政府引導、企業(yè)自愿的原則,組織有關(guān)單位積極申報揭榜,并作為推薦單位,遵循公開(kāi)、公平、公正的原則,審核遴選推薦創(chuàng )新能力突出、產(chǎn)業(yè)化前景好、行業(yè)帶動(dòng)作用明顯的項目,報工業(yè)和信息化部(信息通信發(fā)展司)。
三、工作程序和要求
?。ㄒ唬┥陥髥挝煌ㄟ^(guò)申報系統(https://gs.hcp.ac.cn)進(jìn)行申報,完成注冊后填寫(xiě)申報所需材料。申報截止時(shí)間為2025年3月15日。
?。ǘ└魇?、自治區、直轄市工業(yè)和信息化主管部門(mén)、通信管理局以及有關(guān)中央企業(yè)作為推薦單位,應于2025年3月31日前登錄系統并確認推薦名單(賬號密碼請通過(guò)聯(lián)系人獲?。?。推薦單位在每個(gè)方向推薦項目數量原則上不超過(guò)3個(gè),所有方向累計推薦項目總量不超過(guò)20個(gè)。鼓勵各推薦單位結合實(shí)際情況,對推薦項目單位在政策、資金、資源配套等方面加大扶持力度。
?。ㄈ┕I(yè)和信息化部組織遴選并公布入圍揭榜單位名單。入圍揭榜單位完成攻關(guān)任務(wù)后(名單公布之日起不超過(guò)2年),工業(yè)和信息化部委托第三方專(zhuān)業(yè)機構開(kāi)展測評工作,擇優(yōu)確定揭榜優(yōu)勝單位(每個(gè)揭榜方向原則上不超過(guò)3家)。工業(yè)和信息化部將統籌利用各類(lèi)資源對揭榜入圍、優(yōu)勝單位予以支持,推動(dòng)優(yōu)秀成果示范應用推廣。
附件:算力強基揭榜行動(dòng)任務(wù)榜單
工業(yè)和信息化部辦公廳
2025年2月21日
CAICT
附件
算力強基揭榜行動(dòng)任務(wù)榜單
一、計算
(一)云邊端算網(wǎng)協(xié)同管理系統
揭榜任務(wù):面向云邊端多層級算力環(huán)境,研發(fā)算網(wǎng)協(xié)同應用管理系統,設計面向不同應用軟件架構的管理機制,支持對不同架構應用軟件的統一管理;研發(fā)應用軟件在算網(wǎng)協(xié)同中的自動(dòng)化構建部署能力,支持應用軟件的自動(dòng)構建和分發(fā)部署;研究算網(wǎng)協(xié)同應用系統的一體化觀(guān)測能力,降低運維復雜度,提高復雜應用軟件運行的穩定性和可靠性。
預期目標:到2026年,研制應用軟件管理系統,支持對傳統應用軟件、云原生應用軟件、AI應用軟件、大數據應用軟件等不少于5種應用軟件的全生命周期管理。研究基于算網(wǎng)協(xié)同的分布式構建和部署技術(shù),支持上述應用軟件的自動(dòng)分發(fā)和跨算力節點(diǎn)部署,實(shí)現零人工介入。研發(fā)算網(wǎng)應用一體化觀(guān)測功能,具備白盒化動(dòng)態(tài)分析以及智能故障根因定位能力。在不少于3個(gè)行業(yè)完成試點(diǎn)驗證。
?。ǘ┲С殖笠幠的P偷挠柾埔惑w化異構智算平臺
揭榜任務(wù):面向人工智能大模型訓練和推理對計算資源的需求,研發(fā)支持超大規模參數模型的訓練、推理一體化智算平臺,包括資源調度策略、訓推加速套件等,并可支持多種硬件架構,屏蔽底層硬件差異,提升超大規模模型在訓練、推理過(guò)程中穩定性、資源利用率和運行效率。
預期目標:到2026年,研發(fā)一套支持萬(wàn)億參數模型的超大規模訓推一體化智算平臺,萬(wàn)卡環(huán)境下穩定訓練時(shí)間不低于30天,有效訓練時(shí)長(cháng)不低于95%,訓練效率較當前主流水平提升不低于30%,推理效率提升不低于50%。支持主流深度學(xué)習框架,兼容多種硬件架構,并提供統一的編程接口和開(kāi)發(fā)環(huán)境,實(shí)現不低于10個(gè)行業(yè)用戶(hù)的落地驗證。
?。ㄈ┊悩嬎懔缬蛉蝿?wù)編排系統
揭榜任務(wù):針對跨域異構算力協(xié)同,研發(fā)跨域異構算力管理系統,實(shí)現跨域異構算力的管理和應用。研發(fā)針對多樣性算力的規范化開(kāi)放互聯(lián)功能,支持對不同類(lèi)型的異構算力模型統一抽象封裝;研發(fā)跨域異構算力的管理功能,支持對跨域異構算力的統一管理和協(xié)同;研究跨域多主體算力的安全認證和控制方法,保障跨域協(xié)同安全。
預期目標:到2026年,研發(fā)不少于6種跨域協(xié)同調度算法,支持數據處理、函數計算、機器學(xué)習等不少于3個(gè)場(chǎng)景的計算任務(wù)部署,完成不少于5個(gè)跨域算力中心的統一管理。研發(fā)跨域多主體算力的安全認證方法,支持云邊端等不同層級算力協(xié)同的安全要求。在不少于2個(gè)行業(yè)完成試點(diǎn)驗證。
?。ㄋ模┯柾扑懔σ惑w機
揭榜任務(wù):面向人工智能訓練、推理場(chǎng)景,研發(fā)基于基礎設施即服務(wù)(IaaS)和平臺即服務(wù)(PaaS)的高性能訓推一體化解決方案,覆蓋對大模型開(kāi)發(fā)訓練和部署推理的全流程,包括數據準備、模型訓練、模型評測和模型部署。同時(shí),支持大模型加密、攻擊防御等能力,解決針對大模型數據泄露、指令攻擊等安全問(wèn)題和風(fēng)險。
預期目標:到2026年,研發(fā)支持至少3種指令集芯片的訓推一體機,針對至少5個(gè)行業(yè)開(kāi)展人工智能訓推一體機應用,為用戶(hù)提供多元化訓推一體化服務(wù),并在至少10種不同的場(chǎng)景進(jìn)行人工智能訓推一體機落地。
?。ㄎ澹┐笠幠.悩嬎懔和评砑铀偌夹g(shù)
揭榜任務(wù):研發(fā)存儲、網(wǎng)絡(luò )、計算的協(xié)同優(yōu)化技術(shù),通過(guò)模型加速、調度加速等方法實(shí)現大規模異構算力集群在大模型推理方面的加速,從而支持更大的模型、更長(cháng)的上下文、更高的性能及更低的能耗,促進(jìn)算力芯片在大模型推理方面的更好應用。
預期目標:到2026年,實(shí)現集群有效吞吐量5倍以上提升,實(shí)際應用場(chǎng)景中可處理的請求數提升1倍以上,首字延遲性能提升1倍以上,芯片利用率提升50%以上。通過(guò)優(yōu)化算力中心計算、存儲、網(wǎng)絡(luò )的配比以及拓撲結構和系統調度策略,實(shí)現千卡以上異構集群在推理加速領(lǐng)域的突破。
二、存儲
(六)磁光電融合存儲系統
揭榜任務(wù):針對單一存儲介質(zhì)難以滿(mǎn)足多樣化數據存儲需求的現狀,依托磁、光、電存儲在性能、壽命、功耗等方面的差異化特性,將磁、光、電存儲技術(shù)進(jìn)行融合,研發(fā)磁光電融合存儲系統,構建基于固態(tài)硬盤(pán)(SSD)、機械硬盤(pán)(HDD)和光存儲的多級存儲架構。根據業(yè)務(wù)特征,將數據保存在不同級別的存儲設備中,實(shí)現海量數據的集中、統一存儲管理,支撐算力中心高效、低碳、安全持續發(fā)展。
預期目標:到2026年,研發(fā)磁、光、電融合存儲系統,支持適配分布式文件、分布式塊和分布式對象等至少3種存儲類(lèi)型,系統可以根據數據的訪(fǎng)問(wèn)時(shí)間、訪(fǎng)問(wèn)頻率、文件屬性等自定義分級策略,根據業(yè)務(wù)負載動(dòng)態(tài)調整遷移。系統可通過(guò)介質(zhì)安全、系統安全、軟件安全等夯實(shí)底層安全能力,通過(guò)防勒索、加密算法、遠程監控、光存儲預警檢測等增強數據安全能力。打造磁光電融合存儲應用示范,完成至少20個(gè)業(yè)務(wù)系統應用,實(shí)現至少4個(gè)東部地區數據流動(dòng)至西部磁光電存儲系統,且數據存儲量不少于10PB。
?。ㄆ撸┐鎯φ{度管理及應用技術(shù)
揭榜任務(wù):針對海量數據存儲和算力孤島問(wèn)題,研發(fā)跨域多算的存力調度、存網(wǎng)編排和存算網(wǎng)一體化系統,實(shí)現數據的智能冷熱分級、應用的跨域無(wú)感訪(fǎng)問(wèn)等能力,有效降低成本、提高性能和支撐業(yè)務(wù)。系統具備資源規劃、策略調整能力,可優(yōu)化和調整全網(wǎng)數據存儲布局,實(shí)現對不斷變化的需求的適應。
預期目標:到2026年,研制具備高效、可擴展性的存儲系統,基于智能算法,對數據進(jìn)行分析和調度,實(shí)現應用無(wú)感訪(fǎng)問(wèn)和智能流動(dòng)。研究存力調度策略,使數據召回率控制在30%以下;研究基于潮汐網(wǎng)絡(luò )調度算法,實(shí)現網(wǎng)絡(luò )帶寬利用率提升50%以上,達到存網(wǎng)一體的目標。集成存儲、計算和網(wǎng)絡(luò )的能力,支持存算網(wǎng)一體化調度,在算力中心資源池落地應用。
三、網(wǎng)絡(luò )
(八)高性能數據處理器(DPU)
揭榜任務(wù):開(kāi)展基于芯粒(Chiplet)和第五代精簡(jiǎn)指令集(RISC-V)技術(shù)的軟硬件一體DPU芯片技術(shù)研究,支持算力中心、智算中心、超算中心場(chǎng)景所需的超高帶寬和超低時(shí)延,突破Chiplet異構芯片封裝技術(shù)、高速Serdes通信、大規模無(wú)損網(wǎng)絡(luò )擁塞算法、硬件密碼算法、高性能虛擬化、硬件可編程等技術(shù),實(shí)現基于A(yíng)RM、X86、RISC-V等異構核心的DPU應用,提升算力中心基礎設施處理能力和數據傳輸能效比。
預期目標:到2026年,完成超高性能DPU芯片研發(fā)工作,吞吐能力達到400Gbps,單向流量時(shí)延不高于30us,支持與國內外主流CPU、GPU芯片平臺的適配,支持主流操作系統兼容,支持數據報文硬件處理邏輯可編程。
?。ň牛┗赗oCE的智算網(wǎng)絡(luò )
揭榜任務(wù):面向RoCE網(wǎng)絡(luò )開(kāi)展設備及管控系統研發(fā),通過(guò)提高設備帶寬、優(yōu)化負載均衡算法、強化網(wǎng)絡(luò )流量規劃及運維能力等方式,提升RoCE網(wǎng)絡(luò )的吞吐量和時(shí)延性能。研制新一代智能化管控工具,引入AI大模型能力,簡(jiǎn)化RoCE網(wǎng)絡(luò )的部署和配置工作,實(shí)現全局、多維度的可視化運維。在網(wǎng)絡(luò )波動(dòng)、業(yè)務(wù)變更、故障等情況下,網(wǎng)絡(luò )參數自動(dòng)調整,流量快速切換,從而達到提升網(wǎng)絡(luò )效率和降低運維成本的目標。
預期目標:到2026年,實(shí)現新型RoCE網(wǎng)絡(luò )整體方案的商用部署,網(wǎng)絡(luò )性能提升10%以上。通過(guò)智能化管控及運維工具,網(wǎng)絡(luò )部署難度大幅降低,運維效率提升50%以上,可支撐更大規模部署和應用。
?。ㄊ┕饨粨Q智算網(wǎng)絡(luò )技術(shù)研究與驗證
揭榜任務(wù):面向智算集群低功耗、高帶寬、低延遲技術(shù)需求,開(kāi)展智算集群光交換組網(wǎng)關(guān)鍵技術(shù)研究與驗證,重點(diǎn)突破智算集群光交換組網(wǎng)、路由協(xié)議適配等關(guān)鍵技術(shù)。針對智算集群的功能、性能、可靠性和擴展性等要求,研究光拓撲映射、光電混合路由、多路徑負載均衡等技術(shù)。
預期目標:到2026年,實(shí)現支持智算集群的易操作、高可靠、可平滑過(guò)渡升級的光網(wǎng)絡(luò ),支持人工智能等關(guān)鍵業(yè)務(wù)承載;光交換設備單端口速率支持100GE/400GE/800GE,交換容量彈性可擴展,可支持不少于3種異構算力資源互聯(lián),在不少于2個(gè)智算集群完成驗證,并完成不少于3種智算業(yè)務(wù)承載驗證。
?。ㄊ唬┟嫦蚍植际街撬阒行牡木W(wǎng)絡(luò )關(guān)鍵技術(shù)研究與驗證
揭榜任務(wù):針對智算集群從集中式向分布式部署探索的趨勢,攻關(guān)算力中心間網(wǎng)絡(luò )技術(shù),研發(fā)面向智算中心間的高可靠傳輸設備,構建智算中心間超大容量、超低時(shí)延、超高可靠光電協(xié)同網(wǎng)絡(luò ),實(shí)現智算中心高速、可靠互聯(lián)。
預期目標:到2026年,突破智算中心間超大容量、超高可靠網(wǎng)絡(luò )傳輸關(guān)鍵技術(shù),研制面向智算中心間網(wǎng)絡(luò )的傳輸設備,單波速率不低于1.6Tbps,設備時(shí)延不超過(guò)30us,支撐分布式智算中心間業(yè)務(wù)的高可靠傳輸。
四、應用
(十二)智算中心跨域互聯(lián)應用
揭榜任務(wù):優(yōu)化人工智能算力基礎設施布局,構建跨地域互補、協(xié)同算力調度的超大規模人工智能算力服務(wù)能力。加強與人工智能芯片廠(chǎng)商的兼容適配,構筑大規模高性能異構算力池,提供面向大模型訓推場(chǎng)景深度優(yōu)化的彈性調度、彈性容錯、高資源利用率的人工智能算力服務(wù)。
預期目標:到2026年,形成覆蓋5個(gè)以上全國重點(diǎn)算力樞紐節點(diǎn)的人工智能算力中心,支持跨地域、跨云的算力需求感知和動(dòng)態(tài)調度,完成3款以上算力芯片適配,聚焦大模型訓練和推理場(chǎng)景,構建大規模、高性能、彈性調度、高容錯的訓推一體算力資源池,具備分鐘級斷點(diǎn)續訓能力,支持萬(wàn)卡級別并行訓練。
?。ㄊ┧懔﹄娏f(xié)同應用
揭榜任務(wù):研發(fā)基于算力調度技術(shù)與能源大模型的多云異構算電協(xié)同管理平臺,構建基于數據驅動(dòng)的算力集群用電負荷特性模型、基于計算任務(wù)的時(shí)空轉移特性的能源大模型,推動(dòng)算力預測與調度技術(shù)在智算中心應用落地,提升整體資源利用率,基于新能源、新型儲能系統開(kāi)展算力負荷與電力系統的協(xié)同優(yōu)化,實(shí)現精準、動(dòng)態(tài)、實(shí)時(shí)的能源調度與交易,實(shí)現算力與電力等能源的深度協(xié)同。
預期目標:到2026年,實(shí)現智算場(chǎng)景下能源與算力全鏈路的數據穿透及流程整合,構建算隨電動(dòng)的直接控制及間接引導機制,實(shí)現算力需求預測精準度達到70%、集群有效負載率提升25%以上,智算中心整體集群資源利用率提高10%。結合算力集群用電數據、時(shí)間周期、氣象數據、工作負載等多種因素,實(shí)現電隨算用的能源效率優(yōu)化與算效提升,實(shí)現基礎設施用能決策精準度85%以上,響應時(shí)效性達到提前15分鐘響應級別,智算中心整體算力能效水平提升30%,算力中心用電成本降低5%以上。
?。ㄊ模┐笠幠Mㄐ艠I(yè)務(wù)場(chǎng)景中的算力應用
揭榜任務(wù):圍繞網(wǎng)絡(luò )功能虛擬化(NFV)系統架構,針對NFV中網(wǎng)絡(luò )性能、資源利用和靈活展性等方面的挑戰,研發(fā)面向NFV架構的高性能虛擬化、智能化網(wǎng)絡(luò )管理和資源編排算法等技術(shù)和系統,突破虛擬化層與硬件加速器(如FPGA、DPU、GPU)之間的協(xié)同能力。
預期目標:到2026年,NFV算力平臺系統中實(shí)現對虛擬化網(wǎng)絡(luò )功能的智能調度,支持異構集群部署、動(dòng)態(tài)擴展,資源動(dòng)態(tài)分配,虛擬化資源利用率提升20%以上;支持GPU、FPGA等硬件加速器的虛擬化調度,加速網(wǎng)絡(luò )處理性能至Tbps以上;支持智能化網(wǎng)絡(luò )虛擬化功能管理,提升NFV系統的自動(dòng)化運維能力和管理效能,故障修復時(shí)間縮減不低于30%。
五、綠色低碳
(十五)綠色算力技術(shù)研究及應用
揭榜任務(wù):圍繞算力的綠色節能技術(shù)突破,面向算力中的任務(wù)調度特性、能源使用模式、負載均衡要求等關(guān)鍵要素,研發(fā)適應于綠色計算的動(dòng)態(tài)資源調度算法、能耗優(yōu)化管理系統,以及面向多場(chǎng)景的協(xié)同節能機制,突破節能算法的智能化程度,提升算力網(wǎng)絡(luò )中多節點(diǎn)的能源利用效率。
預期目標:到2026年,能耗管理系統實(shí)現對算力中心和網(wǎng)絡(luò )節點(diǎn)的實(shí)時(shí)監控與節能調度,通過(guò)計算節點(diǎn)支持動(dòng)態(tài)調頻、動(dòng)態(tài)電壓調節,單節點(diǎn)平均能耗降低30%以上,滿(mǎn)足AI推理等應用需求。
?。ㄊ┢髽I(yè)綠色計算碳感知平臺
揭榜任務(wù):建立企業(yè)算力中心碳排放度量體系,能夠實(shí)時(shí)、精準地統計企業(yè)各個(gè)算力中心碳排放,并能將碳排放量分攤到不同的業(yè)務(wù)部門(mén)、應用場(chǎng)景和工作負載,實(shí)現精細化的碳排放的管理。同時(shí),基于碳排放的數據,實(shí)現碳感知調度能力,通過(guò)在保證業(yè)務(wù)體驗和連續性的情況下將工作負載調度到更加低碳的算力中心,進(jìn)一步降低碳排放。
預期目標:到2026年,圍繞千萬(wàn)核級別跨域的算力中心,構建企業(yè)級綠色計算碳感知平臺,形成一套行業(yè)通用的、可精確度量不同類(lèi)型工作負載碳排放的技術(shù)方法和指標體系,通過(guò)生態(tài)共建形成綠色度量衡標準體系。構建碳感知調度能力,達到算力中心可再生能源比例30%的目標。
?。ㄊ撸├浒迨揭豪湓麢C柜服務(wù)器
揭榜任務(wù):面向新一代液冷算力中心,研發(fā)冷板式液冷整機柜,包括液冷服務(wù)器節點(diǎn)、無(wú)源液冷門(mén)等,突破高密算力、多樣性算力的散熱技術(shù)及架構要求,實(shí)現支持供電總線(xiàn)、網(wǎng)絡(luò )互聯(lián)總線(xiàn)、液冷管路可盲插運維的液冷設備,具備液冷機柜及液冷服務(wù)器等多級漏液檢測能力,有效降低業(yè)務(wù)中斷范圍與損失。
預期目標:到2026年,液冷整機柜實(shí)現100%液冷散熱,制冷PUE低于1.15。整機柜服務(wù)器內部實(shí)現全盲插設計,管理模塊可實(shí)現整機柜功耗管理、漏液檢測、資產(chǎn)管理等功能;通用算力單柜功率不低于20kW,智能算力單機柜功率不低于30kW,實(shí)現不少于500臺液冷節點(diǎn)的規模落地應用。
?。ㄊ耍┧懔χ行墓澞苷{優(yōu)平臺
揭榜任務(wù):研制高精確度、高仿真效率、多場(chǎng)景覆蓋的算力中心PUE仿真平臺,突破物理機理模型構建、仿真引擎集群、模型自動(dòng)生成等關(guān)鍵技術(shù),實(shí)現對算力中心不同運行狀態(tài)下細分時(shí)間顆粒度PUE的快速、精準評估。研發(fā)基于大數據分析技術(shù)的算力中心制冷系統AI節能優(yōu)化系統,通過(guò)自動(dòng)化數據治理、自動(dòng)推理等關(guān)鍵技術(shù),準確匹配制冷需求,在滿(mǎn)足可靠性要求條件下實(shí)現算力中心制冷系統整體動(dòng)態(tài)實(shí)時(shí)優(yōu)化,優(yōu)化算力中心PUE。
預期目標:到2026年,支持液冷、水冷等至少2類(lèi)典型制冷場(chǎng)景進(jìn)行能效優(yōu)化,支持制冷系統和配電系統聯(lián)合仿真,系統可輸出不同負載及運行工況條件下的PUE運行曲線(xiàn)、系統設備運行模擬工況等參數,PUE仿真精度達到97%以上?;谀苄?yōu)化平臺,支持AI自動(dòng)推理,小時(shí)級策略自動(dòng)下發(fā),實(shí)現對算力中心能耗的可視、可管、可控。通過(guò)AI能效優(yōu)化,實(shí)現算力中心PUE降低5%以上,通過(guò)算力中心基礎設施與IT聯(lián)動(dòng)節能,實(shí)現總能耗降低5%以上,在5個(gè)以上算力中心落地應用。
?。ㄊ牛┬滦椭评湎到y
揭榜任務(wù):研發(fā)人工智能節能系統,針對算力中心基礎設施的運行調控和環(huán)境監測。提出全新自適應算法,突破原有常見(jiàn)算法的局限性,提升數據的分析和處理效果,搭建基于專(zhuān)家經(jīng)驗的人工智能算法數據庫,提升包括能耗管理、能源調度、安全監測、故障診斷、輔助運維等功能的節能性、可靠性、經(jīng)濟性。
預期目標:到2026年,在滿(mǎn)足制冷要求的基礎上,提高冷卻系統的可靠性和自適應性,提高能源使用效率、水資源使用效率和運維效率,其中節電率提升10%以上。支持冷卻系統數據采集、標注、治理、存儲,具備系統運行異常告警、告警收斂、自動(dòng)診斷、遠程通信、自動(dòng)控制等功能,支持冷卻系統智能化調優(yōu)、智能化控制的核心能力,并開(kāi)展不少于5個(gè)實(shí)際業(yè)務(wù)場(chǎng)景所提供的AI節能調優(yōu)案例。
六、安全可靠
(二十)算力中心智能運維機器人
揭榜任務(wù):研發(fā)算力中心智能運維機器人以及智能機器人管理平臺,基于云邊端三層架構,實(shí)現智能機器人在多層、多房間樓宇機房?jì)鹊脑O備設施識別、多模態(tài)環(huán)境感知、精準空間定位、智能人機協(xié)同、多任務(wù)聯(lián)合調度等方面的技術(shù)與算法優(yōu)化。支撐機器人在算力中心設施運維和IT運營(yíng)等典型場(chǎng)景的應用,提升巡檢質(zhì)量,促進(jìn)算力中心運維、運營(yíng)的降本增效。
預期目標:到2026年,實(shí)現大型算力中心內智能機器人的多機房、多樓層協(xié)同應用部署;機器人巡檢任務(wù)成功率不低于95%,設備識別準確率達到97%,環(huán)境巡檢召回率不低于90%,保障算力中心巡檢業(yè)務(wù)持續運行。實(shí)現云邊端協(xié)同調度,支持不同場(chǎng)景下的自主作業(yè),提高任務(wù)并發(fā)執行效率,促進(jìn)穩定、安全、可靠、可控的算力中心智能運維體系建設。
?。ǘ唬┰七叾艘惑w化智能監測平臺
揭榜任務(wù):開(kāi)發(fā)高性能云邊端一體化系統,研發(fā)以智能化終端或機器人為硬件載體、以多算法模型融合和平臺工具為軟件載體的軟硬結合的集中監測管理與運維巡檢方案。突破多層級自動(dòng)化運維、多維度診斷、多平臺覆蓋、多模型量化等關(guān)鍵技術(shù)。構建綜合運維健康度數字化評估體系與模型,實(shí)現算力設施從規劃、設計、建設、部署、運行、維護的全生命周期數字化管理。
預期目標:到2026年,建立大規模集群的智能化運維能力,設備實(shí)現跨平臺及系統穩定性風(fēng)險和安全風(fēng)險識別能力,綜合視頻識別技術(shù)等,結構化告警收斂推送,準確率超過(guò)98%。算力設施全生命周期數字化聯(lián)動(dòng),平臺自動(dòng)化流程推進(jìn),實(shí)現云端直控覆蓋超10棟算力中心,落地數字化算力中心健康度評估,智能化終端或機器人的自驅動(dòng)巡檢,視頻流識別與告警的聯(lián)動(dòng),系統的智能化運維問(wèn)答,并保障業(yè)務(wù)服務(wù)級別協(xié)議(SLA)達標率99%以上。
七、其他
?。ǘ┢渌懔︻I(lǐng)域的特色化技術(shù)、產(chǎn)品、服務(wù)和平臺等,應具有技術(shù)先進(jìn)性,技術(shù)成熟度較高,產(chǎn)業(yè)化前景較好。
附:
1.算力強基揭榜單位推薦表
2.算力強基揭榜單位申報材料
聯(lián)系方式
王老師 wangshaopeng@caict.ac.cn