日前,2024數字基礎設施高質量發展大會在深圳成功召開,中國信通院云大所總工程師郭亮應邀發表《智算發展現狀與趨勢》的主題報告;中國算力平臺在會議現場同步設置演示展區,圍繞算力生態開展宣介活動。
近日,IEEE《2025年及以后的技術影響》的評選中,AI當之無愧得到了最多的票數,被認為是2025年最重要的技術,且將在安全、教育、健康、能源等方面發揮重要的賦能作用。斯坦福大學的《全球人工智能實力排行榜》,從8個方面42個維度對全球36個國家的人工智能實力進行了評估,美國加權指數總分位居第一;中國在研發、經濟和基礎設施方面表現突出,位居全球第二。據公開信息,我國2024年發布招投標信息的200多個智算中心分布于全國26個省市自治區的100多個地市,有遍地開花之勢;截止2024年11月,我國備案的大模型達到252個。
郭亮認為,集群是智算用得好的首要關鍵。只要Scaling Law繼續生效,大規模算力就具有其獨特的優勢。另外,大集群對基礎設施帶來了巨大的挑戰,液冷已經在xAI的10萬卡集群中得到了規模部署;亞馬遜、微軟等開始加大對小型核反應堆的關注。近日,ODCC(開放數據中心委員會)啟動聚焦百萬量級GPU集群的MegaScaleOut項目,是網絡領域的很好應對。
邊緣是智算用得好的關鍵之二。推理是訓練之外的第二大場景,Nvidia表示,2023年其數據中心部門收入有超過40%的業務是有關部署AI模型(推理)。Intel和AMD在積極使用其CPU應用于推理場景,取得了不錯的效果。2024“華彩杯”算力大賽中,中國電信 “基于通用算力的網絡大模型泛在推理能力研發與創新實踐”得到了評審的一致認可,獲得了總決賽的一等獎。
生態是智算用得好的關鍵之三。從企業來看,Nvidia在多年的積累中,形成了GPU+NVlink+IB+CUDA的一整套生態體系,取得了巨大的成功;從產業來看,算力+算法+數據構成了智算生態的三駕馬車,美國在這三方面都具有較大優勢。而我國面臨著30+以上的AI芯片及多種技術路線的混戰,任重而道遠。
市場是智算用得好的關鍵之四。智算的供給側旺盛,中國算力平臺的匹配系統(閱讀原文可直接訪問)仍是智算供需對接的不二選擇。通過整合全國算力資源,優化算力基礎設施、網絡、資源匹配等監測能力,實現算力資源優化配置和共享,推進全國供給方、需求方和服務方三位一體的整體架構的形成,助力算存運資源統一化、常態化、便捷化建設管理運營。
賦能是智算用得好的關鍵第五。市場對接完成之后,算力的最終使命是去賦能。近年來,各行業的數字化轉型如火如荼,但是如何讓大家更好的使用算力、如何讓算力發揮更大的效用,是智算及IT從業者當前階段需要重點處理的任務,讓算力真正成為社會經濟發展的新引擎,為新質生產力添磚加瓦。