飛象網訊(易歡) 4月23日消息,在今日舉辦的“2025云網智聯大會”上,SNAI推委會榮譽主席、原中國電信科技委主任韋樂平表示,生成式人工智能的聯網技術主要包括以太網、IB(InfiniBand)、芯片光互連、PCIe、CXL(計算機快速鏈路)、OCS(光纖交換)等。
其中,以太網是世界上規模最大的低成本聯網技術,但是,其傳統形態和協議已經不能滿足大集群聯網的苛刻性能需求。目前有三個改進方向:RoCE是一種基于以太網的RDMA。允許直接訪問遠程節點內存,減小了數據傳遞時延,降低了CPU的使用率。適合GenAI應用的需求;無損以太網在現有以太網基礎上進一步采用先進的流控、改進擁塞處理、優化哈希算法等新技術,性能大為改進,但是長尾時延仍偏高(5-10us),趕不上IB(1us),適合不高于2000GPU互連場景;超級以太網聯盟(UEC)從物理層、鏈路層、傳輸層和軟件層全面改進以太網,具有優異的負荷均衡、更好的網絡利用率和更短的時延,滿足GenAI和HPC所需,同時保留以太網生態系統的優勢,期望性價比全面趕超IB。預計2026年起量。
IB是一種用于高性能計算的計算機網絡,具備高寬帶、高擴展、高可靠、無阻塞、超低時延(1us)的特點。但其需要采用專用硬件IB交換機和IB網卡,成本較高,擴展性受限,產業生態較弱,過于封閉,由英偉達獨家控制。最適用高性能計算和高質量大模型訓練場景。
芯片光互連是利用CMOS工藝,將光波導、耦合器和諧振器直接刻蝕在硅基上,再利用先進的封裝技術將分立的具有特定功能的芯片組(各種XPU) 集成進來,構成一個實用化的,結合SiP和Chiplet技術的光互連器。 芯片光互連具備改進了計算集群的擴展性(超100T)和帶寬(擴大5- 10倍)。并且,具備極低功耗、降低時延(可達10倍)、 能效(4-8倍) 和物理尺寸的優勢。但其技術還不成熟,標準缺失,預計最快2026年就有產品。
PCIe是一種計算機串行擴展總線技術。自從1992年以來, PCIe一直用于高速、低時延、高帶寬場景,例如數據中心內的非易失內存快 線(MVMe) 和GPU與CPU的互連等場景。當前應用最廣的是PCIe5.0,采用NRZ調制格式,具備34GT/S能力。2022年發布PCIe6.0,進一步采用PAM4調制格式和靈活電源管理,最大限度的降低了功耗,具備64GT/S能力,還擴展了傳輸距離、簡化了系統設計、降低了時延、改善了信號完整性。但是迄今尚無實際商用產品問世。2025年計劃發布PCIe7.0版本,期望進一步提升至128GT/S能力。
CXL是一種架構在PCIe串行總線上的新接口協議和高速互連技術。CXL允許計算機系統內不同組件間進行快速、可靠的數據傳輸。CXL打破了CPU與內存間的捆綁關系,能夠在維系CPU內存空間和設備內存一致性的前提下,實現更加靈活和高容量的內存池化架構。長期看,CXL將導致現有服務器架構的解構,將處理、內存和I/0分別納入不同物理模塊,使能資源的查詢和共享,適應大集群的訓練需要和高性能計算的需要。
OCS是一種以光纖通道為交換顆粒的大容量交換。近中期主要替代AIDC中的Spine層的電交換機。長期會進一步向外擴展。