飛象網訊(源初/文)第二十一屆中國國際半導體博覽會(IC China 2024)在北京國家會議中心開幕。會上,當嘉賓們談到半導體行業的發展時,AI已經成為了一個繞不開的話題,它因半導體而獲得了算力,算力的猛增又拉動了新的需求。然而,面對復雜的行業外因素,如何尋找突破口也同樣是備受關注的話題。
![]()
AI與半導體互為推動
AI正在引發新一輪科技革命,從語言模型、多模態模型的單體智能,到能夠使用思維鏈(CoT, Chain of Thinking)進行推理的OpenAlo1,再到使用工具完成復雜任務的智能體(AIAgent),AI基礎能力正在快速演進。AlI將成為智能時代的基礎設施,融入生產和生活的每個環節,重塑千行百業,引發新一輪科技和產業革命。
AI與半導體已經形成了一種相互促進的關系,共同推動下一輪技術超級周期的到來。
首先,半導體技術為更多的應用場景提供了支持,包括人工智能(AI)、物聯網(IoT)、5G通信和數據中心。這些應用反過來又產生了海量數據,為AI的深度學習模型提供了驅動力。一項基于亞洲的數據顯示,自2019年以來,AI、物聯網和汽車等領域的數據量呈現出71%的年均復合增長率,反映出技術快速演進和廣泛的市場需求。
此外,大數據正被稱為“新的石油”,推動了AI算法和半導體行業的發展,特別是在AI加速器、高帶寬內存(HBM)、存儲和網絡等關鍵領域。隨著AI技術的進步和大規模應用,半導體將進一步推動這些技術落地,形成互為推動的良性循環。
巴西半導體行業協會機構主任羅薩娜·卡賽斯對于兩者的話題也表示稱,到2030年,僅AI一項預計將為全球經濟貢獻超過15萬億美元。半導體行業持續突破創新邊界,研發更新、更強大的AI加速器。AI具備變革半導體設計和制造的能力。
與此同時,新興技術的能耗問題引發關注。黃仁勛曾提到:“沒有任何物理定律可以阻止AI數據中心擴展到一百萬芯片,但其能源供應可能需要核電站!盇I與人腦比較而言,人類大腦的功耗不超過25W,而英偉達8卡DGXB200功耗達14.3kW?紤]冷卻系統耗電量,百萬卡智算中心能耗將高達3GW。會上,有位嘉賓還做了這樣的比較,在京滬高鐵線上的每位乘客耗電量約為30度電,而預計全球數據中心在2024年的總耗電量將達7000億度。
AIDC在支持AI技術高速發展的過程中,逐漸呈現出高頻寬、大容量、大能耗三大趨勢。首先,AI模型的發展需要處理海量數據,這對數據中心的計算與傳輸能力提出了更高要求;其次,AI的快速進步導致模型和數據規模顯著擴張,推動了存儲和處理能力的躍升。最后,隨著算力和存儲需求的快速增長,AIDC的能耗問題愈發突出,已成為行業的重要挑戰。
面對市場的機遇與挑戰,尋找行業突破口自然也就成為大家關注的話題。
行業突破口在何方
對于國內產業而言,會上有嘉賓表示,應當重視系統和芯片架構創新,縮小技術差距。應當積極開展芯片架構創新,如采用3D堆疊/Chiplet/存算一體等新架構,努力縮小大算力芯片的技術代差。積極開展異構大算力集群系統的架構和任務調配等方面的優化工作,努力縮小大算力集群系統的性能差距。
同時,還要重視端側AI技術創新,端側AI擁有清晰的商業模式,更易實現規模化落地。其芯片對算力(如TOPS數量)和制造工藝(如7nm及以上工藝)的要求相對較低,從而降低了研發和生產成本,為更多企業參與創造了機會。此外,端側AI應用場景多樣化,包括智能設備、車載終端和工業物聯網等領域,這些需求驅動了端側AI的快速發展。面向半導體行業,需要探索多核異構計算架構,提升端側設備的算力效率與適配能力。開發兼容多種終端應用的AI軟件堆棧,以及高效的端側芯片。端側AI的未來將以低成本、高效能和廣泛應用為目標,推動人工智能在終端設備上的深度集成與創新,構建更加智能化的生活與產業生態。
面對先進制程所帶來的成本與制造上的壓力,Chiplet正在成為一種毋庸置疑的發展趨勢。原有情況下,系統級芯片SoC(Systemona Chip)將不同功能元器件整合在單個芯片上,開發時間長、良率低,且各功能模塊的納米制程必須相同,都得用5oC上要求最高模塊的制程,成本較高。
系統級封裝SiP(System in a Package)將多芯片異構集成,開發時間較短、良率較高,部分可重復使用。一個系統中,芯片往往只占系統中器件數目的10%左右。如果把其他所有器件都集成在單一芯片上,可能會導致性能不佳,成本增加。
Chiplet對需要實現的復雜功能進行分解,然后開發出多種具有單一特定功能的裸芯片,這些來自不同功能、不同工藝節點的裸芯片可相互進行模塊化組裝,最終形成一個完整的芯片。這種方法實現了異質集成,為芯片設計帶來了更大的靈活性和可擴展性,有效提升了產品的功能性。例如圖上左邊的SOC上所有模塊都需要用同一制程(例如按CPU、GPU要求用7nm),整體成本較高,而右邊的Chiplet上各模塊分別采用了7nm、14nm、22nm、28nm等多種制程,整體成本較低。
Chiplet具備良率、成本、異構計算等優勢,適用于復雜功能的定制化需求。由于Chiplet由多顆芯粒組成,單顆芯粒的面積較小,其良率高。直接設計一整塊SoC的面積較大,可能導致較低的良率,從而帶來高昂的成本。此外,Chiplet技術支持封裝內部的異構集成,可以根據模塊功能選擇芯片制程,針對特定功能模塊設計專用的高性能芯片,對于其他通用芯片粒采用成熟制程,從而降低成本。
DSA架構為發展智能計算算力提供新途徑。當前智算的發展對計算架構提出了新的要求和挑戰,包括更高的性能、更低的功耗、更強的并行計算能力和更好的安全保障能力等等。這些年軟件定制化已經普遍采用,但硬件定制化仍有待于解決,基于RISC-V的DSA可能在這兩方面提供了一條新途徑。
RISC-V在設計思想中就包含了DSA的概念。為此,RISC-V架構包含了模塊化和自定義擴展指令集功能,并為擴展指令集預留了很大的擴展空間。這樣,用戶可以為某個新應用或某個新算子,自定義一套擴展指令集及其支持硬件模塊,容易構成一個高效的DSA系統。
DSA面向特定領域,通過定制的架構以更好地適應需求,例如用于機器學習的神經網絡處理器,用于圖形學、VR等的GPU,可編程網關和接口。DSA需融合硬件和軟件技術,包括:更有效的并行算法,更有效的存儲帶寬利用,削減不必要的計算精度,采用面向領域的編程語言DSL。DSA可與面向領域的語言DSL相結合,如OpenGL、TensorFlow。發展DSA需要新的技術隊伍,他們了解并掌握垂直集成的一系列技術,包括特定領域的應用,適合該領域的DSL和相關的編譯技術,架構原理,實現技術等等。
AI與半導體正共同推動全球科技與產業變革。AI對算力需求的增長反向驅動半導體技術創新,如Chiplet和DSA架構降低成本并提升性能,同時端側AI以低功耗、高效能的特性成為商業化重點方向。未來,行業需聚焦芯片架構優化、異構計算能力提升,以及開放標準與軟硬件協同,加速低功耗技術研發,解決能耗瓶頸。在這一良性循環中,AI與半導體將共同引領智能時代的技術革命與產業升級。