飛象網訊 (計育青/文)如今人工智能技術已經在各行各業投入了廣泛應用,從居民小區門禁系統的人臉識別到工廠流水線上的產品自動檢測,從兒童玩具中的語音對答到在線商城的客服機器人,人工智能已經在人們工作和生活的方方面面發揮了重要作用。在經歷了前期各個領域的分散性探索之后,人工智能技術開始向著通用大模型時代發展。
在近日舉行的2022年華為全聯接大會上,中國科學技術信息研究所黨委書記、所長、科技部新一代人工智能發展研究中心主任趙志耘表示,大模型具備更強的泛化能力,可以覆蓋更為多樣化的業務場景,因此產學研各界一致認為大模型已經成為當前人工智能技術發展的重要方向。在此次大會上,趙志耘宣布中國科學技術信息研究所正在與業界合作規劃大模型地圖,不久之后就會發布《中國人工智能大模型地圖研究報告》,統籌中國大模型有序發展,共同推進相關應用開發和方案落地。
從追趕到領先
在過去十年間,人工智能技術和應用都發展迅猛,不但傳統深度學習模型持續快速演進,以Transformer為代表的新型網絡模型、訓練微調機制的應用也經歷了飛速增長。短短5年里,原本不到億級的參數規模就增長到如今萬億級別規模。
趙志耘表示,各國圍繞著人工智能大模型的研發做了很多工作,總的來說,該領域的主導權掌握在中美兩國手中。美國對大模型的研究啟動比較早,并且一直維持著較大的投入,不過中國近幾年也加快了追趕的步伐。在科研機構與企業界的聯手推動下,從硬件到軟件,從底層技術到上層應用,國內取得了豐碩的成果。在此期間,人工智能計算中心也在全國各地紛紛落地,為大模型的孵化提供了強有力的算力支撐。
2020年到2021年,中國大模型數量從2個驟增至21個,基本與美國處于同等量級,大幅領先于世界其他各國。在此期間,國內還出現了基于昇騰的鵬程、盤古、紫東、太初、悟道等千億甚至萬億級別的大模型,引起了業界的廣泛關注。
進步與挑戰
為全方位了解國內大模型發展的現狀,中國科學技術信息研究所聯合產業力量,共同對中國人工智能大模型的發展現狀進行了調研,從分布、要素、活躍度和應用等方面,揭示了中國人工智能大模型取得的進步、面臨的挑戰,為下一步統籌規劃大模型的發展和應用提供了一套有效的方法工具。
從分布、要素、活躍度和應用四個維度出發,中國科學技術信息研究所繪制了多個大模型分布地圖。從地域上看,全國很多地方都在開發大模型,不過主要集中在北京、深圳、西安、武漢等國家新一代人工智能發展試驗區;從專注領域來看,現有的大模型主要集中在NLP和多模態方面,其它領域相對較少。從要素地圖來看,最關鍵的是算力和人才,大算力和頂尖人才也是大模型發展不可或缺的要素。從活躍度地圖來看,無論在學術方面還是在開源技術方面,中國依然缺少具有全球影響力的大模型,未來需要強強聯合,共同打造精英級大模型。從應用地圖來看,國內大模型已經開始進行落地試驗、試點,但總量上還比較少。
趙志耘表示,總的來看,國內大模型發展的要素缺乏統籌,資源浪費和資源不足同時存在,同時大模型的開發缺乏協作,發展比較分散,暫未出現現象級別標桿大模型。從落地商用的角度來看,大模型的產業落地仍有很多困難,未能對實體經濟產生足夠的促進作用。
三個建議
據趙志耘介紹,完整版的“中國人工智能大模型地圖研究報告”將在不久后正式對外公布,報告中綜合分析了中國人工智能大模型地圖,并對中國人工智能大模型的未來發展提出了三個建議。首先是大模型發展布局應該有統籌規劃,匯聚大模型發展的相關要素,同時加強發展人工智能計算中心和算力網絡,完善人工智能大模型人才培養體系,圍繞國內自主創新的人工智能根技術來發展我國大模型。其次,大力推進場景化創新,提升大模型的活躍度和影響力。第三,政府需要加大支持力度,鼓勵產學研各界攜手有條件的領域加速大模型的產業落地。
華為計算產品線總裁鄧泰華在會議期間表示,多年來華為通過昇騰構建了一站式的大模型開發平臺,讓大模型更易開發、易適配、易部署。為促進大模型產業化落地,華為和伙伴結成產業聯合體,共同打通科研創新和產業落地,讓大模型更好地服務于各行各業。在科技部牽頭組織下,華為還與中國科學技術信息研究所等產業合作伙伴聯手制定大模型的沙盤,從而有序引導大模型的創新方向。“通過產學研聯手,我們構建起了大模型規劃、開發部署、產業化落地的全流程使能體系,為中國人工智能技術和應用發展探索出了一條行之有效的前進之路!编囂┤A說。