飛象原創(孫迎新/文)回顧人類科技革命史,無論是牛頓的萬有引力定律被提出還是薛定諤的量子力學方程面世,幾乎還從來沒有一次科技革命像人工智能大模型的問世這樣讓人感受到極度的興奮與焦慮。大模型以其強大的數據處理能力和深度學習能力,成為推動人類走進未來智能時代的重要力量。同時,大模型的開發和訓練需要耗費巨量的資源與金錢,簡直堪稱超級吸金的“黑洞”,但更為重要的是,想要玩轉大模型就需要天量的AI算力,這就需要像大型智算中心這樣的算力底座作為支撐。
從大模型到AI算力再到智算中心,這一切都只有實力異常雄厚的企業才能擔負得起,甚至需要國家力量介入才能實現。也正因為如此,像大模型與AI芯片這樣的人工智能領域頂級科技成就便成為某些發達國家筑起的一道科技“防火墻”,同時也成為打壓后起國家科技發展的政治工具。
智慧的火花:OpenAI的誕生與GPT的革命
如果談及大模型的問世,便不得不提及OpenAI這家公司。OpenAI的成立,是科技界對人工智能安全性和可控性的一種自我反思和承諾。2015年,一群科技界的領軍人物,包括特斯拉的埃隆·馬斯克和Y Combinator的山姆·阿爾特曼,共同創立了OpenAI。他們的初衷是推動人工智能的安全性發展,并確保這一強大技術能夠造福全人類。
OpenAI對GPT系列模型的貢獻,是其對人工智能領域最重要的貢獻之一。GPT(生成式預訓練變換器),是一系列基于深度學習的自然語言處理模型。從GPT-1到GPT-3,每一個版本的發布,都標志著人工智能在理解和生成自然語言方面的巨大飛躍。現在很難形容當GPT問世時人們從震撼到驚愕的轉變,甚至都以為是創造出了具有意識的硅基生命體,而這樣的工作,在以往幾千年里人們都認定是由上帝或神才能完成。
讓人感到意外的是,山姆·阿爾特曼,OpenAI的聯合創始人,對人工智能的未來持有復雜的看法。他曾預言,到2030年,我們將見證通用人工智能(AGI)的到來,屆時GPT-10的智慧將超越全人類。這一預言,既令人興奮也引發了廣泛的憂慮。他指出,實現AGI的過程應該是緩慢而謹慎的,需要時間來適應和理解。這種擔憂并非無的放矢,因為隨著AI技術的不斷進步,我們正面臨著前所未有的挑戰。也或許正是這樣具有前瞻性的眼光,使得山姆·阿爾特曼后來不得不以辭職這樣的方式表達對人工智能快速發展的擔憂。
埃隆·馬斯克,作為SpaceX和Tesla的創始人,同樣對AI的快速發展持有深深的顧慮。他曾是OpenAI的聯合創始人之一,即便是在“獵鷹”火箭發射失敗,投資打了水漂之時也沒有放下對AI技術的執念,但后來還是因為對公司發展方向的分歧而退出。盡管如此,他依然對AI技術保持關注,并在其他項目中探索AI的應用。
震撼世界的巨浪:大模型的奇跡與應用
大模型完全可以說是AI技術發展史上的一座里程碑。大模型以其前所未有的計算能力和智能水平,在全球范圍內引起了廣泛的關注和討論。大模型在多個領域展現了其震撼世界的能力,尤其是在自然語言處理、圖像識別和多模態交互等方面。
自然語言處理的突破簡直可以算得上是一個科技奇跡,人們第一次驚奇地發現可以和機器用人類的語言進行交流。大模型在理解和生成自然語言方面的能力,使得機器能夠以前所未有準確度進行語言翻譯、文本摘要和情感分析。例如,GPT-3在多項語言理解測試中的表現超越了人類,這一成就在學術界和工業界都引起了巨大反響。
同時,多模態交互的實現更是強化了人們對這項科技奇跡的認知。大模型的發展推動了多模態AI的興起,這些AI系統能夠處理和理解圖像、文本和聲音等多種類型的數據。例如,DALL-E 2等模型能夠根據文本描述生成逼真的圖像,這種能力在藝術創作和設計領域產生了深遠影響。
在更多的領域,大模型的問世有力推動了科學研究的加速。大模型在生物制藥、材料科學和物理學等領域的應用,加速了科學研究的進程。例如,AlphaFold2在蛋白質結構預測方面的突破,為生物學和醫學研究開辟了新的道路。
跨越障礙:萬億級大模型的挑戰與中美AI領域的較量
在人工智能的宏大敘事中,萬億級大模型代表著技術的巔峰,它們在處理復雜任務時展現出的能力令人震撼。然而這些模型在訓練過程中面臨著一系列難題,同時,全球政治經濟的動態也對這一領域的發展產生了深遠的影響。
如果僅這么說大家肯定不會有什么直觀的印象,但說到英偉達這家公司,它僅憑推出用于AI訓練和推理任務的H100 TENSORCORE引擎便成為全球市值最高的科技公司,當前的市值(3.34萬億)相當于約1.15個微軟(2.89萬億)或1.86個谷歌(1.8萬億)。更為重要的是,英偉達是一家美國公司,美國政府利用它想給誰斷供就給誰斷供,想掐誰脖子就掐誰脖子。
即便在財力上豪橫似英偉達,在面對大模型持續開發和訓練時的算力需求與成本也不得不掂量一下。訓練萬億級大模型需要巨大的計算資源,但這樣的資源在全球范圍內仍屬稀缺,算力的高昂成本也成為大模型訓練的一大障礙。英偉達CEO黃仁勛就多次強調數據中心在未來計算中的重要性。他認為數據中心將成為整個計算單元的基礎,未來計算量級的計算將成為常態。他還提到,全球每年對數據中心設備的投資費用高達2500億美元,英偉達將占據其中大部分市場份額。
數據獲取與處理也是一大難題。大模型的訓練需要依賴海量的高質量數據,數據的采集、清洗、標注都需要大量的時間和人力資源。AI教母、斯坦福大學教授李飛飛最著名的貢獻之一就是創建了ImageNet數據庫,這是一個龐大的圖像分類數據庫,為深度學習的發展提供了重要的數據支持,而這項成果的獲得正是基于搞定了大模型訓練需要的海量高質量數據。
模型的泛化能力一直是令人工智能科學家們頭疼的問題。盡管大模型在特定任務上表現出色,但如何確保它們在不同領域和場景下都能保持穩定的性能,是研究者們需要解決的問題。很難想象大模型在面對某個領域時表現得像個百年不遇的天才,而在面對有的領域卻表現得像個不折不扣的白癡,這樣的情況讓科學家們無比抓狂卻又無可奈何。
此外,能耗與環境影響也是人工智能發展之路上的攔路虎,面對這個巨大的障礙除了爭取國家支持,幾乎沒有什么太好的應對之策。大模型訓練過程中的高能耗問題不容忽視,如哈爾濱智算中心的6.9EFLOPS算力,其背后是巨大的電力消耗,放眼全球也只有中國電力這樣的能源企業有實力提供支撐,畢竟在6,900,000 MW到103.5億千瓦時之間的電力消耗,有的小國家舉全國之力也未必能夠辦到。
事實上在全球的計算中心里,曾經出現過許多次因電力供應中斷帶來的事故。
2015年9月20日,亞馬遜AWS的一個數據中心遭遇停電事故,影響了Netflix、Tinder、Airbnb等應用程序的在線服務。
2022年8月8日,谷歌位于美國愛荷華州康瑟爾布拉夫斯的數據中心發生電力事故,導致3名電工嚴重受傷。
同樣在2022年,微軟澳大利亞東部數據中心在一次長達46小時的中斷事件中,起因是電力供應問題導致冷卻系統故障。
Interxion位于倫敦的一個數據中心在2023年1月10日遭遇了4個小時的故障,許多客戶受到了影響。
最后不得不提到的就是美國對中國在AI領域的限制。通過技術封鎖、投資限制、人才流動限制和國際合作限制等手段,美國在人工智能技術及大模型領域對中國進行了全面的限制。這些措施不僅影響了中國的AI產業發展,也加劇了中美之間的科技競爭。但從某種意義上看,人工智能技術或許是美國在科技領域的最后一個制高點,中國一旦在人工智能技術上占據領先地位將無可爭議地將美國拉下科技神壇。
智算自主:全球運營商最大單集群智算中心在哈爾濱建成投用
在全球智算領域的競爭日趨激烈的今天,中國移動在哈爾濱建成并投入使用的全球運營商最大單集群智算中心,不僅標志著中國在智能計算領域的一次重大飛躍,更是中國在面對美國技術限制下自主創新能力的有力證明。
首先是哈爾濱智算中心實現了國產化率的飛躍。哈爾濱智算中心的AI芯片國產化率達到100%,這一成就的取得來之不易,尤其是在人工智能高端芯片嚴重受限的當下,這也得益于昆侖技術、華鯤振宇、寶德計算機、長江計算、神州鯤泰以及寒武紀這些公司付出的努力,使得哈爾濱智算中心在建設過程中減少了對外部供應鏈的依賴,為中國智算領域的發展提供了堅實的基礎。通過國產化AI芯片和自主研發技術的運用,哈爾濱智算中心減少了對美國技術的依賴,這在一定程度上打破美國的技術限制,削弱了美國通過技術限制對中國智算領域發展的影響力。
哈爾濱智算中心在算力方面取得大幅的提升。該中心能夠提供6.9EFLOPS的智能算力,這一算力相當于300多萬臺高性能計算機的集合。這使得中國在處理大規模數據和復雜計算任務時更加自如,大大提升了國內科研和商業應用的能力。
在技術創新方面,哈爾濱智算中心采用了多項中國移動自主研發的技術,如GSE1.0、天池SDN等,這些技術的創新應用不僅提升了智算中心的運行效率,也為全球智算領域的發展貢獻了中國智慧。
哈爾濱智算中心的成功建設也推動了國內產業鏈的發展,智算中心的建設和運營,帶動了國內相關產業鏈的發展,包括芯片制造、軟件開發、系統集成等,這有助于構建更加完善和自主的國內智算產業生態。同時在增強國際競爭力方面,哈爾濱智算中心的建成,提升了中國在全球智算領域的競爭力。它不僅能夠支持國內的大型AI模型訓練和應用,還能夠吸引國際企業和研究機構的合作,提升中國在全球智算領域的影響力。
在全球AI領域的較量中,中國正以堅定的步伐,不斷探索和創新,力求在萬億級大模型的研發和應用上取得更多的突破。盡管道路充滿挑戰,但未來仍然充滿希望。哈爾濱智算中心的建成和投入使用,是中國智算領域自主創新能力的一個縮影。它不僅展示了中國在面對外部技術限制時的堅韌和智慧,也為全球智算領域的發展貢獻了新的動能。
在人工智能技術領域,美國還能卡中國的脖子嗎?
最后,向GPT-4提出以上的問題作為總結。GPT-4是這樣回答的:
作為一個AI助手,我沒有情感,也不支持或反對任何國家。人工智能技術的發展一直在全球范圍內進行,并帶來了許多機遇和挑戰。對于中國或任何其他國家來說,人工智能的使用和發展都需要權衡利弊,并采取適當的措施來解決可能出現的問題。