2022年11月,OpenAI推出的新型AI聊天機器人工具ChatGPT在一夜之間火爆全球互聯網,引來了無數人的關注,上線僅兩個月,ChatGPT的月活躍用戶數就已突破了1億,成為歷史上增長最快的消費者應用程序。而截至2023年4月,ChatGPT的全球訪問量再創新高,達到17.6億次,僅次于谷歌、百度等搜索引擎。
面對強勢崛起的ChatGPT,“國產ChatGPT”如臨大敵,瘋狂涌入大模型賽道。據不完全統計,目前國內已有超過40家企業、機構發布了大模型產品或公布了大模型計劃,其中不乏百度、阿里巴巴、京東、華為等各個領域的頭部企業。
大模型是指具有巨量參數數量的人工神經網絡模型,通常需要在大規模數據集上進行訓練,并且需要使用大量的計算資源進行優化和調整,主要用于解決復雜的自然語言處理、計算機視覺和語音識別等任務。簡而言之,大模型是ChatGPT及類ChatGPT產品的底層基礎設施。
入局大模型賽道已勢在必行,在ChatGPT的誕生地美國,已有行業受到了ChatGPT的嚴重沖擊。根據網絡流量數據網站SimilarWeb的調研報告,2023年3月,GPT-4、New Bing等產品陸續上線后,美國在線教育公司Chegg網站轉化訪問量同比暴跌89%。與此同時,Chegg還面臨著經營業績下滑、股價腰斬等不利情況。
而對于中國企業而言,在ChatGPT的沖擊正式到來之前,布局大模型業務已經從一道選擇題變成了必答題。隨著越來越多的企業入局其中,大模型之戰已經悄然打響。
01.“國產ChatGPT”百花齊放
國內大模型行業正進入“白熱化”競爭狀態。
百度打響了國內大模型競賽的第一槍。3月16日,被稱為中國版ChatGPT的“文心一言”正式發布,并展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。
緊接著, 在3月27日,百度又正式推出了“文心千帆”大模型平臺。文心千帆大模型平臺整合了百度全套文心大模型、相應的開發工具鏈,未來還將支持第三方的開源大模型。
同樣跑步入局的還有阿里巴巴。4月11日,在2023阿里云峰會上,阿里巴巴正式推出大模型“通義千問”。
通義千問是國內第二款類ChatGPT產品,基于統一學習范式OFA等底層技術打造,具備了能搞定多種任務的能力:不引入新增結構,單一模型即可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等10余項單模態和跨模態任務。升級后,更是可以處理超過包括語音和動作在內的30多種跨模態任務。
戰況大有愈演愈烈之勢。同樣在4月,360集團推出了基于360GPT大模型開發的人工智能產品矩陣“360 智腦”落地搜索場景;昆侖萬維宣布聯合奇點智源研發“天工3.5”國產大語言模型,定位為“中國第一個真正實現智能涌現”的大模型產品,具備智能問答、聊天互動、文本生成等多種應用功能以及豐富的科學、技術、文化、藝術和歷史知識儲備;商湯科技也發布了自研大模型系統“日日新SenseNova”,內含AI數字人視頻生成平臺“如影”,3D內容生成平臺“瓊宇”和“格物”,類ChatGPT產品“SenseChat”等產品。
進入5月以來,大模型領域的戰火進一步蔓延,多個大模型產品陸續面世。
5月5日,網易有道發布了基于“子曰”大模型開發的AI口語老師劇透視頻,介紹其基于教育場景的類ChatGPT產品布局;5月6日,科大訊飛發布認知大模型“訊飛星火”,并預計2023年內還會進行三次升級,分批次增強數學能力、補足代碼能力,全面對標ChatGPT;同一天,淘云科技發布了阿爾法蛋兒童認知大模型,為孩子在練表達、塑情商、啟創造、助學習等方面帶來全新交互體驗。
除此之外,騰訊、華為、京東、字節跳動、小米等也均已推出了大模型產品。
在國際上,大模型的戰況同樣激烈且焦灼。
4月13日,亞馬遜云科技發布多款AI產品,其中包括AI大模型服務Amazon Bedrock、人工智能計算實例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型等;4月17 日,特斯拉CEO埃隆·馬斯克表示即將推出OpenAI的競爭對手TruthGPT,在此之前,其已成立了一家名為X.AI的新人工智能公司;5月11日,谷歌在I/O開發者大會上推出新一代大模型,對180個國家和地區開放聊天機器人Bard,發布對標Office全家桶的Workspace,在安卓系統中也增加了相關功能。
不過,盡管參與者眾多,但截至目前,大模型產品距離真正實現落地還相差甚遠。
02.商業化高墻難越
大模型賽道的想象空間巨大。根據市場研究機構MarketsandMarkets的報告數據,全球生成式人工智能市場規模預計將從2023年的113億美元增長到2028年的518億美元,預測期內復合年增長率為35.6%。由于云存儲的創新使數據易于訪問,以及人工智能和深度學習的發展,預計生成式人工智能市場在預測期內將以顯著的速度增長。
但不容忽視的是,現階段運行大模型仍然十分燒錢。
英偉達披露的信息顯示,訓練一次1750億參數的GPT-3需要34天、使用1024張A100 GPU芯片,同時,OpenAI可能至少需要3.24萬張A100用于日常推理,顯著高于此前訓練底層模型時的用量,由此推算,ChatGPT硬件成本達8億美元以上。
近期,OpenAI被爆出去年虧損額翻倍,達到5.4億美元左右,資金主要用于支撐ChatGPT的運行等。OpenAI CEO山姆·阿爾特曼更是坦言,OpenAI可能需要在未來幾年嘗試籌集多達1000億美元的資金,用來開發足夠先進的通用AI,同時維持公司的正常運轉。
在大模型行業,企業瘋狂燒錢已是常態。國盛證券在研報中指出,通過測算,2800億參數量的大模型預訓練成本約為200萬美元/次,谷歌的PaLM號稱擁有5400億參數,單次預訓練成本將高達1200萬美元。
大模型一邊陷入到燒錢泥潭中無法自拔,一邊還面臨商業化難以落地的困境。
以OpenAI為例,ChatGPT迅速走紅后,其商業模式主要分為兩個部分,即C端推出訂閱制會員和B端提供調用API接口。
具體而言,針對C端市場,OpenAI推出ChatGPT Plus訂閱計劃,每月收費20美元,相較于免費版本,即便在高峰時段用戶也能正常訪問ChatGPT,響應時間更快,并且可以優先使用新功能等。而針對B端市場,OpenAI發布了ChatGPT API,開發者可以將ChatGPT集成到產品中,以更加高效地發揮出價值。
不過,目前ChatGPT的商業化收效甚微,短期內難以覆蓋預訓練成本,但ChatGPT潛在的商業化能力已讓不少企業感受到壓力。谷歌CEO桑達爾·皮查伊認為,谷歌的主要搜索業務可能首次面臨嚴重威脅,因此其召開會議重新定義AI戰略,并計劃在年內發布20款支持AI的新產品。
目前,OpenAI還在探索商業化道路,其預計2023年收入為2億美元,2024年收入或超過10億美元,但并沒有給出明確的盈利時間。
一位AI行業人士向DoNews(ID:ilovedonews)表示,除了OpenAI的探索方向外,業內在討論的商業化方向主要針對B端,包括聚焦并進入垂直領域,如醫療、教育、金融等,以及促進ChatGPT云端化,打造云端ChatGPT模型與工具集。
雖然商業化高墻難越,但投資機構仍然十分看好大模型的商業化前景,比如紅杉資本預測,ChatGPT這類生成式人工智能工具,讓機器開始大規模涉足知識類和創造性工作,這涉及數十億人的工作,未來預計能夠產生數萬億美元的經濟價值。
03.“國產ChatGPT”何去何從
ChatGPT爆火的同時,爭議也不斷涌現。
美國率先宣布“封殺”ChatGPT。3月30日,美國科技倫理組織“人工智能與數字政策中心”(CAIDP)要求美國聯邦貿易委員會(FTC)禁止OpenAI發布新的商業版GPT-4,理由是GPT-4存在偏見和欺騙性,對隱私和公共安全構成了風險。
美國參議院司法委員會下屬的隱私、技術和法律小組委員會發布聲明稱,將于5月16日圍繞AI在各個領域的普及,可能需要哪些法律來保障普通人的利益展開探討。屆時,山姆·阿爾特曼將首次在美國國會作證,這被外界解讀為美國對AI監管的進一步升級。
其實不只美國,在全球各領域頭部企業對大模型業務的追逐下,已經有越來越多國家加入監管行列。
除美國外,意大利、西班牙、德國等均對大模型發展密切關注,其中,意大利一度禁止OpenAI在意大利境內開展業務,相關監管機構認為,ChatGPT及其母公司OpenAI違反了《歐洲通用數據保護條例》中的部分規定。
與此同時,國家網信辦也發布了《生成式人工智能服務管理辦法(征求意見稿)》,明確了生成式人工智能的定義,以及相關產品和服務提供者的合規義務,對生成式人工智能進行專項監管。
在監管趨嚴之下,“國產ChatGPT”應該何去何從?在征求意見稿中,明確規定“國產ChatGPT”需注重數據隱私安全,不能非法獲取、披露、利用個人信息和隱私、商業秘密,不可侵犯知識產權;“國產ChatGPT”生成的內容應當體現社會主義核心價值觀,不能生成歧視性的內容等等。
值得一提的是,各國監管趨嚴并非意在制約大模型行業發展,而是要在合規框架下可控發展,對于“國產ChatGPT”而言,加強監管、凈化行業環境、驅逐不良玩家可能會帶來發展上的限制,但對行業的長期發展卻大有裨益。如何合規發展,已成為“國產ChatGPT”的長期命題。