韩国三级一区-韩国三级香港三级日本三级la-韩国三级香港三级日本三级-韩国三级视频网站-日韩欧美一及在线播放-日韩欧美一二三区

智源研究院“百模”評測結(jié)果：字節(jié)跳動多項第一，大廠AI整體領(lǐng)先

2024年12月24日 08:19 新浪科技

12月23日午間消息，近日，智源研究院發(fā)布國內(nèi)外100余個開/閉源語言、視覺語言、文生圖、文生視頻大模型綜合及專項評測結(jié)果。評測發(fā)現(xiàn)，2024年下半年，大模型發(fā)展更聚焦綜合能力提升與實際應用。多項評測結(jié)果中，字節(jié)跳動多項AI能力領(lǐng)先，阿里巴巴、百度等大廠派AI均取得優(yōu)異表現(xiàn)。

據(jù)評測結(jié)果，針對一般中文場景的開放式問答或生成任務，語言模型能力已趨于飽和穩(wěn)定，但是復雜場景任務的表現(xiàn)，國內(nèi)頭部語言模型仍然與國際一流水平存在顯著差距。在中文能力理解上，字節(jié)跳動Doubao-pro-32k-preview、百度ERNIE 4.0 Turbo位居第一、第二，OpenAI o1-preview-2024-09-12、Anthropic Claude-3-5-sonnet-20241022位列第三、第四，阿里巴巴Qwen-Max-0919排名第五。

在視覺語言多模態(tài)模型能力評測結(jié)果中，一些較好的開源模型在圖文理解任務上正在縮小與頭部閉源模型的能力差距，而長尾視覺知識與文字識別以及復雜圖文數(shù)據(jù)分析能力仍有提升空間。評測顯示，OpenAI GPT-4o-2024-11-20與字節(jié)跳動Doubao-Pro-Vision-32k-241028先后領(lǐng)先于Anthropic Claude-3-5-sonnet-20241022，阿里巴巴Qwen2-VL-72B-Instruct和Google Gemini-1.5-Pro緊隨其后。

此外，文生圖多模態(tài)模型今年上半年參評模型普遍無法生成正確的中文文字，但此次參評的頭部模型已經(jīng)具備中文文字生成能力，但整體普遍存在復雜場景人物變形的情況，針對常識或知識性推理任務，小于3的數(shù)量關(guān)系任務表現(xiàn)有所提升，大于3的數(shù)量關(guān)系依然無法處理。評測結(jié)果顯示，騰訊Hunyuan Image位列第一，字節(jié)跳動Doubao image v2.1、Ideogram 2.0分居第二、第三，OpenAI DALL·E 3、快手可圖次之。

在文生視頻多模態(tài)模型，畫質(zhì)進一步提升，動態(tài)性更強，鏡頭語言更豐富，專場更流暢，但普遍存在大幅度動作變形，無法理解物理規(guī)律，物體消失、閃現(xiàn)、穿模的情況。評測結(jié)果顯示，快手可靈1.5（高品質(zhì)）、字節(jié)跳動即夢P2.0 pro、愛詩科技PixVerse V3、MiniMax海螺AI、Pika 1.5位列前五。

據(jù)介紹，本次評測依托智源研究院自2023年6月上線的大模型評測平臺FlagEval，經(jīng)過數(shù)次迭代，目前已覆蓋全球800多個開閉源模型，包含20多種任務，90多個評測數(shù)據(jù)集，超200萬條評測題目。（文猛）

編輯：路金娣

飛象網(wǎng)版權(quán)及免責聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載，請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權(quán)和其它問題，請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進行的“內(nèi)容核實”、“商務聯(lián)系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。

相關(guān)新聞

·聯(lián)發(fā)科發(fā)布天璣8400移動芯片：采用全大核設計，集成AI..	·中國信通院2025深度觀察報告會在京成功舉辦！
·MediaTek 發(fā)布天璣 8400 移動芯片，開啟高階智能手機全..	·諾基亞攜手阿聯(lián)酋運營商e&，展示全球首個固網(wǎng)游戲端到..
·博通市值破萬億美元，憑什么？	·時空融合的5G基站業(yè)務量預測技術(shù)
·高通在與Arm的芯片訴訟中取得關(guān)鍵勝利，后者尋求再審	·韓國運營商AI戰(zhàn)略布局及發(fā)展現(xiàn)狀
·半年中國智算服務增長近80% 未來五年仍維持高速發(fā)展	·OpenAI發(fā)布更先進的推理模型與谷歌競爭
·體驗科技力量見證冰雪奇緣：中國聯(lián)通組織“魅力亞冬，..	·中國電信11月凈增5G用戶184萬戶累計達3.49億戶
·中國移動11月凈增5G網(wǎng)絡用戶143萬戶累計達5.47億戶	·中國聯(lián)通11月凈增5G套餐用戶127.8萬戶累計達2.89億戶