韩国三级一区-韩国三级香港三级日本三级la-韩国三级香港三级日本三级-韩国三级视频网站-日韩欧美一及在线播放-日韩欧美一二三区

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|低空經濟|智能汽車|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

OpenAI 啟動先鋒計劃,旨在重塑 AI 模型評分體系

2025年4月10日 11:04  IT之家  作 者:遠洋

OpenAI 宣布啟動 OpenAI 先鋒計劃(OpenAI Pioneers Program),致力于改善當前 AI 模型的評分方式。該公司認為現有的 AI 基準測試存在缺陷,而該計劃將專注于創建能夠“設定優秀標準”的評估體系。

隨著 AI 技術在各行業的應用加速普及,深入了解并提升其在現實世界中的影響力變得至關重要。OpenAI 在其博客中指出,創建特定領域的評估指標是更好地反映實際應用場景、幫助團隊在實際且高風險環境中評估模型性能的有效途徑之一。

近期,眾包基準測試平臺 LM Arena 與 Meta 的 Maverick 模型引發的爭議凸顯了一個問題:如今,人們很難明確區分不同 AI 模型之間的差異。許多廣泛使用的 AI 基準測試側重于衡量模型在一些晦澀任務上的表現,例如解決博士級別的數學難題。還有一些基準測試容易被操縱,或者與大多數人的偏好不一致。

據IT之家了解,通過先鋒計劃,OpenAI 希望為法律、金融、保險、醫療保健和會計等特定領域創建基準測試。該實驗室表示,在未來幾個月內,將與“多家公司”合作設計定制化的基準測試,并最終將這些基準測試公開,同時提供“行業特定”的評估。

OpenAI 在博客中提到,先鋒計劃的第一批參與者將專注于初創公司,這些公司將幫助奠定該計劃的基礎。他們將從眾多初創公司中挑選出少數幾家,這些公司都在從事高價值、應用廣泛的用例,AI 在其中可以產生實際影響。

參與該計劃的公司還將有機會與 OpenAI 團隊合作,通過強化微調技術改進模型。這種技術可以針對一組特定任務優化模型,從而提升其在特定領域的表現。

然而,一個關鍵問題是 AI 社區是否會接受由 OpenAI 資助創建的基準測試。此前,OpenAI 曾在財務上支持過基準測試工作,并設計了自己的評估方法。但與客戶合作發布 AI 測試可能會被視為在道德上存在爭議。

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中興通訊董事長李自學:算力筑基、 AI 啟智,共迎數智化新紀元
精彩專題
通信產業2024年業績盤點
3·15權益日 | 共筑滿意消費 守護信息通信安全防線
聚焦2025全國兩會
2025年世界移動通信大會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像