據外媒 TechCrunch 今日報道,為在與谷歌等生成式 AI 競爭對手的較量中進一步加大投入,OpenAI 宣布推出“Flex 處理模式”新的 API 服務 —— 用戶以接受響應速度變慢和“資源偶爾無法分配”為代價,換取更優惠的模型使用價格。
OpenAI 表示,Flex 處理目前已對新近發布的 o3 和 o4-mini 推理模型開放測試,主要面向模型評估、數據擴充、異步處理等優先級較低的“非生產”任務。
采用 Flex 處理,API 費用將直接減半。以 o3 為例,Flex 模式下的費用為每百萬輸入 tokens 收取 5 美元(IT之家注:現匯率約合 36.5 元人民幣,相當于約合 75 萬字),每百萬輸出 tokens 收取 20 美元(現匯率約合 146 元人民幣)。
作為參考,標準價格分別為 10 美元和 40 美元。對于 o4-mini,Flex 模式的費用則從每百萬輸入 tokens 收取 1.10 美元、每百萬輸出 tokens 收取 4.40 美元,降至每百萬輸入 tokens 收取 0.55 美元(現匯率約合 4 元人民幣)和每百萬輸出 tokens 收取 2.20 美元(現匯率約合 16.1 元人民幣)。
OpenAI 在向客戶發送的通知郵件中還表示,按照公司用戶的消費層級劃分,處于第 1 至第 3 層的開發者必須完成新上線的身份驗證流程,方可獲取 o3 的訪問權限。此外,OpenAI 指出,o3 及其他模型的推理摘要功能和流式 API 服務同樣需要完成身份驗證后才能啟用。
OpenAI 此前強調,身份驗證機制的目的是防止用戶違反公司制定的使用政策。