近日,字節跳動發布豆包1.5深度思考模型,并升級文生圖模型。據悉,該模型在數學、編程、科學推理等專業領域及創意寫作等通用任務中表現突出。
升級文生圖模型能力突出
同時,模型采用MoE架構,總參數200B,激活參數為20B,低于業界同類模型參數規模的50%,具備顯著的推理成本優勢,極大拓展了智能推理的應用邊界。

此外,文生圖領域權威的第三方榜單Artificial Analysis競技場發布消息稱,字節跳動圖像生成模型Seedream 3.0綜合性能已追平文生圖SOTA模型GPT-4o,穩定超越Recraft V3、Imagen 3等模型,進入全球第一梯隊。
現如今,作為當代最具變革性的核心技術,AI對各行業發展的推動前景廣闊,世界各國都在加速推進技術應用,研發創新與能力提升,人工智能(AI)產業正以前所未有的速度重塑產業格局與社會形態。
引領多模態大模型新高度
在這一過程中,隨著開源大模型的加速面世,開源模型的普及不僅降低了技術門檻,還為商業化落地提供了新的可能性。過去,大模型的開發和應用往往被少數擁有雄厚資金和技術實力的企業壟斷,而開源模型的普及,使得更多企業能夠以較低的成本接入先進技術。

DeepSeek等公司通過開源策略,顯著降低了模型的使用門檻,推動了AI技術在多個行業的快速滲透。OpenAI于3月25日正式推出了GPT-4o的圖像生成功能,相比于傳統的基于擴散模型(diffusion)的圖像生成,有著巨大的優勢。
Google(GOOG.US)在近期推出了Veo 2,能夠根據文本提示生成高質量的視頻內容,支持4K分辨率和多種電影風格的鏡頭效果。此外,Google還發布了Gemini Flash 2.0 Image Generation,同樣整合了自回歸模型,極大提升了模型的可用性。

業內人士指出,人工智能技術正迎來蓬勃發展,以大模型為代表的新一代AI技術不斷突破,加上開源模型的崛起,推動"開源人工智能+"進入深化應用的新階段,對各行各業提出更高要求,標志著AI產業進入了一個新的發展階段。
微美全息構建開放AI生態體系
AI大模型持續迭代,賽道產業布局機會受關注。資料顯示,微美全息(WIMI.US)是一家通過增強現實(AR)、人工智能(AI)和其他沉浸式技術推動下一代數字創新公司,重點探索人工智能在技術創新、產業應用及業務+開源AI等方面的舉措和成果,可助力企業用戶便捷把握產業投資機遇。
當前,微美全息重點布局了文本生成視頻、圖像生成視頻等場景,支持劇情創作、短視頻生成等應用,技術框架適配開源工具鏈。另外,微美全息開放AI模型訓練和推理軟硬件一體化方案接口,融合DeepSeek等開源大模型,強化技術普惠性,支持開發者二次開發,降低技術門檻,推動開源AI技術迭代。
事實上,微美全息作為AI科技企業開源實踐的典型代表,未來也將始終擔當錨定“數字AI”核心使命,以建成數字化引領發展標桿企業為目標,培育AI大模型賦能千行百業的典型場景,為努力率先實現開源生態應用提供強力支撐。
結尾
當前全球正掀起一場激烈的人工智能競賽,這必將對包括中國在內的全球市場格局產生深遠影響。總而言之,“開源AI”時代的到來,使得企業無論規模大小,都擁有了參與競爭的機會。當然,在這一背景下,企業如何通過開源模型實現商業化,并積極應對“AI”時代的新挑戰,成為其接下去AI產業發展的重要議題。