近年來國內模型進步顯著,2024年Kimi、豆包等模型逐步出圈,并帶來用戶使用習慣的養成。本次DeepSeek-R1的發布,在性能對齊OpenAI-o1正式版、但成本更低,有望帶來下游更為廣泛的應用落地和商業化機會。
交互型多模態大模型是指跨越單一模態的限制,支持文本、音頻、圖像、視頻等模態任意組合的輸入輸出,能做出實時的、“類人”的理解和反饋,可以跟人無縫交流的大模型。西部證券認為,應用是連接人類意圖與信息及技術實現的媒介,其本質是交互。在大模型迭代過程中,性能提高固然重要,但交互的升級也同樣具有重大價值,交互型多模態大模型的出現有望推動人機交互變革——向更為簡單的自然語言交互形式發展。其進一步指出,交互型多模態大模型主要應用場景包括教育、編程、醫療健康、游戲、情感陪伴等。
據財聯社主題庫顯示,相關上市公司中:
拓爾思數字經濟研究院及相關研發團隊已經完成康養大模型第一版本的訓練,加入了情感支持、主動問答以及多模態的能力,正在與虛擬人進行整合。
虹軟科技積極布局視覺大模型+XR相關技術,利用ArcMuse技術引擎產生圖片、視頻、數字人以及3D內容等,為XR眼鏡載體提供便捷、優質的內容生成引擎。