2025年4月10日,商湯科技舉辦2025技術交流日活動,重磅推出全新升級的“日日新SenseNova V6”(以下簡稱:日日新V6)大模型體系,通過多模態長思維鏈訓練、全局記憶、強化學習的技術突破,形成領先的多模態推理能力,并突破成本邊界。
「日日新 V6」模型能力顯著提升,在長思維鏈、推理、數理、全局記憶方面擁有顯著優勢,多模態推理能力國內第一,對標OpenAI o1,數據分析能力大幅領先GPT-4o;同時,高效能與低成本完美結合:多模態訓練整體效率對齊語言訓練實現業內最低、推理成本均實現業界最低;全新的輕量級全模態交互模型SenseNova V6 Omni帶來了國內最強的多模態交互能力;涵蓋國內首個支持10分鐘中長視頻深度解析的大模型,對標Gemini 2.5 Turbo達到同類型最強。
商湯科技董事長兼首席執行官徐立表示:“AI之道,在于百姓之日用。商湯日日新V6將跨越多模態邊界,釋放推理與智能的無限可能。”
多模態長思維鏈、強化學習、全局記憶,日日新V6率先實現多模態下深度思考
作為擁有超6000億參數的MoE原生多模態通用大模型,「日日新 V6」實現了多項技術突破,憑借單一模型就可以完成文本、多模態等各類任務:
· 長思維鏈:超過 200B 高質量多模態長思維鏈數據,最長 64K 思維鏈;
· 數理能力:數據分析能力大幅領先 GPT-4o;
· 推理能力:多模態深度推理國內第一,對標 OpenAI o1;
· 全局記憶:率先在國內突破長視頻理解,支持10分鐘的視頻理解及深度推理。
在權威的推理能力及多模態能力評測中,「日日新 V6」在多個維度獲得SOTA:
【核心指標】純文本任務綜合性能優秀,比肩國際一線模型;多模態性能領先,各方面性能突出;純文本推理與多模態推理能力均均對標 GPT-4.5 和 Gemini 2.0 Pro 等國際一流模型的水平
【強推理能力】日日新融合模型從 5.5 到 V6 / V6 Reasoner,推理能力顯著提升。在獨立評測中,多模態和語言深度推理任務上同時超過了 OpenAI 的 o1 和 Gemini 2.0 flash-thinking 的水平
基于超過200B高質量多模態長思維鏈數據,商湯通過多智能體協作進行長思維鏈合成和驗證,「日日新 V6」形成了突出的多模態推理能力,可以支持合成最長 64K 的多模態長思維鏈,支持模型長時間思考能力。
針對真實環境存在的復雜問題,「日日新 V6」強大的混合圖文理解推理能力,能夠幫助用戶解決各類問題。
在復雜繁瑣的文檔處理場景中,「日日新 V6」同樣能夠以多模態強推理能力解決用戶難題,快來商湯辦公小浣熊體驗:https://xiaohuanxiong.com/office
以保險理賠場景為例,「日日新 V6」可根據商業醫療保險理賠材料,判斷提供材料是符合理賠要求,檢查是否存在亂開藥、亂檢查、材料缺失或者材料對不齊等問題。
小額理賠雖然金額小但往往耗費時間長(3-7天),而交給「日日新 V6」,它能自己檢測到風險提示,自己交叉驗證,最后再給到用戶非常細節、多維的結論,完成模型到客戶使用的最后一公里
得益于多模態強化學習的突破,商湯構建了面向多種圖文任務的混合增強學習框架,基于不同難度分級和多獎勵模型的強化學習訓練。
國內首個!視頻理解打破10分鐘限制,超長內容實現秒級推理拆解
憑借“全局記憶”能力,「日日新 V6」打破了傳統模型僅支持短視頻的限制,可支持10分鐘級視頻全幀率解析。
基于強大的理解能力,「日日新 V6」還可以對視頻的精彩內容進行智能剪輯輸出,幫助用戶保留珍貴瞬間。
針對一段《黑神話》游戲錄屏,游戲玩家們日常積累的游戲錄制、實況,輸入「日日新 V6」理解精彩內容和值得記錄的時間,剪輯出高光時刻,同時可自定義生成解說文案,幫助分享游玩經驗和游戲內的精彩操作
商湯自研技術可將視覺信息(畫面)、聽覺信息(語音、音效)、語言信息(字幕、口語)、時間軸邏輯進行對齊,形成多模態統一時序表征。在此基礎上通過細粒度級聯信息壓縮和內容敏感的動態過濾,實現長視頻的高比例壓縮,10分鐘視頻可以壓縮到 16K tokens,仍然保留關鍵語義。
真正像人一樣交互,「SenseNova V6 Omni」發布即實現多行業落地
伴隨日日新SenseNova V6的發布,商湯日日新實時交互融合大模型升級至「SenseNova V6 Omni」,在角色扮演、翻譯點讀、文旅導游、講解繪本、數學講解等場景下進行了深度優化。
以翻譯點讀場景為例,「SenseNova V6 Omni」讓用戶通過手指就能實現精準位置的空間交互,并精準理解局部信息與全局信息的關系,帶來更符合人類自然直觀的指讀交互體驗。
「SenseNova V6 Omni」擁有更像人的感知和表達能力、情感理解能力,并已在具身智能等領域實現多行業、多場景落地,成為國內首個商業化的全模態實時交互模型。
One More Thing:滿血版“商量”全量上線,現已開放內測
整合日日新SenseNova V6全部能力,商湯商量也迎來全面升級,并推出全新商量APP。用戶通過一個入口,即可體驗文字、圖像、視頻等多種模態流式交互體驗。
商量APP已啟動內測,目前「日日新V6」的能力可在商量Web端體驗:www.chat.sensetime.com。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.