【科技快報網】3月21日騰訊宣布推出自研深度思考模型混元T1正式版。
該模型以騰訊3月初發布的新一代快思考模型混元Turbo S為基座打造,是一款能秒回、吐字快、擅長超長文處理的強推理模型。
通過大規模強化學習,并結合數學、邏輯推理、科學和代碼等理科難題的專項優化,混元T1正式版與此前相比綜合效果明顯提升。
T1展現出非常強的適應性,并采用了Hybrid-Mamba-Transformer融合模式,有效降低計算復雜度和內存占用。此外,T1還解決了長文推理中的上下文丟失和信息依賴問題,并實現了2倍的解碼速度提升。
目前,騰訊云官網已經上線T1 API使用。輸入價格為每百萬tokens 1元,輸出價格為每百萬tokens 4元。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.