99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<ruby id="qfrs8"></ruby>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Kimi 16B勝GPT4o！開源視覺推理模型：MoE架構，推理時僅激活2.8B

2025-04-10 13:30:11　來源: 量子位

北京舉報

0

分享至

剛剛，Kimi團隊上新了！

開源輕量級視覺語言模型Kimi-VL及其推理版Kimi-VL-Thinking，多模態和推理雙雙拿捏。

按照Kimi官方的說法，其關鍵亮點如下：

都是基于MoE架構，總參數為16B，但推理時僅激活2.8B
具備強大的多模態推理能力（媲美參數大10倍的模型）Agent能力
支持128K上下文窗口；
采用相對較為寬松的MIT許可證

如圖所示，和Qwen2.5-VL、Gemma-3等前沿開源VLM相比，Kimi-VL-Thinking僅使用2.8B激活參數即可實現強大的多模態推理。

同時在一些重要基準測試中，Kimi新模型“以小博大”，超越了GPT-4o等規模更大的模型。

目前兩款模型均已上架Hugging Face，分為Instruct基礎版和Thinking推理版。

網友們紛紛表示，新的標桿再次誕生！

多模態和推理雙雙拿捏

話不多說，我們直接看Kimi新模型的具體玩法和效果。

視覺理解與推理

首先，作為一款通用的VLM模型，Kimi-VL具備強大的視覺理解和推理能力。

給它一份手稿，要求它通過逐步推理來確認手稿屬于誰，以及所記錄的內容。

可以看到，Kimi-VL通過分析手稿的筆跡、內容、語言等特征，推斷出手稿可能屬于愛因斯坦，理由是這些內容與引力場方程有關，這與愛因斯坦對廣義相對論的貢獻有關。

又或者只提供一張圖片，讓Kimi-VL來判斷城市地標建筑、識別游戲場景等。

比如第2個例子中，它成功識別出圖片中的穹頂建筑為多倫多的羅杰斯中心（Rogers Centre），同時描述了其特征和用途。

除此之外，Kimi-VL也能被用來解答高難度幾何數學題。

還是僅需一個上傳圖片的動作，它就能將復雜數學公式轉換為LaTeX代碼，并以正確格式輸出。

OCR與文本處理

當然，Kimi-VL對多模態數據的正確理解還離不開一項關鍵能力——OCR字符識別。

在OCRBench基準測試中，其得分為867，屬于SOTA水平。

除了識別數學公式，它還能識別金融表格（以Markdown表格格式輸出）和手寫作文。

甚至還能從長達一小時的視頻課程中捕捉和理解關鍵細節。

比如提供視頻中的某句話“授人以魚不如授人以漁”，要求它找到出處并進一步解讀。

智能體任務與交互

值得關注的是，Kimi-VL還在多輪Agent交互任務（例如OSWorld）中表現出色，取得了媲美旗艦模型的SOTA結果。

比如在Chrome瀏覽器中，要求它自動啟用“Do Not Track”功能來保護用戶隱私。

可以看到，通過一步步思考，Kimi-VL對每個屏幕進行解讀，識別相關的用戶界面元素，并通過清晰的思路、操作和API調用按順序執行相應的操作。

背后技術原理

那么接下來的問題是，怎么做到的？

來看Kimi此次公開的技術報告。

首先，在模型架構上，Kimi-VL和Kimi-VL-Thinking主要由三大部分構成：

MoE專家混合語言模型（之前發布的Moonlight-16B-A3B）
原生分辨率視覺編碼器（MoonViT，基于SigLIP-SO-400M微調）
一個多層感知機（MLP）投影器。

模型具體訓練過程如下：

數據準備

這第一步，團隊構建了三大類別數據集：

1、預訓練數據。精選來自六個類別的高質量數據，包括字幕數據、圖像文本交織數據、OCR數據、知識數據、視頻數據和智能體數據。通過過濾、合成和去重等操作，控制數據質量。

2、指令數據。用于增強模型的對話和指令遵循能力。對于非推理任務，通過人工標注構建種子數據集，訓練種子模型后生成并篩選多輪響應；對于推理任務，利用拒絕采樣的方式擴展數據集，確保數據多樣性和準確性。

3、推理數據。通過類似拒絕采樣和提示工程的方法，收集和合成高質量的長思維鏈數據。

預訓練：主要提升多模態能力

然后開始預訓練，這一階段共消耗4.4T tokens，主要目標是提高模型的多模態理解能力。

概括而言，這一過程包含4個步驟：先獨立進行ViT訓練，以建立原生分辨率視覺編碼器；隨后進行三個聯合訓練階段（預訓練、冷卻、長上下文激活）。

后訓練：主要提升長思維鏈推理能力

接著進行后訓練，通過在32K和128K上下文中進行的兩個階段的聯合監督微調、長思維鏈監督微調及強化學習，團隊進一步提升了模型的長期思考能力。

更多細節感興趣可以查閱原論文。

One More Thing

有一說一，相比于DeepSeek、Qwen等國內競爭對手，Kimi最近一個月實在有點過于安靜了。

從官方公眾號來看，最新一條發布還是在2月份。

在這股平靜之下，網友們開始猜測：

Kimi即將有大動作了？

結合更多消息，目前大家比較認可的推測是K1.6模型即將到來。

就在3月，基于Kimi-K1.6的數學模型突然曝光，在編程基準測試LiveCodeBench中拿下第一，超越o3、DeepSeek-R1等模型。

當然，也歡迎更多知情者在評論區爆料(doge)。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

謝賽寧等新作上線，多模態理解生成大一統！思路竟與GPT-4o相似？

新智元 2025-04-12 18:23:04
2 跟貼 2
永別了，GPT-4！

新智元 2025-04-12 12:53:39
86 跟貼 86

模型越復雜，離真理越遠？我們還需要奧卡姆剃刀嗎？

鈦媒體APP 2025-03-07 16:36:35
0 跟貼 0

3710億數學tokens，全面開放！開源數學預訓練數據集MegaMath發布

機器之心Pro 2025-04-13 18:43:37
1 跟貼 1
最強32B開源中文推理大模型易主：1/20 DeepSeek-R1參數量SOTA

量子位 2025-04-13 21:16:47
3 跟貼 3

全球首個Linux開發本：50TOPS算力，DeepSeek已配好，可隨地開發

量子位 2025-04-11 20:12:52
40 跟貼 40

AI看柯南2分鐘揪真兇，商湯600B多模態MoE推理封神！交互記憶全線升級

新智元 2025-04-11 17:46:51
1 跟貼 1
MIT開發新方法，無需從頭訓練機器人即可執行復雜任務

DeepTech深科技 2024-11-05 18:05:35
0 跟貼 0

熊孩子拿假蛇嚇唬人，女生給客人戴鐲子時受驚摔碎鐲子

重慶聚焦站 2025-04-12 14:12:06
953 跟貼 953
成功率提高7倍！新方法一句話就能讓AI秒出分子設計+合成步驟

DeepTech深科技 2025-04-12 13:27:25
4 跟貼 4
AI奧數大獎出爐，英偉達摘桂冠！14B破解34題暴擊DeepSeek R1

新智元 2025-04-13 15:03:17
4 跟貼 4
強化學習的改進只是「噪音」？最新預警：冷靜看待推理模型進展

機器之心Pro 2025-04-13 15:12:39
0 跟貼 0
商湯忙著減重

虎嗅APP 2025-04-13 03:04:03
2 跟貼 2
一老人牛棚喂牛時，牛突然攻擊老人被活活頂死發出慘叫聲畫面流出

爆料視頻 2025-04-13 11:27:18
5546 跟貼 5546
2024，大模型殺進“決賽圈”

鈦媒體APP 2024-12-17 18:11:20
1 跟貼 1
不用英偉達GPU！華為盤古Ultra來了：昇騰原生135B稠密通用大模型

機器之心Pro 2025-04-13 15:06:55
10 跟貼 10
手機實現GPT級智能，比MoE更極致的稀疏技術：省內存效果不減

量子位 2025-04-12 15:14:56
2 跟貼 2
這屆打工人，有自己的牛馬可以使喚

新周刊 2024-11-13 11:08:58
4 跟貼 4
為什么速度越快時間越慢，時間究竟是如何膨脹的？

心中的麥田 2025-04-13 18:33:09
4 跟貼 4
樂高10351夏洛克·福爾摩斯書立曝光：經典推理IP融入ICONS系列？

酷玩潮CHAO 2025-04-10 09:25:40
4 跟貼 4
考驗孩子的觀察力和推理能力，動手動腦，合理利用空間

萌兔拂塵 2025-04-12 09:15:50
3 跟貼 3
上個月，我去了趟烏魯木齊回來后，我只想說：能不去就盡量不去！

訪史 2025-04-11 10:34:33
39 跟貼 39
問答環節（日本經歷、職業規劃、天真、推理卡）第一集

獨夫之心 2025-04-10 08:25:46
0 跟貼 0
移動GUI智能體邁向實用化！全新驗證器架構V-Droid，刷新任務成功率記錄

新智元 2025-04-12 12:56:14
0 跟貼 0
CNN：川普關稅公式存在重大錯誤，白宮相關官員紛紛對此撇清責任

臺海大林 2025-04-13 00:26:59
19 跟貼 19
美媒：殲-50是空中飛行“紙老虎”，是嚇唬西方的第六代機模型

沐風論道 2025-04-12 21:53:45
0 跟貼 0
頂級律師的推理能力是有目共睹的

叒叒看看劇 2025-04-12 18:16:51
1 跟貼 1
歐洲15國聯軍，戳破虛偽的謊言

難得君 2025-04-11 14:02:42
975 跟貼 975
Claude 4六個月內發布！Anthropic聯創Kaplan：AGI兩三年內到來

新智元 2025-04-12 12:51:58
6 跟貼 6
一群保鏢護著男星胡一天前行對商場路人大喊:靠邊

動態新聞 2025-04-13 18:52:48
3811 跟貼 3811
關稅公式計算錯誤？美將錯就錯，只講金錢不講規則強盜霸權露獠牙

龍悅事記 2025-04-12 07:51:32
5 跟貼 5
微軟AI模型MatterGen能根據需求生成新材料

量子位 2025-01-21 18:07:40
0 跟貼 0
一群騎行男女偷菠蘿被村民抓住，每個人車上都裝著一大袋

眾橫四海 2025-04-13 11:55:45
2941 跟貼 2941
我們使用平方差公式巧妙計算，除此之外你還有別的方法么？

三樂大掌柜 2025-04-10 20:48:27
1 跟貼 1
【免費贈書】博集上新 | 4月第2周首發圖書來啦！

博集天卷書友會 2025-04-12 18:34:11
0 跟貼 0
離譜！美國關稅策劃者的公式抄錯了

國舌天下 2025-04-12 07:54:06
0 跟貼 0
晉城交警模型宣傳勸導市民騎車戴頭盔“柳絮紛飛，戴好頭盔，安全不吃虧”網友：誰懂這一鏡到底的實力！

營天下 2025-04-12 19:07:55
0 跟貼 0
如果世界上真的有龍，那從物理學角度來講，龍的飛行原理是什么？

魅力科學君 2025-04-13 16:39:59
9 跟貼 9
蔡正元：川普計算公式是錯的，是抄了別人的公式

虎悅事記 2025-04-11 11:39:10
0 跟貼 0
好久沒有來菜園了，今天媳婦把菜園整理一下，順便再栽點無花果樹

大慶在農村 2025-04-13 08:34:31
676 跟貼 676

被拐23年剛回家男子：姐姐被1.7萬元賣給老漢遭囚禁多年

被拐23年剛回家男子：姐姐被1.7萬元賣給老漢遭囚禁多年

大象新聞

2025-04-13 22:10:03

網傳上海兩大醫院裁員！清退近30%后勤人員，連院長秘書都被分流

網傳上海兩大醫院裁員！清退近30%后勤人員，連院長秘書都被分流

火山詩話

2025-04-13 18:01:24

2025駕駛證年齡限制調整，超這個年齡將不能開車，看你還能開幾年

2025駕駛證年齡限制調整，超這個年齡將不能開車，看你還能開幾年

華人星光

2025-04-12 12:25:39

證監會發布警示函！4月14號，今日凌晨的三大消息沖擊市場!

證監會發布警示函！4月14號，今日凌晨的三大消息沖擊市場!

風口招財豬

2025-04-14 01:41:41

終局之戰！勇士快船先發雙方均派上最強五人組！

終局之戰！勇士快船先發雙方均派上最強五人組！

直播吧

2025-04-14 03:12:08

Uber司機發現多收了顧客130刀，她第二天登門去退還，結果驚呆了

Uber司機發現多收了顧客130刀，她第二天登門去退還，結果驚呆了

北美省錢快報

2025-04-14 02:13:03

痛心！9歲男孩27樓墜亡，家長哭暈，小區居民：窗戶設計有隱患！

痛心！9歲男孩27樓墜亡，家長哭暈，小區居民：窗戶設計有隱患！

二向箔

2025-04-13 21:52:56

中美貿易戰再次升級！4月14日，凌晨的三大重要消息持續發酵

中美貿易戰再次升級！4月14日，凌晨的三大重要消息持續發酵

風口招財豬

2025-04-14 01:45:13

烏克蘭F-16戰機被擊落，并不是該機性能差，而是烏軍作戰體系太弱

烏克蘭F-16戰機被擊落，并不是該機性能差，而是烏軍作戰體系太弱

止戈軍是我

2025-04-13 21:02:29

熟女阿姨寫真名場面大賞（130）一般人能否招架得住？

熟女阿姨寫真名場面大賞（130）一般人能否招架得住？

解讀熱點事件

2025-03-27 00:10:03

中國地震臺網正式測定：04月13日10時24分在緬甸（北緯21.00度，東經95.95度）發生5.4級地震

中國地震臺網正式測定：04月13日10時24分在緬甸（北緯21.00度，東經95.95度）發生5.4級地震

每日經濟新聞

2025-04-13 11:04:06

WCBA總決賽：東莞女籃3-1時隔6年奪冠四川女籃無緣三連冠

WCBA總決賽：東莞女籃3-1時隔6年奪冠四川女籃無緣三連冠

醉臥浮生

2025-04-13 21:28:07

特朗普沒招了，暗示對華動武，美防長：中國導彈能20分鐘摧毀航母

特朗普沒招了，暗示對華動武，美防長：中國導彈能20分鐘摧毀航母

文雅筆墨

2025-04-13 20:02:00

郭明錤爆料：美國iPhone機型的中國生產線已停產

郭明錤爆料：美國iPhone機型的中國生產線已停產

PChome電腦之家

2025-04-13 22:11:29

折騰老百姓，它們可總有新招！

胖胖說他不胖

2025-04-13 17:44:35

連樹都能整成正方形，三河店招又有何不能改的？人民網痛斥

連樹都能整成正方形，三河店招又有何不能改的？人民網痛斥

小刀99

2025-04-13 12:00:30

京東新聞發言人朋友圈公布劉強東的內網對話：不要和人打口仗，不能產生社會價值

京東新聞發言人朋友圈公布劉強東的內網對話：不要和人打口仗，不能產生社會價值

瀟湘晨報

2025-04-12 21:41:08

有人囤貨、有人藏現金……“關稅亂局”令美國消費者“跟不上了”

有人囤貨、有人藏現金……“關稅亂局”令美國消費者“跟不上了”

參考消息

2025-04-13 22:15:07

美團高管犀利評價京東做外賣，劉強東隔空回應，即時零售市場“戰火”升級

美團高管犀利評價京東做外賣，劉強東隔空回應，即時零售市場“戰火”升級

紅星新聞

2025-04-13 17:04:12

2025年，5國被踢出發達國家行列，分別都是誰？

2025年，5國被踢出發達國家行列，分別都是誰？

校長侃財

2025-03-02 09:37:24

追蹤人工智能動態

10307文章數 176096關注度

往期回顧全部

科技要聞

特朗普政府豁免消費電子等產品的對等關稅

頭條要聞

特朗普"180度大轉彎" 首次"對中國商品實施重大豁免"

頭條要聞

特朗普"180度大轉彎" 首次"對中國商品實施重大豁免"

體育要聞

那個抱起全紅嬋的英國女孩

娛樂要聞

倪虹潔給陳德容上了一課，贏得漂亮！

財經要聞

美方豁免部分產品對等關稅商務部回應

汽車要聞

審美和深層次豪華阿維塔06都辦到了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

家居

本地

旅游

手機

房產要聞

教育理想落地！9年制華師附與未來方洲正式簽約，定義“未來教育”新高度

家居要聞

浪漫與優雅不被定義的現代法式

追夢駐境一步一景
半然鎏光時尚簡約且多功能
現代風格年輕簡約

本地新聞

華北將迎“歷史罕見”大風

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

手機要聞

小米 15 Pro 手機徠卡水印不支持后期關閉問題已優化

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：河东区| 辽宁省| 乐安县| 突泉县| 彩票| 正定县| 彭阳县| 南充市| 新乐市| 资阳市| 阿克| 德惠市| 中阳县| 贵溪市| 灵璧县| 柘荣县| 吉林市| 海晏县| 从江县| 平阳县| 舟山市| 葫芦岛市| 卓尼县| 璧山县| 安福县| 五大连池市| 海门市| 灵丘县| 汉阴县| 红安县| 洛阳市| 凯里市| 黔东| 西充县| 称多县| 衡阳市| 正镶白旗| 泽库县| 积石山| 霍林郭勒市| 织金县|