99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<blockquote id="saqvq"><p id="saqvq"></p></blockquote>

<style id="saqvq"></style>

<sub id="saqvq"><i id="saqvq"></i></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

漫畫趣解：一口氣搞懂模型蒸餾！

2025-02-13 17:42:29　來源: AI全球總部

北京舉報

0

分享至

最近，伴隨著DeepSeek的火爆，「模型蒸餾」這個專業名詞，也頻繁出現在大眾視野。

什么是模型蒸餾呢？

“模型蒸餾”就是把大模型學到的本領，用“濃縮”的方式教給小模型的過程，在保證一定精度的同時，大幅降低運算成本和硬件要求。

大模型：像一位見多識廣、知識儲備龐大的“大教授”，無所不知，但是“供養”他很貴。

不僅培養他的過程很耗時耗力（訓練成本高），請他過來講課成本也很高，要有很大一筆安家費（部署模型的硬件基礎設施，甚至數據中心），還要支付超高的課時費（推理成本高）。

小模型：相當于一枚小學生，知識面非常有限，但是勝在沒教授那么大譜，給個板凳坐著就夠了（部署成本低，推理成本低）。

小模型想要擁有跟大模型完全一樣的能力是不現實的，畢竟一分錢一分貨。

但是我們可以讓大模型教小模型一些基本的解題思路，讓學生和老師一樣思考問題。

教授會100種解題思路，挑兩三種不錯的教給小學生，讓小學生照葫蘆畫瓢。

這個解題思路轉移的過程，其實就是模型蒸餾。

以DeepSeek發布的六個蒸餾模型為例，滿血版671B參數量的DeepSeek R1就是“教授模型”。

而教授模型針對不同尺寸的學生模型進行知識蒸餾，這些學生模型包括↓

看，前幾天讓大家本地安裝的那些模型，其實就是從DeepSeek R1這個老師蒸餾得到的，每個學生都從老師身上學到了些“三腳貓”功夫。

因為學生模型的初始資質不同，所以得到的蒸餾模型能力也不同。

總之，腦容量越大（權重數/參數量），能力就越強，就越接近老師的水平。

那么，模型蒸餾具體是怎么干的呢？

簡單說，就是老師做一遍，學生跟著學。

但針對每個輸入的問題，老師不會直接給出確定答案，而是給出解題思路（俗稱軟標簽）。

比如，輸入一張貓的照片給老師模型，老師不會直接給出答案：這是貓，而是給出一組概率分布，告訴學生，這張圖可能是什么。

老師這么干，就是為了讓學生具備舉一反三、觸類旁通的能力，用概率分布來對應各種類別的相似程度。

如果只告訴學生這是貓，學生就不知道它和老虎有多少差別。通過這種有概率分布的軟標簽，學生就知道了老師是如何判斷、如何區分。

接下來，需要建立小模型的學習標準（綜合損失函數）。

老師雖然NB，但小模型在學習的時候，并不會完全照搬老師的思路。

它會結合自己原有數據集中的硬標簽（貓就是貓、狗就是狗），再參考老師的答案，最終給出自己的判斷。

所以，學生模型既要參考“教授給的學習筆記”（軟標簽），又要結合“媽媽給的判斷”（原有監督學習中的硬標簽）。

實操中，用“蒸餾損失”來衡量學生模型與教授模型輸出結果的差異。用“真實監督損失”來衡量學生模型對基本是非問題的判斷。

然后，再設定一個平衡系數（α）來調節這兩種損失，達到一個最優效果。

說白了，學生模型要盡量模仿教授模型的行為，蒸餾損失越小越好，但是又不能學傻了，基本的是非問題都答不對。

標準確定后，就可以進入正式的蒸餾訓練了。

?把同一批訓練樣本分別輸入到學生模型和教授模型；
?根據硬標簽和軟標簽，對比結果，結合權重，得到學生模型最終的損失值；
?對學生模型進行參數更新，以得到更小的損失值。

不斷重復這個過程?→?→?，就相當于反復刷題，每刷一輪，就找找學生答案和老師答案的差距，及時糾正。

經過多輪以后，學生的知識就會越來越扎實。

最終，蒸餾得到的小模型，盡量復制大模型的智慧，同時保持自己身輕如燕的優勢。

這樣，學生模型就可以作為課代表，獨立帶班，不需要教授坐鎮了。

擴展閱讀

一、關于不同的蒸餾路線

前面講的這種模型蒸餾，只是最常見、最通用的一種方式，叫做知識蒸餾，也叫輸出層蒸餾。

相當于老師直接告訴你最后的答案，學生只需要抄作業，模仿老師的答案就行。

這種方式操作起來最簡單，即便教師模型不開源，你拿不到教師模型，只要能調用他的API，看到老師的知識輸出，就可以模仿他，蒸餾出自己的小模型。

所以，有些模型比如GPT4，是明確聲明不允許知識蒸餾的，但只要你能被調用，就沒法避免別人偷師。

坊間傳聞，業界大模型廠商之間，都存在互相蒸餾的操作，正所謂“互相模仿、共同進步”。

除了輸出層蒸餾，還有中間層蒸餾（也叫特征層蒸餾），不僅學到最終判斷的結論，還學習老師對圖像/文本的內部理解，更深入地繼承老師的“知識結構”。

相當于學生不光看老師的最終答案，還要看老師的解題過程或中間步驟，從而更全面地學到思考方法。

但這種蒸餾方案，操作難度較高，通常需要教師模型允許，甚至主動配合，適用定制化的項目合作。

不過現在也可以通過一些手段來獲取教師模型的推理軌跡（Reasoning Traces），比如使用特殊構造的提示詞來誘導老師逐步返回推理，得到推理軌跡。

同時隨著各種推理模型的推出，有些推理模型的API本身就支持返回推理軌跡，比如Google Gemini2.0 Flash，DeepSeek等等。

二、關于蒸餾、微調和RAG

這三種方法，都是優化的大模型的手段，但是實現路徑和應用場景不同。

蒸餾：是學生通過模仿老師的解題思路，達到和老師相似的知識水平。

適用于將大模型的能力遷移到小模型上，以適配更低端的算力環境。（比如在企業私有云、個人電腦甚至手機、邊緣終端上）

微調：又叫精調，相當于學生意識到自己某門課有短板，然后自己找參考書惡補了一下，從而補上短板。

適用于特定場景下，用特定數據集對通用模型進行小規模訓練。比如通用基礎模型對醫療不大懂，就用醫療數據集給它開小灶，讓他變身醫療專家模型。

RAG：直譯過來叫做“檢索增強生成”。相當于這題我不會，但是我有“小抄”，我回答的時候，就看一眼小抄，然后再綜合我腦子里的已有知識，進行回答。

RAG，不是訓練，不改變大模型的“腦回路”，但可以作為外掛，提升大模型回答問題的精準性。適用于企業自身積累了大量知識庫文檔，通過RAG的方式，與大模型關聯。

這樣，大模型在回答問題的時候，會先檢索知識庫，進行精準回答。

三、舉兩個現實的例子

舉個例子，現在特大號公眾號后臺的自動回復，其實就是騰訊混元大模型，通過RAG的方式，連接了特大號所有的歷史文章，作為知識庫使用。

當你提問的時候，它就會檢索這些歷史文章，然后再回答問題。

再舉個例子，前幾天被熱傳的李飛飛團隊僅花費50美元，就訓練出一個比肩ChatGPT o1和DeepSeek R1的模型，其實是一種誤讀。

李飛飛團隊的s1模型，其實是基于通義的開源模型Qwen2.5-32B進行的微調，而微調所用的數據集，其中一部分蒸餾自Google Gemini 2.0 Flash Thinking。

所以，這個模型的誕生，是先通過知識蒸餾，從Gemini API獲取推理軌跡和答案，輔助篩選出1000個高質量的數據樣本。

然后，再用這個數據集，對通義Qwen2.5-32B進行微調，最終得到性能表現不錯的s1模型。

這個微調過程，消耗了50美元的算力費用，但這背后，卻是Gemini和Qwen兩大模型無法估量的隱形成本。

這就好比，你“偷了”一位名師解題思路，給了一個學霸看，學霸本來就很NB，現在看完“思路”，變得更NB了。

嚴格來講，Gemini 2.0作為閉源商業模型，雖然支持獲得推理軌跡，但原則上是不允許用作蒸餾的，即便蒸餾出來也不能商用。不過如果僅是發發論文、做做學術研究、博博眼球，倒也無可厚非。

當然，不得不說，李的團隊為我們打開了一種思路：我們可以站在巨人的肩膀上，用四兩撥千斤的方法，去做一些創新。

比如，DeepSeek是MIT開源授權，代碼和權重全開放，而且允許蒸餾（且支持獲取推理軌跡）。

那么對于很多中小企業來講，無異于巨大福利，大家可以輕松通過蒸餾和微調，獲得自己的專屬模型，還能商用。

GenAI的普惠革命時代，恐怕真的來了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

京東外賣工服撞衫豬豬俠引爆全網，網友集體喊話求聯名

國貨 2025-04-25 09:23:20
0 跟貼 0
楓葉漫談：痛苦的新生·還是幸福的滅亡

楓葉漫談 2025-04-24 14:54:02
1415 跟貼 1415

行業動態 | 大模型賦能規劃，2025新技術專題會圓滿收官！

中國城市規劃學會 2025-04-24 19:04:55
0 跟貼 0

夸夸我的領導，沒機房也不上云，硬搞DeepSeek大模型！

AI全球總部 2025-04-24 12:32:56
50 跟貼 50
食鹽是個寶，普通人知道三個就牛了，看完漲知識

寒梅愛說生活 2025-04-24 17:45:36
0 跟貼 0

媒體:董明珠稱"海歸派里有間諜絕不會用" 很違背常識

新民周刊 2025-04-24 18:45:08
54331 跟貼 54331

GPT-4o能拼好樂高嗎？首個多步空間推理評測基準：閉源模型領跑

量子位 2025-04-23 11:08:26
3 跟貼 3
智能車速度刷新：僅10個月，首個純端側大模型上車量產！

量子位 2025-04-24 18:42:58
5 跟貼 5

毒蟲被小貓救贖，改變了一生的軌跡

二匠影視 2025-04-23 13:51:14
0 跟貼 0
1.9萬億天價成本！日本曝光全球最大驅逐艦，參數碾壓055？

劉參謀戰史庫 2025-04-24 17:23:21
4 跟貼 4
車主為了過年審，竟更改了輪胎上的參數，真是把別人當傻子了！

微微看點 2025-04-24 17:19:05
0 跟貼 0
師傅編程如行云流水，徒弟初露鋒芒，差異中盡顯成長軌跡！

馬路江湖 2025-04-21 13:04:58
0 跟貼 0
AI賦能數字時代的全民深度閱讀

新華社 2025-04-23 22:54:09
0 跟貼 0
在地球上，地質構造活動以及火山活動抹去了地質變化的歷史

世界地理小知識 2025-04-22 11:04:00
1 跟貼 1
華為云將發布盤古行業推理大模型；商業航天創新聯合體成立｜數智早參

每日經濟新聞 2025-04-25 08:14:19
0 跟貼 0
@宣恩人，縣級政務服務“數字人”上線啦，1900個事項一鍵解答！

宣恩發布 2025-04-24 15:11:06
0 跟貼 0
巴特勒傷退追夢登全美第1熱搜：推倒阿門隔山打牛美媒曬罪行狂批

顏小白的籃球夢 2025-04-24 10:52:28
2664 跟貼 2664
從規劃到實戰，行測判斷推理高效備考攻略！

半月談APP 2025-04-24 21:54:57
0 跟貼 0
大瓜？卸任第2天，劉國梁公司版圖曝光，與王楠夫婦共創500億項目

體育有點水 2025-04-24 12:00:15
2101 跟貼 2101
OpenAI發最強圖像生成模型API！可高級定制功能，價格低至0.15元/圖

智東西 2025-04-24 23:20:11
3 跟貼 3
上海車展某品牌請來網紅跳青海搖，現場一群人圍觀拍照

眾橫四海 2025-04-24 11:26:59
7830 跟貼 7830
上交基于AI開發多感官反饋系統及硬件，建立人機協同空間認知范式

DeepTech深科技 2025-04-24 23:02:43
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
滿載蘆葦的朝鮮貨船在鴨綠江航行丹東和新義州的高樓盡收眼底

火煉樹 2025-04-24 11:43:06
1680 跟貼 1680
生于1984年，馬玥已任遼寧錦州北鎮市代市長

澎湃新聞 2025-04-24 21:18:36
451 跟貼 451
體檢發現磨玻璃結節？一個視頻讓你把心放肚子里?#健康知識科普 ? ?#肺結節 ?

鄭于臻醫生 2025-04-21 10:15:13
0 跟貼 0
不應該！賽后廣廈球迷豎中指，大罵“遼G”，隔空侮辱遼寧隊

南海浪花 2025-04-24 12:02:27
1059 跟貼 1059
何小鵬車展上試乘蔚來螢火蟲，跟李斌說定價太便宜了！

老趙觀天下 2025-04-24 22:00:23
3588 跟貼 3588
網傳河南某國企參加校招，薪資每月0-1000元，遠低于河南最低工資標準

可達鴨面面觀 2025-04-24 11:01:54
4569 跟貼 4569
從退休保安到“玩具設計師”，他不懂理論知識，全靠實踐經驗。打造出了火箭、摩天輪，讓幼兒園秒變游樂場

新知速報 2025-04-23 16:13:07
0 跟貼 0
真不是吹！但凡能一夜崛起的球隊，背后都站著同一個人——李春江

田先生籃球 2025-04-24 21:50:48
86 跟貼 86
交通運輸部：7座以下（含7座）小型客車免費通行時間為5月1日0時至5月5日24時

證券時報 2025-04-24 15:14:15
48 跟貼 48
實現人類靈巧雙手技能向機器人遷移，通研院開源MANIPTRANS框架

DeepTech深科技 2025-04-24 23:07:22
7 跟貼 7
地鐵刷卡機工作，把外殼設計成透明的，原來里面這樣構造！

爆笑無極限 2025-04-24 09:13:46
1 跟貼 1
董明珠一句蠢話，震出來4個真相

17譚 2025-04-24 13:25:25
1564 跟貼 1564
無語！泡了幾年的中藥酒海龍海馬全部都是塑料

薪火視點 2025-04-25 07:53:00
596 跟貼 596
見證向海圖強杭州小伙制作760多艘人民海軍艦艇模型

金臺資訊 2025-04-25 10:13:29
0 跟貼 0
通向AGI的四層階梯

學術頭條 2025-04-24 20:37:45
0 跟貼 0
餐廳老板出餐時遇孩子亂跑，死死捏住火鍋躲讓：2個孩子沒事，自己被燙傷

星視頻 2025-04-24 20:55:07
716 跟貼 716
17歲女子自稱騎行20天到拉薩，均速42.48km/h堪比環法冠軍

可達鴨面面觀 2025-04-24 17:23:45
0 跟貼 0

李連杰和利智一張合照，證明歲月催人老，早已活成了普通人的樣子

李連杰和利智一張合照，證明歲月催人老，早已活成了普通人的樣子

史行途

2025-03-25 10:53:38

阿爾瓦雷斯：沒注意到打破了法爾考的紀錄，西甲要爭冠非常困難

阿爾瓦雷斯：沒注意到打破了法爾考的紀錄，西甲要爭冠非常困難

雷速體育

2025-04-25 07:29:54

中國增持235億美債,特朗普松了一口氣,美經濟學家：中國另有目的

中國增持235億美債,特朗普松了一口氣,美經濟學家：中國另有目的

寫了個錘錘

2025-04-24 20:53:13

掘金官方致敬巴頓退役：恭喜你擁有一個偉大的職業生涯

掘金官方致敬巴頓退役：恭喜你擁有一個偉大的職業生涯

雷速體育

2025-04-25 10:28:08

10人排隊9人托，央媒為民除害，怒揭大鍋鹵菜騙局，結局大快人心

10人排隊9人托，央媒為民除害，怒揭大鍋鹵菜騙局，結局大快人心

博學老K雜談

2025-04-11 18:35:03

研究發現：若晚餐經常吃太早，不超半年，胰腺或迎來6種不良變化

研究發現：若晚餐經常吃太早，不超半年，胰腺或迎來6種不良變化

朗威游戲說

2025-04-24 08:20:00

汪俊也沒想到，請了一堆流量大咖，被一個“過氣演員”高鑫搶風頭

汪俊也沒想到，請了一堆流量大咖，被一個“過氣演員”高鑫搶風頭

她時尚丫

2025-04-24 17:01:25

森林狼火箭收到壞消息，湖人勇士奪冠概率聯盟前五，肖華老謀深算

森林狼火箭收到壞消息，湖人勇士奪冠概率聯盟前五，肖華老謀深算

姜大叔侃球

2025-04-25 09:40:59

印控克什米爾恐襲細節曝光：26名游客死亡，遇難者全部系男性

印控克什米爾恐襲細節曝光：26名游客死亡，遇難者全部系男性

封面新聞

2025-04-24 19:14:03

僅播4集，評分9.8，終于有跟《漫長的季節》一較高下的懸疑劇了！

僅播4集，評分9.8，終于有跟《漫長的季節》一較高下的懸疑劇了！

頭號劇委會

2025-04-24 23:45:03

賴清德急了，害怕被“斬首行動”，讓臺各大部門想辦法，不簡單

賴清德急了，害怕被“斬首行動”，讓臺各大部門想辦法，不簡單

不凍港來了

2025-04-24 22:38:13

退伍老兵在家午休，政府人員找上門：別睡了，國防部長正到處找你

退伍老兵在家午休，政府人員找上門：別睡了，國防部長正到處找你

詩意世界

2025-04-24 23:35:02

謝霆鋒演唱會首日，不化妝換裝無嘉賓，奚夢瑤曬現場照表白偶像

謝霆鋒演唱會首日，不化妝換裝無嘉賓，奚夢瑤曬現場照表白偶像

可樂談情感

2025-04-25 02:38:42

中國就是不給特朗普臺階，李顯龍終于站出來，新加坡好日子到頭了

中國就是不給特朗普臺階，李顯龍終于站出來，新加坡好日子到頭了

娛樂督察中

2025-04-25 07:55:39

謝霆鋒香港演唱會現場：英皇全員出動十分壯觀，王嘉爾隔空合唱

謝霆鋒香港演唱會現場：英皇全員出動十分壯觀，王嘉爾隔空合唱

素素娛樂

2025-04-24 22:13:25

董明珠為什么今年敢說“不用海歸”

董明珠為什么今年敢說“不用海歸”

深度財線

2025-04-24 16:31:40

閑魚變“黃魚”，表面賣女生自用自行車，實則做著見不得人的交易

閑魚變“黃魚”，表面賣女生自用自行車，實則做著見不得人的交易

西齋青簡

2024-05-07 11:55:02

缺鉀比缺鈣危險？5個信號證明你缺鉀了，建議吃這4種食物來緩解

缺鉀比缺鈣危險？5個信號證明你缺鉀了，建議吃這4種食物來緩解

奇妙的本草

2025-04-23 17:54:00

一天接3大噩耗，特朗普不吭聲，美財長警告中國：這可不是鬧著玩

一天接3大噩耗，特朗普不吭聲，美財長警告中國：這可不是鬧著玩

紅色鑒史官

2025-04-24 18:55:03

NBA資深記者：東契奇加盟湖人，讓詹姆斯的生涯又能延長幾年了

NBA資深記者：東契奇加盟湖人，讓詹姆斯的生涯又能延長幾年了

仰臥撐FTUer

2025-04-25 10:23:05

全球最新、最酷AI解決方案

996文章數 717關注度

往期回顧全部

頭條要聞

媒體：日本又打了個樣妥協讓步沒換來美國的高抬貴手

頭條要聞

媒體：日本又打了個樣妥協讓步沒換來美國的高抬貴手

體育要聞

名記:梅西將續約2年近10%股權比肩小貝

娛樂要聞

S家再被打臉！葛斯齊爆料一針見血

財經要聞

王興注定“永無寧日”

科技要聞

這屆上海車展，沒人靠流量活著

汽車要聞

純電CLA L及Vision V概念車奔馳這次玩大了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

房產

家居

手機

軍事航空

教育要聞

今晚8點直播｜海星程 x Sarah：從占星小白到高手到底有多遠？

房產要聞

灣區最美徒步掀起打卡潮！這座世界莊園，解鎖當代美好生活新密碼！

家居要聞

清徐現代有溫度有態度

開放空間滿足功能需求
開闊空間家居輕智能
動靜結合休閑娛樂并存

手機要聞

iPhone 17全系要用12GB內存只因大模型不夠用

軍事要聞

紹伊古：不排除俄羅斯恢復核試驗的可能

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：宜宾市| 庆云县| 石城县| 游戏| 高唐县| 太白县| 红桥区| 玉山县| 文水县| 沂水县| 鄂州市| 景泰县| 潞城市| 深州市| 浦东新区| 横峰县| 广灵县| 米林县| 威远县| 潼南县| 兖州市| 峡江县| 开化县| 常州市| 徐水县| 页游| 广汉市| 封丘县| 大庆市| 滦平县| 康马县| 湖北省| 莱芜市| 萨迦县| 桓台县| 察隅县| 萝北县| 会宁县| 克东县| 平顶山市| 阳泉市|

<style id="0dlus"></style>

^{<blockquote id="0dlus"></blockquote>}

^{<blockquote id="0dlus"></blockquote>}

<blockquote id="0dlus"></blockquote>