99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<cite id="aqwst"><rp id="aqwst"><form id="aqwst"></form></rp></cite>

<p id="aqwst"><li id="aqwst"><pre id="aqwst"></pre></li></p>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

一臺3090就能跑Gemma 3 27B！谷歌發布Gemma 3全系QAT版模型

2025-04-19 14:27:38　來源: 機器之心Pro

河北舉報

0

分享至

機器之心報道

機器之心編輯部

谷歌 Gemma 3 上線剛剛過去一個月，現在又出新版本了。

該版本經過量化感知訓練（Quantization-Aware Training，QAT）優化，能在保持高質量的同時顯著降低內存需求。

比如經過 QAT 優化后，Gemma 3 27B 的 VRAM 占用量可以從 54GB 大幅降至 14.1GB，使其完全可以在 NVIDIA RTX 3090 等消費級 GPU 上本地運行！

Chatbot Arena Elo 得分：更高的分數（最上面的數字）表明更大的用戶偏好。點表示模型使用 BF16 數據類型運行時所需的 NVIDIA H100 GPU 預估數量。

機器之心在一臺配備了 RTX 3070 的電腦上簡單測試了其中的 12B 版本，可以看到雖然 Gemma 3 的 token 輸出速度不夠快，但整體來說還算可以接受。

基于量化感知訓練的 Gemma 3

在 AI 模型中，研究者可以使用更少的位數例如 8 位（int8）甚至 4 位（int4）進行數據存儲。

采用 int4 量化意味著每個數值僅用 4 bit 表示 —— 相比 BF16 格式，數據大小縮減至 1/4。

但是，這種量化方式通常會導致模型性能下降。

那谷歌是如何保持模型質量的？答案是采用 QAT。

與傳統在模型訓練完成后才進行量化的方式不同，QAT 將量化過程直接融入訓練階段 —— 通過在訓練中模擬低精度運算，使模型在后續被量化為更小、更快的版本時，仍能保持準確率損失最小化。

具體實現上，谷歌基于未量化的 checkpoint 概率分布作為目標，進行了約 5,000 步的 QAT 訓練。當量化至 Q4_0（一種常見的量化格式）時，困惑度下降了 54%。

這樣帶來的好處之一是加載模型權重所需的 VRAM 大幅減少：

Gemma 3 27B：從 54 GB（BF16）降至僅 14.1 GB（int4）
Gemma 3 12B：從 24 GB（BF16）縮減至僅 6.6 GB（int4）
Gemma 3 4B：從 8 GB（BF16）精簡至 2.6 GB（int4）
Gemma 3 1B：從 2 GB（BF16）降至僅 0.5 GB（int4）

此圖僅表示加載模型權重所需的 VRAM。運行該模型還需要額外的 VRAM 用于 KV 緩存，該緩存存儲有關正在進行的對話的信息，并取決于上下文長度。

現在看來，用戶在消費級設備上就能運行更大、更強的 Gemma 3 模型，其中：

Gemma 3 27B (int4)：現在可以輕松安裝在單張 NVIDIA RTX 3090（24GB VRAM）或類似顯卡上，本地就能運行最大的 Gemma 3 版本；
Gemma 3 12B (int4)：可在 NVIDIA RTX 4060 GPU（8GB VRAM）等筆記本電腦 GPU 上高效運行，為便攜式設備帶來強大的 AI 功能；
更小的型號（4B、1B）：為資源較為有限的系統（包括手機和烤面包機）提供更強大的可訪問性。

來自 Two Minute Papers 頻道的玩笑

官方 int4 和 Q4_0 非量化 QAT 模型已在 Hugging Face 和 Kaggle 上線。谷歌還與眾多熱門開發者工具合作，讓用戶無縫體驗基于 QAT 的量化 checkpoint：

Ollama：從今天起，只需一個簡單命令即可原生支持 Gemma 3 QAT 模型。
LM Studio：通過用戶友好界面，輕松下載并在桌面上運行 Gemma 3 QAT 模型。
MLX：利用 MLX 在蘋果芯片上對 Gemma 3 QAT 模型進行高效推理。
Gemma.cpp：使用專用的 C++ 實現，直接在 CPU 上進行高效推理。
llama.cpp：得益于對 GGUF 格式 QAT 模型的原生支持，可輕松集成到現有工作流程中。

激動的網友已經無法抑制內心的喜悅：「我的 4070 就能運行 Gemma 3 12B，這次谷歌終于為即將破產的開發者做了一些事情。」

「希望谷歌朝著 1bit 量化使使勁。」

這個可以本地運行的 Gemma 3 你用了嗎，效果如何，歡迎大家評論區留言。

參考鏈接：https://developers.googleblog.com/en/gemma-3-quantized-aware-trained-state-of-the-art-ai-to-consumer-gpus/?linkId=14034718

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

微軟開源“原生1bit”三進制LLM：2B參數，0.4GB內存/單CPU就能跑

量子位 2025-04-21 12:23:35
4 跟貼 4
DeepSeek用的GRPO占用大量內存？有人給出了些破解方法

機器之心Pro 2025-02-07 14:49:06
1 跟貼 1

采樣越多越聰明？隱式擴展顛覆認知，采樣搜索如何挑出完美解

新智元 2025-04-21 12:45:35
0 跟貼 0

任務向量做模型編輯為何有效？ICLR 2025 Oral論文給出了理論分析

機器之心Pro 2025-04-21 19:15:13
1 跟貼 1
瑞士信息與通信科技公司FLOWIT開發AI人才測評軟件，實現人力資源管理智能化 | 瑞士創新100強

鈦媒體APP 2025-04-22 12:11:09
0 跟貼 0

谷歌DeepMind CEO展示Genie 2：機器人訓練新時代

智東西 2025-04-22 10:22:13
4 跟貼 4

AI Phone：先是芯片，再是模型，最后才是手機廠商

鈦媒體APP 2024-11-08 19:44:25
3 跟貼 3
沒等來美國再次偉大，反而是錢包損失慘重，懂王迎來一輪反對浪潮

浩洋真知 2025-04-21 14:44:37
1 跟貼 1

中國拒收波音！特朗普口風軟化！美徹底棄烏？胡塞拖垮美雙航母！

人猿星球觀察 2025-04-20 12:22:25
0 跟貼 0
拒買美氣，退回波音，中方反制還留了一手，更猛烈的還在后面

深藍航跡 2025-04-21 09:00:00
0 跟貼 0
OpenAI還能扛起人工智能的大旗嗎？

虎嗅APP 2025-04-21 22:11:10
25 跟貼 25
小鵬絕地翻盤，頭號功臣是她！

華商韜略 2025-03-28 14:19:16
0 跟貼 0
南海已被篡改稱呼，谷歌倒向菲律賓，不到48小時，中方回了一句話

小宋聊軍工 2025-04-20 09:31:42
0 跟貼 0
蔡蔡：美媒說禁波音會殃及中國商飛，那是他們小看了中國人的決心

風雨與陽光 2025-04-20 00:21:39
0 跟貼 0
3D高斯潑濺算法大漏洞：數據投毒讓GPU顯存暴漲70GB，服務器宕機

量子位 2025-04-22 15:13:23
0 跟貼 0
季后賽對位結果預測：快船掘金到底誰過關？

籃視角 2025-04-21 07:51:37
0 跟貼 0
英偉達H20受限中國市場，國產AI芯片替代多點開花方為正解

鈦媒體APP 2025-04-20 08:48:10
1 跟貼 1
小小冰淇淋機，為何驚動美國總統？ 2017年，3個佛羅里達人因為麥當勞冰淇淋毆打店員；在2024年的

量子位 2025-01-31 10:53:29
0 跟貼 0
9個案例實測谷歌Gemini文生圖，設計行業“快變天了”

虎嗅APP 2025-03-14 05:44:32
322 跟貼 322
打臉特朗普，福特宣告漲價！中國不買美國LNG改買加拿大油氣

人猿星球觀察 2025-04-19 23:14:32
0 跟貼 0
白宮：中國明明要和我們談協議，卻還拒買波音，特朗普暴怒了！

戰武科普 2025-04-21 10:33:31
0 跟貼 0
扣子空間上手體驗：一個會主動跟你「對齊」的 AI 實習生

愛范兒 2025-04-21 12:04:35
1 跟貼 1
730萬桶！中國石油訂單轉交給加拿大，特朗普肉疼，想跟中方和解

蘇浩 2025-04-21 09:56:53
0 跟貼 0
制裁波音后，特朗普徹底沒脾氣了，希望中美一個月內結束關稅戰！

青田花姑娘 2025-04-21 05:14:13
0 跟貼 0
清大對海底撈，美得冒泡

川麻小咪 2025-04-21 17:00:00
0 跟貼 0
中國全面禁止波音！C919，誰又定了600架？或迎來超級爆發

橙子科普MT 2025-04-19 16:57:57
0 跟貼 0
中國戰略布局已經完成，從拒絕接收波音開始，美國后悔也來不及了

熱心市民謠淼 2025-04-19 16:41:49
1 跟貼 1
中國拒收波音飛機引發震動，直擊特朗普的軟肋，真的打疼了美國

包明說 2025-04-20 15:50:08
1 跟貼 1
中國暫停接收波音飛機蔡正元：不救只能倒閉

走過海棠 2025-04-20 06:21:49
0 跟貼 0
第137屆廣交會一期到會境外采購商同比增長20.2%

投資快報 2025-04-21 16:13:12
7399 跟貼 7399
中國剛下禁令，俄羅斯卻要買波音挺美？現在犯難的反而是特朗普

閆樹軍論評 2025-04-20 10:40:51
2 跟貼 2
師傅用電鉆調公里數，竟試圖把上百萬數值歸零，這就是二手車套路

涂涂搞笑說 2025-04-18 10:28:08
16 跟貼 16
人形機器人組隊進廠打工！5只Figure 02在寶馬工廠

量子位 2024-11-22 10:57:40
0 跟貼 0
爸爸為了安靜玩電腦，把孩子“綁”了起來，結果萬萬沒想到

童話鶴壁 2025-04-21 12:50:41
2 跟貼 2
老板想本地跑AI，只給10萬還想體驗滿血DS，我該咋辦？

量子位 2025-04-14 15:31:01
0 跟貼 0
DeepSeek的橫空出世，讓AI+騰訊云數據庫產生了什么化學反應？

量子位 2025-03-04 20:07:47
0 跟貼 0
夢幻西游：網易針對玩家進行“人性化退貨”，秋殺直播做燒烤！

如風說夢幻 2025-04-19 22:25:37
0 跟貼 0
中國叫停波音訂單！美國損失10萬億！更狠的招還在后面！

AI次世代 2025-04-21 18:06:29
28 跟貼 28
o3/o4-mini幻覺暴增2-3倍！OpenAI官方承認暫無法解釋原因

量子位 2025-04-21 13:16:37
110 跟貼 110
尿酸多高才要吃藥？記住兩個數值，聊聊尿酸升高的四個階段

鶴立煙雨 2025-04-18 16:37:12
5 跟貼 5

中央定調！延遲退休新規實施，1970年前出生男性有福，可不受影響

中央定調！延遲退休新規實施，1970年前出生男性有福，可不受影響

王五說說看

2025-04-05 08:58:18

劉強東回憶“給物流老兄弟們敬酒喝斷片”

劉強東回憶“給物流老兄弟們敬酒喝斷片”

封面新聞

2025-04-22 12:46:11

被卡車掉落鋼卷砸中，東風本田S7這強度我真沒見過……

被卡車掉落鋼卷砸中，東風本田S7這強度我真沒見過……

辣哥說車官號

2025-04-21 11:20:17

197票∶102票！韓國的投票結果全部曝光，尹錫悅想要的，終于等到

197票∶102票！韓國的投票結果全部曝光，尹錫悅想要的，終于等到

重裝旗鼓官方

2025-04-22 11:07:46

吳柳芳首談直播跳舞原因：母親生病，自己工資低想要改命

吳柳芳首談直播跳舞原因：母親生病，自己工資低想要改命

喜歡歷史的阿繁

2025-04-22 15:25:12

城中村里的男女關系亂到啥程度？網友:男人的天堂，女人的樂園

城中村里的男女關系亂到啥程度？網友:男人的天堂，女人的樂園

解讀熱點事件

2025-04-10 00:15:04

江西52歲阿姨網戀上海大爺，嫁過去后發現，大爺身份實在不一般

江西52歲阿姨網戀上海大爺，嫁過去后發現，大爺身份實在不一般

紅豆講堂

2025-04-22 11:06:44

CBA季后賽四強大反轉，遼寧成最大贏家，北京山西要奪冠

CBA季后賽四強大反轉，遼寧成最大贏家，北京山西要奪冠

宗介說體育

2025-04-22 14:21:36

特斯拉中國：煥新Model Y全系5年0息，Model 3限時補貼疊加低息政策

特斯拉中國：煥新Model Y全系5年0息，Model 3限時補貼疊加低息政策

環球網資訊

2025-04-22 11:05:03

湖南預警升級！

魯中晨報

2025-04-22 07:28:03

當年說出“不是你撞的，干嘛去扶”的法官，18年后，他過得怎樣？

當年說出“不是你撞的，干嘛去扶”的法官，18年后，他過得怎樣？

大佬日志

2024-03-26 08:00:10

中美貿易越打越兇，我國存在美國的黃金六百余噸，還能要回來嗎？

中美貿易越打越兇，我國存在美國的黃金六百余噸，還能要回來嗎？

百態人間

2025-04-17 16:23:57

方靜去世，那個誣陷她是間諜的前央視主持人，后來怎么樣了？

方靜去世，那個誣陷她是間諜的前央視主持人，后來怎么樣了？

代軍哥哥談娛樂

2025-03-11 11:08:01

真敢說！楊毅點評王楚欽：沒拿過三大賽冠軍，放以前不可能是世一

真敢說！楊毅點評王楚欽：沒拿過三大賽冠軍，放以前不可能是世一

雪餅說

2025-04-22 13:52:11

乒乓球突尼斯賽今天開打！國乒派出13歲小將，挑戰張本美和勒布倫

乒乓球突尼斯賽今天開打！國乒派出13歲小將，挑戰張本美和勒布倫

郝小小看體育

2025-04-22 07:03:03

鄒市明：“毀”在娶了一個北大畢業，卻不知自己幾斤幾兩的老婆上

鄒市明：“毀”在娶了一個北大畢業，卻不知自己幾斤幾兩的老婆上

姩姩有娛呀

2025-01-24 22:29:58

剛吃下中國上億大訂單，加拿大總理開始反華，詆毀中國是最大威脅

剛吃下中國上億大訂單，加拿大總理開始反華，詆毀中國是最大威脅

知鑒明史

2025-04-21 15:58:25

韓媒警告中國：東亞一旦開戰，韓導彈將降落北京，同時會摧毀海軍

韓媒警告中國：東亞一旦開戰，韓導彈將降落北京，同時會摧毀海軍

陳穟侃故事

2025-04-20 00:16:37

賴昌星是如何控制紅樓里的“女公關”的？只用一招，誰也不敢走！

賴昌星是如何控制紅樓里的“女公關”的？只用一招，誰也不敢走！

歲將零

2023-08-18 12:33:33

中國不挽留，美國不收留，被夾在中間的李嘉誠，終于玩不轉了！

中國不挽留，美國不收留，被夾在中間的李嘉誠，終于玩不轉了！

墜入二次元的海洋

2025-04-19 08:34:08

機器之心Pro

專業的人工智能媒體

10387文章數 142296關注度

往期回顧全部

科技要聞

未脫離困境，分析師稱蘋果股價或再跌近30%

頭條要聞

北京一美式烤肉店棄用美國牛肉:全部改用澳大利亞牛肉

頭條要聞

北京一美式烤肉店棄用美國牛肉:全部改用澳大利亞牛肉

體育要聞

當今足壇最瘋的門將，能有多離譜？

娛樂要聞

關曉彤分手風波后首現身！甜美狀態好

財經要聞

宜賓銀行與五糧液集團頻繁關聯交易

汽車要聞

捷途山海T2加長版/山海L9等捷途新車展前亮相

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

藝術

教育

旅游

公開課

家居要聞

動靜結合休閑娛樂并存

黑白紋理簡約低調空間
天臺月光灰白簡約空間
現代極簡舒適與美觀并存

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

教育要聞

中考真題：計算（-3）×5×（-8）

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
全球十大恐怖禁區有哪些？
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：通渭县| 寻乌县| 霍邱县| 河津市| 蓬莱市| 辉县市| 临沭县| 田林县| 合川市| 安顺市| 哈尔滨市| 保康县| 镇平县| 莒南县| 集贤县| 永新县| 六安市| 城市| 大厂| 津市市| 措美县| 乐业县| 青浦区| 固原市| 黄石市| 望都县| 呈贡县| 嵩明县| 三门峡市| 运城市| 宜章县| 灵丘县| 陇西县| 周宁县| 香港| 陆河县| 新昌县| 杂多县| 孟州市| 墨玉县| 宣城市|

<style id="mrf9j"><rp id="mrf9j"></rp></style>

<em id="mrf9j"></em>

<s id="mrf9j"><rp id="mrf9j"><progress id="mrf9j"></progress></rp></s>