99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

一臺3090就能跑Gemma 3 27B!谷歌發布Gemma 3全系QAT版模型

0
分享至

機器之心報道

機器之心編輯部

谷歌 Gemma 3 上線剛剛過去一個月,現在又出新版本了。



該版本經過量化感知訓練(Quantization-Aware Training,QAT)優化,能在保持高質量的同時顯著降低內存需求。



比如經過 QAT 優化后,Gemma 3 27B 的 VRAM 占用量可以從 54GB 大幅降至 14.1GB,使其完全可以在 NVIDIA RTX 3090 等消費級 GPU 上本地運行!



Chatbot Arena Elo 得分:更高的分數(最上面的數字)表明更大的用戶偏好。點表示模型使用 BF16 數據類型運行時所需的 NVIDIA H100 GPU 預估數量。

機器之心在一臺配備了 RTX 3070 的電腦上簡單測試了其中的 12B 版本,可以看到雖然 Gemma 3 的 token 輸出速度不夠快,但整體來說還算可以接受。



基于量化感知訓練的 Gemma 3

在 AI 模型中,研究者可以使用更少的位數例如 8 位(int8)甚至 4 位(int4)進行數據存儲。

采用 int4 量化意味著每個數值僅用 4 bit 表示 —— 相比 BF16 格式,數據大小縮減至 1/4。

但是,這種量化方式通常會導致模型性能下降。

那谷歌是如何保持模型質量的?答案是采用 QAT。

與傳統在模型訓練完成后才進行量化的方式不同,QAT 將量化過程直接融入訓練階段 —— 通過在訓練中模擬低精度運算,使模型在后續被量化為更小、更快的版本時,仍能保持準確率損失最小化。

具體實現上,谷歌基于未量化的 checkpoint 概率分布作為目標,進行了約 5,000 步的 QAT 訓練。當量化至 Q4_0(一種常見的量化格式) 時,困惑度下降了 54%。

這樣帶來的好處之一是加載模型權重所需的 VRAM 大幅減少:

  • Gemma 3 27B:從 54 GB(BF16)降至僅 14.1 GB(int4)
  • Gemma 3 12B:從 24 GB(BF16)縮減至僅 6.6 GB(int4)
  • Gemma 3 4B:從 8 GB(BF16)精簡至 2.6 GB(int4)
  • Gemma 3 1B:從 2 GB(BF16)降至僅 0.5 GB(int4)



此圖僅表示加載模型權重所需的 VRAM。運行該模型還需要額外的 VRAM 用于 KV 緩存,該緩存存儲有關正在進行的對話的信息,并取決于上下文長度。

現在看來,用戶在消費級設備上就能運行更大、更強的 Gemma 3 模型,其中:

  • Gemma 3 27B (int4):現在可以輕松安裝在單張 NVIDIA RTX 3090(24GB VRAM)或類似顯卡上,本地就能運行最大的 Gemma 3 版本;
  • Gemma 3 12B (int4):可在 NVIDIA RTX 4060 GPU(8GB VRAM)等筆記本電腦 GPU 上高效運行,為便攜式設備帶來強大的 AI 功能;
  • 更小的型號(4B、1B):為資源較為有限的系統(包括手機和烤面包機)提供更強大的可訪問性。



來自 Two Minute Papers 頻道的玩笑

官方 int4 和 Q4_0 非量化 QAT 模型已在 Hugging Face 和 Kaggle 上線。谷歌還與眾多熱門開發者工具合作,讓用戶無縫體驗基于 QAT 的量化 checkpoint:

  • Ollama:從今天起,只需一個簡單命令即可原生支持 Gemma 3 QAT 模型。
  • LM Studio:通過用戶友好界面,輕松下載并在桌面上運行 Gemma 3 QAT 模型。
  • MLX:利用 MLX 在蘋果芯片上對 Gemma 3 QAT 模型進行高效推理。
  • Gemma.cpp:使用專用的 C++ 實現,直接在 CPU 上進行高效推理。
  • llama.cpp:得益于對 GGUF 格式 QAT 模型的原生支持,可輕松集成到現有工作流程中。

激動的網友已經無法抑制內心的喜悅:「我的 4070 就能運行 Gemma 3 12B,這次谷歌終于為即將破產的開發者做了一些事情。」



「希望谷歌朝著 1bit 量化使使勁。」



這個可以本地運行的 Gemma 3 你用了嗎,效果如何,歡迎大家評論區留言。

參考鏈接:https://developers.googleblog.com/en/gemma-3-quantized-aware-trained-state-of-the-art-ai-to-consumer-gpus/?linkId=14034718

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中央定調!延遲退休新規實施,1970年前出生男性有福,可不受影響

中央定調!延遲退休新規實施,1970年前出生男性有福,可不受影響

王五說說看
2025-04-05 08:58:18
劉強東回憶“給物流老兄弟們敬酒喝斷片”

劉強東回憶“給物流老兄弟們敬酒喝斷片”

封面新聞
2025-04-22 12:46:11
被卡車掉落鋼卷砸中,東風本田S7這強度我真沒見過……

被卡車掉落鋼卷砸中,東風本田S7這強度我真沒見過……

辣哥說車官號
2025-04-21 11:20:17
197票∶102票!韓國的投票結果全部曝光,尹錫悅想要的,終于等到

197票∶102票!韓國的投票結果全部曝光,尹錫悅想要的,終于等到

重裝旗鼓官方
2025-04-22 11:07:46
吳柳芳首談直播跳舞原因:母親生病,自己工資低想要改命

吳柳芳首談直播跳舞原因:母親生病,自己工資低想要改命

喜歡歷史的阿繁
2025-04-22 15:25:12
城中村里的男女關系亂到啥程度?網友:男人的天堂,女人的樂園

城中村里的男女關系亂到啥程度?網友:男人的天堂,女人的樂園

解讀熱點事件
2025-04-10 00:15:04
江西52歲阿姨網戀上海大爺,嫁過去后發現,大爺身份實在不一般

江西52歲阿姨網戀上海大爺,嫁過去后發現,大爺身份實在不一般

紅豆講堂
2025-04-22 11:06:44
CBA季后賽四強大反轉,遼寧成最大贏家,北京山西要奪冠

CBA季后賽四強大反轉,遼寧成最大贏家,北京山西要奪冠

宗介說體育
2025-04-22 14:21:36
特斯拉中國:煥新Model Y全系5年0息,Model 3限時補貼疊加低息政策

特斯拉中國:煥新Model Y全系5年0息,Model 3限時補貼疊加低息政策

環球網資訊
2025-04-22 11:05:03
湖南預警升級!

湖南預警升級!

魯中晨報
2025-04-22 07:28:03
當年說出“不是你撞的,干嘛去扶”的法官,18年后,他過得怎樣?

當年說出“不是你撞的,干嘛去扶”的法官,18年后,他過得怎樣?

大佬日志
2024-03-26 08:00:10
中美貿易越打越兇,我國存在美國的黃金六百余噸,還能要回來嗎?

中美貿易越打越兇,我國存在美國的黃金六百余噸,還能要回來嗎?

百態人間
2025-04-17 16:23:57
方靜去世,那個誣陷她是間諜的前央視主持人,后來怎么樣了?

方靜去世,那個誣陷她是間諜的前央視主持人,后來怎么樣了?

代軍哥哥談娛樂
2025-03-11 11:08:01
真敢說!楊毅點評王楚欽:沒拿過三大賽冠軍,放以前不可能是世一

真敢說!楊毅點評王楚欽:沒拿過三大賽冠軍,放以前不可能是世一

雪餅說
2025-04-22 13:52:11
乒乓球突尼斯賽今天開打!國乒派出13歲小將,挑戰張本美和勒布倫

乒乓球突尼斯賽今天開打!國乒派出13歲小將,挑戰張本美和勒布倫

郝小小看體育
2025-04-22 07:03:03
鄒市明:“毀”在娶了一個北大畢業,卻不知自己幾斤幾兩的老婆上

鄒市明:“毀”在娶了一個北大畢業,卻不知自己幾斤幾兩的老婆上

姩姩有娛呀
2025-01-24 22:29:58
剛吃下中國上億大訂單,加拿大總理開始反華,詆毀中國是最大威脅

剛吃下中國上億大訂單,加拿大總理開始反華,詆毀中國是最大威脅

知鑒明史
2025-04-21 15:58:25
韓媒警告中國:東亞一旦開戰,韓導彈將降落北京,同時會摧毀海軍

韓媒警告中國:東亞一旦開戰,韓導彈將降落北京,同時會摧毀海軍

陳穟侃故事
2025-04-20 00:16:37
賴昌星是如何控制紅樓里的“女公關”的?只用一招,誰也不敢走!

賴昌星是如何控制紅樓里的“女公關”的?只用一招,誰也不敢走!

歲將零
2023-08-18 12:33:33
中國不挽留,美國不收留,被夾在中間的李嘉誠,終于玩不轉了!

中國不挽留,美國不收留,被夾在中間的李嘉誠,終于玩不轉了!

墜入二次元的海洋
2025-04-19 08:34:08
2025-04-22 16:07:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10387文章數 142296關注度
往期回顧 全部

科技要聞

未脫離困境,分析師稱蘋果股價或再跌近30%

頭條要聞

北京一美式烤肉店棄用美國牛肉:全部改用澳大利亞牛肉

頭條要聞

北京一美式烤肉店棄用美國牛肉:全部改用澳大利亞牛肉

體育要聞

當今足壇最瘋的門將,能有多離譜?

娛樂要聞

關曉彤分手風波后首現身!甜美狀態好

財經要聞

宜賓銀行與五糧液集團頻繁關聯交易

汽車要聞

捷途山海T2加長版/山海L9等 捷途新車展前亮相

態度原創

家居
藝術
教育
旅游
公開課

家居要聞

動靜結合 休閑娛樂并存

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

中考真題:計算(-3)×5×(-8)

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 通渭县| 寻乌县| 霍邱县| 河津市| 蓬莱市| 辉县市| 临沭县| 田林县| 合川市| 安顺市| 哈尔滨市| 保康县| 镇平县| 莒南县| 集贤县| 永新县| 六安市| 城市| 大厂| 津市市| 措美县| 乐业县| 青浦区| 固原市| 黄石市| 望都县| 呈贡县| 嵩明县| 三门峡市| 运城市| 宜章县| 灵丘县| 陇西县| 周宁县| 香港| 陆河县| 新昌县| 杂多县| 孟州市| 墨玉县| 宣城市|