99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Liquid AI推出液態邊緣模型Hyena Edge,實測效率均超Transformer

0
分享至

還記得之前那個提出了新的液體基礎模型(LFM,Liquid Foundation Model)的 Liquid AI 嗎?在被 AMD 投資數月后,這家來自美國麻省理工學院的初創公司又帶來新成果了。

4 月 25 日,Liquid AI 正式發布了面向邊緣設備的全新 AI 架構“Hyena Edge”。與目前主流的基于 Transformer 的模型架構不同,Hyena Edge 是一種基于卷積的多混合模型,專為智能手機等邊緣設備優化設計。

“人工智能正迅速變得無處不在,從大規模云端部署到智能手機和筆記本電腦等資源受限的邊緣設備。”Liquid AI 科學團隊成員 Armin Thomas、Stefano Massaroli 和 Michael Poli 在研究報告中表示,“盡管有令人印象深刻的進步,大多數為邊緣部署優化的小型模型,如 SmolLM2、Phi 模型和 Llama 3.2 1B,主要依賴于基于注意力運算符的 Transformer 架構。”

這些傳統架構雖然具有可并行計算和高效內核的特點,但在邊緣設備上仍面臨效率瓶頸。而 Hyena Edge 作為一種 Liquid 架構,天生就在計算效率上具有優勢,非常適用于邊緣部署。據 Liquid AI 宣稱,Hyena Edge 在真實硬件測試中,于計算效率和模型質量兩方面均展現出超越 Transformer 基線的性能。

他們在三星 Galaxy S24 Ultra 上對 Hyena Edge 進行了測試,結果顯示該模型在多個關鍵指標上均超越強大的基于 Transformer 的基準模型。

在效率方面,Hyena Edge 展示了更快的預填充(prefill)和解碼延遲。特別是對于超過 256 個標記的序列,解碼和預填充延遲最高可提高 30%。值得注意的是,其在短序列長度下的預填充延遲也優于 Transformer 基線,這一點對響應式設備應用至關重要。在內存使用方面,Hyena Edge 在所有測試序列長度下均使用更少的內存。


(來源:Liquid AI)

在模型質量方面,Hyena Edge 在經過 1000 億 tokens 的訓練后,在包括 Wikitext、Lambada、Hellaswag、Winogrande、Piqa、Arc-easy 和 Arc-challenge 在內的各種常見語言建模基準測試中表現出色。例如,在 Wikitext 上的困惑度(perplexity)從 17.3 降至 16.2,在 Lambada 上從 10.8 降至 9.4,在 PiQA 上的準確率從 71.1% 提升至 72.3%,在 Hellaswag 上從 49.3% 提升至 52.8%,在 Winogrande 上從 51.4% 提升至 54.8%。

“這些結果表明,模型的效率提升并不以預測質量為代價——這是許多邊緣優化架構常見的取舍。”研究團隊表示。

而 Hyena Edge 的核心技術,正在于團隊此前提出的 STAR(Synthesis of Tailored Architectures)框架及其優化技術。STAR 框架的核心思想是利用進化算法(Evolutionary Algorithms)和線性輸入變化系統(LIVs,Linear Input-Varying Systems)的數學理論,來高效地探索廣闊的神經網絡架構空間,并自動合成出針對特定目標(如低延遲、小內存占用、高模型質量、小參數量等,可多目標同時優化)的“量身定制”的架構。


圖丨 STAR 框架說明(來源:Liquid AI)

與傳統的依賴人工經驗和直覺進行模型設計,或在有限空間內進行自動化搜索的方法不同,STAR 提供了一個更全面的解決方案。LIV 理論是一個關鍵的理論基礎,它能夠統一地描述和泛化深度學習中常見的多種計算單元,包括各種注意力變體、線性循環網絡、卷積網絡以及其他結構化算子。STAR 基于 LIV 理論,構建了一個新穎的、分層的架構搜索空間。

在這個框架下,模型架構被編碼成一種“基因組(Genome)”。這種基因組包含了架構的多個層級信息,從底層的特征化(Featurization)方式、算子結構(Operator Structure,定義了 Token 和 Channel 的混合方式),到頂層的骨干網絡(Backbone,定義了 LIV 單元之間的連接和組合方式)。STAR 的基因組設計具有良好的層次化和模塊化特性。

隨后,STAR 運用進化算法的原理,對這些架構基因組進行迭代優化。主要包括評估(根據預設目標衡量架構性能)、重組(組合優秀父代架構的特征)和變異(引入隨機變化以探索新架構)等步驟。該框架支持多目標優化,能夠同時考慮模型質量、參數量、推理緩存大小、延遲等多個可能相互沖突的指標,以尋找在這些目標間達到較好平衡的架構方案。

根據其技術文檔,STAR 在優化大型語言模型架構時,無論是在純質量優化、質量與參數量聯合優化,還是質量與推理緩存大小聯合優化方面,其生成的架構均能在各項指標上顯著優于高度優化的 Transformer++ 和 StripedMamba 等基準模型。例如,在優化質量和參數量時,7/8 的 STAR 進化架構在下游任務基準上超越了 Transformer++ 和混合模型,同時參數量減少高達 13%。在優化質量和緩存大小時,7/8 的 STAR 進化架構實現了比混合模型小 37%、比 Transformer 小 90% 的緩存,同時質量相當甚至更好。

在 Hyena Edge 的設計中,Liquid AI 團隊就應用了 STAR 框架。他們從一個包含 16 個候選架構的初始種群開始,進行了 24 代的進化迭代。其搜索空間設計得非常豐富,包含了多種卷積算子的變體,這些變體主要受到 Hyena 架構的啟發:

  • Hyena(Full):在門控機制(Gating Mechanism)和 Hyena 內部卷積中都包含卷積操作。
  • Hyena-X:排除了內部卷積。
  • Hyena-Y:排除了特征組(門)中的卷積。

除了這三種主要的 Hyena 類型,搜索空間還考慮了它們學習到的短距離、顯式卷積核的長度變化(從 3 到 128),總共構成了 18 種不同的卷積算子。此外,搜索空間還包括了分組查詢注意力的變體(具有不同的 KV 頭數量)和 SwiGLU(具有不同的內部寬度)等常見的 Transformer 組件。

在進化過程中,STAR 框架通過對每個候選架構在三星 S24 Ultra 上的初始延遲和內存占用進行性能分析,并結合模型在訓練過程中的困惑度表現,不斷地將架構種群向著效率-質量前沿(Efficiency-Quality Frontier)進行優化。

有意思的是,隨著進化過程的推進,當架構接近效率-質量最優邊界時,STAR 明顯地偏愛選用 Hyena-Y 類型的卷積。這表明 Hyena-Y 卷積在延遲、內存和模型質量之間取得了更優越的平衡。

基于這一發現,最終的 Hyena Edge 架構在一個 GQA-Transformer++ 基準模型的基礎上,將部分 GQA 算子替換為由 STAR 優化選出的 Hyena-Y 門控卷積。

而最終結果如基準測試所表明的,Hyena Edge 在提升效率的同時,保持了較高的模型質量,這對于性能和資源都受限的邊緣設備應用而言是一個重要的特性。

Liquid AI 已表示計劃在未來數月內開源包括 Hyena Edge 在內的一系列基礎模型,其目標是構建能夠適應從云端到邊緣多種環境的 AI 系統。除了模型本身,其所展現出的設計方法,或許更值得我們的期待。

參考資料:

1.https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices

2.https://arxiv.org/abs/2411.17800

3.https://venturebeat.com/ai/liquid-ai-is-revolutionizing-llms-to-work-on-edge-devices-like-smartphones-with-new-hyena-edge-model/

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
曝欽州一女司機故意在校門外開快車,一天先后兩次,疑欲故意沖撞學生

曝欽州一女司機故意在校門外開快車,一天先后兩次,疑欲故意沖撞學生

西虹市閑話
2025-04-28 18:17:09
廣廈26分大勝遼寧奪賽點!布朗30+9趙繼偉被凍結,衛冕冠軍陷絕境

廣廈26分大勝遼寧奪賽點!布朗30+9趙繼偉被凍結,衛冕冠軍陷絕境

體壇紀錄片
2025-04-28 21:48:57
字母哥:我對利拉德無比尊敬 現在這份敬意已到了新的高度

字母哥:我對利拉德無比尊敬 現在這份敬意已到了新的高度

直播吧
2025-04-28 16:04:04
馬云的預測或成真?全國42%的城鎮家庭,可能不得不面臨4個困境

馬云的預測或成真?全國42%的城鎮家庭,可能不得不面臨4個困境

春序娛樂
2025-04-27 10:13:43
曝拒幫肖飛打招呼的醫生是盤尼西林樂隊成員

曝拒幫肖飛打招呼的醫生是盤尼西林樂隊成員

大象新聞
2025-04-28 17:06:20
普京宣布5月8日至10日實施停火,白宮表態

普京宣布5月8日至10日實施停火,白宮表態

環球網資訊
2025-04-28 22:04:35
某女外嫁西班牙,其老公月薪5000歐卻只給她300歐,從不做家務!

某女外嫁西班牙,其老公月薪5000歐卻只給她300歐,從不做家務!

去非
2025-04-28 19:43:42
朱立倫表示5月20日后要發動對賴清德罷免,民眾黨主席稱想要賴下臺已成非常多島內民眾共同心聲

朱立倫表示5月20日后要發動對賴清德罷免,民眾黨主席稱想要賴下臺已成非常多島內民眾共同心聲

環球網資訊
2025-04-28 22:04:35
傳京東外賣上線前,劉強東曾約王興程維姚勁波喝酒:零售任何人都可以做,做外賣也一樣,兄弟們守好自己底線

傳京東外賣上線前,劉強東曾約王興程維姚勁波喝酒:零售任何人都可以做,做外賣也一樣,兄弟們守好自己底線

和訊網
2025-04-28 15:34:49
自動續費很惡心?沒事,老外比我們慘多了。

自動續費很惡心?沒事,老外比我們慘多了。

差評XPIN
2025-04-28 00:05:38
北京、上海最新消費數據,出現斷崖式下滑

北京、上海最新消費數據,出現斷崖式下滑

黑噪音
2025-04-28 04:33:29
中日友好董女士,一生都在走后門:本科經濟,回國4+4直接協和醫學博士

中日友好董女士,一生都在走后門:本科經濟,回國4+4直接協和醫學博士

可達鴨面面觀
2025-04-28 13:31:05
中國已經挑明后果,莫迪還想犧牲中國利益,和特朗普達成交易?

中國已經挑明后果,莫迪還想犧牲中國利益,和特朗普達成交易?

紅色鑒史官
2025-04-28 00:30:03
羅翔:寧愿養出一個任性的女兒,也不要逼迫出一個懂事的女兒

羅翔:寧愿養出一個任性的女兒,也不要逼迫出一個懂事的女兒

清風拂心
2025-04-28 17:20:03
俄軍全面解放庫爾斯克,烏克蘭損失報告出爐,看完數據就知道輸哪

俄軍全面解放庫爾斯克,烏克蘭損失報告出爐,看完數據就知道輸哪

碳基生物關懷組織
2025-04-27 18:46:31
深夜!美國財長,突然宣布!

深夜!美國財長,突然宣布!

證券時報
2025-04-28 23:49:05
舉報后再發:楊白勞借黃世仁錢的利息是多少?這又刺痛了多少人?

舉報后再發:楊白勞借黃世仁錢的利息是多少?這又刺痛了多少人?

翻開歷史和現實
2025-04-28 14:48:17
哈爾濱某法警崗考生遭舉報,發表大量極端言論:刀全世界,閹割所有男人

哈爾濱某法警崗考生遭舉報,發表大量極端言論:刀全世界,閹割所有男人

不掉線電波
2025-04-28 19:35:11
特朗普再談克里米亞問題 德防長稱美要求烏割讓領土太過分

特朗普再談克里米亞問題 德防長稱美要求烏割讓領土太過分

財聯社
2025-04-28 16:02:08
德國足協回應呂迪格事件:我們已和他本人聯系,他被皇馬過度渲染的緊張氛圍影響

德國足協回應呂迪格事件:我們已和他本人聯系,他被皇馬過度渲染的緊張氛圍影響

雷速體育
2025-04-28 18:54:20
2025-04-29 02:03:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15114文章數 513595關注度
往期回顧 全部

科技要聞

傳騰訊阿里從字節搶購算力資源 字節否認

頭條要聞

媒體:新央企中國雅江集團正籌備

頭條要聞

媒體:新央企中國雅江集團正籌備

體育要聞

“我們欠球迷一個冠軍慶典,現在可以狂歡了”

娛樂要聞

黃渤青島做東請客 桌上全人情世故

財經要聞

外賣平臺陷入內卷,傷害的是誰?

汽車要聞

東風日產,重新起跑

態度原創

旅游
本地
教育
時尚
健康

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

與重慶超合拍|取景框對準來福士,開機你的電影感之旅

教育要聞

方程很復雜,硬解實數不理智

五一,就躲在家里看書吧!

唇皰疹和口腔潰瘍是"同伙"嗎?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 江油市| 垫江县| 富蕴县| 城固县| 威海市| 务川| 土默特左旗| 承德县| 方正县| 宁远县| 南江县| 临洮县| 油尖旺区| 依安县| 黄骅市| 怀柔区| 新平| 稷山县| 巍山| 聂荣县| 八宿县| 延津县| 金华市| 法库县| 山东| 沙雅县| 泾阳县| 天峨县| 咸宁市| 将乐县| 镶黄旗| 林芝县| 琼海市| 南京市| 武川县| 丁青县| 宿州市| 广西| 筠连县| 东港市| 内江市|