99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

任度雙腦大模型:國內首創技術路線,突破AI技術邊界

0
分享至

禪宗有云:“以小見大,一花一世界,一葉一菩提”。啟示我們即便在微小如一片葉子中,也能洞察到宏大的菩提智慧。

步入AI時代,企業在智能化轉型時,常面臨決策成本高、投入大且效果難以預料的挑戰。在此情境下,企業迫切渴望突破傳統AI推理與訓練邏輯,在大模型時代踐行“以小見大,見微知著”的理念,如同從一葉之中領悟菩提真諦,更精簡高效地駕馭智能化進程。

2021年AI技術迅猛發展初期,就有聲音指出Scaling Law(規模定律)可能存在局限性。然而,ChatGPT從2.0到3.0再到3.5的連續迭代和巨大技術飛躍,使Scaling Law的有效性得到廣泛認可。但ChatGPT 4.0似乎觸及人類現有數據處理的極限時,該領域探索似乎遇到瓶頸。

在此背景下,行業內開始深入探討在通向AGI的征途中,除了依賴Scaling Law外,我們還需要哪些新的策略與方向。大模型的目標應當是追求“智慧”的提升,而不僅僅是參數規模。客戶期待的是大模型在自身實際場景中,像懂自己業務的專家一樣發揮實效,解決實際問題,而不是一個無關痛癢的外部顧問,也不是參數越大越好。大模型要真正在服務客戶時發揮內部專家作用,就不能僅僅停留在表面交互模式,而是必須深入客戶實際數據中進行深度理解和挖掘。因此,集中式預訓練模式需重新審視,實時學習和訓練模式更具探索價值。

一. 大模型的未來,不能完全押注在Scaling Law上

很多模型都在追隨OpenAI的路徑,一味增加模型腦容量(即“參數”),認為這樣能讓模型更聰明。然而近期大量論文表明,大模型的聰明程度與腦容量并非成正比,甚至腦容量增加,聰明程度反而降低。

近期,傳神推出的“任度數推分離大模型”獨辟蹊徑,采用雙網絡架構實現數推分離,把推理網絡與數據學習網絡分開。可將其理解為兩個協同聯動的大腦:一個是客戶數據學習網絡大腦,專注于數據的動態管理與迭代訓練,為模型持續注入知識;一個是推理網絡大腦,作為經大量數據預訓練的基礎網絡,有良好的推理和泛化能力。雙網絡通過共享嵌入層和中間表示層協同工作,形成類似“主腦”與“輔腦”的高效配合模式,既支持獨立訓練,也支持聯合推理。

憑借這一創新模式,傳神成為全球大模型領域第一家實現數推分離技術路線的人工智能企業,也是中國人工智能在行業內的重大突破。



(一)打破上下文輸入長度限制,實現實時的數據學習效果

數推分離的雙網絡架構,能夠突破常規大模型數推混合一體技術架構限制,使得推理大腦成熟后,數據大腦還可以持續不斷地學習接入的數據,并且不影響推理大腦的能力。因此,對于雙網絡架構來講,上下文輸入長度不再受限,可將類似1億字數據乃至更多數據壓縮到神經網絡中實現深度知識理解。

任度大模型的技術架構無需通過大量參數存儲數據來豐富知識,它可依靠數據大腦在客戶場景中實時學習數據。這樣能大幅降低參數規模,進而減少訓練和推理的硬件投入成本。

這種架構能隨著客戶業務發展產生的新數據持續學習并提升完成數據壓縮。在數推分離模式下,更新數據的網絡壓縮對推理網絡影響極小,能廣泛適應各種場景,靈活處理數據,訓練時間可縮短至分鐘級。

(二)客戶本地即可完成數據學習訓練,確保數據安全無憂

雙網絡大模型架構可以降低訓練推理的算力和能耗成本,還能有效避免一體化大模型在客戶數據微調訓練時出現的基座模型能力退化和泛化能力減弱問題。而且,數據網絡學習客戶數據無增加算力和專業人員,數據可在客戶現場完成訓練,學習企業歷史數據和新數據,消除企業的數據安全擔憂。

任度的數推分離雙腦模式在應用中,解決了客戶定制大模型的三大難題:客戶數據需離場、向量效果差、人才投入高,實現本地實時學習,讓客戶數據快速轉化為“專家”為客戶服務。重要的是,客戶數據本地訓練不傳公有云,保障了數據隱私安全。

二. Scaling Law 不是萬能的,性參比才是根本,本土企業需另辟蹊徑

在中國市場,大型語言模型尚未充分體現 Scaling Law。在AGI 領域,Scaling Law 涉及算力、算法、數據三要素,其實現需大量資金支持。過去一段時間,甚至有國際大公司宣稱在大數據、大算力背景下,算法一文不值。

傳神語聯創始人何恩培認為,僅依賴Scaling Law的大模型路線已遇瓶頸,要真正突破需依靠算法與架構。事實上,在不同算法與框架下,模型性能不總與參數規模成正比,采用創新架構的小參數模型憑借高效算法設計,也能有強大性能,甚至在特定指標上超越常規大參數模型。

目前,雙網絡架構的數推分離大模型已應用于任度“雙腦”大模型一體機,其內置的任度大模型有9B和2.1B兩種參數。在多項國內外測評中,9B參數模型與數百億乃至千億參數大模型對比脫穎而出,以更少的參數實現領先性能。

事實上,過高的成本投入已使大模型開發商和使用企業裹足不前。而最佳方案顯然是企業能以最低成本實現大模型應用。相較于大參數模型,小參數模型降低了算力投入和資源消耗,更適合商業落地,且滿足通用場景應用需求,是驗證大模型落地可行性的便捷方式。所以,傳神語聯未來會加大在算法和架構提升大模型能力方面的研發投入,持續迭代。

何恩培堅信,“算法制勝”是具有中國特色的技術路徑之一,這符合中國人的聰明智慧,在以大模型為代表的AI時代尤為重要。相信中國有很多像傳神這樣的團隊在默默耕耘,正在以獨特理念引領智能創新,只是他們現在還未走向臺前,但終將會成為中國 AI 技術發展的重要力量。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
好炸裂!網傳重慶一初三學生因在廁所玩泄物,被學校以書面警告…

好炸裂!網傳重慶一初三學生因在廁所玩泄物,被學校以書面警告…

火山詩話
2025-04-04 07:48:31
多項反制!經國務院批準,對原產美國所有進口商品加征關稅

多項反制!經國務院批準,對原產美國所有進口商品加征關稅

政知新媒體
2025-04-04 18:48:23
網友自曝去中醫館開中藥,竟然發現一粒西藥藥片:這就是中西醫結合嗎?

網友自曝去中醫館開中藥,竟然發現一粒西藥藥片:這就是中西醫結合嗎?

可達鴨面面觀
2025-04-04 22:35:46
特朗普給我們宣布增加34%的關稅后,中美幾乎不存在談判可能了

特朗普給我們宣布增加34%的關稅后,中美幾乎不存在談判可能了

橘色密碼
2025-04-03 11:10:36
深夜大跳水!暴跌超1500點

深夜大跳水!暴跌超1500點

新浪財經
2025-04-04 00:12:05
熱門中概股美股盤前全線下行,阿里巴巴、拼多多跌逾8%,京東跌7.7%,百度、貝殼、小鵬等多股跌6%

熱門中概股美股盤前全線下行,阿里巴巴、拼多多跌逾8%,京東跌7.7%,百度、貝殼、小鵬等多股跌6%

每日經濟新聞
2025-04-04 19:02:07
戰隼出擊,烏軍F16飛入俄境內轟炸

戰隼出擊,烏軍F16飛入俄境內轟炸

史政先鋒
2025-04-04 15:16:19
歐爾班宣布匈牙利退出ICC

歐爾班宣布匈牙利退出ICC

風華講史
2025-04-04 10:09:13
韋立,被查

韋立,被查

新京報政事兒
2025-04-04 21:55:54
美聯儲主席鮑威爾:美聯儲有條件等一等 再考慮是否調整政策

美聯儲主席鮑威爾:美聯儲有條件等一等 再考慮是否調整政策

財聯社
2025-04-04 23:35:33
邊牧在墓區偷吃供品胖成百斤“肥豬”,墓園:會叮囑大爺看好狗狗

邊牧在墓區偷吃供品胖成百斤“肥豬”,墓園:會叮囑大爺看好狗狗

瀟湘晨報
2025-04-04 16:05:04
反制來的太重!數千噸美國牛肉被中國拒絕,美國廠商該偷哭了!

反制來的太重!數千噸美國牛肉被中國拒絕,美國廠商該偷哭了!

皓月前沿
2025-04-04 12:50:12
不容易!庫里賽后將原味球衣送貝克漢姆 腰上纏著厚厚的繃帶

不容易!庫里賽后將原味球衣送貝克漢姆 腰上纏著厚厚的繃帶

直播吧
2025-04-04 16:16:32
特朗普給美股捅出大出血!對等關稅真正意圖是為戰爭做準備?

特朗普給美股捅出大出血!對等關稅真正意圖是為戰爭做準備?

二向箔
2025-04-04 13:52:44
別鬧了,他也能吹成「中國影帝」?

別鬧了,他也能吹成「中國影帝」?

獨立魚
2025-04-04 22:57:17
把美股捅出大出血之后,特朗普發文自夸

把美股捅出大出血之后,特朗普發文自夸

魯中晨報
2025-04-04 09:46:04
蘋果CEO庫克套現超1.7億元!一年內已三次減持蘋果股票,累計套現達8億元

蘋果CEO庫克套現超1.7億元!一年內已三次減持蘋果股票,累計套現達8億元

每日經濟新聞
2025-04-03 15:34:06
何偉文:要做好中美貿易量下降50%的準備

何偉文:要做好中美貿易量下降50%的準備

看看新聞Knews
2025-04-04 00:42:25
10年16冠!曼城官方告別德布勞內:向英超歷史最偉大球員之一致敬

10年16冠!曼城官方告別德布勞內:向英超歷史最偉大球員之一致敬

直播吧
2025-04-04 19:57:12
男子和鄰居妻子偷情后,想交換妻子遭拒他將鄰居滅門,2021年落網

男子和鄰居妻子偷情后,想交換妻子遭拒他將鄰居滅門,2021年落網

漢史趣聞
2025-03-29 14:13:36
2025-04-05 00:07:00
36氪 incentive-icons
36氪
讓一部分人先看到未來
147738文章數 2844667關注度
往期回顧 全部

科技要聞

DeepSeek提出新方法 或將應用于R2

頭條要聞

美媒感慨:特朗普給了中國黃金機遇 讓他們贏得全世界

頭條要聞

美媒感慨:特朗普給了中國黃金機遇 讓他們贏得全世界

體育要聞

挑對手!恩怨局!CBA季后賽故事可太多了

娛樂要聞

汪小菲懶理S媽暗諷,帶孩子戶外散步

財經要聞

中方多箭齊發!對美加征34%關稅

汽車要聞

別克GL8陸尚內飾官圖發布 有望上海車展亮相

態度原創

親子
教育
時尚
家居
本地

親子要聞

巨傷腰的 8 個動作,媽媽占一大半!很多人每天在做

教育要聞

辛集市第二實驗學校燃烽火!620名青少年逐鹿乒乓球邀請賽

在春天,遇見最美的配色

家居要聞

詮釋東方神韻 展現大宅之美

本地新聞

我在新昌當女主|大佛寺氛圍感拉滿 古偶頂流機位GET

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 筠连县| 陵川县| 汉阴县| 互助| 普宁市| 泽库县| 安多县| 黄梅县| 北京市| 明溪县| 上蔡县| 太仓市| 宣化县| 文安县| 耿马| 土默特左旗| 互助| 滨海县| 兰考县| 柳州市| 华蓥市| 陆丰市| 佛山市| 凤凰县| 文水县| 古交市| 沙湾县| 同心县| 额敏县| 浪卡子县| 三都| 临潭县| 苍溪县| 贵港市| 平度市| 伊春市| 霸州市| 宜兰县| 昆明市| 高唐县| 西丰县|