99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從零復(fù)現(xiàn),全面開源:360 Light-R1-14B/7B帶來端側(cè)AI平權(quán)時刻

0
分享至



性能領(lǐng)先、開源普惠、國產(chǎn)易獲取的三重勢能,造就了年初DeepSeek的技術(shù)平權(quán)狂熱,掀起AI普惠浪潮。

然而,當(dāng)很多人想在端側(cè)部署DeepSeek模型時,卻遭遇了挑戰(zhàn):部署滿血版大模型需數(shù)萬元硬件投入,退而求其次選擇蒸餾版14B版本,又會出現(xiàn)性能斷崖式下跌與響應(yīng)延遲。

就在AI用戶陷入“高成本部署”與“低質(zhì)量妥協(xié)”的兩難困境時,端側(cè)AI的破局時刻,悄悄被360打開了。

近期,360智腦團(tuán)隊發(fā)布了最強(qiáng)14B推理模型Light-R1-14B-DS,是業(yè)界首次在14B模型上復(fù)現(xiàn)強(qiáng)化學(xué)習(xí)效果。數(shù)學(xué)能力上,表現(xiàn)超過
DeepSeek-R1-Distill-Llama-70B和DeepSeek-R1-Distill-Qwen-32B。



盡管只訓(xùn)練了MATH數(shù)據(jù),但在GPQA科學(xué)常識評測中,7B/14B雙版本均超越對標(biāo)產(chǎn)品,展現(xiàn)出“小參數(shù)大智慧”的泛化能力。

此外,配合360的全面開源策略(模型/數(shù)據(jù)/代碼/技術(shù)報告全開放),這場端側(cè)AI平權(quán)運動,意味著14B模型能在手機(jī)端流暢運行,意味著企業(yè)無需天價算力即可部署專業(yè)級AI。

AI端側(cè)民主化的風(fēng)暴眼,正在醞釀之中。



我們第一時間研讀了360放出的技術(shù)報告,發(fā)現(xiàn)端側(cè)AI的技術(shù)拐點已經(jīng)出現(xiàn)。360開源的Light-R1-14B-DS創(chuàng)造了三項行業(yè)紀(jì)錄:

一是能力復(fù)現(xiàn)。Light-R1-14B-DS首次在數(shù)學(xué)能力上,用14B 模型復(fù)現(xiàn)了強(qiáng)化學(xué)習(xí)效果,通過多階段課程學(xué)習(xí)SFT強(qiáng)化學(xué)習(xí),Light-R1-14B-DS的表現(xiàn)超過
DeepSeek-R1-Distill-Llama-70B和DeepSeek-R1-Distill-Qwen-32B,是目前最優(yōu)的14B模型,這驗證了RL強(qiáng)化學(xué)習(xí)策略的有效性,RL對端側(cè)模型訓(xùn)練的收益很大,仍有進(jìn)一步挖掘潛力。



(Light-R1 訓(xùn)練流程)

二是效率革命。Light-R1-14B-DS 經(jīng)過長思維鏈強(qiáng)化學(xué)習(xí)后訓(xùn)練,在AIME 24和25上分別取得了74.0和60.2的成績,數(shù)學(xué)部分表現(xiàn)超越DeepSeek的70B(72.6分)和32B(54.9分)蒸餾模型,取得了非常顯著的提升,這標(biāo)志著推理能耗進(jìn)一步降低。另一版本的Light-R1-7B-DS,無需量化即可端側(cè)部署。此次探索,在低成本復(fù)現(xiàn) DeepSeek-R1方面邁出了重要一步。

三是泛化能力增強(qiáng)。Light-R1-14B-DS在科學(xué)常識評測GPQA上漲,打破了模型“災(zāi)難性遺忘”的魔咒,具有較好的泛化性,開辟模型優(yōu)化新路徑。



最強(qiáng)14B端側(cè)推理模型,撕開了DeepSeek 70B的性能封鎖線,端側(cè)AI迎來了規(guī)模化普及的拐點。不過,在AI與大眾之間,還差一個開源。



如果僅有技術(shù)突破,但沒有開源機(jī)制,那么端側(cè)推理模型再好,也無法被大眾輕松獲得、低成本用起來。

此次,360采取了全棧式的開源策略——模型權(quán)重、22萬條數(shù)學(xué)數(shù)據(jù)集、RL訓(xùn)練代碼、技術(shù)報告等,都悉數(shù)公開。這種開源深度,遠(yuǎn)遠(yuǎn)超過了常規(guī)模型權(quán)重開放。

也就是說,中小團(tuán)隊僅需極少算力,就能從數(shù)據(jù)清洗到強(qiáng)化學(xué)習(xí)全鏈路復(fù)現(xiàn),完成端側(cè)AI的后訓(xùn)練與部署。

端側(cè)AI的民主化,高度依賴于科技企業(yè)的開源策略,為什么說360此次開放端側(cè)推理模型很重要?



對企業(yè)來說,傳統(tǒng)端側(cè)AI部署,會面臨閉源模型高昂的授權(quán)費用(如OpenAI API調(diào)用成本)與硬件適配的邊際成本(需定制化芯片或服務(wù)器),成本難以承受。此前openai也發(fā)布過蒸餾版o1-mini,但高昂的訂閱費依然讓大量開發(fā)者望而卻步。此外,閉源模型存在不可解釋性風(fēng)險,醫(yī)療、法律等行業(yè)因合規(guī)要求無法接受“輸入-輸出”不透明的AI決策。因此,Light-R1-14B-DS這樣低成本、全開源的國產(chǎn)端側(cè)推理模型,有望打消企業(yè)對AI的顧慮,輕松邁入智能化。

對個人來講,云端模型需要上傳數(shù)據(jù),這會引發(fā)隱私泄露的顧慮。而在端側(cè)離線運行大模型,又對算力/內(nèi)存有更高的要求,傳統(tǒng)端側(cè)AI需要旗艦級設(shè)備,買不起旗艦機(jī),就用不到好AI,這形成了一種AI時代的“設(shè)備歧視”。



360開源最強(qiáng)14B端側(cè)模型,讓端側(cè)AI能力不再是少數(shù)機(jī)型的特權(quán),也可以下沉到普惠機(jī)型上,為大眾所用。而用戶規(guī)模的擴(kuò)大,也會推動AI應(yīng)用及大模型產(chǎn)品的增長。

由此看到,360開源策略所帶來的技術(shù)民主化,可以激活A(yù)I的長尾需求,加速AI普惠的到來。



終端設(shè)備,是用好AI的載體。推理模型下沉到端側(cè),應(yīng)用空間也十分廣闊,打開了端側(cè)AI的無限想象空間。

預(yù)測一下,目前這兩個最強(qiáng)端側(cè)14B/7B推理模型,可能會首先落地在商業(yè)價值高的場景,然后一步步滲透進(jìn)各行業(yè)。

首當(dāng)其沖的,就是消費電子領(lǐng)域。智能手機(jī)、手表、平板、PC、眼鏡等終端設(shè)備,近兩年都在加速AI化。

但此前AI化有兩種方案:一是純端側(cè),保證本地隱私安全,但內(nèi)存要求高,功耗大;另一種是端云結(jié)合,部分任務(wù)上云處理。Light-R1-7B-DS無需量化即可部署于終端設(shè)備(如手機(jī)、IoT設(shè)備),標(biāo)志著消費級硬件也能運行復(fù)雜AI任務(wù)。對比傳統(tǒng)需要32B以上參數(shù)的端側(cè)模型,其7B規(guī)模大幅降低內(nèi)存占用和能耗。為AI終端帶來了更大的創(chuàng)新空間,比如在手機(jī)本地運行復(fù)雜數(shù)學(xué)輔導(dǎo)、法律文書解析等任務(wù),解決隱私和延遲痛點。



360的技術(shù)突破與全棧開源,可以為消費電子領(lǐng)域的AI探索帶來非常有益的借鑒。

下一個就是重點行業(yè)、垂直領(lǐng)域。金融、政務(wù)、醫(yī)療、法律等數(shù)字化基礎(chǔ)較好的行業(yè),積極擁抱AI,又希望在本地化運行專業(yè)級AI,避免敏感數(shù)據(jù)上傳云端,這就需要專有模型+后訓(xùn)練,最強(qiáng)端側(cè)14B/7B推理模型可以大幅降低端側(cè)專有模型的訓(xùn)練、推理等硬件門檻,加速行業(yè)智能化探索。

更進(jìn)一步,傳統(tǒng)行業(yè)壁壘也將被端側(cè)普惠AI撕開。比如智慧城市治理,通過部署端側(cè)AI的邊緣智能計算,可以極大減少智能化的建設(shè)和升級運維成本;農(nóng)業(yè)智能化,搭載14B模型的農(nóng)業(yè)無人機(jī),路線自動避障、精準(zhǔn)識別地面等能力,都會隨著推理能力的增強(qiáng)而大幅提升。



通過端側(cè)AI的普惠路線圖,來進(jìn)行推演,不難看到,360的技術(shù)突破與開源策略,一定會吸引大量行業(yè)開發(fā)者或個人開發(fā)者前來試用,與豐富的場景相結(jié)合,催生大量智能化的長尾應(yīng)用。

也就是說,通過開源輕量級推理模型,360有望規(guī)避AI六小強(qiáng)在千億參數(shù)級的競爭。基于開源開放的技術(shù)公信力,構(gòu)建開發(fā)者生態(tài)護(hù)城河。從這個角度看,360掀起的端側(cè)AI颶風(fēng),也將卷出一個大模型競爭的新格局。

端側(cè)推理模型的平權(quán)時刻已到,萬億級邊緣智能市場正蓄勢待發(fā)、乘風(fēng)遠(yuǎn)航。



聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
越南談中越戰(zhàn)爭:中國不是給越南一個教訓(xùn),而是摧毀,他們做到了

越南談中越戰(zhàn)爭:中國不是給越南一個教訓(xùn),而是摧毀,他們做到了

欽點歷史
2025-04-26 17:40:05
再次收獲30+!詹姆斯和喬丹是歷史上僅有的兩位達(dá)到季后賽100場30+的球員

再次收獲30+!詹姆斯和喬丹是歷史上僅有的兩位達(dá)到季后賽100場30+的球員

雷速體育
2025-04-26 12:41:12
74年周總理下達(dá)特別絕密:妥善保管273號骨灰盒,多年后真相大白

74年周總理下達(dá)特別絕密:妥善保管273號骨灰盒,多年后真相大白

小米一個
2025-04-26 16:30:11
表面是演員,實際軍銜卻高到嚇人,這4位明星個個深藏不露!

表面是演員,實際軍銜卻高到嚇人,這4位明星個個深藏不露!

草莓解說體育
2025-04-25 01:51:46
符勇、石晟屹、許達(dá)昌、韓碧蕓、侯同波、覃俊,被罷免

符勇、石晟屹、許達(dá)昌、韓碧蕓、侯同波、覃俊,被罷免

上觀新聞
2025-04-26 11:58:04
狗子睡覺太死被禿鷲誤會,在旁苦等半天,結(jié)果...

狗子睡覺太死被禿鷲誤會,在旁苦等半天,結(jié)果...

英國那些事兒
2025-04-21 23:32:58
浙江女子曬婆婆和親媽做的區(qū)別菜火了,網(wǎng)友:沒有對比就沒有傷害

浙江女子曬婆婆和親媽做的區(qū)別菜火了,網(wǎng)友:沒有對比就沒有傷害

阿龍美食記
2025-04-26 12:35:14
湖人vs森林狼G3復(fù)盤筆記:愛德華茲關(guān)鍵攻防 老詹對抗時間

湖人vs森林狼G3復(fù)盤筆記:愛德華茲關(guān)鍵攻防 老詹對抗時間

北青網(wǎng)-北京青年報
2025-04-26 17:16:03
趙麗穎帶兒子買玩具,想想眉眼酷似馮紹峰,牽著媽媽的手乖巧可愛

趙麗穎帶兒子買玩具,想想眉眼酷似馮紹峰,牽著媽媽的手乖巧可愛

毗那夜迦
2025-04-26 01:00:03
怎么吹?胡荷韜96分鐘門線解圍力保蓉城3分 獻(xiàn)多次搶斷及關(guān)鍵傳球

怎么吹?胡荷韜96分鐘門線解圍力保蓉城3分 獻(xiàn)多次搶斷及關(guān)鍵傳球

直播吧
2025-04-26 17:50:09
金晨身上有多處紋身,作為公眾人物在形象展示上還是有點不妥吧?

金晨身上有多處紋身,作為公眾人物在形象展示上還是有點不妥吧?

喜歡歷史的阿繁
2025-04-26 00:37:57
全紅嬋老家蓋新房,老爹找的別墅建筑隊已入場,大片空地被推平

全紅嬋老家蓋新房,老爹找的別墅建筑隊已入場,大片空地被推平

奇特短尾矮袋鼠
2025-04-25 17:25:08
83歲高明喪子后首露面,滿頭白發(fā)神情黯然,遺孀發(fā)文令人淚目!

83歲高明喪子后首露面,滿頭白發(fā)神情黯然,遺孀發(fā)文令人淚目!

古希臘掌管月桂的神
2025-04-25 14:46:42
NBA季后賽明天4月27日賽程:第四場勇士主場PK火箭

NBA季后賽明天4月27日賽程:第四場勇士主場PK火箭

薇說體育
2025-04-26 17:30:25
北影節(jié)晚宴暴露咖位:林志玲無人問津,金晨被冷落,c位雷打不動

北影節(jié)晚宴暴露咖位:林志玲無人問津,金晨被冷落,c位雷打不動

頭號劇委會
2025-04-25 12:23:15
安徽鐵塔的瓜!疑內(nèi)部人員稱:各自有家庭,事發(fā)時媒體設(shè)備沒開機(jī)

安徽鐵塔的瓜!疑內(nèi)部人員稱:各自有家庭,事發(fā)時媒體設(shè)備沒開機(jī)

奇思妙想草葉君
2025-04-25 23:29:40
58年毛主席來濟(jì)南軍區(qū),無意間看到67軍軍長,直呼昵稱:小李子

58年毛主席來濟(jì)南軍區(qū),無意間看到67軍軍長,直呼昵稱:小李子

悠閑歷史
2025-04-25 17:20:45
每天只睡5小時!杭州程序員腦干出血,昏迷15天!醫(yī)生:這個時段一定要睡覺

每天只睡5小時!杭州程序員腦干出血,昏迷15天!醫(yī)生:這個時段一定要睡覺

環(huán)球網(wǎng)資訊
2025-04-24 13:47:06
已確認(rèn)!他在空襲中喪生

已確認(rèn)!他在空襲中喪生

FM93浙江交通之聲
2025-04-22 21:35:54
重慶好色院長包養(yǎng)20名情婦,案發(fā)后,竟因一本日記被判十二年

重慶好色院長包養(yǎng)20名情婦,案發(fā)后,竟因一本日記被判十二年

朝暮書屋
2024-04-24 16:57:00
2025-04-26 18:23:00
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3319文章數(shù) 166801關(guān)注度
往期回顧 全部

科技要聞

李斌:對蔚來公司四季度盈利非常有信心

頭條要聞

美媒記者探訪義烏工廠 工人們懟:你以為我們怕美國嗎

頭條要聞

美媒記者探訪義烏工廠 工人們懟:你以為我們怕美國嗎

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經(jīng)要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續(xù)航100公里 探訪華為兆瓦超充站

態(tài)度原創(chuàng)

游戲
教育
健康
時尚
軍事航空

COD玩家?guī)А昂镒诱◤棥边^安檢 結(jié)局尷尬了!

教育要聞

小學(xué)生體驗“星際探索”、探秘雨林奇境…… | 一周校園新鮮事

唇皰疹和口腔潰瘍是"同伙"嗎?

今夏流行“不穿褲子”!洋氣顯瘦顯腿長,誰穿誰好看!

軍事要聞

印巴交火 從“斷水”到“反制”

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 六盘水市| 青田县| 光泽县| 鹤峰县| 北宁市| 宁晋县| 东平县| 思南县| 奇台县| 开平市| 西青区| 湖北省| 阿城市| 湟中县| 信丰县| 京山县| 防城港市| 太保市| 涞水县| SHOW| 桐乡市| 常山县| 屏南县| 晋江市| 定南县| 泰来县| 东光县| 鄂温| 华坪县| 平南县| 微山县| 屏东县| 临邑县| 巴彦淖尔市| 资阳市| 茌平县| 商洛市| 会理县| 闽清县| 收藏| 淳安县|