99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

推薦場景Scaling Law來了！中科大&華為諾亞方舟聯合推出

2025-03-31 15:22:41　來源: 量子位

北京舉報

0

分享至

當Scaling Law應用于推薦場景，模型又將如何表現？

中科大認知智能全國重點實驗室陳恩紅團隊聯合華為諾亞方舟實驗室推出推薦模型性能定律，首次對模型的性能與模型、數據的規模和質量進行了定量分析。

針對現有工作只能對推薦大模型Scaling Law（擴展定律）做定性分析的局限性，論文首次嘗試對推薦大模型性能擴展定律給出明確的定量預測。

具體地，相較于傳統大模型擴展定律里的數據量指標，考慮推薦領域的數據特性提出了序列數據的質量衡量指標，并從模型性能預測角度出發避免傳統擴展定律帶來參數增大導致的模型過擬合問題。

最終基于論文發現的推薦大模型性能預測定律，能夠在給定的數據集和模型配置下，有效預測模型的擴展潛力，同時實現模型參數的最優性能配置。

下面具體來看。

提出推薦大模型性能預測定律

序列推薦系統旨在根據用戶過去的交互記錄預測下一個推薦給用戶的物品，以此來捕捉用戶的動態偏好。

近年來，隨著商業和互聯網場景中用戶數據量的急劇增長，推薦系統受到了越來越多的關注。然而，為了處理這些龐大的數據集，商用與學術領域均開始采用更為復雜和龐大的推薦模型。

這些模型的高計算要求不僅帶來了巨大的開發成本，而且還使得開發過程中的資源分配和GPU使用變得充滿挑戰。

如上圖所示，為了更好地預測推薦模型在不同情況下的性能，研究者們開發了一系列的擴展定律，用于在無需進行大規模實驗的情況下評估和預測模型效果。

擴展定律最初在大型語言模型中進行探索。例如Chinchilla擴展定律的通過模型參數數量和訓練樣本的數量來預測預訓練損失。

然而，將擴展定律應用于推薦系統分析面臨兩大主要挑戰：

(1) 與擴展定律中通常考察的模型損失指標相比，推薦模型中性能指標（如命中率）更為重要，由擴展定律導向的增大模型規模雖然能使模型損失降低，卻會由于模型過擬合問題導致性能出現衰減。

(2) 除了數據的規模之外，推薦系統的數據集通常具有結構和協作特性，同時重復序列片段和冗余度較高，這使得數據質量成為影響結果的核心因素，但在現有的推薦模型擴展定律中尚未被充分討論。

這些挑戰使得現有的推薦系統擴展定律工作僅僅給出了一些定性的分析，并不能對模型的精度進行定量預測。

為應對這些挑戰，研究人員提出了推薦大模型性能預測定律，首次對模型的性能與模型、數據的規模和質量進行了定量分析。

通過擬合推薦模型的關鍵性能指標，包括命中率（HR）和歸一化折扣累積增益（NDCG），可以定量預測模型的層數和物品嵌入維度對其性能的影響。

此外，為了應對數據質量研究因素匱乏的挑戰，引入了近似熵（ApEn）作為評價數據質量的創新性指標，將原有擴展定律中的數據規模替換為數據規模與近似熵之比，并通過理論和實驗驗證了這一替代的合理性。

研究人員也對提出的大模型性能預測定律進行了應用實驗，有效地預測了模型的最優性能參數配置和擴展潛力。

引入近似熵因子

如前所述，研究人員引入了近似熵因子，以進一步增強序列推薦系統中的擴展定律。

具體來說，近似熵是一種用于量化時間序列數據的規律性和不可預測性的統計測度，其計算方法如下：

首先，對于一個長度為N的時間序列{ }以及參數m（嵌入維度）和r（容差），構造m維向量=[，+1，…，+m-1 ] ，其中=1，…，N-m+1 。然后，定義兩個向量和之間的距離為：

接著，對于給定的容差r ，計算相似性度量：

平均相似性的計算公式為：

最終，近似熵定義為：

在后續對近似熵的計算中，研究人員將容差設定為r = 0 。這一決定是基于推薦物品的獨特特性，其中具有相似ID的產品可能傳達完全不同的意義。

總的來說，近似熵值越高，數據的重復率越高。

然而，傳統熵通常與數據復制率呈現負相關性。因此，盡管ApEn被冠以”熵”的稱謂，但其變化趨勢與傳統熵指標具有相反特性。

為避免概念混淆，本研究采用ApEn′=1/ApEn作為近似熵的最終測度。研究人員進一步引入數據平均最小編碼長度作為最終的數據質量衡量指標。

由于重復的序列模式均可用相似的編碼表征，從而降低平均最小編碼長度，該指標將保障數據的最小可學知識量、有效防止重復與無效數據導致的數據量虛高問題。

研究證明了最小編碼長度有如下的下界保障引理。

假設用戶序列可以被建模為一階非周期性平穩馬爾可夫鏈。如果用戶序列為S={S，∈U } ，那么所有序列的最小編碼長度之和|U|L(C)由以下公式給出：

這個下界表達了在給定的用戶序列情況下，最小編碼長度應該至少等于序列元素長度總和除以序列的近似熵。這個不等式利用了近似熵的概念來提供編碼效率的下界。

于是研究人員將D′=∑∈U|S| · ApEn′(S)代入了原有的擴展定律公式D。

研究人員進一步證明能將每一項參數用1/x+log(x）的形式以加入衰減項，從而優化性能擬合。他們擬合模型的最終形式為：

其中N為模型層數，demb為嵌入維度，D′=∑∈U|S| · ApEn′(S)為數據質量衡量指標，其余均為擬合參數。

實驗環節

驗證實驗

研究人員的驗證實驗目標是驗證理論的準確性，主要從兩個方面進行：一是其模型是否符合擴展法則，二是使用近似熵（ApEn）和標記數量來評估數據規模的方式是否合適。

他們首先檢查模型損失曲線與擴展法則的一致性，從圖像上可看出實際模型性能非常貼合其表現定律。

然后，數據參數D’加入參數進行一并擬合，以研究其影響因素。在下圖中他們擬合的數據參數與ApEn的組合呈現出明確的線性關系，這證明了理論的有效性。

應用實驗

由于性能法則中包含衰減項，使得實現全局最優解成為可能。

在前述擬合分析的基礎上，研究人員在下表從全局和給定參數規模篇兩個方面利用Performance Law給出了兩個參數最優擬合，均獲得了較好的結果。

同時研究人員也可以在小規模實驗上分析擬合參數對模型增大時的提升潛力與全局最優性能進行預測。

他們在下表驗證了這個應用，在更小的衰減項參數上模型的擴展潛力更大，最優結果更強。

更多細節歡迎查閱原論文。

論文鏈接: https://arxiv.org/abs/2412.00430

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Scaling Law無法無限擴展？科學家揭示低精度訓練的極限

DeepTech深科技 2024-11-13 21:38:25
2 跟貼 2
中國公開光電混合計算架構，已完成從概念驗證到產品交付的跨越

DeepTech深科技 2025-04-10 16:24:49
18 跟貼 18

美國關稅棒打實驗室！儀器耗材、版面費瘋狂漲價，引發囤貨潮，科研人：已成為第一批受害者

生物學霸 2025-04-11 17:58:25
2 跟貼 2

“天衍”量子計算云平臺訪問量突破2700萬

經濟觀察報 2025-04-11 14:59:02
5 跟貼 5
福州大學發表最新Science論文

生物世界 2025-04-11 15:34:01
0 跟貼 0

三招干掉BBA，2024年最兇殘的男人

雷科技 2024-11-27 17:49:41
300 跟貼 300

我國EUV光源為何14年難攻克？ASML技術困局深度拆解

宇宙科學探索 2025-04-11 15:13:57
7 跟貼 7
這就是大國的自信，我們的東西老美不得不買

智能相對論 2025-04-11 17:24:30
11 跟貼 11

能夠打敗華為的公司只有華為自己

智能相對論 2025-04-07 19:45:40
1 跟貼 1
我用華為云，10分鐘捏了個DeepSeek滿血版“智能體”

雷科技 2025-04-11 21:14:08
3 跟貼 3
華為Mate一抓一放隔空傳送，效果amazing！

愛范兒 2024-11-27 13:29:05
202 跟貼 202
市場份額50%！ openEuler系裝機量過千萬國產操作系統借開源突圍

量子位 2024-11-19 14:35:43
29 跟貼 29
華為、騰訊、比亞迪都來放大招了！就在1314！

深圳夢 2025-04-11 23:58:10
0 跟貼 0
華為手機鈴聲之絕對音盛，順便還學了幾個單詞

重慶聚焦站 2025-04-08 15:21:34
0 跟貼 0
買華為折疊屏手機，當天就出現異響？輕微響聲，無性能故障

民生大參考 2025-04-11 15:52:15
0 跟貼 0
自動駕駛解放雙手，女子懷里還抱著孩子，華為有這個實力！

生活中的老七 2025-04-10 11:28:40
18 跟貼 18
我每次去美國出差，從來不帶個人手機和電腦，防止被收集信息

蘇浩 2025-04-09 09:45:06
0 跟貼 0
當華為小藝試圖挑戰 DeepSeek

雷科技 2025-02-18 19:06:07
0 跟貼 0
華為Pura70劇烈抖動手機，下一秒徹底震驚，這場面國外見不到！

一休在搞笑 2025-04-11 14:26:53
0 跟貼 0
美商務部長：數百萬美國可以進廠擰螺絲造iPhone

梨視頻 2025-04-10 20:05:23
0 跟貼 0
華為手機摔成這樣了還能用？

社會奇聞知 2025-04-09 14:38:26
1 跟貼 1
“國家隊”智駕新旗艦首曝，疑似華為最高階智駕首款SUV！

車載娛樂 2025-04-09 16:28:28
31 跟貼 31
華為智駕ADS4.0+央企，疑似王炸組合聯手造車

車大拿 2025-04-09 17:09:36
3 跟貼 3
數字化大勢已到，海光搶跑

財聯社 2025-03-13 18:57:17
0 跟貼 0
黃仁勛：DeepSeek激發全球推理熱情，推理將消耗100倍更多的算力

財聯社 2025-02-27 12:10:34
0 跟貼 0
手機鏡頭凸起將徹底消失？華為這個新專利太炸裂了

雷科技 2025-04-11 22:01:52
65 跟貼 65
晚上用華為Pura X的小藝，聊天的搭子！

大龍Dallon 2025-04-10 17:50:50
0 跟貼 0
男子展示華為手機摔成了“曲面屏”還可以正常使用？

青島文藝廣播 2025-04-09 23:50:27
0 跟貼 0
華為汽車AITO M5征服全球網友：希望能象華為手機那樣全球暢銷

老表小梁 2025-04-12 00:39:17
3 跟貼 3
中國AI力量崛起：中美AI大模型差距縮小，阿里通義千問領先全球

人生就是要簡單 2025-04-12 00:12:35
0 跟貼 0
余承東和尼格買提力薦華為Pura X，鴻蒙5賦能，AI眼動翻頁超酷炫

每日經濟新聞 2025-03-21 20:54:36
0 跟貼 0
華為Pura X一用就AI，闊是用來這么玩的

科技鋒說 2025-04-10 09:13:05
1 跟貼 1
馬斯克怒斥特朗普貿易顧問納瓦羅白癡，特斯拉汽車美國制造成分最高

每日經濟新聞 2025-04-09 13:54:43
4 跟貼 4
復旦&微軟開源StableAnimator: 首個端到端ID一致性人類視頻生成

機器之心Pro 2025-03-19 17:41:41
40 跟貼 40
靈魂就是不能交給華為排隊交給高通英偉達

宏傲易 2025-04-12 00:34:55
0 跟貼 0
華為一出手就是王炸：華為公布硫化物固態電池專利！果然遙遙領先

桑經藝 2025-04-11 00:38:57
0 跟貼 0
外媒：一場史無前例的電腦故障后，全球宕機陰謀論甚囂塵上

你得漂亮 2025-04-11 05:31:06
0 跟貼 0
小鵬絕地翻盤，頭號功臣是她！

華商韜略 2025-03-28 14:19:16
0 跟貼 0
國外熱議：美國一紙禁令，臺積電拉黑大陸7納米以上所有芯片代工

房車影視 2025-04-09 12:22:28
1 跟貼 1
拼殺到死 Sok VS 星巴克魔獸爭霸店長推薦

店長推薦你懂的 2025-04-10 07:59:00
0 跟貼 0

卡拉格：如果阿森納能奪得歐冠冠軍，沒人會在乎他們在聯賽的表現

卡拉格：如果阿森納能奪得歐冠冠軍，沒人會在乎他們在聯賽的表現

雷速體育

2025-04-11 22:59:08

約基奇26+16+12，比肩兩大傳奇！威少納投名狀，掘金逆轉灰熊！

約基奇26+16+12，比肩兩大傳奇！威少納投名狀，掘金逆轉灰熊！

釘釘陌上花開

2025-04-12 11:23:30

你能頂得住張元英穿黑絲嗎？

喜歡歷史的阿繁

2025-04-10 06:57:33

7中2+5犯，但他一戰打回輪換！球迷：哈維晚上睡覺都要夢見你

7中2+5犯，但他一戰打回輪換！球迷：哈維晚上睡覺都要夢見你

弄月公子

2025-04-12 10:30:29

我退休工資3000，一年能存40000，如何做到的？

我退休工資3000，一年能存40000，如何做到的？

蟬吟槐蕊

2025-04-12 10:51:21

該儲量美國最多，中國95%都依賴進口，如果美國斷供，中國咋辦？

該儲量美國最多，中國95%都依賴進口，如果美國斷供，中國咋辦？

琉璃聊科學

2025-04-11 22:39:57

中國向全世界宣布，退出五千億美元大項目

中國向全世界宣布，退出五千億美元大項目

鐵拳大衛君

2025-04-11 20:00:18

0-1，0-2！感謝國足！印尼主場或打破68年恥辱紀錄，送國足出局

0-1，0-2！感謝國足！印尼主場或打破68年恥辱紀錄，送國足出局

大秦壁虎白話體育

2025-04-12 09:39:20

海關戲精附體，加稅至今未收！美海關大爺想出合適又體面的理由

海關戲精附體，加稅至今未收！美海關大爺想出合適又體面的理由

大風文字

2025-04-12 09:29:09

關稅重壓下，諾華230億美元在美國建廠

關稅重壓下，諾華230億美元在美國建廠

動脈新醫藥

2025-04-11 19:53:06

放棄核心地位，首選加盟火箭！賽季僅出戰8場，28歲射手要后悔了

放棄核心地位，首選加盟火箭！賽季僅出戰8場，28歲射手要后悔了

熊哥愛籃球

2025-04-11 20:58:35

突發建交！朝鮮遭背刺，全球政治版圖改寫

突發建交！朝鮮遭背刺，全球政治版圖改寫

華語智庫

2025-04-12 08:05:40

這兩天，一位特別的客人來到北京

這兩天，一位特別的客人來到北京

牛彈琴

2025-04-12 10:59:14

“風暴”中的在美中國留學生

界面新聞

2025-04-11 09:08:50

中法免簽，大量法國游客涌入我國，看似旅游卻不去任何景區，為啥

中法免簽，大量法國游客涌入我國，看似旅游卻不去任何景區，為啥

歷史看阿敞

2024-12-28 17:34:59

4月9日上午，仁愛礁傳來消息！賴在這的菲律賓軍艦，不可能拖走了

4月9日上午，仁愛礁傳來消息！賴在這的菲律賓軍艦，不可能拖走了

Ck的蜜糖

2025-04-09 13:52:28

“新型啃老”正在全國蔓延：孩子不上班也不伸手要錢，3000塊能活

“新型啃老”正在全國蔓延：孩子不上班也不伸手要錢，3000塊能活

巢客HOME

2025-04-05 23:19:55

賈一凡：石宇奇是一個非常好的男孩子，但是我們沒有在一起

賈一凡：石宇奇是一個非常好的男孩子，但是我們沒有在一起

懂球帝

2025-04-11 23:10:11

“放棄國籍、替日洗白”，被全網封殺的趙立新，徹底活成了笑話！

“放棄國籍、替日洗白”，被全網封殺的趙立新，徹底活成了笑話！

華人星光

2025-04-09 13:46:02

基辛格預言成真？美國四度擊垮“老二”，中國或成第五個反殺者

基辛格預言成真？美國四度擊垮“老二”，中國或成第五個反殺者

娛樂洞察點點

2025-04-11 12:05:05

追蹤人工智能動態

10303文章數 176094關注度

往期回顧全部

科技要聞

單臺年入20萬！首批人形機器人致富者來了

頭條要聞

牛彈琴：特別的客人來到北京美國公開威脅"后果嚴重"

頭條要聞

牛彈琴：特別的客人來到北京美國公開威脅"后果嚴重"

體育要聞

當意甲冠軍跌入意乙降級區老男孩們坐不住了

娛樂要聞

25歲女歌手突然離世，和大S死因相似

財經要聞

造假累計數百億揭秘東旭集團造假手法

汽車要聞

審美和深層次豪華阿維塔06都辦到了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

旅游

本地

軍事航空

教育要聞

從廈大到武大，985高校出現大量調劑名額“空缺”，原因為何？

繼德訓鞋、老爹鞋之后，今年輪到這雙運動鞋刷屏！

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

本地新聞

華北將迎“歷史罕見”大風

軍事要聞

普京與美國中東問題特使結束會談

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：蓬溪县| 江华| 高要市| 神池县| 建宁县| 盐亭县| 台北县| 香河县| 赤峰市| 吉林省| 栾川县| 淮阳县| 民权县| 会理县| 怀化市| 剑河县| 彭山县| 黔江区| 北海市| 平乐县| 于都县| 郎溪县| 莱州市| 天门市| 辽中县| 阿坝| 三江| 炎陵县| 安福县| 高邮市| 勃利县| 左权县| 乃东县| 修武县| 乌拉特后旗| 乌拉特前旗| 岐山县| 日照市| 渭南市| 乌兰浩特市| 营山县|

<sub id="z0kdz"></sub>

<cite id="z0kdz"></cite>