99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

余弦相似度可能沒用?對于某些線性模型,相似度甚至不唯一

0
分享至

機器之心報道

機器之心編輯部

好不容易找了把尺子,結果尺子會隨機伸縮。

在機器學習和數據科學領域,余弦相似度長期以來一直是衡量高維對象之間語義相似度的首選指標。余弦相似度已廣泛應用于從推薦系統到自然語言處理的各種應用中。它的流行源于人們相信它捕獲了嵌入向量之間的方向對齊,提供了比簡單點積更有意義的相似性度量。

然而,Netflix 和康奈爾大學的一項研究挑戰了我們對這種流行方法的理解:余弦相似度可能導致任意且毫無意義的結果。



論文地址:https://arxiv.org/pdf/2403.05440v1

余弦相似度通過測量兩個向量的夾角的余弦值來度量它們之間的相似性,機器學習研究常常通過將余弦相似性應用于學得的低維特征嵌入來量化高維對象之間的語義相似性。但在實踐中,這可能比嵌入向量之間的非標準化點積效果更好,但有時也更糟糕。



圖源:https://www.shaped.ai/blog/cosine-similarity-not-the-silver-bullet-we-thought-it-was

為了深入了解這一經驗觀察,Netflix 和康奈爾大學的研究團隊研究了從正則化線性模型派生的嵌入,通過分析得出結論:對于某些線性模型來說,相似度甚至不是唯一的,而對于其他模型來說,它們是由正則化隱式控制的。

該研究討論了線性模型之外的情況:學習深度模型時采用不同正則化的組合,當對結果嵌入進行余弦相似度計算時,會產生隱式和意想不到的效果,使結果變得不透明并且可能是任意的。基于這些見解,研究團隊得出結論:不要盲目使用余弦相似度,并概述了替代方案。

最近,這篇論文在機器學習社區再度引起熱議,一篇題為《Cosine Similarity: Not the Silver Bullet We Thought It Was(余弦相似度:不是我們想象的靈丹妙藥)》的博客概述了研究內容。



博客地址:https://www.shaped.ai/blog/cosine-similarity-not-the-silver-bullet-we-thought-it-was

有網友表示:「問題沒那么嚴重,相似度指標需要根據嵌入空間進行量身定制,需要測試不同的指標來建立定性評估。」



網友認為余弦相似度應該是一個足夠好的方法。畢竟,「根據 OpenAI 關于嵌入的文檔,他們還在代碼片段中使用了余弦相似度。」



這個結論是怎么得出來的呢?讓我們一起看看這篇論文的主要內容,一探究竟。

研究簡介

研究團隊發現了一個重要問題:在特定場景下,余弦相似度會隨意產生結果,這使得該度量方法變得不可靠。

研究著重分析了線性矩陣模型。這類模型能夠得到封閉形式的解與理論分析,在推薦系統等應用中被廣泛用于學習離散實體的低維嵌入表示。

研究分析了 MF 模型的兩個常用訓練目標:



其中 X 是輸入數據矩陣,A 和 B 是學習到的嵌入矩陣,λ 是正則化參數。

問題根源:正則化與自由度

研究人員發現,第一個優化目標(等同于使用去噪或 dropout 的學習方式)在學習到的嵌入中引入了一個關鍵的自由度。這種自由度允許對嵌入維度進行任意縮放,卻不會影響模型的預測結果。

從數學角度來看,如果 ? 和 B? 是第一個目標的解,那么對于任意對角矩陣 D,?D 和 B?D^(-1) 也是解。這種縮放會影響學習到的嵌入的歸一化,從而影響它們之間的余弦相似度。



來自論文:《Is Cosine-Similarity of Embeddings Really About Similarity? 》

舉兩個隨意產生結果的例子:

1. 在全秩 MF 模型中,通過適當選擇 D,item-item 余弦相似度可以等于單位矩陣。這個奇怪的結果表明每個 item 只與自己相似,而與所有其他 item 完全不相似。

2. 通過選擇不同的 D,user-user 余弦相似度可以簡化為 ΩA?X?X^T?ΩA,其中 X 是原始數據矩陣。這意味著相似度僅基于原始數據,完全沒有利用到學習的嵌入。

線性模型之外

除了線性模型,類似的問題在更復雜的場景中也存在:

1. 深度學習模型通常會同時使用多種不同的正則化技術,這可能會對最終嵌入的余弦相似度產生意想不到的影響。

2. 在通過點積優化來學習嵌入時,如果直接使用余弦相似度,可能會得到難以解釋且沒有實際意義的結果。

研究人員提出了幾種解決這些問題的方法:

  1. 直接針對余弦相似度訓練模型,可能需要借助層歸一化等技術。
  2. 完全避免在嵌入空間中工作。相反,在應用余弦相似度之前,先將嵌入投影回原始空間。
  3. 在學習過程中或之前應用歸一化或減少流行度偏差,而不是像余弦相似度那樣僅在學習后進行歸一化。

語義分析中余弦相似度的替代方案

在論文的基礎上,博客作者 Amarpreet Kaur 歸納了一些可以替換余弦相似度的備選項:

  • 歐幾里得距離:雖然由于對向量大小敏感而在文本數據中不太流行,但在嵌入經過適當歸一化時可以發揮作用。
  • 點積:在某些應用中,嵌入向量之間的非歸一化點積被發現優于余弦相似度,特別是在密集段落檢索和問答任務中。
  • 軟余弦相似度:這種方法除了考慮向量表示外,還考慮了單個詞之間的相似度,可能提供更細致的比較。



圖源:https://www.machinelearningplus.com/nlp/cosine-similarity/

  • 語義文本相似度(STS)預測:專門為語義相似度任務訓練的微調模型 (如 STSScore) 有望提供更穩健和和更可解釋的相似度度量。
  • 歸一化嵌入與余弦相似度:在使用余弦相似度之前,應用層歸一化等歸一化技術能有效提升相似度計算的準確性。

在選擇替代方案時,必須考慮任務的具體要求、數據的性質以及所使用的模型架構。通常需要在特定領域的數據集上進行實證評估,以確定最適合特定應用的相似度。

我們經常用「余弦相似度」來計算用戶或物品之間的相似程度。這就像是測量兩個向量之間的夾角,夾角越小,相似度越高。論文中的實驗結果也表明,余弦相似度給出的答案經常與實際情況不符。

在比較簡單的線性模型上都已經如此隨機,在更復雜的深度學習模型中,這個問題可能會更嚴重。因為深度學習模型通常使用更多復雜的數學技巧來優化結果,這些技巧會影響模型內部的數值大小,從而影響余弦相似度的計算。

這就像是把一個本來就不太準的測量工具放在一個更復雜的環境中使用,結果可能會更不可靠。因此,需要尋找更好的方法,比如使用其他相似度計算方式,或者研究正則化技術對語義的影響。這提醒大家:在開發 AI 系統時,要多思考、多測試,確保工具真的好用。

對于這項研究的結論,你怎么看?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
廉潔底線失守、大肆收錢斂財 中央紀委國家監委駐中央組織部紀檢監察組原組長李剛被“雙開”

廉潔底線失守、大肆收錢斂財 中央紀委國家監委駐中央組織部紀檢監察組原組長李剛被“雙開”

每日經濟新聞
2025-04-07 17:35:02
亞少賽積分榜:印尼2連勝提前晉級世少賽,越南戰平日本有望出線

亞少賽積分榜:印尼2連勝提前晉級世少賽,越南戰平日本有望出線

直播吧
2025-04-08 01:48:05
中國隊出局僅1天!馬德興爆出2大“實情”,崔康熙的話得到印證

中國隊出局僅1天!馬德興爆出2大“實情”,崔康熙的話得到印證

何老師呀
2025-04-07 23:34:10
驚出一身冷汗!鄭欽文苦戰3盤小逆轉獲勝,艱難進8強,再迎復仇戰

驚出一身冷汗!鄭欽文苦戰3盤小逆轉獲勝,艱難進8強,再迎復仇戰

搏擊江湖
2025-04-07 20:18:33
重慶特斯拉失控后續:監控曝光連壓5輛車無人員傷亡,口碑爆了!

重慶特斯拉失控后續:監控曝光連壓5輛車無人員傷亡,口碑爆了!

鋭娛之樂
2025-04-07 16:06:10
520億美元訂單也唬不住中國?第三架C919交付前,波音妥協了

520億美元訂單也唬不住中國?第三架C919交付前,波音妥協了

Thurman在昆明
2025-04-08 00:42:35
簡直不要太像,德云社張婉怡幾乎跟趙麗穎一模一樣。

簡直不要太像,德云社張婉怡幾乎跟趙麗穎一模一樣。

東方不敗然多多
2025-04-07 16:30:04
又一“網紅家電巨頭”跌落神壇!被爆以假亂真,暴跌85%成智商稅

又一“網紅家電巨頭”跌落神壇!被爆以假亂真,暴跌85%成智商稅

夢史
2025-04-07 12:58:44
64歲好萊塢巨星被爆收受5名模特在套房享用,前妻曾控訴其性癮大

64歲好萊塢巨星被爆收受5名模特在套房享用,前妻曾控訴其性癮大

烏娛子醬
2025-04-07 21:50:56
全程僅2分鐘!事發深圳南山,情況緊急!

全程僅2分鐘!事發深圳南山,情況緊急!

深圳晚報
2025-04-07 15:20:27
曝微軟某外包公司的員工全部被裁員!員工:清明節回來就沒工作了

曝微軟某外包公司的員工全部被裁員!員工:清明節回來就沒工作了

小人物看盡人間百態
2025-04-07 21:08:15
經典跑車搞笑冷笑話,有一次進錯群幾個富二代在那聊車,保時捷啊,法拉利啊,蘭博基尼啊

經典跑車搞笑冷笑話,有一次進錯群幾個富二代在那聊車,保時捷啊,法拉利啊,蘭博基尼啊

天天明星
2025-04-06 16:09:39
權貴越無恥,民粹越極端

權貴越無恥,民粹越極端

特例的貓
2025-04-07 07:55:54
34%關稅落地,美國對華宣布新制裁,凍結在美資產,中國強勢回應

34%關稅落地,美國對華宣布新制裁,凍結在美資產,中國強勢回應

歷史微鑒
2025-04-06 16:24:06
奢侈品生意也難做?曾一天賺十億,中國最頂級商場SKP要被賣了

奢侈品生意也難做?曾一天賺十億,中國最頂級商場SKP要被賣了

派大星紀錄片
2025-04-07 19:23:03
炸裂!季后賽首秀61+22!又一個能打NBA的中國后衛……

炸裂!季后賽首秀61+22!又一個能打NBA的中國后衛……

籃球實戰寶典
2025-04-07 22:26:29
說唱女歌手VaVa向楊超越下跪道歉,曾公開質疑其“只會哭”!楊超越回應:大家都很好啦

說唱女歌手VaVa向楊超越下跪道歉,曾公開質疑其“只會哭”!楊超越回應:大家都很好啦

魯中晨報
2025-04-06 17:11:04
李現曬滕王閣游客照,網友大哭:是我拍的,以為是大學生沒認出來

李現曬滕王閣游客照,網友大哭:是我拍的,以為是大學生沒認出來

小俎娛樂
2025-04-07 20:19:17
如果最后3場打滿 約基奇再拿90分12助就能達成賽季場均30+三雙

如果最后3場打滿 約基奇再拿90分12助就能達成賽季場均30+三雙

直播吧
2025-04-07 14:49:18
廣東4地5名干部被查

廣東4地5名干部被查

魯中晨報
2025-04-07 19:59:02
2025-04-08 07:07:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10324文章數 142284關注度
往期回顧 全部

科技要聞

Llama 4發布36小時差評如潮!匿名員工爆料

頭條要聞

特朗普再對歐盟施壓:必須從美國購入能源

頭條要聞

特朗普再對歐盟施壓:必須從美國購入能源

體育要聞

刷屏中文互聯網,甲亢哥是怎么火的?

娛樂要聞

汪小菲身旁的朋友,對馬筱梅的評價

財經要聞

美股巨震!特朗普關稅,又有新變化?

汽車要聞

途昂Pro的五套組合拳打完 看清油車的自我救贖

態度原創

房產
健康
教育
數碼
軍事航空

房產要聞

生猛!三亞開始巨量拆遷!

在中國,到底哪些人在吃“偉哥”?

教育要聞

結果40多人的班級,只有3人做對,看來幾何題還得好好加強啊

數碼要聞

英偉達 RTX 5090 移動版顯卡跑分:略高于桌面版 RTX 5070

軍事要聞

特朗普關稅名單上沒俄羅斯 白宮:為了不影響俄烏和談

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 射阳县| 玛多县| 兴业县| 新蔡县| 织金县| 黄梅县| 克什克腾旗| 旺苍县| 图们市| 尤溪县| 仁寿县| 辛集市| 邯郸市| 裕民县| 盐边县| 桃江县| 长沙县| 田林县| 建湖县| 故城县| 张掖市| 德格县| 焦作市| 高青县| 辽中县| 兰州市| 中宁县| 鄂州市| 滁州市| 富蕴县| 星子县| 广灵县| 获嘉县| 德惠市| 陵川县| 阳东县| 博野县| 剑阁县| 贡山| 长寿区| 依安县|