99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

研究人員打造知識圖譜補全新框架,可用于推薦系統和信息檢索

0
分享至

知識圖譜(KG,Knowledge Graph)是一種關鍵的知識組織形式,其以圖結構將事實知識呈現為(頭實體、關系、尾實體)的三元組(triple)形式。

這種結構化的知識表達方式在眾多領域發揮著基礎性的支撐作用,并廣泛應用于推薦系統、問答系統和情感分析等下游應用中。

然而,盡管主流知識圖譜如 Freebase 和 Wordnet 包含了豐富的知識,但仍然存在嚴重的不完整問題。這意味著在這些知識圖譜中,實體之間缺少大量的關系連接,導致知識圖譜無法全面、準確地反映真實世界的知識。

例如,在描述人物關系時,可能存在某些人物之間的關聯關系未被記錄;在描述事件時,可能缺少關鍵的參與實體或事件發生的背景信息等。這種不完整性嚴重限制了知識圖譜在上述下游應用中的性能和效果,凸顯了知識圖譜補全(KGC,Knowledge Graph Completion)任務的重要性。

已有的解決方案大多通過預設的幾何空間假設學習實體和關系的低維嵌入,并通過定義好的打分函數進行補全。這類方案僅依賴知識圖譜中的三元組,忽略了支持這些三元組的上下文語義,容易得出與事實不符的結論,且在處理長尾實體時表現不佳。

近年來基于文本的方法,利用預訓練語言模型將實體和關系與其標簽和描述進行編碼。由于結構化的三元組與自然語言句子之間存在較大語義差距,其性能仍無法超越最新的基于嵌入的方法。

最近兩年的研究表明,大語言模型較強的語義理解能力和上下文學習能力可以被利用于解決較為復雜的推理問題。

香港中文大學博士生李木之和香港科技大學(廣州)博士生楊策皓認為,通過提供相關的知識和恰當監督,可以激發大語言模型的推理能力,更好地解決知識圖譜補全問題。


圖 | 香港中文大學博士生李木之(來源:李木之)


圖 | 香港科技大學(廣州)博士生楊策皓(來源:楊策皓)

基于此,他們研發出一種名為 KGR3 的 KGC 框架,具體包括如下三個模塊。

檢索模塊:負責收集與待補全三元組相關的語義和結構化知識。這包括:

1)三元組檢索:從知識圖譜中獲取與查詢三元組具有相同關系和相似實體的一些三元組);

2)文本上下文檢索,從知識庫中提取查詢三元組及支持三元組中實體的相關上下文,如標簽、描述、別名等);

3)候選答案檢索(利用先前的 KGC 模型對知識圖譜中的實體進行初步評分和排名,選取排名靠前的實體作為候選答案)。

推理模塊:利用大語言模型的上下文感知推理能力,為具體的不完整三元組生成一些可能的答案。為了引導大語言模型更好地完成任務,他們利用演示提取出的相似三元組幫助大語言模型理解任務,并提供了實體的描述來防止幻覺現象的產生。考慮到大語言模型輸出的噪聲問題,他們會對生成的答案做對齊,確保輸出的實體在知識圖譜中真實存在。

重排序模塊:整合并重排上述兩個模塊的候選答案,使滿足不完整三元組的最佳實體排在較前位置。在這個模塊中,他們通過對訓練集中的三元組頭尾實體進行負采樣來候選答案集,并引入監督微調機制,使大語言模型擁有能夠根據實體描述和已知實體的鄰接三元組從答案集中選擇最佳實體的能力。

實驗結果表明,在文本語義信息、圖譜結構化知識、以及監督微調的多重指導下,即使是參數量較小(1.5B 和 7B)的開源大模型,都有能力很好地解決知識圖譜的補全問題。


(來源:arXiv)

據介紹,KGR3 可被用于推薦系統、信息檢索等領域。例如,KGR3 通過補全知識圖譜中的用戶和物品關系,推薦系統可以發現用戶潛在的興趣點,提供更個性化、符合用戶需求的推薦內容。

在電商平臺上,能根據知識圖譜中的 KGR3 補全的相關實體關系(如品牌關聯、產品功能互補等)推薦搭配產品或相關服務,基于用戶購買歷史推薦相似產品,提升推薦的質量和效果。

在社交網絡平臺的好友推薦或內容推薦中,利用 KGR3 補全后的知識圖譜挖掘用戶之間更深層次的聯系,以及用戶可能感興趣的話題或群組,增強用戶在平臺上的互動和參與度。

據了解,李木之在粵港澳大灣區數字經濟研究院(IDEA,International Digital Economy Academy)訪問期間,在郭健教授和徐鋮晉博士的指導下,他與博士生楊策皓組成團隊,將語境知識圖譜作為研究課題。

團隊察覺到現有 KGC 方法的不足,尤其是嵌入法和文本法在處理語義理解和長尾實體時的局限,而大語言模型雖有潛力但應用受限。

因此,他們決定嘗試探索一種新的解決方案,把圖譜中可以獲取到的知識整合起來,看是否可以大語言模型學會做這樣的任務。經過初步嘗試,他們開發出了 KGR3 框架的雛形,包含檢索、推理和重排序三個模塊,并初步驗證了可行性。

在驗證方案可行之后,他們快速進行了實驗,并首次提交了論文。然而結果不盡人意,評審分數未達預期。審稿人指出,盡管框架的設計有一定創新性,但在性能表現上仍有明顯不足,使用了參數量更多,能力更大的大語言模型,卻未能顯著超過傳統方法,缺乏足夠的說服力。

這一挫折讓他們意識到,研究仍需深入,必須找到提升框架性能的有效途徑。

他們仔細查看了審稿意見,分析實驗數據,發現原本的重排序方案是整個框架的瓶頸。在前序方案中,他們嘗試讓大語言模型去生成候選實體的完整排序。然而,在知識圖譜中并沒有具體排序的監督數據。

于是,他們選擇利用已有 KGC 模型輸出的排序來微調大語言模型,這無益于解決已有方案的缺陷。在閱讀關于大語言模型的其他文獻后,他們認為輸出完整排序實質上增加了任務難度。

相較于在實體間“比大小”,大語言模型更擅長做“選擇題”,因此他們轉換到了現在的方案。同時,他們意識到需要在寫作方面強化研究目的。

在新一版論文中,他們更清晰地闡述 KGR3 框架如何有效利用實體上下文和大語言模型的能力,以及各模塊間的協同工作原理。

此外,他們補充了更多對比實驗,以全面展示 KGR3 在不同數據集、不同基準 KGC 模型、以及不同規模和種類的大語言模型下的優勢,增強研究的說服力。

再次提交論文之后,這一次論文得到了審稿人的一致性高度認可,評審分數大幅提升。審稿人對 KGR3 框架在性能上的顯著提升給予了充分肯定,尤其贊賞其在處理復雜知識圖譜補全任務時的有效性和創新性。

日前,相關論文以《檢索、推理、重新排序:知識圖譜補全的語境增強框架》(Retrieval, Reasoning, Re-ranking: A Context-Enriched Framework for Knowledge Graph Completion)在預印本網站arXiv發表[1],并已被自然語言處理頂會 NAACL 2025 主會收錄。


圖 | 相關論文(來源:arXiv)

未來,團隊計劃將 KGR3 范式延伸至其他知識圖譜推理任務,如歸納式知識圖譜補全和基于知識的問答。

在當前研究中,KGR3 框架已在傳統的知識圖譜補全任務中展現出顯著優勢,但對于未在訓練集中出現的實體(即歸納式設置下的情況),該框架尚無法有效處理。后續,團隊將著力解決這一問題,使 KGR3 能夠應對更復雜、更具挑戰性的實際場景。

例如,在實際應用中,新的實體和關系不斷涌現,能夠處理歸納式 KGC 任務將大大提升知識圖譜的完整性和實用性。

此外,研究人員還計劃將 KGR3 框架應用于知識圖譜問答,從問題理解、知識檢索、答案生成和優化等多個環節入手,充分發揮其在處理知識圖譜和文本信息方面的優勢,為用戶提供準確、有用的答案,進而將語境知識圖譜概念進一步延伸。

參考資料:

1.https://arxiv.org/pdf/2411.08165

排版:劉雅坤

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
取消1.9萬億出口退稅,利大于弊

取消1.9萬億出口退稅,利大于弊

克萊恩財經
2025-04-14 23:08:28
《我的后半生》大結局:劉麗娜到死不知,沈青重新碰她的真實原因

《我的后半生》大結局:劉麗娜到死不知,沈青重新碰她的真實原因

大歪歪
2025-04-16 13:18:45
大逆轉!訂婚強奸案男方全家拒絕緩刑,竟因這一驚人操作…

大逆轉!訂婚強奸案男方全家拒絕緩刑,竟因這一驚人操作…

縱橫談天
2025-04-16 15:27:43
貴州一永輝超市“閉店期間丟失購物車500余輛”!回應:已報警

貴州一永輝超市“閉店期間丟失購物車500余輛”!回應:已報警

環球網資訊
2025-04-16 07:12:07
美防長緊急叫停:再玩失控了!貿易戰前,解放軍早已做好開戰準備

美防長緊急叫停:再玩失控了!貿易戰前,解放軍早已做好開戰準備

文昌每日談
2025-04-14 16:42:59
毛新宇的妻子劉濱有多美?她身著軍裝氣質不凡,一家四口幸福美滿

毛新宇的妻子劉濱有多美?她身著軍裝氣質不凡,一家四口幸福美滿

揚平說史
2025-04-16 20:05:28
九十年代的臥鋪大巴亂成啥樣?網友:我的初次就是在上面丟的

九十年代的臥鋪大巴亂成啥樣?網友:我的初次就是在上面丟的

娛樂圈人物大賞
2025-04-10 01:15:06
動物交配之前為什么要先聞屁股?看似不雅的動作,其實隱藏真科學

動物交配之前為什么要先聞屁股?看似不雅的動作,其實隱藏真科學

凡知
2025-04-16 15:05:44
舊社會的家妓有多慘?被當做“肉屏風”,吞痰液,連娼妓都不如

舊社會的家妓有多慘?被當做“肉屏風”,吞痰液,連娼妓都不如

午夜故事會
2025-04-11 14:51:35
解說員談布彭扎意外離世:俱樂部不可能不知道 別當大家是傻子

解說員談布彭扎意外離世:俱樂部不可能不知道 別當大家是傻子

直播吧
2025-04-16 23:09:11
德媒:舒馬赫在外孫女出生前乘直升機回瑞士,不過兩件事并無關聯

德媒:舒馬赫在外孫女出生前乘直升機回瑞士,不過兩件事并無關聯

直播吧
2025-04-16 10:43:11
滕哈格曼聯首簽出租也是水貨,今夏將遭退貨!對方拒絕1000萬買斷

滕哈格曼聯首簽出租也是水貨,今夏將遭退貨!對方拒絕1000萬買斷

羅米的曼聯博客
2025-04-16 11:46:03
提醒所有股民,A股已發出了終極警告,明天行情已經提前出來

提醒所有股民,A股已發出了終極警告,明天行情已經提前出來

悠然安晴
2025-04-16 12:33:48
處女膜完整也能構成強奸罪嗎:專家:不是判定標準

處女膜完整也能構成強奸罪嗎:專家:不是判定標準

看看新聞Knews
2025-04-16 13:11:17
不得不說,中國人就吃這套:奧迪一降價,30天就狂賣了48168輛!

不得不說,中國人就吃這套:奧迪一降價,30天就狂賣了48168輛!

愛論歷史
2025-04-14 22:13:53
甲亢哥回美國后發18張照片,對中國印象一目了然,釋放了3個信號

甲亢哥回美國后發18張照片,對中國印象一目了然,釋放了3個信號

界史
2025-04-15 13:48:33
葉劉淑儀:夏寶龍講話是在提醒香港企業家勿“利字當頭”

葉劉淑儀:夏寶龍講話是在提醒香港企業家勿“利字當頭”

觀察者網
2025-04-16 21:30:11
荷蘭發達到什么程度了?人口僅1700萬,卻擁有12個世界五百強!

荷蘭發達到什么程度了?人口僅1700萬,卻擁有12個世界五百強!

風到腰彎
2025-04-15 09:32:58
有情有義?梅州進球后全隊雙手合十向看臺鞠躬!告慰布彭扎獲盛贊

有情有義?梅州進球后全隊雙手合十向看臺鞠躬!告慰布彭扎獲盛贊

我愛英超
2025-04-16 21:01:57
銀行女職員的出軌經歷,老公出差不在家,上司賴在家里不肯走

銀行女職員的出軌經歷,老公出差不在家,上司賴在家里不肯走

馬軍情感故事
2024-03-27 11:24:58
2025-04-17 00:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15068文章數 513547關注度
往期回顧 全部

科技要聞

華為問界M8售價公布:36.98萬元起

頭條要聞

鄭永年:特朗普逼中國簽下新版"廣場協議"幾無可能

頭條要聞

鄭永年:特朗普逼中國簽下新版"廣場協議"幾無可能

體育要聞

諾坎普奇跡的兩位當事人,差點靈魂互換

娛樂要聞

娛樂圈的“現實”在岳云鵬身上應驗了

財經要聞

增長5.4% 一季度GDP增速為何超預期?

汽車要聞

又帥又快超實用 極氪007GT獵裝車才是完美的車?

態度原創

房產
健康
教育
數碼
軍事航空

房產要聞

中海|南海·叁號院,以海岸美學重塑海口灣生活向往

在中國,到底哪些人在吃“偉哥”?

教育要聞

AB=BC=10,BD=5,求△ABD面積

數碼要聞

英特爾BTL-S桌面級CPU或即將發布 面向高性能市場

軍事要聞

涉嫌泄密 美防長高級顧問被調查

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 乌兰浩特市| 壶关县| 镇坪县| 舒城县| 巴中市| 平和县| 昆山市| 达州市| 阳城县| 濮阳市| 三台县| 鲜城| 河间市| 浦江县| 兰西县| 新密市| 随州市| 沙坪坝区| 榆林市| 秦皇岛市| 四子王旗| 南城县| 隆德县| 托克逊县| 江川县| 香港 | 遂溪县| 加查县| 临高县| 合川市| 镇江市| 南和县| 玉溪市| 凉城县| 利川市| 台南县| 玉林市| 溧阳市| 社会| 景泰县| 大渡口区|