99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

本科生推翻姚期智40年前的猜想,哈希表的平均查詢時間竟與填滿程度無關

0
分享至


機器之心編譯自量子雜志

作者:Steve Nadis

1985 年,著名計算機科學家、圖靈獎得主姚期智提出了一個與哈希表有關的猜想。現在,40 年過去了,一名本科生卻成功推翻了這個猜想。而這項成就卻源自一個始于 2021 年秋的故事。

量子雜志近日報道了這個故事,機器之心編譯了該文章以饗讀者。


原文地址:

https://www.quantamagazine.org/undergraduate-upends-a-40-year-old-data-science-conjecture-20250210/

2021 年秋季的某天,羅格斯大學的一位本科生 Andrew Krapivin 遇到了一篇論文,而這篇論文將改變他的一生。不過那時候,Krapivin 倒沒有多想。兩年之后,當他終于有空細讀這篇論文時(他說當時只是為了好玩),他還沒意識到:他的工作將讓人重新審視計算機科學領域一種被廣泛使用的工具。

這篇論文題為「Tiny Pointers」,即微型指針。這是一種類似箭頭的東西,指向的是計算機內存中的一段信息或一個元素。Krapivin 很快就發現了一種有望進一步降低指針內存使用量的方法。但首先,他需要一種更好的方法來組織指針指向的數據。


論文標題:Tiny Pointers

論文地址:https://arxiv.org/pdf/2111.12800

他的方法是使用一種常用于存儲數據的方法,即哈希表(hash table)。在探索研究的過程中,Krapivin 最終發現了一種新的哈希表。并且這種新哈希表的工作速度更快 —— 用更少的時間和步數便能找到指定元素。

不過,Krapivin 之前的教授 Martín Farach-Colton 起初對這個新設計深感懷疑,畢竟哈希表似乎早已被人研究透了,很難再取得新進展。

但直覺上的看法并不一定總是對的。為了確認這個新設計的有效性,Farach-Colton 邀請了卡內基梅隆大學的 William Kuszmaul 檢查 Krapivin 的新發明。

Kuszmaul 深感振奮。他記得自己當時對 Krapivin 說:「你不只是想出了一個很酷的哈希表,你實際上徹底推翻了一個已有 40 年的猜想!」

本科生推翻存在 40 年的猜想

Krapivin 推翻的是著名計算機科學家、圖靈獎得主姚期智在 1985 年提出的一項研究。

他們的研究過程是這樣的。1 月份,劍橋大學研究生 Krapivin、任職于紐約大學的 Farach-Colton 以及 Kuszmaul 共同發表了一篇文章。

這篇文章重新探討了開放尋址哈希表(open-addressed hash table)的最優搜索復雜度,以便在檢索時能以盡可能少的探測次數找到元素。文章提出了兩種新的哈希表插入策略 —— 彈性哈希(elastic hashing)和漏斗哈希(funnel hashing),并證明了,即使不隨時間重新排列元素,也可以構建一種哈希表,其預期的搜索復雜度(無論是攤銷復雜度還是最壞情況)遠超以往認為可能的水平。


論文標題:Optimal Bounds for Open Addressing Without Reordering

論文地址:https://arxiv.org/pdf/2501.02305

在論文摘要部分,他們強調了這項研究推翻了姚期智在其開創性論文《Uniform Hashing is Optimal》中留下的核心猜想,并給出了相關的下界證明。

眾所周知,哈希表在計算領域已變得無處不在,主要在于其簡單性和易用性。它通過將數據映射到一個固定大小的數組中,從而實現快速的插入、刪除和查詢操作。哈希表的核心思想是利用哈希函數(Hash Function)將數據的鍵(Key)轉換為數組的索引(Index),從而快速定位數據存儲的位置。

最早的哈希表可以追溯到 20 世紀 50 年代初,自那時起,計算機科學家一直在研究和使用它們。研究人員希望弄清楚這些操作的速度極限。例如,新的搜索或插入可能有多快?


Martín Farach-Colton 幫助 Krapivin 證明了新哈希表與一個長期存在的猜想相矛盾

答案通常取決于在哈希表中找到一個空位所需的時間。而這通常又取決于哈希表的填充程度。

填充程度可以用百分比表示,比如 50% 或 90%,但在研究中,哈希表往往接近完全填滿。

為了更精確地描述這種高填充狀態,研究者們可能會使用一個整數(記作 x)來表示哈希表接近 100% 滿的程度。如果 x 是 100,那么哈希表是 99% 滿的;如果 x 是 1,000,那么哈希表是 99.9% 滿的。

這種衡量填充程度的方法為評估執行查詢或插入等操作所需的時間提供了一種便捷的方式。

此前,研究人員得出這樣一個結論,對于某些常見的哈希表,執行最壞情況下插入操作所需的預期時間與 x 成正比。Kuszmaul 表示:「如果你的哈希表是 99% 滿的,那么你需要查看大約 100 個不同的位置才能找到一個空閑槽位,這種情況是合理的。」

著名計算機科學家姚期智在這篇論文中提出,在具有特定屬性的哈希表中,查找單個元素或空位的最佳方法是隨機地遍歷潛在的位置 —— 這種方法被稱為均勻探測(uniform probing)。他還指出,在最壞的情況下(即尋找最后一個空閑位置時),你無法做得比 x 更好。


論文標題:Uniform Hashing Is Optimal

論文地址:https://dl.acm.org/doi/pdf/10.1145/3828.3836

40 年來,大多數計算機科學家都認為姚期智的猜想是正確的。

Krapivin 沒有囿于傳統的想法,原因很簡單:他不知道這個傳統的想法。他說:「我在不知道姚期智猜想的情況下做到了這一點。」這讓 Tapline 聯合創始人兼 CEO 不禁在 上感嘆說:「無知也是一種福氣。」


Krapivin 在微型指針方面進行的探索最終得到了一種新的哈希表 —— 一種不依賴于均勻探測的哈希表。

對于這種新的哈希表,最壞情況查詢和插入所需的時間與 (log x)2 成正比 —— 比 x 快得多。這個結果直接與姚期智的猜想相矛盾。Farach-Colton 和 Kuszmaul 幫助 Krapivin 證明了 (log x)2 是姚期智所寫的常見哈希表類別的最佳、不可超越的界限。

卡內基梅隆大學的 Guy Blelloch 贊道:「這個結果非常美妙,因為它重新審視并解決了這樣一個經典問題。」

滑鐵盧大學的 Sepehr Assadi 表示:「他們不僅證否了 [姚期智猜想],還找到了該問題的最佳答案。我們原本可能還要再等 40 年才能知道這個正確答案。」


Krapivin 在劍橋大學的國王學院橋上。他的新哈希表可以超出研究者預料的速度更快地查找和存儲數據。

除了證否姚期智的猜想外,這篇論文還包含許多更驚人的結果。這與一個相關但略有不同的情況有關:1985 年,姚期智不僅研究了查詢的最壞情況時間,還研究了所有可能查詢的平均時間。他證明:具有某些屬性的哈希表(包括被標記為「貪婪」的哈希表,這意味著新元素必須放在第一個可用位置)的平均時間永遠不會比 log x 好。

Farach-Colton、Krapivin 和 Kuszmaul 想看看對于非貪婪哈希表,這個限制是否同樣適用。

最終,他們表明這個限制不適用。證明過程很簡單,他們提供了一個反例,即一個平均查詢時間遠遠好于 log x 的非貪婪哈希表。事實上,它根本與 x 無關。

Farach-Colton 說:「你會得到一個數值,而這個數值就是一個常量,與哈希表的填滿程度沒有關系。」也就是說,無論這個哈希表的填滿程度如何,平均查詢時間都是一個常量。

這一事實大出人們意料 —— 甚至連這幾位作者自己也沒有想到。

Conway 說,該團隊得到的結果可能不會帶來任何直接的應用,但這并不重要。「更好地理解這些類型的數據結構很重要。你不知道這樣的結果何時會造就一些東西,從而讓你創造更好的實踐。」

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1-0到1-3!丁俊暉3局0分,斯佳輝被罰7分,或首敗塞爾比終結者?

1-0到1-3!丁俊暉3局0分,斯佳輝被罰7分,或首敗塞爾比終結者?

劉姚堯的文字城堡
2025-04-27 03:27:14
特朗普上臺將滿100天,金融市場給“差評”!電商平臺集體漲價,機構稱“破產咨詢激增”!關稅暴漲44倍,企業主起訴政府

特朗普上臺將滿100天,金融市場給“差評”!電商平臺集體漲價,機構稱“破產咨詢激增”!關稅暴漲44倍,企業主起訴政府

每日經濟新聞
2025-04-27 00:05:07
特朗普示弱,“窮寇” 真能不追?七年前的巴掌猶在臉畔!

特朗普示弱,“窮寇” 真能不追?七年前的巴掌猶在臉畔!

貓眼觀史
2025-04-26 01:07:13
今夏流行“不穿褲子”!洋氣顯瘦顯腿長,誰穿誰好看!

今夏流行“不穿褲子”!洋氣顯瘦顯腿長,誰穿誰好看!

Yuki女人故事
2025-04-25 22:30:18
0-7慘敗!韓媒怒斥:亞冠已徹底喪失公平,冠軍就是為沙特定做的

0-7慘敗!韓媒怒斥:亞冠已徹底喪失公平,冠軍就是為沙特定做的

直播吧
2025-04-26 16:57:12
南京淪陷后,日軍舉行慶祝活動,高級軍官鞠躬時腦袋被砍

南京淪陷后,日軍舉行慶祝活動,高級軍官鞠躬時腦袋被砍

阿七說史
2025-04-25 23:52:40
劉爽下場開撕董明珠:若不收回成命,劉氏與赫舍里家族將抵制格力

劉爽下場開撕董明珠:若不收回成命,劉氏與赫舍里家族將抵制格力

剛哥說法365
2025-04-26 21:04:23
美國拒發簽證,中國代表無法入境,耿爽發聲,聯合國搬遷勢在必行

美國拒發簽證,中國代表無法入境,耿爽發聲,聯合國搬遷勢在必行

說天說地說實事
2025-04-27 02:53:11
廣廈主場19分大勝遼籃,全隊卻不開心!遼籃輸球只因一人不在狀態

廣廈主場19分大勝遼籃,全隊卻不開心!遼籃輸球只因一人不在狀態

生活新鮮市
2025-04-27 00:49:13
特朗普還是贏了?美聯儲連夜“投降”,半小時內美國股市全面大漲

特朗普還是贏了?美聯儲連夜“投降”,半小時內美國股市全面大漲

肆時說
2025-04-26 19:03:47
搬磚9年攢200萬元蓋了別墅!90后男子說自己很后悔

搬磚9年攢200萬元蓋了別墅!90后男子說自己很后悔

新民周刊
2025-04-26 18:07:26
回不來了!臺積電張忠謀正式表態,國內院士:放棄一切幻想

回不來了!臺積電張忠謀正式表態,國內院士:放棄一切幻想

Thurman在昆明
2025-04-27 00:49:43
張柏芝淪為笑話?就算謝霆鋒向王菲示愛100次,她也是“大贏家”

張柏芝淪為笑話?就算謝霆鋒向王菲示愛100次,她也是“大贏家”

春序娛樂
2025-04-26 20:17:52
笑噴!廣西人工降雨結果打到廣東,廣東網友: 表,別打了都快淹了

笑噴!廣西人工降雨結果打到廣東,廣東網友: 表,別打了都快淹了

有趣的火烈鳥
2025-04-26 17:26:07
海關總署:4月22日起,允許符合相關要求的阿根廷牛黃進口

海關總署:4月22日起,允許符合相關要求的阿根廷牛黃進口

每日經濟新聞
2025-04-26 21:57:06
歐洲裁判不慣著楊鳴!繼偉夢回國際賽場,廣廈造19分慘案1-0遼寧

歐洲裁判不慣著楊鳴!繼偉夢回國際賽場,廣廈造19分慘案1-0遼寧

后仰大風車
2025-04-26 21:52:11
澤連斯基“讓步”了

澤連斯基“讓步”了

環球時報新聞
2025-04-26 17:01:11
曝中日友好醫院外科醫生出軌:護士長兩次懷孕,與小三曖昧照流出

曝中日友好醫院外科醫生出軌:護士長兩次懷孕,與小三曖昧照流出

博士觀察
2025-04-26 08:57:28
2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

芳芳歷史燴
2025-04-24 15:23:20
沒人結婚,成都崇州最豪華的喜宴中心倒閉了,才開業一年多

沒人結婚,成都崇州最豪華的喜宴中心倒閉了,才開業一年多

小人物看盡人間百態
2025-04-26 20:42:11
2025-04-27 05:20:49
學術頭條
學術頭條
致力于學術傳播和科學普及,重點關注人工智能、生命科學等前沿科學進展。
1247文章數 5069關注度
往期回顧 全部

科技要聞

百度心響實測:“能用版Manus”開了個好頭

頭條要聞

特朗普將舉行集會慶祝執政100天 美媒:時機不妙

頭條要聞

特朗普將舉行集會慶祝執政100天 美媒:時機不妙

體育要聞

廣廈19分勝遼寧獲開門紅 孫銘徽13分3助崴腳

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

教育
家居
數碼
公開課
軍事航空

教育要聞

你說說看,你做做這樣也可以嗎?

家居要聞

清徐現代 有溫度有態度

數碼要聞

AMD修補高危安全漏洞!歷代Zen架構CPU 100%中招

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

白宮爭吵后特朗普與澤連斯基"首度"碰面

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 晋江市| 浑源县| 石景山区| 新巴尔虎左旗| 永修县| 舟山市| 文山县| 镶黄旗| 广西| 松江区| 会昌县| 汝州市| 烟台市| 原阳县| 池州市| 当涂县| 甘肃省| 加查县| 四川省| 咸丰县| 林州市| 嘉义市| 金塔县| 长寿区| 从化市| 定远县| 临猗县| 芮城县| 耒阳市| 泰来县| 连山| 乐清市| 阿坝| 宣恩县| 长武县| 旺苍县| 体育| 钦州市| 磐石市| 斗六市| 许昌县|