在一輪輪 AI 基礎建設起來之后,目前率先卷起來的應用場景,是「深度研究」。
更準確、更針對、更深入,看到「深度研究」卷成這樣,不禁要大呼:完了,搜索引擎都別干了。
別急,還未必就這樣。
Semrush 是一個監測網站的訪問流量變化的平臺,數字營銷及 SEO 在調研中發現,Semrush 統計顯示,被認為最容易受到 AI 威脅的維基百科,流量實際上并沒有如預期般走低。
月均訪問量仍然有 50 億次,誰說的 Wikipedia 馬上就要被 AI 干掉了?
甚至不同于搜索引擎,支持關鍵詞又支持完整句, 維基百科是一個「詞條」導向的檢索方式,純復古。
AI 搜索不斷進化的過程,實際也在不斷證明 Wikipedia 的重要性,或者說內容來源的重要性。
幻覺橫行的舊版本
早期把 AI 應用到搜索場景中時,它的 幻覺是一個嚴重的問題。尤其是預訓練和參數量被視為唯二法則的時候,LLM 有時會給出行文上看起來合理,但實則虛假的回答。
「一本正經地胡說八道」是最常見的形容。比如,去年兩位紐約律師遭到了法庭制裁,因為他們提交的文書中,有六個案件引文完全不存在,是律師們在用 GPT 生成時,模型憑空捏造出來的 。
這個例子多少有點離譜,卻很典型:在早期 AI 搜索沒有被質疑的時候,引用鏈接還不是常見的設計,導致 AI 直接給出的單一答案往往缺乏透明度,很難核查。
這對于某些領域的工作而言是非常致命的。2022 年,Meta 曾經發布過一版名為「Galactica」的模型,主打科研場景,但沒幾天就被科研人員大量投訴,Meta 不得不緊急撤回一個發布。
相比之下,傳統搜索引擎的排列,有一套規則和判斷方式。以 Google 去年發布的 Google’s Search Quality Rater Guidelines 中,提出了一套「EEAT」法則:
簡而言之就是, 經驗、專業性、權威性、可信度,這四個維度,共同構成了 Google 抓取內容時的標準。同時,平臺還會根據用戶反饋,調整頁面排名,使低質內容沉底。 這些機制,都對錯誤信息和低質內容起到了過濾的效果,從而保障整體信息質量。
當然,不能忽略的是,當競價廣告成為傳統搜索引擎的主要收入來源之后,這一套機制也要對營收妥協。
不過,傳統搜索引擎的形態在很長一段時間內沒有發生變化。而 AI 搜索,在過去一兩年里快速進步,在形態上發生了翻天覆地的改變。
有「深度研究」就可以不核查了嗎?
今年才過去三個月,主流的大模型廠商紛紛推出 Deep Research 服務。從 OpenAI、DeepSeek,到剛推出不久的 Grok 3,以及曾經的弄潮兒 Perplexity,「深度研究」成了一時間,家家都在卷的功能。
所有的 Deep Research 都有一點共性: 內容有來源,且來源可追 溯。
在以往,AI 生成的回答就是一個完整的段落,讓人沒法核查。有些即便提供了引用來源,溯源依然有很大的難度。
比如,模型羅列了一大堆網站和文檔,但實際只用了其中一小部分內容?;蛘呓o出的回答主要靠數據集的「記憶」來生成,而非檢索到的文檔。
而作為 Deep Research 模式的 基本操守,來源是必須有的。在 ChatGPT 的 Deep Research 中,會文內顯示來源網站的域名。
Grok 3 里面是在思考過程里列出網址,報告正文有時候會觸發出文內引用,有時候沒有,看情況。
Perplexity 的方式是數字角標,鼠標懸停時會顯示一段介紹網頁內容的話。
如果你是老網民,大概率還保留著對域名的敏感。能辨別對.org .edu .gov 這類后綴的潛臺詞:這是來自機構的網頁,有更高的可信度。
像上面 Perplexity 的例子,就是來自商務部的專欄。
Deep Research 加強了內容來源的透明度,這是符合用戶習慣的:在搜索信息時, 用戶不僅要求答案準確,還要求過程透明、結果可驗。
到這一步為止,好像都還看不出什么變化:這不都能在站內解決?還有搜索引擎什么事兒嗎?
有的,甚至不只是傳統搜索引擎,而是核查這個工作,并不是看看網頁是不是非法站點就完成了的——這恰恰讓人更加無法放棄傳統搜索引擎。
AI 搜索節省的是在搜索引擎的列表上,一路點開、查看的操作時間。如果你有一個明確熟悉的領域,效率的提升其實有限。就像 PubMed 之于醫學生,arxiv 之于技術人員,github 之于程序員,等等等,簡直像「家」一般熟悉。
但這個環節,像是把大塊的石頭放進瓶子里:兩三塊可能就塞不下了,卻還是有很多空間可以放倒碎石。碎石也倒不了了,還可以倒細沙,直到把瓶子里的每一寸空間都填滿。
這些碎石細沙,相當于 需要長尾查詢的信息,這往往涉及非常具體的細節或小眾的知識點——你只能自己判斷。
這種場景下,AI 的優勢變成了劣勢。 被高度濃縮和提煉過的信息,沒有足夠的廣度和多樣性,反而限制了做判斷時的動作幅度。
比方說你想了解一下最新的小米 15 Ultra,「了解」二字的背后其實涉及了很多層面:它價格多少、什么時候上市、與你現在的手機相比如何、它的售價相對于你的銀行存款如何、預售排隊嗎……等等等等。
購買決策是一個復雜的鏈條,它涉及到外部對比和內部對比,外部對比可以只看同類產品的競爭力,但內部對比就要考慮自己使用、偏好等各種情況——前者可以有 AI 幫忙,后者就純靠自己拿捏了。
你要對著 chatbot 把自己的家底都嘮清楚嗎?很難。你要把自己的微信支付賬單上傳給 AI,讓它分析你的財務實力嗎?很難。
千頭萬緒,你最想要了解的,還是匯成了兩個關鍵字:「小米 Ultra」「價格」。
然而這些具體又小眾的信息點,并不是人人都能用精準的語言描述出來的。它仍然是一個關鍵字探查之旅: 你最想了解的東西,就是你打出的那個關鍵字。
有這么一個說法:遇事不決拋硬幣的時候,拋出那一刻、硬幣尚未落地時,你心中冒出的念頭,就是你在找的答案。
在搜索引擎上檢索,就是在拋硬幣,一次不行拋兩次,兩次不行拋三次,直到搜集足夠多的細沙,把石頭的空隙填滿。
各類「深度研究」很好用,以后也會越來越好用,但眼下我還不能沒有搜索引擎。
我們正在招募伙伴
簡歷投遞郵箱
hr@ifanr.com
?? 郵件標題
「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.