網易首頁 > 網易號 > 正文申請入駐

AI進化受阻：搜索引擎仍未等到舉杯時刻

2024-11-22 14:38:35　來源: 逐浪

北京舉報

分享至

生活中，越來越難找到打開搜索引擎的理由了。

吃飯有點評軟件，出行有導航地圖，看新聞有資訊APP，購物有網購平臺，聊天有社交媒體。越來越多搜索行為正從傳統搜索框轉移向一個個獨立的APP。

傳統搜索引擎的優勢蕩然無存，處境尷尬。而AI浪潮的來臨，讓傳統搜索有了新的進化方向。

OpenAI正式上線ChatGPT的實時搜索功能；谷歌宣布其“雙子座”AI模型將整合谷歌搜索功能；百度的AI智能回答，對文心大模型日均調用量超6億次。

一場AI時代的搜索新“戰事”正在上演，但AI搜索能否在用戶生活中，提供足夠“必要”的價值，仍是一個值得商榷的問題。

被拋棄的傳統搜索引擎

一直以來，百度都長時間占據著中國互聯網搜索領域的主導者位置。但隨著用戶搜索行為的多元化，傳統搜索引擎的用戶正在逐漸流失。

年輕人們在微博搜明星動態、熱點新聞，在抖音和快手消耗瑣碎時間，在小紅書尋找經驗攻略。

今年6月，釘釘總裁葉軍曾在一場企業家論壇上談到搜索變革，他表示，搜索場景已經被變革掉了，百度也得馬上跟進，如果再不跟進，大家也不會用百度了。

搜索的前提，是平臺有足夠的內容，滿足用戶的信息需求。PC時代，所有內容通過網頁展示，傳統搜索引擎依賴爬蟲技術，抓取互聯網上的網頁，然后進行清洗和排序。當用戶輸入查詢的詞條后，搜索引擎會根據其算法對網頁進行排序，并將結果展示給用戶。爬蟲抓取的信息數量越多，質量越好，傳統搜索引擎的體驗就越高。

而在移動互聯網時代，互聯網入口變為手機上一個個APP，各APP廠商不愿意再將左右生死的流量權，交給搜索引擎，便高筑墻，深挖溝，將爬蟲擋在門外，并加強運營機制，將優質內容、獨家內容留在門內。于是，移動互聯網時代，各APP內容孤島化嚴重，信息從此不再“互聯”。

流量的走向，重塑著新的互聯網格局。但傳統搜索處境下滑的同時，各獨立APP的搜索量與日俱增。

小紅書有將近70%的月活用戶有搜索行為，1/3的月活用戶打開小紅書的第一件事就是直奔搜索；2023年，抖音生活服務搜索GMV增長254%，商品搜索GMV增長143.8%；2024年第二季度，使用快手搜索的月活躍用戶近5億，同時單日搜索次數同比增長超20%。更不用說微博的熱搜，憑借搜索，締造了一個又一個頂流話題。

就目前而言，傳統搜索引擎已經落后于時代，其本質原因，在于搜索引擎并不生產內容，只是內容的搬運工，而搜索內容的需求已經被內容方滿足。

生成式AI的誕生，給了傳統搜索引擎更沉重一擊，人們不再需要在搜索結果中，尋找所需信息，AI已可以通過自然對話方式，代替思考，提供答案。

人們直接跳過“搜索”，直達信息的彼岸。

之于搜索引擎，這是鶴頂紅，卻也是回魂丹。受威脅最大的傳統搜索引擎，成為生成式AI最忠誠的擁躉。

2023年初，微軟宣布與OpenAI合作，推出了由AI驅動的Bing搜索引擎和Edge瀏覽器。

同年5月，谷歌推出由生成式AI驅動的搜索引擎。谷歌稱，這是谷歌搜索引擎多年來最大規模的一次革新。

2023年8月，昆侖萬維推出了國內第一款AI搜索引擎，2個月后，百度也將旗下的簡單搜索升級為AI互動式搜索引擎，在搜索頁面內置文心一言大模型技術。

今年6月，360公司正式發布了“360AI搜索”和“360AI瀏覽器”；同一個月，知乎發布AI搜索產品“知乎直答”；7月，夸克升級了“超級搜索框”，推出以AI搜索為中心的一站式AI服務。

行業出現了“無AI，不搜索”的趨勢，并且各大廠商為AI搜索賦予重任。

生成式AI，正在生成傳統搜索的未來。

AI搜索難當大任

AI搜索引擎與傳統搜索引擎有著顯著的區別。

傳統搜索引擎像一個圖書館的目錄卡，用戶需要提供書的具體書名或作者，才能找到書的位置。AI搜索引擎更像一個圖書管理員，用戶只需要告訴它大概的信息，它就能找到相關的書，并總結書中的主要內容。

而且，AI搜索還不局限于文字，能理解和索引視頻、圖片、語音等內容。還能實現了AI寫作、AI文件總結等操作。

但AI搜索的發展似乎并不順利。以上一切全新體驗的前提，在于搜索的結果，務必精準。

谷歌 AI搜索上線不久后就鬧出了不少笑話。很多用戶都反映，AI搜索在“胡言亂語”。

一位用戶向谷歌AI搜索提問“我每天應該吃多少塊石頭”，得到的回答是“根據加州大學伯克利分校地質學家的說法，人們每天應該至少吃一塊小石頭”。

在今年的百度世界2024大會上，百度發布檢索增強的文生圖技術iRAG，可結合百度搜索的圖片資源，消除大模型，生成各種超真實的圖片，“去除了機器味兒”。

而在媒體復刻發布會所展示的“愛因斯坦與天壇合影”指令時，大模型仍然出現錯誤幻覺：原本三層護欄，變成了四層甚至五層。

就目前而言，AI搜索生成答案的準確性和可靠性依舊難以保證、容易出現事實錯誤，且生成的內容缺乏深度、無法提供有效的溯源。

諾貝爾經濟學獎得主保羅·克魯格曼曾在社交媒體上批評了當前的人工智能，稱它比沒用還糟糕，“有很多關于谷歌和其他搜索引擎退化的消息。這是真的，讓我的工作變得困難”。

同時，AI的濫用還在加劇互聯網信息的混亂，產生很多無效信息、虛假信息，混淆了正常搜索的結果。

今年1月，江西南昌的一家MCN利用AI工具日產7000篇文章。文章內容真假混雜，甚至引發了網傳西安有巨大爆炸聲的謠言。

溫州公安最近也抓捕了一位網絡作者。該作者利用AI工具批量改寫網絡文章，發布到信息平臺從而獲得文章收益，最終造成了諸多不良的社會影響。

伴隨著AI工具的普及，AI制造的無用、虛假信息的數量也越來越多。

清華大學新聞學院的報告稱，近一年來，經濟與企業類AI謠言，增速高達99.91%。谷歌研究人員也發現生成式AI造成的虛假信息正在互聯網上泛濫成災。

雖然，目前AI引發的內容風險還沒有上升到“威脅生存”的地步，但按照AI的發展趨勢來看，這種偽造或篡改的信息會越來越多。

最終導致互聯網的信息更加混亂，使得真實與虛假之間的界限模糊。

甚至AI自己，也將在越發低質的語料庫中停止進化與生長。

信息荒漠時代

隨著 AI 生成的錯誤和無意義的信息會不斷累積，互聯網的錯誤、無用信息占比會逐步增加。

清華大學新聞學院新媒體研究中心主任、跨學科知名學者沈陽說，AI生成的內容急劇增加，大量自媒體文章的內容由AI自動生成，而AI幻覺產生的錯誤就夾雜在這些文章當中，這也會造成整個互聯網的內容質量進一步下降，導致數據質量的整體下降。這種現象被稱為“數據退化”。

AI的訓練和學習需要大量的網絡信息，但大量虛假和無意義的信息只會讓AI陷入混亂，產生錯誤觀念。

不止如此，AI除了要面臨劣質內容的侵害，還面臨優質底層信息的短缺。

研究公司 Epoch AI表示，到2028年，文字資料將會被消耗殆盡。而這些數據是人類在在過去幾個世紀里，創作的大量文字、視頻。

也有人試圖用AI生成的信息訓練AI，但結果并不美好。國外的科學家發現，如果 AI 只學習其他 AI 生成的內容，那么經過幾代訓練后，AI 將輸出無意義的垃圾信息。

他們把這種現象稱為“模型崩潰”。

當前正處于信息大爆炸時代，我們所有人都被大量的信息所包圍，但是對于AI而言，這是一個數據匱乏的時代。

對AI而言，誰能幫助AI擺脫信息匱乏的窘相，誰就掌握了AI發展的未來。為此，OpenAI、Anthropic、百度等公司都在積極開發更優質的合成數據，以此克服挑戰。但大多數學者都持悲觀態度。

今年11月，有外媒報道，OpenAI下一代旗艦模型“獵戶座”（Orion）的性能提升幅度，小于GPT-4相對GPT-3的提升。

其創始人奧特曼曾表示，可能不會把新模型命名為GPT-5。

多位專家勸說AI公司停止訓練大模型，“如果當前趨勢持續，人工智能很快就會耗盡其可用的訓練數據。面對這種情況，AI公司可以選擇停止追求規模更大、更復雜的模型。”

AI是當前互聯網進步的主要動力之一，尤其是對搜索引擎而言，誰能突破AI的限制，誰就掌握了搜索市場的未來。

只是，這杯慶功酒遙遙無期。

文|《逐浪》出品

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.