生活中,越來越難找到打開搜索引擎的理由了。
吃飯有點評軟件,出行有導航地圖,看新聞有資訊APP,購物有網購平臺,聊天有社交媒體。越來越多搜索行為正從傳統搜索框轉移向一個個獨立的APP。
傳統搜索引擎的優勢蕩然無存,處境尷尬。而AI浪潮的來臨,讓傳統搜索有了新的進化方向。
OpenAI正式上線ChatGPT的實時搜索功能;谷歌宣布其“雙子座”AI模型將整合谷歌搜索功能;百度的AI智能回答,對文心大模型日均調用量超6億次。
一場AI時代的搜索新“戰事”正在上演,但AI搜索能否在用戶生活中,提供足夠“必要”的價值,仍是一個值得商榷的問題。
被拋棄的傳統搜索引擎
一直以來,百度都長時間占據著中國互聯網搜索領域的主導者位置。但隨著用戶搜索行為的多元化,傳統搜索引擎的用戶正在逐漸流失。
年輕人們在微博搜明星動態、熱點新聞,在抖音和快手消耗瑣碎時間,在小紅書尋找經驗攻略。
今年6月,釘釘總裁葉軍曾在一場企業家論壇上談到搜索變革,他表示,搜索場景已經被變革掉了,百度也得馬上跟進,如果再不跟進,大家也不會用百度了。
搜索的前提,是平臺有足夠的內容,滿足用戶的信息需求。PC時代,所有內容通過網頁展示,傳統搜索引擎依賴爬蟲技術,抓取互聯網上的網頁,然后進行清洗和排序。當用戶輸入查詢的詞條后,搜索引擎會根據其算法對網頁進行排序,并將結果展示給用戶。爬蟲抓取的信息數量越多,質量越好,傳統搜索引擎的體驗就越高。
而在移動互聯網時代,互聯網入口變為手機上一個個APP,各APP廠商不愿意再將左右生死的流量權,交給搜索引擎,便高筑墻,深挖溝,將爬蟲擋在門外,并加強運營機制,將優質內容、獨家內容留在門內。于是,移動互聯網時代,各APP內容孤島化嚴重,信息從此不再“互聯”。
流量的走向,重塑著新的互聯網格局。但傳統搜索處境下滑的同時,各獨立APP的搜索量與日俱增。
小紅書有將近70%的月活用戶有搜索行為,1/3的月活用戶打開小紅書的第一件事就是直奔搜索;2023年,抖音生活服務搜索GMV增長254%,商品搜索GMV增長143.8%;2024年第二季度,使用快手搜索的月活躍用戶近5億,同時單日搜索次數同比增長超20%。更不用說微博的熱搜,憑借搜索,締造了一個又一個頂流話題。
就目前而言,傳統搜索引擎已經落后于時代,其本質原因,在于搜索引擎并不生產內容,只是內容的搬運工,而搜索內容的需求已經被內容方滿足。
生成式AI的誕生,給了傳統搜索引擎更沉重一擊,人們不再需要在搜索結果中,尋找所需信息,AI已可以通過自然對話方式,代替思考,提供答案。
人們直接跳過“搜索”,直達信息的彼岸。
之于搜索引擎,這是鶴頂紅,卻也是回魂丹。受威脅最大的傳統搜索引擎,成為生成式AI最忠誠的擁躉。
2023年初,微軟宣布與OpenAI合作,推出了由AI驅動的Bing搜索引擎和Edge瀏覽器。
同年5月,谷歌推出由生成式AI驅動的搜索引擎。谷歌稱,這是谷歌搜索引擎多年來最大規模的一次革新。
2023年8月,昆侖萬維推出了國內第一款AI搜索引擎,2個月后,百度也將旗下的簡單搜索升級為AI互動式搜索引擎,在搜索頁面內置文心一言大模型技術。
今年6月,360公司正式發布了“360AI搜索”和“360AI瀏覽器”;同一個月,知乎發布AI搜索產品“知乎直答”;7月,夸克升級了“超級搜索框”,推出以AI搜索為中心的一站式AI服務。
行業出現了“無AI,不搜索”的趨勢,并且各大廠商為AI搜索賦予重任。
生成式AI,正在生成傳統搜索的未來。
AI搜索難當大任
AI搜索引擎與傳統搜索引擎有著顯著的區別。
傳統搜索引擎像一個圖書館的目錄卡,用戶需要提供書的具體書名或作者,才能找到書的位置。AI搜索引擎更像一個圖書管理員,用戶只需要告訴它大概的信息,它就能找到相關的書,并總結書中的主要內容。
而且,AI搜索還不局限于文字,能理解和索引視頻、圖片、語音等內容。還能實現了AI寫作、AI文件總結等操作。
但AI搜索的發展似乎并不順利。以上一切全新體驗的前提,在于搜索的結果,務必精準。
谷歌 AI搜索上線不久后就鬧出了不少笑話。很多用戶都反映,AI搜索在“胡言亂語”。
一位用戶向谷歌AI搜索提問“我每天應該吃多少塊石頭”,得到的回答是“根據加州大學伯克利分校地質學家的說法,人們每天應該至少吃一塊小石頭”。
在今年的百度世界2024大會上,百度發布檢索增強的文生圖技術iRAG,可結合百度搜索的圖片資源,消除大模型,生成各種超真實的圖片,“去除了機器味兒”。
而在媒體復刻發布會所展示的“愛因斯坦與天壇合影”指令時,大模型仍然出現錯誤幻覺:原本三層護欄,變成了四層甚至五層。
就目前而言,AI搜索生成答案的準確性和可靠性依舊難以保證、容易出現事實錯誤,且生成的內容缺乏深度、無法提供有效的溯源。
諾貝爾經濟學獎得主保羅·克魯格曼曾在社交媒體上批評了當前的人工智能,稱它比沒用還糟糕,“有很多關于谷歌和其他搜索引擎退化的消息。這是真的,讓我的工作變得困難”。
同時,AI的濫用還在加劇互聯網信息的混亂,產生很多無效信息、虛假信息,混淆了正常搜索的結果。
今年1月,江西南昌的一家MCN利用AI工具日產7000篇文章。文章內容真假混雜,甚至引發了網傳西安有巨大爆炸聲的謠言。
溫州公安最近也抓捕了一位網絡作者。該作者利用AI工具批量改寫網絡文章,發布到信息平臺從而獲得文章收益,最終造成了諸多不良的社會影響。
伴隨著AI工具的普及,AI制造的無用、虛假信息的數量也越來越多。
清華大學新聞學院的報告稱,近一年來,經濟與企業類AI謠言,增速高達99.91%。谷歌研究人員也發現生成式AI造成的虛假信息正在互聯網上泛濫成災。
雖然,目前AI引發的內容風險還沒有上升到“威脅生存”的地步,但按照AI的發展趨勢來看,這種偽造或篡改的信息會越來越多。
最終導致互聯網的信息更加混亂,使得真實與虛假之間的界限模糊。
甚至AI自己,也將在越發低質的語料庫中停止進化與生長。
信息荒漠時代
隨著 AI 生成的錯誤和無意義的信息會不斷累積,互聯網的錯誤、無用信息占比會逐步增加。
清華大學新聞學院新媒體研究中心主任、跨學科知名學者沈陽說,AI生成的內容急劇增加,大量自媒體文章的內容由AI自動生成,而AI幻覺產生的錯誤就夾雜在這些文章當中,這也會造成整個互聯網的內容質量進一步下降,導致數據質量的整體下降。這種現象被稱為“數據退化”。
AI的訓練和學習需要大量的網絡信息,但大量虛假和無意義的信息只會讓AI陷入混亂,產生錯誤觀念。
不止如此,AI除了要面臨劣質內容的侵害,還面臨優質底層信息的短缺。
研究公司 Epoch AI表示,到2028年,文字資料將會被消耗殆盡。而這些數據是人類在在過去幾個世紀里,創作的大量文字、視頻。
也有人試圖用AI生成的信息訓練AI,但結果并不美好。國外的科學家發現,如果 AI 只學習其他 AI 生成的內容,那么經過幾代訓練后,AI 將輸出無意義的垃圾信息。
他們把這種現象稱為“模型崩潰”。
當前正處于信息大爆炸時代,我們所有人都被大量的信息所包圍,但是對于AI而言,這是一個數據匱乏的時代。
對AI而言,誰能幫助AI擺脫信息匱乏的窘相,誰就掌握了AI發展的未來。為此,OpenAI、Anthropic、百度等公司都在積極開發更優質的合成數據,以此克服挑戰。但大多數學者都持悲觀態度。
今年11月,有外媒報道,OpenAI下一代旗艦模型“獵戶座”(Orion)的性能提升幅度,小于GPT-4相對GPT-3的提升。
其創始人奧特曼曾表示,可能不會把新模型命名為GPT-5。
多位專家勸說AI公司停止訓練大模型,“如果當前趨勢持續,人工智能很快就會耗盡其可用的訓練數據。面對這種情況,AI公司可以選擇停止追求規模更大、更復雜的模型。”
AI是當前互聯網進步的主要動力之一,尤其是對搜索引擎而言,誰能突破AI的限制,誰就掌握了搜索市場的未來。
只是,這杯慶功酒遙遙無期。
文|《逐浪》出品
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.