文:王智遠 | ID:Z201440
去年12月,谷歌推出了Gemini Deep Research。
什么是Deep Research?它像一個AI助理一樣,輸入一個問題,它立馬能搜索、規劃、推理、最后形成一個報告。
01
今年,它做了大升級。升級后能力凸顯在三方面:
一,它能幫你把一個大問題拆成幾個小問題,一個一個解決;二,能從很多不同的地方找到信息,分析幾百個來源;三,特別快,幾分鐘就能做出一個詳細的報告,從計劃到總結,全都有。而且,它還能處理45種以上的語言。
官方說的是,目前免費試用,我用免費賬號折騰半天不行,后來去某寶租了一個Gemini Advanced 賬號,一下子就能用了。
體驗地址是:https://gemini.google.com
打開Gemini的網頁,登錄后,你可以在左上角切換不同的模型,現在有五種。
2.0 Flash 適合快速回答問題,處理簡單任務;2.0 Flash Thinking 能分析復雜問題;Personalization 會根據你的習慣調整回答;2.0 PRO(Experimental)是還在測試的高級版本,適合專業人士。
最后說說,它的第五個能力:Deep Research。
話不多說,直接在Gemini Deep Research 里輸入了一個問題:幫我寫一個關于 Gemini Deep Research 的深度研究報告。
它很快給我擬定了一個方案。這個方案列出 7 條主要內容。每一條都很清晰,具體是這樣的:
第一條,先整理 Gemini Deep Research 的官方資料;第二條,會分析這個工具可以用在哪些場景,還有它的主要特點是什么。
第三條,去找一些用戶對這個工具的評價,看看大家用起來覺得哪里好、哪里不好;第四條,收集一些專業人士的測評和分析,看看專家們是怎么評價它的。
第五條,它會找一些和 Gemini Deep Research 類似的工具,做一個對比,看看它在競爭中有什么優勢或者不足;第六條,研究一些實際使用過的案例,看看這個工具在解決實際問題時表現如何。
最后一條,也就是第七條,它會深入探討這個工具的技術原理,評估數據是否可靠、準確;同時,它還會把工具放在更大的學術背景中,看看在整個領域里的水平如何,未來發展潛力怎么樣。
方案列完后,它問我我:你覺得這個方案行不行?如果覺得沒問題,可以直接開始研究了。
從整個研究結構來看,它確實比我個人想得更全面。
至少它不僅提供了背景資料,還給出優劣勢分析、專業人士的測評、工具對比,以及最后在更大背景下的表現評估;所以,在我看來,這更像一份簡單而完整的工具測評報告。
02
我確認方案后,便開始了工作。
一開始,它從 7 個網站中幫我查找資料,這些網站包括 ZDNet、YouTube.com、SearchEngineJournal、Google、播客,以及 WorkspaceUpdates.Google 等。
這些網站可能會提供有關 Google Gemini 的基礎信息、使用教程、新聞報道或者用戶支持等內容。
找資料過程中,我發現它把核心功能、關鍵特點、技術亮點都整理得清清楚楚。
接著,它開始了下一步:
從更多地方收集信息。它訪問了 Reddit、How-To Geek、SectionSchool、Google 的官方頁面,以及 SearchEngineJournal。
我覺得,這些網站選擇,它主要為了獲取幾類不同信息。
首先是用戶的討論和評價。它想看看大家實際用起來感覺怎么樣,我還隨機點開了幾個 Reddit 頁面,發現它不僅抓取了博主寫的文章內容,還提取了下面的評論。
這些評論往往是用戶的真實感受,特別有參考價值。
第二類是教程和學習資料。像 How-To Geek 和 SectionSchool 這樣的網站,會提供詳細的使用指南或者教學資源。
第三類是官方信息;最后一類是專業分析和評價。SearchEngineJournal 這個網站專注于 SEO 和數字營銷,上面有不少專業人士對工具的深入分析和評測。
所以,我認為,這一步,它想全面收集用戶反饋、專業解讀、使用教程和官方的公告;這樣的信息組合,確實能讓人從不同角度了解 Google Gemini。
然后,它總結了三個重點:
它說:我看了用戶對產品的評價,發現體驗各不相同。大家普遍贊賞,工具能幫他們節省時間,快速了解主題或者寫個初步報告。
不過,也有人擔心質量問題,工具在判斷信息來源的可靠性上可能不夠好,有時候,生成的信息太泛泛,不夠深入。還有人提到,工具會突然中斷,導致研究失敗。
在比較方面,它說,有些用戶把GEMINI Deep Research和Perplexity、DeepSeek做了對比。
一些人認為Perplexity在講故事和挖細節上做得更好,而DeepSeek的新模型在研究質量和速度上表現最佳;甚至,ChatGPT在某些情況下能提供更高質量的研究結果;這些比較顯示,Deep Research在某些方面可能還有提升的空間。
通過這一步詳細拆解,我認為細節對我幫助很大。畢竟,別人對Deep Research的看法,是他們的本地知識,這些有助于做商業分析用。
03
第三步研究中,它開始尋找找更專業的知識。
看了看它推薦的9個網站,發現網站和第二步里的不一樣。它們更關注怎么提高工作效率的工具、人工智能研究,還有戰略和市場分析這些內容。
看起來這些網站挺權威,里面有技術支持文檔、新聞博客、社交討論和專業教程,各種信息都有。
我覺得,這些網站是對之前研究的一個補充,之前分析了好壞,現在要找更專業、更深入的信息。
所以,它給我的結論是:Deep Research 功能很強,但在準確性上還得提高;還有,Gemini 2.0 的深度思考模型是個重要的升級。
接下來第四步、第五步和第六步,步驟都差不多。它找的是些專業網站。它主要關注三個方面:
- 專家怎么說,怎么評價
- 看看實際用起來怎么樣,有沒有案例
- 再深挖一下技術原理和數據來源
這個過程,從不同角度,找問題的答案和評價。
它給出的結論也挺清楚。專家們覺得工具挺有潛力,特別是在升級到Gemini 2.0 Flash Thinking Experimental模型后,規劃、搜索、推理和報告的能力都提高了不少。
專家們還說,它免費對所有人開放,這在和ChatGPT這些競爭對手比起來,是很大優勢。不過,他們也指出了一些不足,比如:信息來源的可靠性、準確性,還有避免生成不符合事實的內容,這些地方還要改進。
但是,我個人有點遺憾的是,在實際案例這部分,并沒有給出具體的應用例子,只是提了幾個問題。
比如:處理需要專業知識或最新信息的復雜主題時,表現怎么樣?生成的報告準不準確、深入不深入、有沒有用?
這些問題,它都沒有回答。
還有,技術原理和數據來源這部分,也沒有給出清晰的對比。我點開它給的9個網站,發現確實有一些技術對比的內容,但它沒有很好地展示這些信息,感覺有點匆忙。
所以,我理解的是:后面步驟不夠細致,有些草率。
可能因為能力還有局限,特別是專家分析、實際案例部分,它應該做個表格,把幾者的對比都展示出來,這樣可以清楚地展示Gemini 2.0深度研究和其他深度研究能力上的對比,這樣更有說服力,也更容易理解。
第七步是:學術信息收集。
我注意到,它對學術研究特別感興趣,它搜了27個學術網站,想找些和深度研究有關的文獻,還有AI在學術界的應用信息。
但是呢,最后得出的結論太匆忙了。簡單說了兩句:開發團隊訓練的模型能很好地做計劃,還設計了個任務管理器;這些是大家一看就知道,我本來希望能看到更深入的研究結果。
比如說:
怎么讓模型更準確?有哪些具體的改進方法?需要哪些技術能力?甚至怎么優化架構等等。
還有,做完學術信息收集后,它突然又來了一句:之前用工具時出了語法錯誤,得修正一下,這樣才能拿到最新信息。
這讓我覺得到,它在用搜索工具獲取信息時,可能還有遺漏,不夠完善;換句話說,它的表現還不穩定,甚至因為技術上的小問題,影響了最后的結果質量。
04
最后,我下載了它生成的報告,一看整整 8700 字。
不過,把不太重要的內容去掉,最核心的部分是關于用戶體驗和反饋。這部分它確實做得不錯,不僅做了深入研究,還詳細列出了優點和缺點,甚至還用表格進行了對比,非常直觀。
另一部分讓我比較欣賞的是,它把自家工具和其他人工智能研究工具做了詳細的對比分析;這部分內容挺實用,能讓人清楚地看到它的優勢和不足。
至于技術分析和學術研究的部分,寫得有點太理論化了,像在堆砌術語,實際參考價值不大,讀起來像“八股文”一樣枯燥。
值得一提的是,8700 字的報告里,一共引用了28 個鏈接,而鏈接加起來差不多占了 1000 字的篇幅;如果除去這 1000 字,再加上報告開頭和結尾那些常規性的內容,仔細算算,真正有價值的信息還能剩下多少呢?
所以,要我評價的話,主要有三點:
一,和國內的產品如 Kimi、Qwen、豆包、夸克相比,它絕對是領先的;它能生成這么長的報告,還能調動多種能力,從用戶體驗上來說,國內很多產品目前還做不到這一點。它的綜合表現確實更勝一籌。
二,記憶能力和處理長文本的能力還是很強的。相比之下,國內一些產品在生成報告時,后半部分會顯得比較隨意,有些草率。
當然,Gemini 的深度搜索也存在類似的問題,但沒有國內產品那么嚴重,整體表現依然更穩定。
第三,和 Manus 相比,它在工具調用方面還有不足。Manus 能生成 PDF,可視化能力也很強。Gemini 深度搜索在這方面就顯得遜色,它最多提供一個類似 Word 文檔的文件,里面帶一個非常簡單的表格。
在工具調用和功能擴展上,Gemini 深度搜索顯然還有提升的空間。
值得一提的是,Gemini 本周的密集更新,無疑讓它的地位在生態系統里變得更重要的,高頻的優化和功能擴展,也讓它在競爭中占據了更有利的位置。
今年是 Agent 元年,AI 在 TOC 領域的這波機會,它自然不能錯過;這種快加速,無疑也把壓力傳給了其他競爭對手。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.