99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

實測豆包剛剛上線的新版深度思考,他們也向DeepSearch邁出了一步。

0
分享至

今天晚上,就在剛剛,豆包終于上了之前很多人期待的功能。

深度思考。


我之前用別人的賬號體驗過這功能,就是推理模型,而今天看到的第一刻,我以為的是,豆包的推理模型終于全量上線了。

但是當我體驗了一下以后,發現他們這個深度思考,跟之前的推理模型、還有其他的AI聯網還真的有點不太一樣。

它不止是是個推理模型,還直接把思考和搜索,給融合在了一起,有點DeepSearch那個做法。

而不是像DeepSeek一樣,把深度思考和搜索分開去處理,用戶自己選擇是否打開思考和聯網。


這個說法可能有點難理解,看個案例。

比如說,我最近有一部非常喜歡的情景喜劇在看,是《鵲刀門傳奇2》,今天終于看到大結局了,還挺舍不得的。。。


小聲比比:我強烈安利所有沒看過的人去看,真的超級無敵爆炸好看。

這里面的演員呢,其實很多都是趙家班的,我在彈幕上天天看到有人說,這人是《鄉村愛情》里面的誰誰誰。

于是,我就想搜一下,鵲刀門傳奇2中的演員,在鄉村愛情中分別出演過什么樣的角色?

如果你把這個問題,問DeepSeek的話,他的做法和答案是這樣的。


你會看到,流程是先根據我的問題,去聯網查詢,查到了所有的內容以后,再根據這些搜到的內容和我的問題,來給我進行回答。

而最后的回答是這樣的。


我當時臉都看懵了,一半是配角,一半是未透露。

不是,那幾個主角,你是一句沒提啊。。。


這個其實就是現在很多AI搜索的弊端,在一些稍微復雜一點的問題上,根本就不夠準確。

而像我一直狂吹的OpenAI的DeepResearch之所以效果那么好,是因為他除了底模是o3強到爆炸之外,也是一個Agent,不是上來對著這句話先搜,而是先思考,先規劃,規劃完了再去一點一點搜索,得到答案。

豆包這個深度思考,是一樣的邏輯。

比如我把剛才那句話,問豆包。


你會看到,跟DeepSeek的搜索不一樣的是,豆包的深度推理是先思考,再搜索。

先把問題拆成了4步:

  1. 搜索《鵲刀門傳奇 2》的主要演員名單。

  2. 對每個演員,搜索他們在《鄉村愛情》系列中飾演的角色。

  3. 整理這些信息,確保每個演員的對應角色正確無誤。

  4. 注意可能的重復角色或演員替換情況,避免錯誤。

然后才去搜索相關資料。

在過程中,也不是搜索一次以后就結束了,而是思考 - 搜索 - 思考 - 繼續搜索。


所以你會看到,在一次任務中,可能會出現好幾次搜索。

我的這個任務,在豆包經歷了兩次搜索之后,給出了一篇答案。



主角都抓出來了,回答質量上也好不少,整體的正確率能達到80%。

當然,一些細節的錯誤也有,就單說鵲刀門傳奇2的角色。

比如高大毛并不是鵲刀門的弟子,他是天池幫的;比如唐鑒軍老師在鵲刀門傳奇2中飾演的角色是絕絕子,不是公孫麗蓉,公孫麗蓉是張小英老師演的;比如王小虎飾演的是王公公,并不是任我翔。

細節的幻覺部分還是難以避免。

除了這個兩部戲的演員關聯,我也測了一些其他的例子。

比如我有一個很有意思的prompt,是:

《哈利·波特》系列電影中,每部電影出現但被大多數觀眾忽略的關鍵細節分別是什么?

豆包想了很久,整整搜索了3輪。

第一輪搜索,豆包把任務拆完分步驟以后,知道了大概的隱藏細節是什么樣子的,知道純靠自己估計答不好,需要去參考影迷社區的討論。


可以在右邊看到,搜索的還是很精準的,幾乎都是精準的細節帖子。

在第一輪搜索結束之后,其實已經拿到不少內容了。但是豆包自己PUA自己了一圈以后,發現怎么只有第一、三、四、七部的,哈利波特總共8部的,缺了另外4部的一些內容,然后,它又開始了第二輪搜索。


拿了不少關于魂器和鳳凰社的信息。

而第三輪搜索,則是給自己,繼續補充細節。


最后,豆包自己感覺,信息基本都夠了,再搜可能沒啥增量信息了,決定停了,也差不多了,可以整合整合給用戶回答了。


最后,回答的效果是這樣的。


很全面,很細節,又勾起了我的很多的回憶。

比如我最近想買一個數碼相機,學一學攝影。我是這么問豆包的:

我想買一臺數碼相機,預算1萬左右,主要用途是旅游拍照和短視頻拍攝。請你先在國內外評測網站搜索該價位區間內畫質、視頻防抖表現都不錯的機型,然后再比較這些機型在鏡頭群、重量和售后服務方面的優劣。根據實際使用場景給出購買建議。

同樣,也搜索了3輪,自己想了N多的回答。


最后,給我列了一個對比表。


對比了一通后,非常推薦我 富士 X-T4 單機身,說是 搭配二手鏡頭是最優解;若能接受小幅超支, 佳能 EOS R8 的綜合性能更值得投資。

不知道有沒有懂攝影的朋友,來看看豆包這個推薦的怎么樣。

目前從我的測試來看,大多數的回答,都回在2~3輪會結束,時間最長在50秒左右,大多數情況在20多秒的時候都能出回答。

我個人對豆包的新版深度思考的評價是:

最終質量中規中矩,但是補上了一個生態位。

現在所有跟AI搜索相關的功能(包括AI搜索、深度思考、DeepResearch、DeeperSearch等等),其實可以列成一個四象限。

橫軸是最后搜索結果的質量,從一般到高;縱軸是消耗時長(也可以說是成本)從高到低。

我自己也做了一下評測,然后做了一張圖。(疊個甲:根據我自己日常使用場景進行測試,純個人主觀,如果不同意見勿噴。)


單從輸出質量看,T0肯定是OpenAI的DeepResearch,但是消耗時間也最高,十幾分鐘是長有的事,也是最貴的模型,一次查詢就是2美刀。

他們強就強在是一個極度完整的Agent,擁有最強基座o3模型。

其次就是Grok前幾天更新的DeeperSearch,擁有X獨特的資源,同時也大幅增加了搜索的時長,效果比之前牛逼很多。

而豆包的生態,就在于質量還不錯,同時擁有最快的速度。性價比最高,而且,還無限免費用。

從這也能看出各家的打法,坦率的講,DeepResearch原來就沒法給國內的普通人用。

即使Gemini的DeepResearch可以一個月用5次,但是還是不夠平權。

而豆包的深度思考,邊想邊搜的模式,有了Agent的雛形,同時把成本打得足夠低,人人都能免費用的上。

而且是免費無限用。

這一點,我覺得他的意義更加重要。

再牛逼的東西,高高在上,處于云端之間,只可遠觀,虛無縹緲,那還有什么意思呢?

愿更多人。

與觸手可及的寶刀相遇。

然后屠龍。

以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克

>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
韓紅母親育有兩個女兒,晚年在京治病,戰友曝韓紅和繼父真實關系

韓紅母親育有兩個女兒,晚年在京治病,戰友曝韓紅和繼父真實關系

古希臘掌管月桂的神
2025-04-15 19:55:43
韓佳奇受傷后回看比賽特別愧疚:這次又讓侯哥替我背鍋了

韓佳奇受傷后回看比賽特別愧疚:這次又讓侯哥替我背鍋了

雷速體育
2025-04-16 13:15:32
大街上有人向我借火,我順手給了他點了,沒想到居然救了自己一命

大街上有人向我借火,我順手給了他點了,沒想到居然救了自己一命

蕭竹輕語
2025-04-10 18:47:27
特斯拉成爛大街國民車,2025年3月Model Y賣4.8萬輛,國產車咋玩

特斯拉成爛大街國民車,2025年3月Model Y賣4.8萬輛,國產車咋玩

小鵬財經
2025-04-14 11:28:49
澤連斯基要倒霉了,他最后的下場,將會跟卡扎菲和薩達姆一樣

澤連斯基要倒霉了,他最后的下場,將會跟卡扎菲和薩達姆一樣

利刃號
2025-04-02 10:40:23
辟謠:不要被自媒體帶歪了,美國245%的關稅只是針對注射器和針頭,占對美產品總額的萬分之三。

辟謠:不要被自媒體帶歪了,美國245%的關稅只是針對注射器和針頭,占對美產品總額的萬分之三。

邏輯與常識
2025-04-16 15:17:08
吳宗憲回應了,希望某人別著急,吳姍儒只是代班,代班而已!

吳宗憲回應了,希望某人別著急,吳姍儒只是代班,代班而已!

小咪侃娛圈
2025-04-16 11:34:42
突發!特朗普最新簽令!英偉達盤后大跌,市值蒸發1.2萬億元!美股遭大規模拋售,華爾街大佬集體警告,基金經理們“相當悲觀”

突發!特朗普最新簽令!英偉達盤后大跌,市值蒸發1.2萬億元!美股遭大規模拋售,華爾街大佬集體警告,基金經理們“相當悲觀”

每日經濟新聞
2025-04-16 09:12:04
哈登也得叫大哥!巴特勒5場出手62次罰球62個,這才是一碰就犯規

哈登也得叫大哥!巴特勒5場出手62次罰球62個,這才是一碰就犯規

嘴炮體壇
2025-04-16 13:36:04
阿根廷總統認為世界新秩序的領導者將是俄羅斯、美國和中國

阿根廷總統認為世界新秩序的領導者將是俄羅斯、美國和中國

俄羅斯衛星通訊社
2025-04-16 15:10:32
十年行內專家建議:住宅寧愿空著,也不要輕易出租!都是為啥?

十年行內專家建議:住宅寧愿空著,也不要輕易出租!都是為啥?

巢客HOME
2025-04-11 10:15:08
舊社會的家妓有多慘?被當做“肉屏風”,吞痰液,連娼妓都不如

舊社會的家妓有多慘?被當做“肉屏風”,吞痰液,連娼妓都不如

午夜故事會
2025-04-11 14:51:35
歐冠:皇馬vs阿森納,這個位置不解決,皇馬很難晉級!

歐冠:皇馬vs阿森納,這個位置不解決,皇馬很難晉級!

大牛足球觀
2025-04-16 18:28:22
你是認真的嗎?獨行俠高管:東契奇的交易價值,等同于埃利斯

你是認真的嗎?獨行俠高管:東契奇的交易價值,等同于埃利斯

雞丁侃球
2025-04-16 07:57:26
巴普蒂斯塔:梅西總有頂級隊友,C羅是GOAT因他做的事更難

巴普蒂斯塔:梅西總有頂級隊友,C羅是GOAT因他做的事更難

雷速體育
2025-04-16 14:59:11
夫妻生活在婚姻中很重要嗎?網友:當晚質量決定第二天的待遇!

夫妻生活在婚姻中很重要嗎?網友:當晚質量決定第二天的待遇!

美好客棧大掌柜
2025-02-23 00:10:05
51歲的陳德容被偶遇,真實顏值長這樣,網友:果然不是路人能比!

51歲的陳德容被偶遇,真實顏值長這樣,網友:果然不是路人能比!

喜歡歷史的阿繁
2025-04-15 14:13:20
庫爾斯克烏軍僅剩兩三個據點,為何俄軍重兵圍攻月余還沒奪下來?

庫爾斯克烏軍僅剩兩三個據點,為何俄軍重兵圍攻月余還沒奪下來?

凱撒談兵
2025-04-16 10:21:05
鬧大了!景德鎮滅門慘案后續來了,肇事者父親威脅白發人,你敢信

鬧大了!景德鎮滅門慘案后續來了,肇事者父親威脅白發人,你敢信

六目先生
2025-04-16 09:14:32
“糖尿病真兇”揭曉,是甜食的十倍,醫生:再不忌口,血糖飆升

“糖尿病真兇”揭曉,是甜食的十倍,醫生:再不忌口,血糖飆升

白宸侃片
2025-04-16 10:06:24
2025-04-16 20:16:50
數字生命卡茲克 incentive-icons
數字生命卡茲克
反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
283文章數 387關注度
往期回顧 全部

科技要聞

華為問界M8售價公布:36.98萬元起

頭條要聞

拜登批特朗普"不到百天破壞力驚人" 多名前政要也發聲

頭條要聞

拜登批特朗普"不到百天破壞力驚人" 多名前政要也發聲

體育要聞

諾坎普奇跡的兩位當事人,差點靈魂互換

娛樂要聞

娛樂圈的“現實”在岳云鵬身上應驗了

財經要聞

增長5.4% 一季度GDP增速為何超預期?

汽車要聞

又帥又快超實用 極氪007GT獵裝車才是完美的車?

態度原創

教育
手機
本地
親子
家居

教育要聞

高校要求!教師每節課設計不少于1個這樣的教學片段

手機要聞

榮耀Power線下上手體驗:不吐不快,說說真實感受

本地新聞

云游湖北 | 七仙女都愛的山水,雙峰米酒一口上頭

親子要聞

抑郁、雙相孩子“窩里橫”,對父母拳打腳踢,怎么科學應對?

家居要聞

秋日的風 木質簡約空間

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 商水县| 浮梁县| 湛江市| 肇东市| 芦山县| 金阳县| 巴林左旗| 承德县| 亳州市| 眉山市| 甘洛县| 龙州县| 天津市| 汽车| 杭锦旗| 东丰县| 金溪县| 获嘉县| 陆河县| 上林县| 焦作市| 娄烦县| 北辰区| 永川市| 手游| 陇南市| 瓮安县| 安国市| 什邡市| 庆云县| 正蓝旗| 巫山县| 博兴县| 玉树县| 电白县| 西贡区| 雷州市| 呼和浩特市| 宜州市| 烟台市| 西城区|