99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<thead id="cyvwz"><rt id="cyvwz"><noscript id="cyvwz"></noscript></rt></thead>

<em id="cyvwz"></em>

^{<blockquote id="cyvwz"></blockquote>}

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權(quán)郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應(yīng)用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

一手實測豆包新發(fā)布的視覺理解大模型，他們真的卷起飛了。

2024-12-18 12:45:12　來源: 數(shù)字生命卡茲克

天津舉報

0

分享至

人在字節(jié)火山發(fā)布會現(xiàn)場。

眼睜睜看著他們發(fā)了一大堆的模型升級，眼花繚亂，有一種要一股腦把字節(jié)系的AI底牌往桌上亮的感覺。

有語音的，有音樂的，有大語言模型的，有文生圖的，有3D生成。

真的過于豪華了，字節(jié)真的是，家大業(yè)大。。。

但是看完了全場，我覺得最值得寫一寫，聊一聊的，還是這個：

豆包視覺理解模型。

效果不僅出奇的好，最關(guān)鍵的是，他們的價格。

價格直接低85%，直接把視覺理解模型拉入了“厘時代”。

字節(jié)，還是那個字節(jié)。

說實話，過去一兩年，人人都在講文字推理，講大語言模型的爆點。

但是視覺理解，才一直是我們認知世界的第一道關(guān)卡。

當你來到這個世界睜開眼睛的第一刻，沒有學會語言的時候，靠的就是你的眼睛。

我們先看到光影、顏色，才逐漸分辨出父母的面孔，屋子的空間，那時沒有詞匯、沒有句子，只有模糊的光影與輪廓。

當我們對這個世界，通過視覺，一步步認識父母的臉，認識身邊的玩具，認識窗外的樹影，有了基本的認知后，然后才有了咿呀學語的過程。

它是我們觸及世界的第一道門，不僅僅是看見了什么，更是用看去建立理解，進而觸發(fā)思考與關(guān)聯(lián)。

語言是有門檻的，你要先懂詞語的意思。可視覺先于語言，是不需要翻譯的輸入。

有太多普通人，不知道如何描繪自己的需求，無法組織語言清楚的表達一件事，但是把圖片扔給AI，問一下，這是任何人都會的。

上至80歲老人、下至10歲孩童，都可以。

所以，對于視覺理解模型，我才如此看重。

而這次新發(fā)布的豆包視覺理解模型，除了在火山開放了API，也已經(jīng)在豆包上上線可以直接體驗了。

我也第一時間，在發(fā)布會現(xiàn)場拉著我的朋友@賽博禪心和@Max，在會場廁所門口，從早上跑到中午，飯都沒吃，跑了大概100個case，跟GPT4o對比做了個詳細評測。

雖然感覺有點對不起他兩，但是最后的結(jié)果，還是很讓人有點驚喜的。

我們測的第一波例子，也是很多視覺大模型最痛苦的，就是數(shù)數(shù)。

我這有一個萬惡之源的圖，在好多論文里面都出現(xiàn)過，就是讓大模型來數(shù)這張圖里面有幾只狗。

正常人類直接數(shù)中間的狗頭，都非常清晰的能數(shù)清楚，一共是12只狗。

但是對于AI來說，那就炸了。數(shù)數(shù)這事，是最難的。

GPT4o非常自信的給了一個11只的答案。

Claude3.5也一個樣，自信的爆出了11只的答案，Claude和GPT這兩冤家，差點弄的我以為自己數(shù)錯了。

直到把這張圖發(fā)給豆包。

我還怕豆包是不是幻覺了，連續(xù)roll了5次，每次都是堅定不移的12只。

而且相比于GPT，還準確的識別了這是金毛巡回犬的幼犬，在答案的準確性和豐富度上，都比GPT4o要強。

于是，我又讓它倆，做了另一件更難的事。

紅框里有幾個手辦？分別是什么角色？

不僅需要精準的識別出數(shù)量，還要知道每個角色是啥，這個能答上來，那才是真的懂了。

結(jié)果GPT上來直接抽風，上來就是忽悠我4個。

然后那些角色也在那給我瞎掰，不是，哪有孫悟飯啊？哪有金發(fā)角色啊？你家孫悟飯藍頭發(fā)啊？

真的，槽點太多，我都不知道從哪吐槽起了。

再回頭看豆包。

數(shù)量6個對了，4個《火影》系列的手辦，從左到右其實是波風水門、漩渦鳴人、迪達拉、蝎，豆包對了前面兩個水門和鳴人，再加漫威的一個雷神和綠巨人。

正確率66%，雖然沒能完美識別，但也算是一個巨大的進步了。

這一波，說一句把GPT4o摁在地上打不過分吧。。。

測完數(shù)數(shù)后，我們又測了一波看圖識景點。

直接掏出了黑悟空里面的十大景點，測了一波。

大部分GPT4o和豆包都差不太多，幾乎打了個平手，像大足石刻、懸空寺、開元寺這種都識別出來了，而像小西天、水陸庵野都一起翻車了。

本來我覺得這兩會在這個點上打個平手，結(jié)果，最后一題，GPT4o翻了車。

這個塔林，是山東濟南靈巖寺塔林。自唐以降，墓塔成林。

早為鐘，黃昏為鼓，白為方，才有了所謂“晨鐘暮鼓白天方”。

而豆包，在這最后一題上，守住了自己的榮耀，回答了上來，從而險勝GPT4o一籌。

在一些世界常識中，GPT4o也落敗了。

比如這根經(jīng)典的滾珠絲桿，做了個視覺誤導(dǎo)，問哪根最長。

豆包沒啥問題，準確的回答了左邊第二根最長。

但是GPT4o，卻又翻車了，我roll了5次，每一次都信誓旦旦的告訴我，就是最左邊最長，我都甚至懷疑是不是我自己的眼睛瞎了。。。

我們也做了一個非常詳細的統(tǒng)計表格。把豆包和GPT4o的評測，每個跑三次放在了一起對比。

也能看出來，在大多數(shù)的任務(wù)上，豆包的這個視覺理解大模型都比GPT4o識別的更精準、更詳細，對中國文化的一些內(nèi)容，懂的也更多。

而且還有個很有趣的點，就是GPT4o因為那坑爹到家的安全限制，所以他沒法看到任何人臉。

但是，豆包可以。

當然，也并不是說豆包在視覺理解上，它就強到爆炸了。

不行的點，當然也有。

比如我們發(fā)現(xiàn)，在一些數(shù)學公式的計算上，錯誤率還是會有一些的。

比如這道題。

答案其實是A。

但是扔給豆包的時候，會發(fā)現(xiàn)，回答還是會有一些錯誤。

在一些復(fù)雜的計算上，還是會有一些差距，畢竟做題，真的一直以來都是大模型的短板。

但整體來看，這波升級就是解決了很多基礎(chǔ)的常識性問題，讓大模型，有了更強的眼睛，也有了更好的腦子。

還是非常有用的。

文章的最后，我突然想說一個關(guān)于我朋友和他想要的AI的故事。

這哥們是一個大概40歲出頭的中年人，壓力很大，背著房貸，四腳吞金獸還在地上跑。人在一線城市，平時要上班養(yǎng)家糊口，又在業(yè)余時間搞了點自己的小買賣，想減輕一點家里的壓力。

他以前和我說過，他最大的痛苦就是沒有時間學更專業(yè)的技能，他那個網(wǎng)店是賣點數(shù)碼的小玩意，但是吧自己又不會拍好看的商品圖，不懂設(shè)計，也沒有錢請專業(yè)攝影師和設(shè)計師。

我當時給他推薦了一些電商的AI生圖工具，能自動給產(chǎn)品做美化背景，能改色調(diào)、能幫他處理一些雜事。

但有個問題，這哥們沒啥想象力，審美上也有點差異，所以對于AI繪圖的那些Prompt描述能力不行，總是詞不達意，AI給出的圖經(jīng)常也有點離譜。

后來有天，他跟我說過，他真正想要的那種AI產(chǎn)品，是他不用管那些亂七八糟的，是想讓自己的數(shù)碼小玩意融入一個夏日海灘的場景的時候，他只需要拍張桌上堆滿物品的亂七八糟的圖，然后把那個產(chǎn)品圈出來，對AI說：

“給我用這件單品，搞個夏日風海報，然后把我桌面上那些雜亂的東西都變成整潔的道具擺放。”

AI看懂后，直接創(chuàng)作出一張清爽的營銷圖，就完事了。

這個哥們跟我聊天說這樣的需求時，他眼睛里放光。問我有沒有這樣的東西。

我說，現(xiàn)在還真沒有。

然后看著他可惜的眼神，嘴角輕輕的嘆了口氣。

但是我相信，隨著視覺理解模型的進步，隨著一句話改圖的進步，隨著這兩者，發(fā)光發(fā)熱繼續(xù)融合。

一定會有那么一天，能讓那哥們，有眼睛里發(fā)光的那天。

而且可能，就在不遠的將來。

讓每個人，都能享受科技的樂趣，這就是技術(shù)，真正該發(fā)揮的作用。

不是替代，而是幫助。

幫助一個普通人在沉重生活里找到一絲自我創(chuàng)造的樂趣。

幫助那些有想法但缺手段的人，讓他們用更少的時間把腦中藍圖變?yōu)楝F(xiàn)實。

我覺得，這可能才是，最酷的事吧。

以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉(zhuǎn)發(fā)三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克

>/ 投稿或爆料，請聯(lián)系郵箱：wzglyay@gmail.com

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

運動會上的超燃瞬間，110米跨欄比賽，才剛開始就已經(jīng)結(jié)束了

新聞早點到 2025-04-14 17:42:10
1007 跟貼 1007
針對三河市“廣告牌匾禁用紅藍黑底色”等問題，廊坊發(fā)布情況通報

澎湃新聞 2025-04-15 10:06:46
48526 跟貼 48526

真可悲，教育的目的是什么？還有什么資格說別人不尊重歷史！

ConfusionMax 2025-04-15 06:17:24
3343 跟貼 3343

4月14日俄烏最新：盧比奧表現(xiàn)正常

西樓飲月 2025-04-14 20:41:13
2334 跟貼 2334
多位經(jīng)銷商圍堵哪吒汽車工廠稱"車錢兩空":要一個交代

中國經(jīng)營報 2025-04-15 04:07:18
12512 跟貼 12512

短評：別整天嚷嚷拋美債了！丟人！

財經(jīng)飛說不可 2025-04-14 18:18:09
1972 跟貼 1972

恐怖主義“鼻祖”露出原型，以色列離再次亡國，可能就在眼前了！

小lu侃侃而談 2025-04-13 22:56:47
1 跟貼 1
山西42分狂勝廣東八強戰(zhàn)拔頭籌古德溫25+8+6領(lǐng)7人上雙

網(wǎng)易體育 2025-04-14 21:44:08
9726 跟貼 9726

取消1.9萬億出口退稅，利大于弊

克萊恩財經(jīng) 2025-04-14 23:08:28
1117 跟貼 1117
博主控訴在騰格里沙漠月亮湖露營被掀帳篷景區(qū)回應(yīng)：多次溝通游客拒絕買門票

封面新聞 2025-04-13 18:53:06
3594 跟貼 3594
信號已經(jīng)很危險，卻還在捂住眼睛裝看不見，刺痛的是誰？

胖胖說他不胖 2025-04-14 18:19:28
0 跟貼 0
孩子：怎么把我飯碗蓋上了扒開

動態(tài)新聞 2025-04-15 11:27:57
1331 跟貼 1331
宇樹：美國加關(guān)稅并未有太大影響，沒有哪家企業(yè)不做美國市場就不行了

澎湃新聞 2025-04-14 19:54:03
4212 跟貼 4212
大媽騎著有車輪的“大象”在車道上跑市民看了笑個不停

火煉樹 2025-04-14 23:42:42
778 跟貼 778
難以置信！網(wǎng)傳一大廠高管凌晨2點組織開會，不到就被邊緣離職

火山詩話 2025-04-15 07:25:29
39 跟貼 39
周琦自宣：近日訓(xùn)練中眼部傷勢反復(fù) 已影響到視覺暫時無法出戰(zhàn)

直播吧 2025-04-14 18:45:11
1031 跟貼 1031
網(wǎng)友：金龜子不裝了！幾十年沒變的鍋蓋頭突然換金黃短發(fā)

丫頭舫 2025-04-14 21:12:35
3 跟貼 3
國家中醫(yī)藥局：中醫(yī)藥越來越受年輕人喜愛

紅星新聞 2025-04-14 19:29:19
27 跟貼 27
曝某地橋上石欄被大風“肢解”，堪稱現(xiàn)代豆腐渣工程！驗收是怎么通過的

可達鴨面面觀 2025-04-14 20:41:28
0 跟貼 0
實探河北三河市蜜雪冰城門店：“綠招牌”已換回紅色

澎湃新聞 2025-04-15 17:39:02
0 跟貼 0
雷克薩斯以13億余元摘得上海金山一地塊，已在滬成立獨資公司

澎湃新聞 2025-04-15 06:58:27
0 跟貼 0
Shams：太陽即將開啟杜蘭特的交易談判！也將討論比爾未來

直播吧 2025-04-15 00:33:03
0 跟貼 0
牛刀斬謠｜徐州九頂山野生動物園發(fā)布聲明：免費贈票？假的！

揚子晚報 2025-04-15 17:29:11
0 跟貼 0
女子室外赤身泡湯時頭頂現(xiàn)無人機同一家店已發(fā)生多次

新聞晨報 2025-04-15 13:48:54
0 跟貼 0
女生替去世前男友還債，被嘲諷“戀愛腦”？當?shù)貗D聯(lián)回應(yīng)

江西晨報 2025-04-15 17:33:38
0 跟貼 0

68歲大媽在女婿家住了4年，女兒卻突然板著臉說：媽，你趕緊走吧

68歲大媽在女婿家住了4年，女兒卻突然板著臉說：媽，你趕緊走吧

惟來

2025-04-14 16:38:35

中國股市：這7只股或成中國股市新“蓮花”！

中國股市：這7只股或成中國股市新“蓮花”！

經(jīng)經(jīng)向上

2025-04-15 11:24:33

鬧大了！63歲重機車網(wǎng)紅去世，晚上騎車撞護欄，更多細節(jié)曝光

鬧大了！63歲重機車網(wǎng)紅去世，晚上騎車撞護欄，更多細節(jié)曝光

阿矗論古今

2025-04-14 16:58:59

國青主帥：非常支持歸化政策這能促進中國球員提升競爭力

國青主帥：非常支持歸化政策這能促進中國球員提升競爭力

直播吧

2025-04-15 14:04:08

6名國民黨青年被告已交保！羅智強：捐230萬轉(zhuǎn)作罷免“雙吳”經(jīng)費

6名國民黨青年被告已交保！羅智強：捐230萬轉(zhuǎn)作罷免“雙吳”經(jīng)費

新時光點滴

2025-04-15 16:24:50

居民存款被“鎖死”？2025年起，個人存取現(xiàn)金將全部按“新規(guī)”來

居民存款被“鎖死”？2025年起，個人存取現(xiàn)金將全部按“新規(guī)”來

平說財經(jīng)

2025-02-26 16:02:48

【紫牛頭條】“任教31年臨近退休遭解聘”當事人最新發(fā)聲，學校再回應(yīng)：正核實處理

【紫牛頭條】“任教31年臨近退休遭解聘”當事人最新發(fā)聲，學校再回應(yīng)：正核實處理

揚子晚報

2025-04-15 09:03:13

曼晚：若今夏出售奧納納，曼聯(lián)就將打破二戰(zhàn)以來的紀錄

曼晚：若今夏出售奧納納，曼聯(lián)就將打破二戰(zhàn)以來的紀錄

懂球帝

2025-04-14 19:06:08

特斯拉Model Y技術(shù)壁壘解析，為何國產(chǎn)車頻繁換代仍難追趕？

特斯拉Model Y技術(shù)壁壘解析，為何國產(chǎn)車頻繁換代仍難追趕？

車轂轆

2025-04-14 13:00:07

高息高返玩不轉(zhuǎn)了？浙江多家國有大行“圍堵”車貸提前還款，“5滿2”今起變?yōu)椤?滿3”

高息高返玩不轉(zhuǎn)了？浙江多家國有大行“圍堵”車貸提前還款，“5滿2”今起變?yōu)椤?滿3”

財聯(lián)社

2025-04-15 14:45:09

尼日爾撕毀4億美元合同驅(qū)逐我高管，中方暗藏后手，讓其悔青腸子

尼日爾撕毀4億美元合同驅(qū)逐我高管，中方暗藏后手，讓其悔青腸子

睡前講故事

2025-03-27 16:53:53

安徽美女道士胡小慧被捕：精通“胡媚術(shù)”，九名男徒弟揭露其罪行

安徽美女道士胡小慧被捕：精通“胡媚術(shù)”，九名男徒弟揭露其罪行

素衣讀史

2025-04-07 14:56:22

奢侈品淪為地攤貨！銷量大跳水，暴跌25%，山姆成了中產(chǎn)“新寵”

奢侈品淪為地攤貨！銷量大跳水，暴跌25%，山姆成了中產(chǎn)“新寵”

史行途

2025-03-06 10:37:45

馬筱梅被嘲黑矮？回京她粉色妝容和汪小菲逛國貿(mào) 網(wǎng)友直呼好般配

馬筱梅被嘲黑矮？回京她粉色妝容和汪小菲逛國貿(mào) 網(wǎng)友直呼好般配

曉風說

2025-04-15 16:19:00

半夜 “容易醒”的人，八成是這2處堵住了！照著一排，好處可不少

半夜 “容易醒”的人，八成是這2處堵住了！照著一排，好處可不少

罐兒哥中醫(yī)自媒體

2025-04-13 14:14:43

19歲新星蒯紀聞加盟歐塞爾中國男足年輕一代很有希望

19歲新星蒯紀聞加盟歐塞爾中國男足年輕一代很有希望

環(huán)球體壇啄木鳥

2025-04-14 11:11:21

水果也塌了，央視曝光7大“水果騙局”，越看越害怕，別再踩坑了

水果也塌了，央視曝光7大“水果騙局”，越看越害怕，別再踩坑了

景來律師

2025-03-30 10:44:56

最新！特朗普：考慮免除！

第一財經(jīng)資訊

2025-04-15 11:46:39

中美貿(mào)易大戰(zhàn)，美國為何不把大豆先賣給巴西，再從巴西運到中國？

中美貿(mào)易大戰(zhàn)，美國為何不把大豆先賣給巴西，再從巴西運到中國？

凱撒談兵

2025-04-14 21:12:13

人老后，為什么千萬不要長期待在家里，不是玄學！而是這3個原因

人老后，為什么千萬不要長期待在家里，不是玄學！而是這3個原因

生活不過如此呀

2025-03-16 06:20:04

數(shù)字生命卡茲克

反復(fù)橫跳于不同的AI領(lǐng)域，努力分享一些很酷的AI干貨

283文章數(shù) 385關(guān)注度

往期回顧全部

科技要聞

對等關(guān)稅下顯卡被爆炒：黃牛背刺游戲玩家

頭條要聞

韓國今日正式被美列為"敏感國家" 韓國各界倍感"憋屈"

頭條要聞

韓國今日正式被美列為"敏感國家" 韓國各界倍感"憋屈"

體育要聞

父母是臺灣移民！女林書豪被WNBA球隊選中

娛樂要聞

娛樂圈模范夫妻塌房？私生活曝光！

財經(jīng)要聞

美國財長，突然發(fā)聲！涉及“對華關(guān)稅”

汽車要聞

轉(zhuǎn)型中的"穩(wěn)健派" 一汽-大眾的智能化突圍路徑

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

手機

教育

數(shù)碼

旅游

家居要聞

現(xiàn)代本真展現(xiàn)歸零心態(tài)

時間靜止老房子的新生活
浪漫與優(yōu)雅不被定義的現(xiàn)代法式
追夢駐境一步一景

手機要聞

行業(yè)第一款8000mAh續(xù)航巨無霸！榮耀Power今日發(fā)布：配置匯總來了

教育要聞

英國校長代表團再訪華，雙方在教育、科研及人文領(lǐng)域展開深入交流

數(shù)碼要聞

三星 Galaxy Tab S10 FE / Tab S10 FE+ 平板國行版官宣

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

© 1997-2025 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進入關(guān)懷版主站蜘蛛池模板：栾川县| 南木林县| 盈江县| 靖安县| 姚安县| 汤原县| 昌乐县| 永州市| 梧州市| 德格县| 宁南县| 泸定县| 博爱县| 开封市| 东莞市| 崇州市| 深圳市| 封开县| 万州区| 雅安市| 东兰县| 鸡西市| 清苑县| 中西区| 高邑县| 吐鲁番市| 城固县| 罗甸县| 醴陵市| 连云港市| 洮南市| 固原市| 安宁市| 锡林郭勒盟| 昌乐县| 清水河县| 新竹县| 龙川县| 洪洞县| 祥云县| 北宁市|

<cite id="qr4fk"></cite>

<blockquote id="qr4fk"></blockquote>

<sub id="qr4fk"></sub>

<cite id="qr4fk"><li id="qr4fk"><pre id="qr4fk"></pre></li></cite>

<blockquote id="qr4fk"><p id="qr4fk"></p></blockquote>

<cite id="qr4fk"></cite>