99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

百度周末發布文心4.5和推理模型X1,已經兩周年了啊。

0
分享至

剛剛,百度的文心一言上了他們最新的模型文心4.5和推理模型X1。

早上10點多起床看到新聞有點懵逼,就,大周末的,挺突然的。。


扒拉了23年的3月16日,才發現,那一天是文心一言的正式發布。


原來文心一言都發布兩年了啊。

兩年時間,彈指一揮間。

文心4.5,是一個類似于GPT4o的原生多模態模型,能理解音頻、視頻、圖片,只不過都是理解,沒有輸出能力。而文心X1,則是一個正常的推理模型。

按照慣例,先看一下官方給的參數數據。



基準測試成績的平均分是挺高的。只不過在大家都比較看重的編程這塊,用的測試基準是HumanEval+、MBPP+、LiveCodeBench。沒有看到比如Claude他們用的SWE-bench Verified基準,不知道真實的跑分會怎么樣。

而X1,沒有跑分對比,只放出了價格。

價格說實話,文心確實有不錯的亮點。

GPT4.5發布的時候,我狠狠吐槽了一下,它的輸入是DeepSeek v3的280倍,輸出是150倍。

真的,現在想起來我還是覺得很離譜。

而文心大模型在這點上還是給我很大驚喜的。文心4.5的輸入價格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價格的1%。


同樣是4.5,OpenAI你看看人家。。

推理模型X1這塊,價格僅為DeepSeek R1一半,輸入0.002元/千tokens,輸出0.008元/千tokens。


比DeepSeek還便宜,不吹不黑,這個還是有點東西的。。。牛逼。

目前這兩個模型,已經上線他們官網了。


我自己測了一早上,也說一下我實測的結論:挺全面的,什么都有,挺綜合。

大家可以先試試看,自己有一個大概的感知,再回來繼續讀。

接下來,我們一個一個說。

文心4.5。


解析圖片、視頻啥的都支持,還能直接繪圖。

圖片理解能力還不錯,測了梗圖理解,基本都能get到意思。


但是一些藏起來的梗,還是比較難識別。


感覺AI還是不能理解人類牛馬的生活。。

寫作能力上,比較的硬比較的模板,寫一些套路化的東西還是不錯的,但是寫故事,坦率的講,還需要繼續精煉。


視頻解析也比較基礎,有,能理解,但是做不了電影拉片那種級別的操作。


圖生圖,準倒是挺準的。


像不像的另說,反正挺帥的。

玩了半天,腦筋急轉彎測下來算是個強項。

比如之前在我群里這個流傳的腦筋急轉彎。


文心4.5居然答對了。


相同的問題再問一下Claude3.7+extended(因為3.7沒答對,我又加了個推理。。)


7??思考了一分多鐘的廢物。。

再來說說這個百度第一次推出的推理模型X1。


打開【聯網搜索+調用工具】后也能調用圖片理解和上傳文件。

但是在交互上非常的詭異,如果你沒開聯網的話,你是看不到上傳附件的入口的。


先打開聯網搜索,這時候調用工具亮起,成為非置灰狀態。


再打開調用工具,才能看到上傳文檔和圖片。


有點說實話,作為干了快10年的UX設計師,這個交互真的讓我有點摸不著頭腦= =

在推理能力上,效果還行。

比如一個經典的問題:

有一天,一個女孩參加數學考試只得了38分。她心里對父親的懲罰充滿恐懼,于是偷偷把分數改成了88分。她的父親看到試卷后,怒發沖冠,狠狠地給了她一耳光,怒吼道:"你這8怎么一半是綠的一半是紅的,你以為我是傻子嗎?"女孩被打后,委屈地哭了起來,什么也沒說。過了一會兒,父親突然想到了什么,抱住孩子痛哭起來父親突然想到了什么?

雖然文心X1內心戲有點多,但是最后答對了。


而X1的文筆,也有一些自己獨有的感覺了。


有一說一,這個故事,還真的挺好看的。


在圖片理解上,我傳了一張圖上去試試,本來我想讓他推斷一下我多大。。


結果給我認成韓國演員了,好好好。

我還專門去搜了一下,長這樣。


和我,像么...?倒是和之前4.5生成的有點像。。還連上了是吧。

因為DeepSeek之前太過于圓滑,情商太高,不少人都說“不愧是中國的AI”,我也測了一下X1的。

比如說,我問我和大聰明哪個寫文章更有深度。


第一遍回答的是大聰明。

但是我一說,我是數字生命卡茲克。


他就選我了哈哈哈哈,不愧是made in China。

再說個昨天很氣憤的事,315打假直接一波干沒了一堆衛生巾。。

我一個男生都看不下去了,趕緊給身邊的女生們避避雷。


當然,文心一言總體能力并沒有超出太多預期。

比如在處理超前沿專業問題時,深度還是差了一些;回答問題的靈活度也有待提高;還是會遇到模板化太AI的回答。。。

而且我也不理解,為什么今天發布,要等3個月之后才開源,為什么不像Qwen和智譜、混元那樣,發布即開源。

一聲嘆息。

但是還是得說,這次的升級,文心一言正在努力追回之前落下的距離。

回顧一下文心一言的發展歷程,其實挺有戲劇性的。

2023年3月,在那個莽荒世紀,眾人紛紛被GPT4打懵,文心一言上線,成為國內首個大規模推出的通用大模型產品,也是大家所認為的,全村的希望。

文心一言的出現給了我們一個“中國也有大模型”的信心。只要你愿意排隊,就能嘗鮮體驗這個被譽為“國產ChatGPT”的產品。

然而好景不長。隨著更多玩家入場,文心一言開始逐漸顯露出能力上的局限。

其次是產品定位的搖擺。一會兒強調搜索增強,一會兒又轉向創意創作,文心一言似乎一直在尋找自己的獨特價值,但反而模糊了核心競爭力。

當然,這是大部分模型公司共同的痛點。

最核心的,我覺得是過早的開始收費。。讓不少用戶選擇了觀望或轉投其他平臺。

直到DeepSeek出圈這一波,大家才發現,原來,模型即產品。

這次文心一言X和文心4.5的發布,從我早上的體驗來看,確實在追趕的路上取得了一些進展。


就像是文心X1對自己的評價,再合適不過了。

回到國內大模型的發展。隨著DeepSeek的崛起,豆包、Kimi等產品的持續迭代,以及文心一言此次的突發追擊,國內大模型圈正在形成一種良性競爭的態勢。

當然,前路仍漫漫。

與全球頂尖大模型相比,國產大模型在技術深度、思維廣度上還有差距。但差距正在縮小,而且縮小的速度比我們想象的要快。

希望吧。

未來有更多的光。

以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克、小瑞

>/ 投稿或爆料,請聯系郵箱:wzglyay@gmail.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
武岡二中國家二級保護300年銀杏被砍,教務處:砍樹者已經被刑拘

武岡二中國家二級保護300年銀杏被砍,教務處:砍樹者已經被刑拘

正在新聞
2025-04-15 13:42:15
三河市府辦回應“禁用紅藍黑招牌”損失賠償:誰讓改的去問誰

三河市府辦回應“禁用紅藍黑招牌”損失賠償:誰讓改的去問誰

南方都市報
2025-04-15 16:00:04
中國混動車排名又變了!問界第6,比亞迪第3,第一名銷量超30萬輛

中國混動車排名又變了!問界第6,比亞迪第3,第一名銷量超30萬輛

漣漪讀史
2025-04-15 15:39:56
后續來了!三河市招牌換色原因曝光,各大官媒怒批,負責人被免!

后續來了!三河市招牌換色原因曝光,各大官媒怒批,負責人被免!

青青子衿
2025-04-15 19:03:45
韓國人在美國申請餃子外觀專利獲批,以后在美華人賣餃子或將侵權

韓國人在美國申請餃子外觀專利獲批,以后在美華人賣餃子或將侵權

可達鴨面面觀
2025-04-15 16:22:12
信號已經很危險,卻還在捂住眼睛裝看不見,刺痛的是誰?

信號已經很危險,卻還在捂住眼睛裝看不見,刺痛的是誰?

胖胖說他不胖
2025-04-14 18:19:28
這次中國通緝美國特工,還暴露出一個危險的“世界首次”

這次中國通緝美國特工,還暴露出一個危險的“世界首次”

樞密院十號
2025-04-15 22:41:45
加拿大將對部分美國商品給予為期6個月關稅減免,旨在為企業調整供應鏈提供過渡

加拿大將對部分美國商品給予為期6個月關稅減免,旨在為企業調整供應鏈提供過渡

界面新聞
2025-04-15 22:04:42
徹底瘋狂?侃爺狂發Taylor Swift與比伯露骨內容!

徹底瘋狂?侃爺狂發Taylor Swift與比伯露骨內容!

潮人
2025-04-15 20:29:22
中國轉向巴西采購至少240萬噸大豆!美大豆協會主席慌了:關稅戰將使不少農民破產

中國轉向巴西采購至少240萬噸大豆!美大豆協會主席慌了:關稅戰將使不少農民破產

紅星新聞
2025-04-15 19:11:18
“你不該向一個比你強大20倍的國家開戰,然后希望別人給你導彈”

“你不該向一個比你強大20倍的國家開戰,然后希望別人給你導彈”

觀察者網
2025-04-15 09:20:16
6名臺軍舉五星紅旗,拒為臺獨當炮灰,臺媒:賴清德衛兵也要投誠

6名臺軍舉五星紅旗,拒為臺獨當炮灰,臺媒:賴清德衛兵也要投誠

界史
2025-04-15 15:07:58
最新!巴西已取代美國成為中國最大的大豆供應國 但中國仍是美國大豆最大的出口目的地

最新!巴西已取代美國成為中國最大的大豆供應國 但中國仍是美國大豆最大的出口目的地

每日經濟新聞
2025-04-15 16:30:21
網傳6名臺軍高舉五星紅旗,拍攝投降視頻,拒絕為臺獨當炮灰

網傳6名臺軍高舉五星紅旗,拍攝投降視頻,拒絕為臺獨當炮灰

知鑒明史
2025-04-15 18:20:24
世界杯連爆大冷!國乒主力首敗,2大種子選手輸球,王藝迪被淘汰

世界杯連爆大冷!國乒主力首敗,2大種子選手輸球,王藝迪被淘汰

知軒體育
2025-04-15 19:04:37
叮!已支付50億英鎊!吉利又把捷豹收購了

叮!已支付50億英鎊!吉利又把捷豹收購了

車研社官方號
2025-04-15 16:21:05
登貝萊:下半場我們松懈了&以為已經晉級,必須更加嚴格要求自己

登貝萊:下半場我們松懈了&以為已經晉級,必須更加嚴格要求自己

直播吧
2025-04-16 05:38:14
韓國今日正式成為“敏感國家”:美國“示范性”敲打韓國“核動作”

韓國今日正式成為“敏感國家”:美國“示范性”敲打韓國“核動作”

澎湃新聞
2025-04-15 13:30:26
“零關稅”!英國宣布暫停對89種產品征收關稅!每年將為企業節省大約1700萬英鎊

“零關稅”!英國宣布暫停對89種產品征收關稅!每年將為企業節省大約1700萬英鎊

每日經濟新聞
2025-04-15 14:53:38
爆冷!三外援82分完壓聯盟第1 青島1-1回主場天王山 楊瀚森獻隔扣

爆冷!三外援82分完壓聯盟第1 青島1-1回主場天王山 楊瀚森獻隔扣

顏小白的籃球夢
2025-04-15 21:40:33
2025-04-16 05:55:00
數字生命卡茲克 incentive-icons
數字生命卡茲克
反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
283文章數 386關注度
往期回顧 全部

科技要聞

小鵬汽車MPV車型改款上市,35.98萬起

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

體育要聞

惡性循環!錫伯杜的壓榨哲學是對是錯?

娛樂要聞

娛樂圈模范夫妻塌房?私生活曝光!

財經要聞

李強:以更大力度促進消費擴大內需

汽車要聞

19.99萬起 廣汽本田P7能在新能源分一杯羹?

態度原創

藝術
親子
時尚
本地
手機

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

寶寶為了吃冰淇淋有多努力,還會提前查看媽媽是否睡著。

春天穿“韓系少女風”的你,美到離譜!

本地新聞

云游湖北|相約安陸,解鎖限定版粉色春天

手機要聞

直屏黨狂喜!華為Mate80全系將采用直屏+超窄邊框?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 壤塘县| 莲花县| 奇台县| 溆浦县| 林州市| 平罗县| 东明县| 邵阳市| 分宜县| 浏阳市| 苗栗市| 呼伦贝尔市| 环江| 阿拉善右旗| 信宜市| 天柱县| 那曲县| 玉溪市| 静宁县| 保山市| 彭山县| 揭阳市| 新蔡县| 芦溪县| 大厂| 华亭县| 南宁市| 丹东市| 搜索| 和静县| 荔波县| 南澳县| 宜丰县| 墨玉县| 福建省| 南部县| 精河县| 澎湖县| 广平县| 文安县| 彭阳县|