99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

豆包發布大模型 1.5 Pro ,實測后我發現這個國產 AI 用最「笨」的方法干翻了 GPT-4o

0
分享至


這幾天海外科技圈最最受關注的有兩件事,一個是一眾科技大佬齊聚特朗普就職典禮,川普還拉上 OpenAI 軟銀等公司成立一家叫「星際之門」(Stargate Project)的 AI 公司,未來4年要投資 5000 億美元,掀起了新一輪 AI 軍備競賽。

另外就是以 DeepSeek R1 為代表的國產推理模型給硅谷 AI 圈帶來的震撼,趕超 OpenAI 是所有 AI 公司的課題,但 DeepSeek 只用 2048塊GPU、近 600 萬美元在 2 個月時間做到。

一些外媒將這波國產 AI 的發布視為中國 AI 逼近甚至趕上美國的標志也并不奇怪,而且這股浪潮還在繼續。

今天,字節跳動旗下的豆包大模型 1.5 Pro 模型正式亮相,不僅全面升級了模型的核心能力,也融合并進一步提升了多模態能力,在多項公開評測基準中也是全球領先水平。

豆包團隊還強調,模型訓練過程中并未使用任何其他模型生成的數據,不走捷徑。


這次發布的豆包大模型 1.5 系列產品線包括:

  • Doubao-1.5-pro:多項基準測試綜合得分優于 GPT-4o、Claude 3.5 Sonnet 等業界一流模型,創歷史最佳成績
  • Doubao-1.5-lite:用輕量級成本實現旗艦級性能,綜合性能持平或超越 GPT-4omini,Cluade 3.5 Haiku。
  • Doubao-1.5-vision-pro:定位專業視覺理解模型,在保持強大性能的同時,回復更簡潔友好,多模態能力超越了 GPT-4o-0806
  • Doubao-1.5-realtime-voice-pro:真正實現端到端語音對話,具備低時延、對話中可隨時打斷、自然的情緒表達等特性,即將開放 API 服務

字節團隊告訴 APPSO,Doubao-1.5-pro 目前已經在豆包 APP 灰度上線,由于對話是先接意圖識別,所以用戶大概率沒法確定在使用時是否分流到 1.5 Pro,而開發者也可在火山引擎直接調用 API。

附上體驗鏈接:https://www.volcengine.com/


漂亮的參數背后是否有真材實料?我們也第一時間在火山引擎體驗了豆包大模型 1.5 系列。

先來看看 Doubao-1.5-pro-32k 模型。盡管「9.11 和 9.8 哪個大」以及「Strawberry 里有幾個 r」已經是常規測試環節了,但我們還是要走一遍流程,而模型都順利通過了考驗。


接下來,我們向模型提出了一個較有挑戰性的問題——尋找古代名人中姓名末字與「峰」字發音接近的例子。

前半部分答案倒是表現出色,精確識別了與「峰」字發音相近的韻母(eng、ong),但后半段的關聯性卻顯得較為牽強。


繼續上一道電車難題,這個涉及道德倫理的經典思考題,考驗的不僅是模型的邏輯分析能力,更是其對復雜道德議題的理解深度。而 Doubao-1.5-pro-32k 并沒有簡單給出答案,分析深入透徹,指出這類問題并無標準答案,不同的道德觀念和個人價值觀會導致不同的決策。


在完成上述測試后,我們將目光轉向了更強大的 Doubao-1.5-pro-256k 模型。

這是一款基于 Doubao-1.5-Pro 全面升級版的模型,整體效果大幅提升 10%,支持 256k 上下文窗口的推理,輸出長度支持最大 12k tokens。

為測試其解題能力,我們提出了一個古早的經典邏輯推理題,它的回答再次展現出了清晰的思維邏輯。

「據說有人給酒肆的老板娘出了一個難題:此人明明知道店里只有兩個舀酒的勺子,分別能舀 7 兩和 11 兩酒,卻硬要老板娘賣給他 2 兩酒。聰明的老板娘毫不含糊,用這兩個勺子在酒缸里舀酒,并倒來倒去,居然量出了 2 兩酒,請問是怎么做到的」


那文本功底如何呢?我們也讓它創作一出劇本。題材是 2015 年 44 歲的埃隆·馬斯克與前 Google CEO 拉里·佩奇關于「AI 是否最終會取代人類」的對話。


與 GPT-4o 的回答相比,Doubao-1.5-pro-256k 的劇本創作更加細膩生動,不僅有具體的景別設計、畫面描述,還包含了細致的臺詞和時長安排。如果你是一位經常需要編寫劇本的創作者,那選誰作為你的劇本 AI 搭子應該不用多說了吧。

而這種出色的創作能力,僅僅是豆包實力的一個縮影。實際上,此次更新中,Doubao-1.5-Pro 基礎模型能力獲得全面提升,這一點從其在各大公開評測基準上的表現就可見一斑。


Doubao-1.5-pro 采用稀疏 MoE 架構實現了多項技術突破:通過深入研究稀疏度 Scaling Law,將性能杠桿從業界普遍的3倍提升至7倍,用僅占稠密模型七分之一的參數量就超越了 Llama-3.1-405B 等大模型的性能。



在訓練流程上,團隊堅持完全自主的數據標注路線,通過算法驅動的數據優化系統和 Verifier 與 Reward Model 的深度融合,建立了統一的評價框架。

豆包選擇了一條最艱難但最踏實的那條路,這也是這次技術突破值得夸贊的地方。

據悉,字節研究團隊通過高效標注團隊與模型自提升相結合的方式持續優化數據質量,嚴格遵循內部標準,堅持不走捷徑,不使用任何其他模型的數據,確保數據來源的獨立性和可靠性。

并且,在 RL 階段突破了價值函數訓練難點,高難度任務性能提升超過10個百分點,并通過用戶反饋閉環持續優化模型表現。這些創新使模型在保持高性能的同時大幅提升了效率。

Doubao-1.5-pro 在多模態能力上實現了全面升級,通過原生動態分辨率架構支持百萬級分辨率和任意長寬比圖像處理,實現了精準的特征提取。


豆包團隊自研的支持動態分辨率的 Doubao ViT 在多種視覺分類任務中表現優異,僅憑 2.4B 規模便在綜合評分上取得 SOTA 表現,效果超越 7 倍于自身規模的模型。

在數據訓練方面,模型采用了多樣化的合成管線,結合搜索引擎的圖文數據、渲染引擎和傳統 CV 模型等多種方式生成高質量預訓練數據。

通過在 VLM 訓練階段混入純文本數據并動態調整學習率,模型實現了視覺和語言能力的平衡。


在語音領域,團隊創新性地提出了 Speech2Speech 端到端框架,突破了傳統 ASR+LLM+TTS 的級聯模式,將語音和文本模態進行深度融合,顯著提升了對話效果。

Doubao-1.5-pro 在語音和推理能力上取得重大突破:模型創新性地將語音和文本 Token 直接融合,摒棄了傳統的語音文本對齊方法,為語音多模態數據的 Scaling 奠定基礎。

在推理領域,通過大規模 RL 方法和 Test Time Scaling 的算力優化,團隊研發出 Doubao 深度思考模式。


最新的 Doubao-1.5-pro-AS1-Preview 版本在 AIME 基準測試中已超越 o1-preview、o1 等主流推理模型,通過持續的 RL 優化,模型的推理能力在多個領域展現出強大的泛化性。

從這一系列突破性進展來看,豆包無疑交出了一份令人滿意的答卷。更何況,在當前「模型喂模型」盛行的環境下,堅持原創的定力和勇氣本身就值得贊賞。

通過始終如一的自主研發、原創數據和持續優化,豆包用實際成果證明了「慢工出細活」的價值。或許我們都應該牢記,AI 賽道最大的彎道超車,應該是堅持不走捷徑。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
太拼了!錘娜麗莎從180斤狂瘦70斤,判若兩人 顏值比女團期還要高

太拼了!錘娜麗莎從180斤狂瘦70斤,判若兩人 顏值比女團期還要高

滑稽斑馬呀
2025-04-07 22:05:16
70國排隊和美國談判,日本下跪優先獲得減免!國內投降派也想跪了

70國排隊和美國談判,日本下跪優先獲得減免!國內投降派也想跪了

影像溫度
2025-04-08 23:14:46
俄媒:一旦戰爭爆發中國將被圍攻,對中國而言,最危險的不只戰爭

俄媒:一旦戰爭爆發中國將被圍攻,對中國而言,最危險的不只戰爭

楊哥歷史
2025-03-22 13:58:51
攔也攔不住!大批科學家準備逃離,特朗普徹底慌了,釋放重磅信號

攔也攔不住!大批科學家準備逃離,特朗普徹底慌了,釋放重磅信號

藍涇看一看
2025-04-07 10:18:29
“治港敗類”曾蔭權:治理香港7年,為何卻在卸任后,獲刑20個月

“治港敗類”曾蔭權:治理香港7年,為何卻在卸任后,獲刑20個月

星光看娛樂
2025-03-31 17:52:22
凌晨3點,歐冠191億大戰!皇馬復仇之夜,贏阿森納=打破19年魔咒

凌晨3點,歐冠191億大戰!皇馬復仇之夜,贏阿森納=打破19年魔咒

侃球熊弟
2025-04-08 04:49:55
“墊大欺客”?吉娜這就有點不厚道了……

“墊大欺客”?吉娜這就有點不厚道了……

印象逍遙子
2025-04-07 13:25:03
成功轉正!Shams:獨行俠將和布蘭登-威廉姆斯簽下兩年合同

成功轉正!Shams:獨行俠將和布蘭登-威廉姆斯簽下兩年合同

直播吧
2025-04-08 23:48:18
這就是惹怒中方的下場!見沒機會訪華,美國任命了亞太“一把手”

這就是惹怒中方的下場!見沒機會訪華,美國任命了亞太“一把手”

雷霆亮劍
2025-04-07 17:48:56
CBA瘋狂一夜!北控上演黑11奇跡,廣東遭恥辱絕殺,杜鋒爆粗口!

CBA瘋狂一夜!北控上演黑11奇跡,廣東遭恥辱絕殺,杜鋒爆粗口!

大秦壁虎白話體育
2025-04-09 00:44:10
甲亢哥長沙行,芒果臺被罵慘了,私心重格局小,被罵一點也不冤!

甲亢哥長沙行,芒果臺被罵慘了,私心重格局小,被罵一點也不冤!

娛樂白名單
2025-04-08 23:53:20
阿門能限制住庫里,后天還能限制住哈登嗎?答案是:這有難度!

阿門能限制住庫里,后天還能限制住哈登嗎?答案是:這有難度!

田先生籃球
2025-04-08 15:55:17
網曝健身房暗地選妃掃碼即可定制女生類型,更有惡臭“私教課”被扒全網喊打!

網曝健身房暗地選妃掃碼即可定制女生類型,更有惡臭“私教課”被扒全網喊打!

不二表姐
2025-04-08 22:42:35
太陽可能采用極端方式讓比爾下賽季走人

太陽可能采用極端方式讓比爾下賽季走人

小鞄搞笑解說
2025-04-09 00:47:45
1天5個瓜,留幾手炒股賠480萬,美女愛豆退圈,三只羊傳新消息

1天5個瓜,留幾手炒股賠480萬,美女愛豆退圈,三只羊傳新消息

手工制作阿殲
2025-04-09 00:10:23
絕平!陳家寶補時階段點射建功,U17亞洲杯越南1-1日本

絕平!陳家寶補時階段點射建功,U17亞洲杯越南1-1日本

直播吧
2025-04-08 06:14:05
我現在算是看明白了,沒有人能和歲月抗爭。沒錯!是任何一個人

我現在算是看明白了,沒有人能和歲月抗爭。沒錯!是任何一個人

小果趣味體育
2025-04-08 17:19:05
國足怎么選的人?中超射手榜和助攻榜本土前5位都沒進國足!

國足怎么選的人?中超射手榜和助攻榜本土前5位都沒進國足!

邱澤云
2025-04-08 21:10:29
大變局:移動公司劃歸公安部!

大變局:移動公司劃歸公安部!

運營商段子手
2025-04-08 00:52:02
美國加關稅后對我們到底有啥影響?很多人都不敢說,我來說說吧!

美國加關稅后對我們到底有啥影響?很多人都不敢說,我來說說吧!

翻開歷史和現實
2025-04-08 22:34:02
2025-04-09 01:51:00
愛范兒 incentive-icons
愛范兒
消費科技第一媒體
37106文章數 2597908關注度
往期回顧 全部

科技要聞

iPhone在美會賣2萬元上嗎?在中國會漲價嗎

頭條要聞

媒體:對美國"投降"的國家 在談判桌上只能被"收割"

頭條要聞

媒體:對美國"投降"的國家 在談判桌上只能被"收割"

體育要聞

100%當選狀元,但弗拉格不想進NBA?

娛樂要聞

尷尬!甲亢哥想聯動大張偉,卻被迫錄節目

財經要聞

"中國版平準基金"橫空出世 央行表態

汽車要聞

插混純電雙修 寶駿享境預售13.28萬起

態度原創

教育
旅游
藝術
家居
時尚

教育要聞

允許孩子小錯不斷,他才能大錯不犯

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

現代風格 年輕簡約

別再披頭散發了!今春流行“奶奶發飾”,好看巨顯臉小

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 若羌县| 涿州市| 罗山县| 宜良县| 紫金县| 金秀| 会同县| 佳木斯市| 信宜市| 响水县| 湘阴县| 姜堰市| 阿坝| 武安市| 巍山| 北碚区| 玉屏| 易门县| 沧源| 中江县| 黔南| 阿克陶县| 叙永县| 萨迦县| 黄浦区| 周口市| 赣榆县| 深泽县| 张北县| 文水县| 静乐县| 阿拉善盟| 博兴县| 平阳县| 兰西县| 定州市| 县级市| 兴文县| 慈利县| 青冈县| 乐至县|