99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

國產六大推理模型激戰OpenAI?

0
分享至

撰文| 郝 鑫

編輯| 王 潘

“DeepSeek-R1如同當年蘇聯搶發的第一顆衛星,成為AI開啟新時代的斯普特尼克時刻。”

2025年春節前,DeepSeek比除夕那天的煙花先一步在世界上空綻放。

離年夜飯僅剩幾個小時,國內某家云服務器的工程師突然被拉入工作群,接到緊急任務,要求其快速調優芯片,以適配最新的DeepSeek-R1模型。該工程師告訴我們,“從接入到完成,整個過程不到一周”。

大年初二,一家從事Agent To B業務的廠商負責人電話被打爆,客戶的要求簡單粗暴:第一時間驗證模型真實性能,盡快把部署提上日程。

節前大模型,節后只有DeepSeek。DeepSeek-R1就像一道分水嶺,重新書寫了中國大模型的敘事邏輯。


以2022年11月,OpenAI發布基于GPT-3.5的ChatGPT應用為起點,國內自此走上了追趕OpenAI的道路。2023年,大模型如雨后春筍般冒出頭,無大模型不AI,各廠商你追我趕,百模大戰初見端倪。

你方唱罷我登場,2024年的主人公變成了“AI六小虎”,AI創業成為新的故事腳本。僅一年的時間,智譜累計完成40億元人民幣融資,月之暗面融資總額超13億美元。在資本拋出橄欖枝后,他們站到了聚光燈下,一躍成為明星獨角獸公司。

新的轉折點發生在DeepSeek-R1爆火后,曾有一段時間內行業陷入了“一半火焰,一半海水”的境地,即一邊積極擁抱學習R1,一邊陷入了深深的自省。

徘徊是短暫的,隨著百度、阿里、字節、騰訊、科大訊飛等廠商紛紛發布最新的推理模型,2025年的AI敘事主題呼之欲出:“六大推理模型迎戰OpenAI”。

推理模型的當打之年

回看OpenAI的模型發布時間線,在基礎模型方向,可以分為GPT系列和o系列,2024年OpenAI所發布的o1是一個里程碑式的轉向。



(光子星球制圖)

GPT系列是OpenAI最早構建的模型體系,聚焦自然語言處理、對話系統與文本生成,強調語言流暢性與上下文理解能力。o系列是OpenAI于2023年新設立的模型家族,核心聚焦“結構化推理”能力,強調模型的邏輯、分析、工具調用能力,是對GPT系列“語言偏重”路線的補充與擴展。

未來GPT系列或將逐漸退出歷史舞臺。OpenAI在更新日志中宣布,自2025年4月30日起,GPT4將在ChatGPT中退役,將完全被GPT4o取代。

如果只是OpenAI自身技術選擇,o系列和DeepSeek-R1并不會帶來如此強大的影響。以底層模型架構舉例,有公司選擇傳統的Transformer架構,也有公司選擇自研架構。

o系列崛起有一個大背景,即大模型范式的改變,從傳統預訓練階段模型參數的Scaling Law,轉移到強化學習推理計算帶來新Scaling Law。這一點在OpenAI的o3開發過程中得到了驗證,OpenAI觀察到大規模強化學習表現出與GPT系列預訓練中觀察到的趨勢相同,計算量越大,性能越好。

簡而言之,就是讓AI自己規劃、學習、反饋和完成任務,這與如今大熱的Agent所需具備的能力一致。

有技術人員告訴光子星球,o1以后所發布的“Deep Research”Agent,完全基于模型從頭訓練,且未公開思維鏈推理過程。“這意味著底座模型能力直接決定了Agent的落地效果”,想要在大模型第二程變得有競爭力,推理模型幾乎成為了必選。

站在公司和技術一號位角度,第一時間跟進o1和DeepSeek-R1是一種判斷和眼光,但同時也代表著重投入與高風險。

我們了解到國內的很多公司,名義上有自研大模型,但實則是“套殼”。o系列站在GPT的肩膀上誕生,這導致地基不牢的公司只能望而卻步。另一方面,融資和商業化變現的壓力,又淘汰了一批公司。



(光子星球制圖)

于是,我們發現去年星光暗淡的大廠們,成為了反應最快,跟進最及時的代表。

以DeepSeek-R1(2025年1月20日發布)為時間基準線,當月科大訊飛就發布了深度推理大模型——訊飛星火X1;3月,百度發布文心大模型X1,阿里發布通義千問Qwen-QwQ-32B推理模型,騰訊發布混元T1深度思考模型;4月,字節豆包1.5深度思考模型上線,同時訊飛星火X1迎來升級,發布“快思考、慢思考統一模型”。

上述廠商有一些共同之處,跟上了每一次的模型能力升級進度,在轉向推理方向前,其基礎模型能力基本都達到了GPT-4的水平。以此作為參照,這可能是邁入大模型第二階段的基本條件。

六大推理模型混戰o3

o3目前是OpenAI最強大的推理模型。網上流傳的一張大模型IQ圖顯示,人類平均IQ為100,o3智商達到了驚人的136。

測試數據顯示,o3在多項基準測試中超越了o1的性能,特別在分析圖像、圖表和圖形等視覺任務中表現尤為出色。

在外部專家的評估中,o3在困難的現實任務中比o1犯的重大錯誤減少20%,在編程、商業、咨詢和創意構思等領域都有不錯的表現。

需要承認的是,OpenAI存貨確實有兩把刷子,繼o1之后,o3又成為了新的大模型性能攀登高峰。但國內各大模型廠商的跟進速度并不慢,若以DeepSeek-R1為參考標準,百度、阿里、科大訊飛、字節、騰訊后面所發布的推理模型水平相差不大,部分在一些測試指標上甚至有超越。

截至目前,國產六大推理模型各有千秋。

DeepSeek-R1的意義不言而喻,完整的技術報告和開源部署,給予了行業推理大模型訓練思路。打開了OpenAI閉源的“黑匣子”,成功復刻出了性能相差無幾的o1。R1突出的特點是“花小錢辦大事”,高效且追求極致性價比。在非常有限的算力、數據等資源投入的情況下,訓練成本卻僅為560萬美元,遠低于美國AI公司的數千萬美元乃至數億美元投入。

一位知情人士告訴我們,DeepSeek-R1和一些國產推理大模型不構成直接競爭對手。在B端業務中,目前阿里開源的千問系列模型占比更重。“全尺寸和全模型,就像一個全家桶,可以供客戶選擇。32B的模型大小,跑起來成本也不是很高”。

百度在這波中從生態層面接入了DeepSeek,這給了用戶更多選擇權,開源和免費的策略或將能吸引更多用戶。文心大模型X1采用“思維鏈-行動鏈”協同訓練,在復雜任務中自動拆解為二十多個推理步驟,同時可以調用十幾種的工具鏈,以此來增強Agent的能力。

有參與過與百度合作的人士告訴光子星球,在金融、醫療、政務等一些垂類領域,百度會“牽線搭橋”,把一些相關業務的公司攢到一個局。“百度提供基礎模型,我們提供另一方所需的技術,最后直接跟百度核算”。通過這種方式,百度正不斷縮小To B大模型市場與科大訊飛之間的差距。

科大訊飛的星火X1,是當前業界唯一基于全國產算力訓練的深度推理大模型。

正是基于全棧國產、自主可控的優勢,科大訊飛的星火大模型倍受央國企和政府客戶的青睞,保持行業端領先。4月21日,星火X1升級提升了通用能力,也同步增強了面向行業的解決方案能力。在重點行業,如教育、醫療、司法等領域的測試中,都獲得了超過OpenAI和DeepSeek的分數,這些能力無疑會在今年大模型訂單中有所體現。

星火X1一個模型同時支持兩種思考模式,提升了模型處理不同復雜度任務的能力,滿血版星火X1僅需4張卡(華為910B)即可部署。與華為的深度合作,以及不斷迭代的底座大模型能力和強大的行業大模型落地體系,已經成為科大訊飛在一眾大廠圍剿中突出重圍的三大利器。

國內閉源大模型中,豆包模型被評價為“有一定價格競爭力”。一位做AI玩具的廠商告訴我們,他的產品接入了多家大模型,在用戶使用過程中,優先使用各家的免費Token額度,“一旦超過后,優先切換豆包,價格能控制在比較低的成本”。

去年,豆包參與主導了價格戰,豆包大模型價格降至0.0008元/千Tokens,豆包視覺理解模型定價0.003元/千Tokens,均低于當時行業平均水平。此外,豆包大模型是技術落地AI應用產品值得借鑒的案例,端到端的實時語音技術、多模態、Agent技術都能在第一時間介入豆包應用端,這也是支撐其快速迭代更新的原因之一。

騰訊混元入場較晚。有員工曾向我們表示,混元團隊成員大部分以前是搜索推薦廣告出身,跟通義、字節或許有一定差距,“趕鴨子上架,好像也沒什么明確方向,東一下西一下”,“一群外行人指導內行人”。加之人員的流逝,導致了混元曾一度處于停滯狀態。

借著DeepSeek崛起的東風,元寶已經悄然實現了逆襲。至少從數據層面看,已經取得階段性成果。一位內部人士告訴我們,2025年春節以來的這幾個月,騰訊傾注了整個集團資源對元寶進行推廣,無論線下活動資源,還是微信導流或者預算投入,對于元寶都是重點傾斜,通過這種大力出奇跡的方式,逆轉了此前完全被動的局面。

從目前各公司的市場反饋來看,云端多模調用已經逐漸被認可,各家模型并存,用戶按需調取才是未來。在現實情況中,客戶最終是否選用一款大模型,模型性能只是一項衡量標準,背后可能還涉及數據、生態等多方面的考量。

大模型全面國產

自DeepSeek-R1開始,國產推理大模型成為了各榜單的常客,AI開源社區的用戶以真實的下載量和Star數來支持中國AI的發展。

即便如此,當前大模型仍面臨著或多或少的“卡脖子”的問題。

近期,有消息稱,英偉達已通過非正式渠道通知其AIC合作伙伴(如七彩虹、影馳、同德等),暫停GeForce RTX 5090D的銷售和出貨。這一舉措被認為是英偉達在應對國際環境變化的預防性措施。

盡管英偉達尚未發布正式公告,但業內普遍認為,RTX 5090D的供應已進入“暫停狀態”,這僅僅才只是開始。

若從源頭上被限制,英偉達必將遭遇更加巨額的損失,而美國之外國家的大模型發展將遭遇不確定性,追趕OpenAI的步伐也將受到一定的阻礙。

在此背景下,全國產化技術路徑將越來越成為大家的備選項。這其中,科大訊飛做了較為充分的準備。據了解,科大訊飛與合作伙伴聯合通過四大核心技術優化,實現MoE模型集群推理性能翻倍提升。

根據最新測試集評測結果,星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1,在數學、知識問答等方面表現突出,這表明在技術自主可控的道路上,中國AI已具備與國際頂尖模型同臺競技的實力。

去年風光無限的AI六小虎,如今早已各奔東西,境遇迥然。被DeepSeek擊碎“AGI理想”“學術天才創業”和“明星AI產品”的月之暗面,回歸到低調的技術研發中;將底層技術和產品解綁后的MiniMax,加大了對技術的投入,方向同樣為Agent和推理模型;六小虎中的智譜終于盼來了即將IPO的好消息,不過其整體營收、估值以及能否順利實現IPO,仍充滿變數。

去年,Kimi、海螺AI等AI應用的出圈,短暫地迎來了AI公司的高光時刻。但今年,推理模型已經成為了國內各大廠商角逐的重要方向,AI六小虎的方向與大廠高度重合,而決定他們能否生存下去的“口糧”則握在大廠們的手上。

如今,隨著六大推理大模型的全面崛起,以及國際環境的不確定性加劇,全棧國產化大模型有望將成為一種新的主流。

從半導體、工業軟件與信創再到今天的AI芯片,歷史的經驗告訴我們,想要擺脫被制約的現狀就得實現獨立自主,將命運牢牢掌握在自己手中。或許在不久的將來,越來越多的國產大模型將走上全棧國產化對抗OpenAI們的道路。

微信號|TMTweb

公眾號|光子星球

別忘了掃碼關注我們!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1945年,法國巴黎名叫伊娃的女人衣服被扒光,豐腴的身體沒有遮擋

1945年,法國巴黎名叫伊娃的女人衣服被扒光,豐腴的身體沒有遮擋

百態人間
2025-04-22 16:24:22
中方4次打假辟謠,送美一句忠告,特朗普稱中國必須實質性讓步!

中方4次打假辟謠,送美一句忠告,特朗普稱中國必須實質性讓步!

文雅筆墨
2025-04-28 15:38:12
東亞區獨苗!3-2,日職聯勁旅掀翻亞冠2冠王,晉級精英賽半決賽

東亞區獨苗!3-2,日職聯勁旅掀翻亞冠2冠王,晉級精英賽半決賽

側身凌空斬
2025-04-28 05:05:37
國足新核破繭成蝶!18歲王鈺棟驚天世界波鎖定未來十年鋒線答案

國足新核破繭成蝶!18歲王鈺棟驚天世界波鎖定未來十年鋒線答案

中山印象體育攝影師
2025-04-28 10:11:38
東體:國安外援法比奧曾私下多次咨詢能否被歸化,與合同和金錢無關

東體:國安外援法比奧曾私下多次咨詢能否被歸化,與合同和金錢無關

雷速體育
2025-04-28 12:09:08
重大誤判!大黑馬2-2變1-3:全場噓聲四起,布倫森32+11拯救球隊

重大誤判!大黑馬2-2變1-3:全場噓聲四起,布倫森32+11拯救球隊

體壇小李
2025-04-28 05:43:45
駐韓美軍厭煩被中國人圍觀,破防的卻是韓國人!

駐韓美軍厭煩被中國人圍觀,破防的卻是韓國人!

談芯說科技
2025-04-26 21:57:46
中美關稅大戰:最大成果不是中國勝了,而是美國再無手段控制中國

中美關稅大戰:最大成果不是中國勝了,而是美國再無手段控制中國

墜入二次元的海洋
2025-04-28 13:48:38
38歲楊冪現身香港疑似去看女兒,頭發潦草,八千多的鞋被穿成拖鞋

38歲楊冪現身香港疑似去看女兒,頭發潦草,八千多的鞋被穿成拖鞋

漣漪讀史
2025-04-28 00:07:49
俄媒:一旦戰爭爆發中國將被圍攻,對中國而言,最危險的不只戰爭

俄媒:一旦戰爭爆發中國將被圍攻,對中國而言,最危險的不只戰爭

大國紀錄
2025-03-07 11:15:20
成都蓉城新歸化有望進國足?已提前入籍,本賽季入隊后表現不俗

成都蓉城新歸化有望進國足?已提前入籍,本賽季入隊后表現不俗

小彭美識
2025-04-28 11:59:31
大軍集結之后,印度空軍突然發現:自己已經對付不了梟龍3!

大軍集結之后,印度空軍突然發現:自己已經對付不了梟龍3!

嘆知
2025-04-26 20:43:39
美國要為擊中基輔的導彈負責!燒掉俄軍蘇-30SM,但我高興不起來

美國要為擊中基輔的導彈負責!燒掉俄軍蘇-30SM,但我高興不起來

鷹眼Defence
2025-04-26 17:59:09
努涅斯朝身為穆斯林的薩拉赫潑香檳?事實上那是0酒精香檳飲料

努涅斯朝身為穆斯林的薩拉赫潑香檳?事實上那是0酒精香檳飲料

直播吧
2025-04-28 15:46:53
最高法:堅決防止把經濟糾紛當作犯罪處理

最高法:堅決防止把經濟糾紛當作犯罪處理

財聯社
2025-04-27 15:05:31
面對新式紅衛兵,一個歷史老師的無奈:誰之罪?

面對新式紅衛兵,一個歷史老師的無奈:誰之罪?

霹靂炮
2025-04-23 23:16:50
1999年,一江西婦女到北京找知青丈夫,首長聽到此事后深思了起來

1999年,一江西婦女到北京找知青丈夫,首長聽到此事后深思了起來

牛魔王與芭蕉扇
2025-04-15 16:26:10
日本網紅怒批中國人給手機充電是“偷電”!中日網友為此在外網吵了起來…

日本網紅怒批中國人給手機充電是“偷電”!中日網友為此在外網吵了起來…

東京新青年
2025-04-27 18:51:37
陳夢與黃曉明同框,共同現身華表獎!氣質絕佳、顏值不輸現場明星

陳夢與黃曉明同框,共同現身華表獎!氣質絕佳、顏值不輸現場明星

十點街球體育
2025-04-28 00:10:03
吳秀波,判了

吳秀波,判了

BenSir本色說
2025-04-25 22:15:54
2025-04-28 17:19:00
光子星球 incentive-icons
光子星球
細微之處,看見未來!
1046文章數 2120關注度
往期回顧 全部

科技要聞

大廠圍獵AI人才:部分實習生日薪可達2000

頭條要聞

醫生被指婚內出軌多名女同事 做手術離開手術臺40分鐘

頭條要聞

醫生被指婚內出軌多名女同事 做手術離開手術臺40分鐘

體育要聞

“我們欠球迷一個冠軍慶典,現在可以狂歡了”

娛樂要聞

王寶強座位引眾怒 論演技誰能壓得了

財經要聞

事關穩就業、穩經濟!四部門聯合發聲

汽車要聞

2025上海車展,再看比亞迪

態度原創

健康
藝術
手機
數碼
軍事航空

唇皰疹和口腔潰瘍是"同伙"嗎?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

手機要聞

努比亞Z70S Ultra攝影師版發布,超越不止一英寸,起售價4599元!

數碼要聞

消息稱英偉達 B300 GPU 五月投產:超級芯片主板沿用 Bianca 設計

軍事要聞

特朗普:澤連斯基愿放棄克里米亞

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 洛阳市| 富锦市| 新乡市| 乌拉特中旗| 金溪县| 甘孜县| 余干县| 大渡口区| 万山特区| 饶阳县| 潮安县| 富平县| 乡宁县| 达拉特旗| 闽清县| 闽侯县| 平邑县| 孝昌县| 黑山县| 修水县| 海盐县| 东海县| 东宁县| 科技| 焉耆| 湘阴县| 博白县| 驻马店市| 长沙县| 夏邑县| 罗源县| 屏东县| 鹤庆县| 丰都县| 泰安市| 崇明县| 岚皋县| 绥化市| 汉源县| 伊川县| 绿春县|