全球領先的AI研究機構Artificial Analysis發布了最新的中國AI大模型的報告,其中對比了中美兩國在AI大模型的各項數據。我們可以一窺中國大模型在全球的格局和地位。
人工智能在領導力領域的崛起
趨勢:中國AI實驗室(如DeepSeek、阿里巴巴)逐步縮小與美國(如OpenAI、Anthropic)的差距,部分中國模型(如DeepSeek R1)接近o1級智能(推測為性能等級)。
關鍵技術趨勢
2024年底中國密集發布高性能模型(如DeepSeek V3),中美模型智能差距顯著縮小。OpenAI于2024Q3首創“先思考后回答”的推理模型,中國實驗室(如DeepSeek)快速跟進,已具備與c1級(對標標準)相當的推理能力。DeepSeek、阿里巴巴的開源模型(如Owen系列)接近o1級智能,推動技術普惠。
2024年底,DeepSeek取代阿里巴巴成為中國AI模型發布的領跑者,持續推出新模型(如R1、V3系列)。
中國AI實驗室雖起步較晚,但2024年迅速縮小與美國頂尖模型(如OpenAI的O1)的差距,DeepSeek R1對標美國同類模型僅耗時數月。
開源模型全球競爭力:中國實驗室(如DeepSeek、阿里巴巴、騰訊)發布的開源權重模型已達全球前沿水平。
2025年初,中國實驗室(DeepSeek、阿里巴巴、月之暗面、智譜等)密集發布前沿推理模型,發布速度和數量表明其技術已不再落后。
美國在語言模型領域保持整體領先,多個模型得分較高(如OpenAI的o3和o1.得分94和90)。中國緊隨其后,部分模型得分接近美國(如DeepSeek和o1-mini,得分89)。法國、加拿大和以色列等國家也有部分模型進入榜單,但得分相對較低(如加拿大的AI21 Labs模型得分為55)。
多個中國AI實驗室已經展示了或聲稱達到了前沿級別的智能水平。其中,有七個模型具備推理能力。圖表顯示了中國AI實驗室開發的模型在“Artificial Analysis Intelligence Index”中的得分。總體來看,中國AI實驗室在語言模型領域,尤其是在推理能力方面,取得了顯著進展,與美國的模型表現相當。
阿里巴巴、百度、字節跳動、華為和騰訊等公司發布了多個AI語言模型,涵蓋推理和非推理能力。這些公司通過開放權重模型和專有模型推動AI技術發展。
▌主要AI模型及智能得分
阿里巴巴:Qwen 2.5 Max(79分)、QwQ(78分)。
百度:Ernie 4.0 Turbo(76分)。
字節跳動:Doubao 1.5 Lite(77分)、Doubao 1.5 Pro(80分)。
華為:Pangu 5.0 Large(74分)。
騰訊:混元Large(74分)。
中國AI初創公司,在中國大型科技公司和政府的支持下,這些公司開發了世界領先的開放權重模型。
▌主要AI模型及智能得分
MiniMax:MiniMax-Text-01(非推理,76分)、Kimi k1.5(推理,87分)。
Moonshot AI:V1-128k(非推理,52分)。
01.AI:Yi-Lightning(非推理,73分)、R1(推理,89分)。
DeepSeek AI:V3(非推理,79分)、GLM-Zero-Preview(推理,81分)。
Zhipu.AI:GLM-4-Plus(非推理,70分)。
Baichuan智能:Baichuan 4-Turbo(非推理,65分)、Baichuan M1-Preview(推理,83分)。
Stepfun:Step-2-16k(非推理,82分)、Step-R-mini(推理,84分)。
美國對中國出口高端AI加速器的限制時間線,以及NVIDIA GPU在不同限制下的狀態。
美國對中國出口高端AI加速器的限制時間線及具體措施。
影響:TPP ≥ 4.800 或 TPP ≥ 1.600 且 PD ≥ 5.92.
特朗普政府可能進一步擴大受限芯片范圍,H20可能被加入限制清單。總體來看,美國對NVIDIA高端GPU的出口限制嚴格,但H20和L20目前不受影響。
未來,中美AI競爭將繼續推動技術發展。盡管美國在高端AI芯片出口方面對中國實施了嚴格限制,但中國AI實驗室在語言模型方面取得了顯著進展,全球AI技術的應用前景將更加廣闊。
以上內容引自:Artificial Analysis。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.