最近,AI 圈出了件大事!2025年1月31日,英偉達官網宣布,推理開放模型DeepSeek R1正式在NVIDIA NIM平臺上提供預覽版,這意味著DeepSeek R1模型已作為NVIDIA NIM微服務預覽版在英偉達開發者平臺上線,雙方開啟了技術合作。此消息經風口財經等報道后,瞬間引發了業內關注。
DeepSeek - R1是個超厲害的大語言模型,推理、數學、編碼樣樣精通。它最讓人驚訝的就是成本超低。訓練的時候,只用了2048塊符合美國出口管制版本的英偉達H800 GPU,花了55天,才花了557.6萬美元,成本只有同類模型的1/20,推理成本是OpenAI模型的1/30。而且它還是開源的,就像“AI界的拼多多”,性價比超高。從技術上講,它用了混合專家模型(MoE)、多頭潛注意力(MLA)和雙重流水線(DualPipe)等技術優化,計算效率大大提高。
這消息一出來,股票市場都跟著動了。1月27日那天,英偉達的股價一下子跌了16.86%,市值少了差不多5900億美元,博通這些芯片股也跟著跌。為啥呢?因為投資者擔心AI模型成本變低,大家就不需要那么多高端GPU了,這會影響英偉達這些公司的發展。
不過,英偉達和DeepSeek合作也是有想法的。一方面,能擴大自己的生態,吸引更多開發者;英偉達推出的NIM微服務基于HGX H200系統,每秒可處理3872個tokens ,其API靈活易用,基于云原生架構,此次預覽版發布旨在吸引開發者測試反饋,未來還將融入英偉達AI Enterprise平臺,這被視為英偉達在企業級AI市場的重要布局,有助于加速高性能模型商業化。另一方面,它強調用的H800 GPU符合出口規定,回應大家對供應鏈的擔心。而且,從長遠看,英偉達覺得這里面有個“杰文斯悖論”。啥是杰文斯悖論呢?簡單說,就是技術進步讓資源用得更有效率,成本降低了,大家就會用得更多,最后總的使用量反而會增加。就像以前蒸汽機效率提高了,煤炭用得卻更多;汽車省油了,石油消耗總量卻沒減少。在AI這里也是,以后人工智能用得更方便高效了,對計算資源的需求可能會更多。
此外,歐洲對DeepSeek開源特別高興。比如法國之前推出的露西模型,沒幾天就下架了,說明他們自己做AI模型有點難。現在DeepSeek開源,他們就能借著這個模型參與到AI競爭里,這對他們來說是個難得的機會。
當然,DeepSeek 以后也有不少挑戰,有人懷疑它成本是不是真這么低,技術是不是原創的。但不管怎么說,它的出現可能會讓更多小公司靠優化算法參與競爭,推動行業創新,也會讓不同地區在技術方面的競爭更激烈。這次的事是AI發展中的一個重要節點,未來會怎么樣,我們可得好好關注。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.