繼英偉達、微軟、亞馬遜等美國巨頭接入DeepSeek-R1后,華為云官方宣布:DeepSeek-R1開源后引發全球用戶和開發者關注。經過硅基流動和華為云團隊連日攻堅,現在,雙方聯合首發并上線基于華為云昇騰云服務的DeepSeekR1/V3推理服務。
該服務具備以下特點:
得益于自研推理加速引擎加持,硅基流動和華為云昇騰云服務支持部署的DeepSeek模型可獲得持平全球高端GPU部署模型的效果。
提供穩定的、生產級服務能力,讓模型能夠在?規模生產環境中穩定運行,并滿足業務商?部署需求。華為云昇騰云服務可以提供澎湃、彈性、充足的算力。
在線體驗
DeepSeek-R1:
https://r1.siliconflow.cn
DeepSeek-V3:
https://v3.siliconflow.cn
此外,當地時間1月31日,OpenAI正式上線競品推理模型o3-mini,并首次向免費用戶開放推理模型。 OpenAI的CEO Altman 承認 DeepSeek 削弱了 OpenAI 在人工智能領域的領先地位,并表示他 認為 OpenAI 在開源技術方面站在了歷史的錯誤一邊。 盡管 OpenAI 過去曾開源過模型,但該公司通常傾向于采用專有的閉源開發方法。
DeepSeek,突發!
DeepSeek,繼續在全球刷屏!
2月1日,#DeepSeek在美商標被梁文鋒校友搶注#的話題沖上微博熱搜。據新華每日電訊援引TC報道,一家總部位于美國特拉華州的名稱為Delson Group的公司申請了DeepSeek商標。報道稱,Delson Group的首席執行官兼創始人名為Willie Lu,后者與DeepSeek創始人梁文鋒畢業于同一所大學——浙江大學。
另外,據華為云官方公眾號2月1日消息,DeepSeek-R1開源后引發全球用戶和開發者關注。經過硅基流動和華為云團隊連日攻堅,現在,雙方聯合首發并上線基于華為云昇騰云服務的DeepSeekR1/V3推理服務。
值得關注的是,最近幾天,DeepSeek的熱度居高不下。日前,英偉達、微軟、亞馬遜等AI巨頭紛紛宣布,已接入DeepSeek。此外,或許是迫于DeepSeek帶來的壓力,OpenAI緊急上線新一代推理模型o3-mini,并首次向ChatGPT免費用戶開放推理模型。
國泰君安指出,DeepSeek-R1以MIT License完全開源模型權重,并允許商用模型蒸餾,為開發者提供了二次創新的自由空間。這一策略推動中國首次在通用大模型開源領域占據技術制高點,增強全球AI 話語權。同時,開源生態可能加速行業技術路線趨同,通用大模型因同質化加劇競爭,只有擁有真正領先技術的企業才能在這種趨勢中留存。因此,此次國產開源模型的突破有望重塑全球AIGC技術路線及產業格局。
在美商標被梁文鋒校友搶注
據新華每日電訊援引TC報道稱,近日,中國人工智能公司 DeepSeek成為大規模網絡攻擊的目標。現在,該公司似乎又面臨新的麻煩:美國商標糾紛。另一家公司申請了DeepSeek商標:一家總部位于特拉華州的公司,名稱為Delson Group Inc.
Delson Group 聲稱,它自2020年初以來一直在銷售DeepSeek品牌的 AI 產品。其首席執行官兼創始人名為 Willie Lu。Willie Lu與 DeepSeek 創始人梁文鋒畢業于同一所大學——浙江大學。
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創新型科技公司,專注于開發先進的大語言模型(LLM)和相關技術。
DeepSeek在2024年12月26日推出V3(對標GPT4o),因其顯著的性能,用戶迅速開始增長,同時在1月20日發布R1(對標GPT-o1)后,進一步出圈。根據點點數據,從DeepSeek在美國下載排名從1月22日的201名,迅速在1月27日登頂第一名;根據七麥數據,截至1月30日,DeepSeek在168個國家位居下載榜第一名。
1月24日,著名投資公司A16z的創始人馬克·安德森發文稱,Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。最具煽動性的評價來自ScaleAI創始人亞歷山大·王(AlexandrWang)。他說:過去十年來,美國可能一直在AI競賽中領先于中國,但DeepSeek的AI大模型發布可能會“改變一切”。
AI巨頭紛紛接入DeepSeek
1月31日,英偉達(NVIDIA)宣布,NVIDIA NIM已經可以使用DeepSeek-R1。英偉達官網當天發布文章指出,DeepSeek-R1是具備最先進推理能力的開放模型,比起直接提供響應,像DeepSeek-R1這樣的推理模型,會對查詢進行多次推理處理,使用連鎖思維、共識和搜尋方法來生成最佳答案。
上述文章寫道,為了幫助開發者安全地試驗這些功能,并構建自己的專門代理,DeepSeek-R1模型現已作為NVIDIA NIM微服務預覽版上線使用。
報道稱,DeepSeek先前橫空出世重創美國科技股,一度影響英偉達股價重挫17%,引發討論。英偉達先前也發聲,指DeepSeek的進步,代表了英偉達芯片對于內地市場的可用性,而未來,DeepSeek會需要更多英偉達芯片滿足服務的需求。
另據參考消息援引臺灣東森新聞網報道,近日,與OpenAI是密切合作伙伴的微軟宣布,目前已將DeepSeek-R1正式納入Azure AI Foundry,成為該企業級AI服務平臺的一部分。
微軟作為OpenAI的最大股東,長期資助OpenAI之余,還深度整合其AI技術,因此將DeepSeek-R1正式納入的消息曝光后,外界十分關注微軟為何在OpenAI對DeepSeek進行調查的同時,仍決定將R1模型納入其AI服務。
微軟強調,DeepSeek-R1模型已通過“嚴格的紅隊測試與安全評估”,并經歷“模型行為自動化檢測與廣泛的安全審查,以降低潛在風險”。
微軟也在聲明中提到,后續微軟仍會持續評估DeepSeek-R1模型,并可能進行一定程度的調整與優化,以提升其準確度及審查機制。
1月31日,亞馬遜云科技也宣布,客戶現已可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。此外,客戶還可以通過Amazon EC2、Amazon SageMaker AI,使用Amazon Trainium和Amazon Inferentia部署DeepSeek-R1-Distill。
OpenAI首次向免費用戶開放推理模型
DeepSeek的爆火,使得全球在AI領域的競爭進一步白熱化。當地時間1月31日,OpenAI正式上線競品推理模型o3-mini,并首次向免費用戶開放推理模型。
OpenAI介紹稱,o3-mini支持開發者調整“AI推理努力程度”分為低、中、高三個級別。這種靈活性使得o3-mini可以在面對難題時“更努力思考”,而需要效率時優先考慮回應速度。
據OpenAI披露,在2024年美國數學邀請賽(AIME 2024)的測試中,低推理努力的o3-mini準確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準確率能夠提升到79.6%,與o1模型相當。在最高努力水平時,o3-mini的準確率則能進一步提升至87.3%。在博士級科學問題(GPQA Diamond)方面,三種努力程度模型的準確率分別為70.6%、76.8%和79.7%。開發者可根據場景需求,靈活選擇低、中、高三級推理強度,使模型在應對復雜挑戰時能“深度思考”,或在需要快速響應時優先保證速度。
ChatGPT Plus、Team及Pro用戶即日(1月31日)可體驗o3-mini,企業用戶將在一周后獲得訪問權限。即日(1月31日)起,免費版用戶也可通過消息編輯器選擇“推理”模式或重新生成回復來試用o3-mini,這是ChatGPT首次向免費用戶開放推理模型。
在OpenAI發布新模型o3-mini后,麻省理工知名AI研究科學家、著名科技播客主持人評價該模型稱,OpenAI的o3-mini是個不錯的模型,DeepSeek的R1性能和它差不多,但價格更便宜,且能展示推理過程。更好的模型會不斷出現(很期待o3 Pro 面世),但 “DeepSeek 時刻” 意義非凡。5年后人們仍會銘記這一偉大時刻,是科技史上的關鍵節點,部分原因是其地緣政治影響,當然還有諸多其他緣由。
機構:DeepSeek重構大模型生態
DeepSeek日前發布其最新開源模型DeepSeek-R1,用較低的成本達到了接近于OpenAI開發的GPT-o1的性能。這一進展破解了全球人工智能產業長期以來“堆算力”的路徑依賴,其影響還波及了資本市場。
從定價看,DeepSeek-R1不僅開源,API(接口)價格還明顯低于GPT-o1。DeepSeek-R1輸入(緩存命中)、輸出定價分別為每百萬tokens 1元、6元,低于GPT-o1的55元、438元,具備性價比優勢。
國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過顯著提高數據質量和改進模型架構,展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說,DeepSeek的模型現在低成本優勢突出,與國際知名大模型相比,其成本大約低了一個數量級。
國泰君安指出,DeepSeek-R1以開源、高性能及低成本API對標OpenAI o1。其蒸餾模型的優異表現將支持消費電子、智能駕駛等終端AI的部署,開源策略將重整通用模型競爭格局,大模型的商業化落地將在DeepSeek 的低價API支持下加速,未來垂類應用也有望加速創新迭代。該券商表示,R1在后訓練階段通過大規模強化學習技術,在極少標注數據下提升推理能力,驗證了算法優化的高效性。這一技術突破打破了海外企業在復雜任務上的技術壟斷,為中國大模型技術參與全球競爭提供了實證支撐。
長江證券也表示,國產模型推理能力對齊業界領先水平,看好推理算力與應用側受益。一方面,國產推理模型持續迭代,推理側的scaling up將帶來推理算力需求的顯著提升;另一方面,通過利用DeepSeek-R1整理的80萬個樣本進行微調,小型模型推理能力顯著提升,或加速垂類模型應用落地進程。
(來源:深圳夢綜合自華為云、券商中國 陳銘)
來源:深圳夢(微信號ID:SZeverything)
為偉大思想而生!
AI+時代,互聯網思想(wanging0123),
第一必讀自媒體
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.