2月24日,DeepSeek啟動“開源周”,開源了首個代碼庫FlashMLA。
DeepSeek稱,這是DeepSeek針對Hopper GPU優化的高效MLA解碼內核,專為處理可變長度序列而設計,現在已經投入生產使用?!霸贖800上能實現3000GB/s的內存帶寬以及580TFLOPS的計算性能。”DeepSeek表示。
據介紹,MLA(Multi-Layer Attention,多層注意力機制)是一種改進的注意力機制,旨在提高Transformer模型在處理長序列時的效率和性能?。MLA通過多個頭(head)的并行計算,讓模型能夠同時關注文本中不同位置和不同語義層面的信息,從而更全面、更深入地捕捉長距離依賴關系和復雜語義結構?。
此前2月21日午間,DeepSeek在社交平臺宣布,將連續開源5個項目的代碼庫,以完全透明的方式與全球開發者社區分享他們的研究進展,這一計劃定義為“Open Source Week(開源周)”。DeepSeek表示,其在線服務中的構建模塊已經被記錄、部署并進行了實際測試,希望分享的每一行代碼能加速行業發展進程。就在DeepSeek加碼開源的同時,包括上海交通大學、深圳大學、浙江大學在內的多所高校本月都宣布開設DeepSeek課程。
市場空間超5200億元
DeepSeek一體機火了!
民生證券計算機團隊23日撰文指出,DeepSeek開源給予了云廠商低門檻部署世界級AI大模型機遇,而客戶對于數據合規與部署便捷性需求,催生出DeepSeek一體機的藍海市場。
已有超30家企業推出一體機
據民生證券計算團隊梳理,天璣科技、深信服、??低?、大華股份、浪潮信息、中國長城等30多家企業均推出了大模型一體機,其中以“DeepSeek”命名的約有近20家。
云從科技在接受南財快訊記者以投資者身份采訪時表示,政務方面的一體機存在本地化部署的需求,但是客戶訂單信息無法透露。談及賬期是否較長時,該人員稱,得看具體的約定,這與簽訂的合同有關。
為何要選擇部署一體機
DeepSeek作為第一梯隊的免費開源模型,上線后訪問量激增,成為目前最快突破3000萬日活躍用戶量的應用程序。需求井噴也造成了DeepSeek始終處于滿負荷算力運行狀態,官網API供應不穩定,用戶使用過程中經常出現服務器繁忙導致無法回復用戶問題的狀況。第三方云服務廠商紛紛上線DeepSeek開源模型。但許多政企用戶出于保護內部數據的考慮,往往不愿意使用公有云服務,私有化部署需求應運而生。
浙商證券指出,一體機“開箱即用”,是便捷、低門檻的私有化部署方案。還能夠降低算力使用門檻,對于對數據安全要求較高的央國企、黨政機關,一體機可以為其提供可靠省心的解決方案。
據了解,一體機是專為人工智能大模型應用和部署而設計的集成計算設備,本質上可以看作是AI服務器與大模型私有化部署的融合,通常包含中央處理器(CPU)、圖形處理器(GPU)、存儲器、操作系統、AI平臺軟件及各類模型算法等軟硬組件。
根據浙商證券測算,預期DeepSeek快速部署需求有望帶動一體機需求增長,2025年到2027年一體機需求量將分別將達到15、39、72萬臺,對應市場空間1236、2937、5208億元。
DeepSeek相關概念發生異動
2月24日,DeepSeek一體機概念發生異動,云從科技-UW盤中一度漲停,軟通動力、科大訊飛、拓維信息等多股盤中走高,截至收盤均有回調。
(聲明:文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。)
來 源:21財經客戶端、南財快訊(記者:尹華祿)、上海證券報、證券時報、每日經濟新聞
為偉大思想而生!
AI+時代,互聯網思想(wanging0123),
第一必讀自媒體
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.