貝克街探案官
作者:魯鎮西
算力,早已成為21世紀新基建
在2023世界人工智能大會上,華為發布了自研的“盤古大模型3.0”。在華為人眼中,大模型要真正發揮價值,就要走入千行百業。
華為云CEO張平安公開表示華為盤古大模型不作詩,只做事,針對不同用戶的應用場景,華為準備了100億、380億、710億、1000億等不同規模的大模型,并提供全套開發套件,幫助客戶二次訓練私有數據且保證其純私域運行。
秉持著“AI for Industries”(工業領域人工智能/工業互聯網)理念,華為云打造了金融、政務、制造、礦山、氣象、鐵路等領域行業大模型和能力集,涉及項目超過1000個,除了學習大量通用知識外,盤古還深耕金融、政務、氣象、醫療、健康、互聯網、教育、汽車、零售等行業,每個行業數據量超過500億tokens,確保不同行業的客戶即來即用。
01 盤古如何改變世界?
工業互聯網產業鏈可分為設備層、網絡層、平臺層、軟件層、應用層和安全體系等六大部分。
從產業鏈劃分,設備層、網絡層屬產業鏈上游,應用層屬產業鏈下游,其余部分就是華為盤古大模型所處的產業鏈中游。
聚焦盤古大模型,華為首先用一站式AI開發平臺ModelArts建立了L0基礎通用模型,包括CV大模型、NLP大模型、科學計算大模型等,其中CV大模型可應用于工業質檢、物流倉庫監控、時尚輔助設計等領域,NLP大模型可應用于智能文檔搜索、智能ERP、小語種大模型等領域,科學計算大模型可應用于氣象預報、海浪預測等領域。
其次是建立L1級模型,將基礎模型與行業數據結合進行混合訓練后的行業的模型,已經發布礦山、氣象、藥物、分子、電力、海浪、金融等行業的大模型,在L1基礎上,L2級把L1再具體下游業務場景進行部署后生成的部署模型,如OCR模型、電力巡檢模型。
基于“預訓練+下游微調”的工業化AI開發模式,盤古大模型擁有泛化能力強、小樣本學習和模型高精度三大特性,因此高度適配各類復雜的工業應用場景,解決了AI無法規模化、產業化的難題,能夠通過小樣本學習掌握行業細化知識,且實現精度較高。
按照華為的規劃,L0基礎通用模型會由科研機構主導,L1行業大模型由科研機構+行業伙伴主導,L2場景模型,由科研機構和行業場景化專家主導。
在此基礎上,華為將模型的發展由小作坊模式過渡到工業化模式,強化了模型網絡架構和泛化能力。在盤古三大基礎模型架構上,依次推出了盤古多模態、圖網絡、藥物分子、礦山、氣象、海浪、金融OCR等大模型,并實現落地應用。
僅以氣象領域為例,盤古于今年2月份提前兩天預測到發生在芬蘭的寒潮,歐洲自己的氣象系統只是在寒潮當天“準時預報”,且預測低溫為零下15攝氏度,盤古預計的低溫是零下22攝氏度,更接近實際低溫零下29攝氏度。
此后,歐洲氣象局將盤古列為重要參考對象,國際科技期刊nature也正式刊發了關于盤古氣象預測的文章——《三維神經網絡用于精準中期全球天氣預報》(《Accurate medium-range global weather forecasting with 3D neural networks》)。
公開數據顯示,這是近年來中國科技公司首篇作為唯一署名單位發表的《自然》正刊論文。
鑒于盤古目前展現出來的極強的TO B特性,盤古或許可以聚合工業互聯網不同細分領域的優勢企業,成為龐大生態伙伴體系,加速訓練垂直行業模型,幫助工業企業更快地構建符合具體場景的小模型或收編高度定制化的小模型,以滿足各個生產環節對AI的需求,快速生成高質量生產數據,指導機器人或產線完成各種復雜的任務,實現更高水平的人機協作。
伴隨圍繞盤古的生態體系不斷完善,盤古或許會成為數字化企業和智能工廠的指揮部,成為廣泛應用的“工業GPT”。
02 算力支撐盤古騰飛
眾所周知,大模型的穩定運行離不開算力的支撐,對比OpenAI等可以使用成熟GPU、軟件,華為只能自己從零開始搭建模型運行環境,成功發布以鯤鵬、昇騰為基礎的算力底座,并通過通過不斷創新,持續提升的計算效率。
2019年,華為推出了昇騰AI集群,發揮云、計算、存儲、網絡、能源的綜合優勢,相當于把AI數據中心當成一臺超級計算機來設計,使得昇騰AI集群性能更高,并且更可靠,時至今日,基于此訓練的盤古大模型,效能不僅不落后,而且還領先于現在業界主流GPU的1.1倍。
同時華為還將昇騰外租,目前已經在貴安、蕪湖、烏蘭察布設立三大AI算力中心當前在華為云烏蘭察布和貴安數據中心,已經上線單集群2000P Flops昇騰AI云服務,為行業大模型訓練提供穩定、綠色的澎湃算力,讓大模型觸手可及,實測發現通過集群的方式,在同等算力的情況下可以得到10%以上的效率提升。
這主要得益于華為發布的AI處理器,其中昇騰310AI處理器典型配置下可以輸出16TOPS@INT8和8TOPS@FP16,功耗8W;910AI處理器實現了業界較佳的AI性能與能效,可輸出640TOPS@INT8和320TFLOPS@FP16,功耗310W。
這兩款芯片均基于自研的華為達芬奇架構3DCube技術,為盤古大模型提供了充足的算力支持。
有了優質芯片的加持,按照華為的規劃,華為在國內建設的規模最大的AI計算集群在深圳鵬城云腦II期,目前算力是1000P的規模,按照規劃,到2024年三期的時候,規模會達到16000P的水平。
在計算節點層面,華為推出的對等平構架構,突破傳統的以CPU為中心的異構計算帶來的性能瓶頸,從而提升整個計算的帶寬、降低時延,使得節點性能得到30%的提升。
值得注意的是,昇騰云的穩定性比使用GPU的云服務商更好,在大模型訓練過程中,經常會遇到GPU故障,不得不重啟訓練,時間長代價大。昇騰云服務可以提供更長穩的AI算力服務,千卡訓練30天長穩率達到90%,斷點恢復時長不超過10分鐘。
為了進一步提升大模型開發效率,華為云提供全流程的大模型開發套件,包括數據工程平臺,讓數據標注效率提升3倍;模型開發套件,讓開發者可以一天內完成典型模型微調任務;以及應用開發套件,開發者可以基于靈活的SDK快速開展大模型應用開發。參照GPT-3完成一個千億行業模型的端到端開發,從過去需要5個月縮短到現在1個月,整體速度提升5倍。
更快的訓練速度,可以幫助盤古用戶降低投入成本,從而吸引更多企業前來合作,華為云匯聚了“華為企業IT管理應用”與“華為終端云互聯網移動應用”兩大類應用開發實踐,面向華為云內外部開發者,打造一站式、集成式和開放式的云原生應用平臺AppArts,實現云原生應用高效開發,極簡運維、精準運營,促進更多應用在華為云上開發、運維、運營,形成華為云的應用生態。
03 5G網絡為云而生
充足高效的算力支撐,只是云服務商的基礎,想要為客戶提供“即時”“低延遲”的服務,還需要有穩定高效的網絡系統。
目前市場上存在三大類主流的工業網絡通信協議——現場總線、工業以太網、無線,其各自又包含不同的細分協議,適用于不同廠商、不同細分應用場景,過于碎片化的標準導致工業互聯網生態較為封閉;同時現有協議以發達國家為主導,我國有望在無線領域彎道超車。
根據HMS數據,全球工業網絡新安裝節點2022年相比2021年同比增長8%,其中工業以太網同比增長10%,現場總線同比增長4%,無線同比增長8%;市場份額方面,2016-2022年,工業以太網份額由38%提升至66%,現場總線由58%下降至27%。
現行技術條件下,5G與TSN(時間敏感網絡)融合,打破封閉生態,有望引領下一代網絡升級方向。TSN,即在非確定性的以太網中實現確定性的最小時間延時的協議族,可以滿足工業4.0的確定性時延及協議統一的訴求,將TSN技術原理與5G網絡的傳輸過程進行融合,可以更為有效地保證5G網絡的端到端高可靠低時延傳輸要求,創造一個脫離有線束縛、滿足端到端確定性時延、具備開放生態的工業網絡新時代。
作為全球重要通信設備廠,華為4月4日參與中國電信在武漢召開中國電信5G全連接工廠應用發布會,發布多項5G技術在工業領域的深度應用創新成果,提升以5G全連接工廠等項目為標桿的示范引領性,助力規上工業企業數字化改造“全覆蓋”。
同時聯合中國移動基于5G-Advanced技術,在現場實現了包括超大規模天線陣列、8流MIMO、增強型UPF動態多核聚合、智能卸載等多項性能的驗證,并測得了超過10Gbps的單用戶峰值速率,相比5G突破10倍能力提升,論證了5G-Advanced實現下行萬兆速率從核心網、基站到終端的關鍵技術要求,為端到端產業成熟奠定基礎。
設備采購方面,華為中標中國移動2022 年至 2023 年全閃存存儲和光纖交換機集中采購項目;中標江蘇省FTTR 全光組網設備(第一批)項目;入圍廣電IP骨干網(一期)工程國干網四份相關設備集采項目的候選人。
至此,作為國內受限最多科技公司,不僅沒有自怨自艾,反而不斷突破封鎖,并為國內其他企業保留了一條退路,畢竟按照海外廠商的套路,當國內大模型企業發展到一定規模以至于可以挑戰OpenAI的行業地位,勢必會再次承受制裁,比如全面禁止AI芯片出口,若真有此日,華為的昇騰云服務就可以直接替代,不僅可以實現算力替代,還能保證5G通信安全,因此無論盤古發展多么迅速,規模多么龐大,都不會再重蹈當年手機業務的覆轍,可以盡情嘗試無限可能,甚至可以試圖超越OpenAI。
? THE END
本文僅作為分享學習使用,不構成任何投資建議。
本文由貝克街探案官原創,未經許可,請勿轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.