作者 | 曾響鈴
文 | 響鈴說
今天,在DeepSeek掀起的AI熱潮中,人人都在為強大且智能的AI體驗而興奮、狂熱。企業側也掀起了一場接入熱潮,紛紛開展DeepSeek的應用探索。
然而,可能大多數人都忽略了——盡管DeepSeek的高性價比和開源免費,已經大大降低了AI的使用門檻,也減輕了企業組織的成本負擔。但這條應用之路走起來其實并沒有那么輕快。
當DeepSeek深度應用到企業的核心生產系統以及組織內部的方方面面,大量的問題將會爆發出來:是否一個DeepSeek就足夠了?未來是否會出現更強大的模型?屆時如何替換或整合?現有的數據如何投喂給DeepSeek,甚至是下一個更強的模型?等等。
這些問題困擾著CTO們,特別是企業組織已經開始接入DeepSeek之后,他們更焦慮了。
從實驗室到生產車間,企業AI應用共同的“痛”
目前,政務、金融、電力、煤礦、制造等多個行業的多家頭部企業已公開宣稱引入DeepSeek開展智能化應用。據統計,目前98家央企中已有超過40家開展DeepSeek應用。
翻看具體的應用場景,大多數都還集中在客服、辦公、研發等通用場景,有部分頭部企業開始拓展到核心場景。如何讓DeepSeek全面地賦能企業生產全流程,讓大模型真正“上崗”是大家接下來最關心的問題。
一、百模千態:多模型協同是必然,未來也會出現更創新的模型。
人類世界是一個復雜多元的世界,場景和問題也是復雜多變的,單一的模型無法滿足所有場景的需求。例如,典型的制造企業,既有銷服環節的智能問答、知識庫場景,又有生產環節的工廠的入侵、異常事件準確預警和生產工藝進行優化場景,這些都需要自然語言模型、機器視覺模型和預測模型才能完成。DeepSeek 在自然語言、科學計算等方面表現出色,但它不是萬能的,更無法覆蓋AI 應用的全部領域。
大部分政企在接入DeepSeek的同時,之前已部署使用的模型也會依然并行使用,尤其是目前工業領域應用比較多的機器視覺、預測等依然會發揮重要作用。從長遠來看,模型技術的迭代更新會越來越快,這意味著未來一定會有新的模型或訓練范式出現。
因此,多模型并存、協同發展是 AI 產業滿足多樣化需求的必然選擇,不會因某一特定模型的出現而被替代。
二、算力激增:算力需求不減反增,技術的演進需要強大的基礎設施。
AI 技術的發展,尤其是深度學習模型的不斷演進,對算力的需求呈指數級增長。從早期簡單的神經網絡到如今復雜的大規模預訓練模型,每一次技術突破都依賴于強大的算力支持。
盡管DeepSeek通過算法優化將訓練成本降低90%,但是也降低了算力門檻,刺激了更多行業擁抱AI。基于長期發展來看,不論是AI應用普及還是模型迭代更新都離不開算力的持續提升。
因此,算力需求的增長趨勢不可阻擋,這是推動 AI 產業發展的重要物質基礎,不會因個別技術或產品的出現而改變。
三、應用為王:深入行業場景,以系統化思維。
每個行業都有其獨特的知識體系和運作邏輯,AI 只有持續深入其中,不斷優化和定制,才能真正發揮其巨大潛力。因此,在政企AI應用落地中,需要將通用模型和行業知識深度融合共同發揮作用,才能最大化發揮AI技術的價值。例如,在金融領域,AI技術的領先固然重要,但還需要結合分析客戶的交易數據、信用記錄、社交網絡等多源數據,構建風險評估模型,才能精準判斷客戶的信用風險,決定是否批準貸款以及貸款額度、利率等,而這些都是目前的通用模型所做不到的。
在這個過程中,需要一套科學的方法論,是一個系統工程。DeepSeek 為企業提供了一種新的大模型選擇,但落地過程中的關鍵步驟和原則不會改變。包括從需求的精準梳理、數據的高效準備、模型的選型與定制,到部署、運維以及與企業現有業務流程和系統的融合等多個環節。
首先,企業要明確自身業務目標,確定哪些業務環節可以借助大模型實現優化或創新。其次,在模型部署時,要考慮企業的 IT 基礎設施、數據安全和隱私保護要求,選擇合適的部署方式,如私有云、混合云或邊緣部署。再者,需要高質量的行業數據,對大模型進行增訓、微調,以匹配企業的實際場景。模型投入使用后,需要持續監測其性能,根據業務變化和用戶反饋進行及時調整和優化。這一整套方法論是確保大模型在企業中發揮價值、實現可持續發展的保障,不會因新模型的出現而被顛覆。
綜合來說,政企AI應用的難點和基本面并未改變,這也就決定了政企AI應用方向,牢牢把握基本盤,結合自身發展訴求和行業特性積極布局,實現穩健且可持續發展。
打通最后一公里:可持續演進的平臺是核心
事實上,大模型的熱點一直在變。從ChatGPT到DeepSeek,中間只是2年的時間,市場的C位就已經完成替換。在技術的發展路徑中,變化是必然的,不確定性也是必然的。而對于大型政企而言,構建一個具備可持續演進能力的AI架構,作為應對未來變化的一大基本盤,是企業在 AI 領域實現穩健且可持續發展的必要條件。
一、穩定的AI開發平臺。AI平臺是下層的軟硬件基礎設施和上層的大模型之間聯接的橋梁,其技術架構要收斂,要簡單,要統一。AI平臺向下需要結合云平臺封裝底層軟硬件的復雜性,通過彈性資源調度解決算力效率,做好算力、模型和各類資源的調度和運營;向上需要支持來源多樣的模型的快速適配,并且提供一系列工具鏈支持模型、數據、應用的一站式開發和部署,通過微調、評測、壓縮、部署端到端標準化,讓模型上線更快。
此外,AI平臺還需要根據企業在不同時期和場景的需要,靈活選擇公有云、私有云或是兩者結合的多種部署模式。同時,對于有邊緣業務需求的場景,需要提前規劃云邊協同的架構。
混合云是更為匹配的一種方案。以華為云提供的混合云方案華為云Stack為例,針對政企客戶在不同階段的不同AI需求,可以提供昇騰云服務、全棧混合云、邊緣輕量化等多種部署模式供政企客戶靈活選擇。在探索應用初期,政企客戶可以一鍵式使用華為云昇騰云服務快速開展應用試點嘗鮮。等到了深入應用階段,政企客戶還可以有選擇地將昇騰云上訓練好的模型推送到本地中心云,基于華為云Stack提供的全棧云服務,結合客戶本地私有數據進行模型的微調和增訓,從而訓練出更匹配自身業務訴求的專精模型。
如此一來,政企客戶完全不需要遷移平臺或是重構架構,就能順暢地完成不同階段的AI應用部署與嘗試,高效實現企業的數智化轉型升級。
二、標準化的落地范式。架構可演進還來自其對AI落地范式的理解與落實,往往一個平臺越是具備標準化的落地范式越能有條不紊地解決好政企AI應用落地的各種問題,而這往往需要一系列的開發工具來支撐實現。
例如針對數據開發,一套強大的數據開發工具,具備高效數據采集、清洗、預處理功能,能夠有效地提高數據質量。基于這些高質量數據,才能對DeepSeek模型進行增訓和微調,適應企業場景。
在模型開發環節,通過一系列先進的工具來支持模型的設計、訓練和優化。包括模型的增訓、微調、邊緣部署,并開展量化壓縮和模型評估,幫助開發者了解模型的優缺點,進而進行針對性的優化。
還有應用開發環節,高效好用的應用開發框架可以幫助用戶快速將訓練好的模型集成到各種應用系統中,包括Prompt模板、預制插件、RAG等,實現分鐘級AI應用創建。同時,可視化的界面設計功能,能夠降低開發門檻,提高開發效率,使得非專業的開發人員也能夠快速搭建出功能完善的 AI 應用。
三、人才和經驗的積累。架構的可演進除了技術能力外,還離不開其在人才和經驗方面的沉淀。這是一種看似抽象,但實際依然有跡可循的能力。隨著政企AI應用進程加速,這些能力正轉化成為平臺的不可替代的財富。
通過建立完善的經驗沉淀機制,將這些經驗進行整理、歸納和分享。例如,通過建立內部知識庫,定期組織經驗分享會和技術交流活動,對企業內部的經驗知識進行結構化管理,可以使得企業在面對新的大模型目時,能夠快速借鑒以往的成功經驗,少走彎路。
同時制定全面的 AI 人才培養計劃,吸引和培養一批高素質的 AI 專業人才。明確 AI 人才的招聘標準、培養計劃、成長通道等,同時,企業要營造良好的創新氛圍,鼓勵員工勇于嘗試新技術、新方法,為員工提供實踐和創新的平臺,激發員工的創造力和潛力,打造一支具有強大競爭力的 AI 人才隊伍。
結語
今天,DeepSeek引發的AI熱潮,正在重新定義政企組織面向AI領域的機會與挑戰。面對不斷增長的算力需求和復雜多變的業務場景,企業不僅需要緊跟時代步伐,積極擁抱新模型、新技術,更要立足長遠,從自身的實際情況和發展訴求出發,精心挑選正確的AI架構與演進路徑。
這不僅僅是一次技術選型的過程,更是對企業戰略眼光和執行能力的考驗。只有選對一個穩定、可靠且具備靈活演進能力的AI平臺,才能確保政企AI在大規模部署、應用開發、數據工程以及模型增訓、微調等關鍵環節上取得成功,并以長期穩定的姿態應對持續變化的未來。
*本文圖片均來源于網絡
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.