題圖|視覺中國
DeepSeek-R1蔓延速度之快,讓偉大的前輩ChatGPT都成了“老爺車”。
DeepSeek-R1憑借其特有的"認知預判"架構,在2025年率先實現了生成質量與推理速度的平衡,成為有史以來增速最快的大模型。
而且單代AI技術整體的“領先有效期”越來越短,對企業形成愈加頻繁地強烈沖擊。
在這種形勢下,一方面企業要持續跟蹤最新的技術,另一方面同時還要保證自己AI應用落地的效果——這已經成為企業在AI上的巨大挑戰。
DeepSeek-R1強,讓企業更焦慮
DeepSeek-R1比較容易產生“幻覺”,恰恰是源于其關鍵創新:正式回答前的深度思考。
這個類似于人類在回答復雜問題前,會先在腦海中梳理思路,內容更有條理性和邏輯性。因其生成文字的能力足夠強,邏輯足夠強大,這些幻想出來的“假話”往往還非常難分辨。
要么讓它負責前期思考,提供解決問題的框架;要么在完成資料搜集后,利用它強大的語言能力進行內容整合輸出。最終結合部分其他大模型的成果,實現總體效果的最佳化。
對需要產生商業價值的企業級生成式AI應用來說,這完全不可接受。這就是生成式AI著名的“不可能三角”:準確、性能、成本。
這三方面的綜合要求,最終轉化為了AI應用搭建、知識儲備、模型訓練與部署等環節中的復雜挑戰。即使那些已完成數字化轉型的企業,也常在這些環節中偏離正軌,最終導致投入大量資金卻未能獲得預期效果。
“解藥”,藏在誰手里?
答案其實很明確,在云廠商手里。
今天凌晨,亞馬遜云科技宣布在Amazon Bedrock平臺上推出全托管、無服務器的DeepSeek-R1模型,是首個提供DeepSeek-R1作為全托管、正式商用模型的海外云廠商。所以,對于出海企業而言,DeepSeek on Bedrock是一個絕佳的選擇。
DeepSeek-R1作為Amazon Bedrock上首個完全托管的中國大模型,在今年1月底的部署版DeepSeek-R1上線之后就獲得了企業客戶的好評,數千用戶已經Amazon Bedrock的自定義模型導入功能進行了部署。
此次更新的完全托管版相比之前的部署版,能夠進一步使用Amazon Bedrock上所有功能,包括模型蒸餾、安全防護、數據加密、模型評估以及開箱即用的工具。
亞馬遜云科技這一次的更新,從事實上證明了云計算廠商在AI大模型時代依舊具有明確的競爭優勢:
1、更準確——云端大模型商店,匯聚全球最領先的AI大模型,供企業快速調用;企業數據全面防護,驅動大模型訓練和運轉; 2、更強性能——云原生架構方便多種模型和海量Agent協作;大規模GPU計算基礎設施,隨時調用; 3、更低成本——減少企業自身使用大模型、蒸餾小模型的工作量;靈活調用的計算資源,可以從根本上減少計算花費。
絕大多數企業無法擁有機器學習專家、數據科學家和語言模型專家,人才成本、人才累積都無法承受。
云計算廠商,則可以在人才和基礎設施方面進行更積極的投入,更好、更快地挖掘技術潛力。同時還能積極推進與全球多家最領先AI創業公司合作。生態化的合作方式,讓眾多客戶企業能夠享受到全球最領先的AI人才、AI創業公司的技術成果。
亞馬遜云科技通過與Anthropic、DeepSeek、Cohere等頭部AI創業公司深度合作,讓Amazon Bedrock上可選基礎大模型來到180多款,其中50款可以云原生部署,比如Claude3.7 Sonnet、DeepSeek-R1、Llama 3.3、Nova系列模型、Mistral Large等。
相比大模型的“有無問題”,云計算廠商還是有更進幾步的思考:
一、多模型的選擇和部署
根據國際知名咨詢機構Gartner的最新預測:因為單一模型無法同時滿足企業的所有功能性和非功能性要求,所以到2027年,中國80%的企業將使用多模型生成式人工智能策略來實現多樣化的模型功能,來獲得成本效益。
但想要完成復雜的多模型部署與應用協調并非易事,在打造專用模型的過程中,企業還很可能因為自身并沒有足夠龐大且高質量的數據集來訓練和優化,導致效果不佳。最終出現落地進程比不過技術快速迭代的速度,導致“技術落地即過時。”
Amazon Bedrock的多種大模型的同平臺、同Marketplace搭載,就為企業多模型組合使用創造了便利。企業完全可以根據自己的需求特點,實現云上多模型策略:根據自己的具體場景需求,把多個大模型,按照“高級的高性能安全模型、中級的平衡型模型、Good-Enough便宜大碗好用模型”雇傭一組不同學歷和資歷的AI員工,兼顧場景、性能、準確和成本。
例如亞馬遜云科技自己的Nova模型,就是典型的“便宜大碗安全好用型”,本身就涵蓋了多個版本,在各類基準測試中表現持平來自于Google的Gemini 1.5 Flash,同時比后者還有更快的輸出速度和性價比,適用于企業客服、內容生成、簡單數據分析、企業內部自動化等場景。就非常適合當做“Good-Enough”模型,企業可以拿它與Claude 3.7 Sonnect、DeepSeek-R1這樣的強模型組合,形成高低搭配。
二、能落地、上生產,才是好模型
企業客戶需要趁手的開發平臺、工具、功能,實現真正的從技術落地到上生產的老大難問題。
Amazon SageMaker AI,讓用戶可以在集成式開發環境高效地構建、訓練和部署機器學習模型。Amazon Bedrock自帶防護機制中的“自動推理檢查”功能,則可以從根源上盡可能消除大模型運行過程中的“幻覺”問題。
云計算結合大模型的解決方案,正在全面推動云計算再次成為企業IT基礎設施的最佳選擇。
在知名咨詢機構PWC的一份關于領先企業在云計算和AI領域的投入調研中,有92%的行業領先企業都正在計劃增加自己的云預算,其中63%更是將云預算的增長提升了6%以上(遠高于通貨膨脹率)。
越來越多的企業正在通過AI驅動的云架構加速數據現代化,將IT能力與AI緊密結合,從而在行業中獲得領先地位。
亞馬遜云科技,企業AI時代的“僚機”
亞馬遜云科技CEO Matt Garman在一次采訪中明確指出AI時代云計算廠商的核心任務——持續走在企業前列,幫助客戶捕捉關鍵選擇。
他以兩個例子來說明這一觀點:第一,為用戶提供最先進的技術和產品,例如推理能力更強的DeepSeek-R1大模型;第二,打造有競爭力的AI計算基礎,例如亞馬遜云科技專門為人工智能訓練和推理設計的Tranium2人工智能芯片。
Garman特別強調,云計算廠商并非像其他公司一樣急于推出聊天機器人,而是基于客戶需求,打造一個聚合平臺,提供多種大模型和各環節工具,幫助客戶將新技術真正應用于業務,讓AI成為企業的關鍵競爭優勢。
亞馬遜云科技的實踐與傳統云計算時代并無本質不同——始終走在技術探索的前沿,在掌握新技術后,將成果反饋給客戶。
為了確保領先,亞馬遜還在不斷增加投入。根據第三方研究機構的統計,亞馬遜繼續在基礎設施的支出上領銜全球云廠商,2024年AI基礎設施投資更是推動了資本支出的大幅增加。亞馬遜CEO Andy Jassy在此前的第四季度財報會上專門指出:亞馬遜第四季度263億美元資本支出的"絕大部分"用于亞馬遜云科技的AI投資。
"開放的多贏邏輯"、"保持技術實力的絕對優勢"、"只盯著客戶的需求"——這是亞馬遜云科技在生成式AI時代走向新高度背后的邏輯。
本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系 hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4062550.html
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.