2025年3月29日,英特爾在北京舉辦了“英特爾酷睿Ultra 200HX新品分享會”,展示了來自10家OEM的20款搭載了最新的酷睿Ultra 200HX處理器的高性能游戲本,而在本次分享會之前,英特爾還與一眾媒體分享了他們在AI領域的最新進展,特別是在大模型部署和AI PC應用方面的突破性成就。
本次會議圍繞英特爾的AI PC戰略,全面展示了在大模型部署、框架優化及應用生態建設上的最新進展。會上,英特爾中國區AI PC產品總監孫峪系統闡述了DeepSeek大模型的突破性技術及其在本地化部署中的實踐,并聯合神州數碼、愛奇藝、亦心科技等合作伙伴,展示了多款基于AI PC的創新應用。此次會議不僅凸顯了英特爾在AI算力硬件領域的持續領先,更通過軟硬協同的生態策略,為開發者、企業和個人用戶構建了從框架支持到場景落地的完整解決方案。
DeepSeek大模型部署:私有化需求驅動全棧解決方案
DeepSeek可以說是今年最火熱的大模型,它作為一款完全開源的MIT模型,DeepSeek通過MOE(混合專家)和COT(思維鏈)技術,實現了參數規模與推理效率的平衡。而隨著大模型技術從云端向端側延伸,私有化部署成為政企客戶的核心訴求。而DeepSeek通過蒸餾技術推出了14B、32B等不同尺寸的模型版本,降低了部署門檻。
現在的私有化部署有三種不同使用場景:
滿血版部署:采用BF16或FP8高精度數據格式,最大化模型性能,適用于對結果準確性要求嚴苛的場景;
蒸餾模型適配:通過DeepSeek對LLaMA、Qwen等模型的蒸餾,提供輕量化版本,降低硬件成本;
定制化開發:結合企業數據,通過“老師-學生”模式訓練專屬模型,實現場景化能力強化。
在私有化部署過程中,需考慮的因素包括但不限于數據精度的選擇、硬件配置以及服務級別協議(SLA)的要求,如首字響應時間和平均每秒生成的token數量。為了更好地適應這些復雜需求,英特爾推出了多種一體機解決方案,它們具有開箱即用、支持私有化部署彈性以及能夠與本地企業應用深度結合的優勢。
而英特爾本身擁有擁有非常完善的CPU與GPU產品線,所以這個一體機也可以是多種多樣的,可以是至強W處理器+多張英特爾銳炫獨立顯卡的工作站,或者是使用酷睿處理器搭配單張銳炫顯卡的整機,也可以是搭載酷睿Ultra處理器的輕薄本。
英特爾現場展示了基于酷睿Ultra處理器的輕薄本運行DeepSeek蒸餾模型,14B模型可在普通輕薄本上流暢運行代碼生成任務,而搭載了64GB內存的筆記本更是可以運行32B的模型,通過投機解碼技術,模型生成速度提升顯著,實現每秒14個token的高效生成能力。
多樣化的大模型框架解決方案
除了專注于大模型本身,英特爾還在多個大模型框架上提供了豐富的解決方案。例如,針對個人開發者和ISV,英特爾推出了IPEX-LLM整合包,旨在解決開發者在端側部署時的硬件兼容性問題,該工具不僅兼容Ollama框架,還支持LLM Studio、Open WebUI等主流框架。使得用戶能夠在端側充分利用英特爾AI PC本地算力。
IPEX-LLM的整合包僅200MB,可在GitHub和魔搭社區一鍵下載,且做了本地化優化,它是通過魔搭社區獲取模型的,避免了網絡依賴問題。
神州數碼與英特爾合作開發的愛問學端側AI PC應用開發框架,則致力于解決底層硬件迭代更新、大模型獲取便捷性以及應用瘦身等問題,為開發者提供更加流暢的開發體驗。
該框架整合Ollama、Hugging Face、Model Scope三大模型生態,提供統一API接口,降低ISV的開發門檻,該框架自動適配英特爾CPU與GPU算力,開發者無需關注底層迭代;并內置模型市場支持動態更新,縮短開發周期;還通過端側小模型與云端協同,實現安裝包“瘦身”。
五大場景重塑用戶體驗
英特爾與合作伙伴展示了多款端側AI應用,覆蓋知識管理、辦公協作、影音娛樂、創意設計等場景,凸顯AIPC的實用價值。
扣子AIPC會議助手:端云協同提效辦公
基于扣子平臺開發的會議助手,集成本地語音轉寫、云端摘要生成與圖片向量化功能。演示中,系統實時轉錄會議內容,并通過指令“截圖入庫”自動保存關鍵信息,會后一鍵生成結構化紀要,解決多任務處理痛點。
愛問學“隨身百科”:RAG助力知識管理
神州數碼演示了愛問學軟件的文檔解析能力。用戶上傳《云南野生食用菌規范》后,14B模型從文本中提取信息,生成旅行推薦,并結合搜索引擎獲取最新資訊,實現“本地知識庫+實時數據”的融合應用。
面壁智能多模態分析:視頻摘要再升級
面壁智能的8B視覺大模型可離線解析視頻內容。現場導入的大熊貓互動視頻中,模型準確識別動作并生成摘要,任務管理器顯示其完全運行于集成顯卡,驗證端側算力的可靠性。
愛奇藝智能助手:個性化影音伴侶
愛奇藝應用通過大模型分析用戶偏好,實現“精準推薦+劇情互動”。例如,詢問“年代劇推薦”后,助手結合云端片庫與端側GPU算力,推送匹配內容,并支持實時問答,增強觀影沉浸感。
亦心科技AI閃繪:端側AIGC顛覆創作
亦心科技總經理韋祖興展示了搭載于Yoga設備的“AI閃繪”功能。用戶通過手寫筆輸入草圖,端側模型實時渲染成精細圖像,且生成速度媲美云端。韋祖興表示:“本地化不僅消除網絡延遲,還支持離線創作,釋放藝術自由度。”
結語
在會議的最后,孫峪總結了英特爾在AIPC上的三大優勢。第一,英特爾不斷地提升他們的AIPC產品的算力,擴大整體產品家族。第二,對于業績廣泛的框架,包含了OpenVINO、微軟框架、Ollama等等框架都有非常好的支持,確保軟件層面給個人開發者、ISV有更多選擇。第三,英特爾全球和中國團隊都在推動AIPC的ISV工作,并舉辦英特爾人工智能大賽,鼓勵開發者創新。
英特爾通過此次技術交流會,全面展現了其在大模型部署、框架支持及AI PC應用領域的領先地位和技術實力。通過提供完整的解決方案和與合作伙伴的緊密合作,英特爾能夠滿足市場對高性能AI計算的需求,推動AI技術的創新和應用。未來,英特爾將繼續致力于推動AI技術的發展和普及,為各行各業帶來更多的價值和創新。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.