前幾天看到一個有趣的比喻——
有人將ChatGPT比作iPhone,它的出現,帶來了一種全新的概念(大模型/智能手機)。而DeepSeek,則被比作是國產安卓手機,它的作用,是讓這個概念真正走進了千家萬戶。
我個人認為,這個比喻是非常貼切的。今年以來,DeepSeek的橫空出世,掀起了一股席卷全球的AI浪潮。它憑借混合專家(MoE)架構、多頭潛在注意力(MLA)機制、低精度訓練(FP8)策略等技術創新,不僅提升了模型的性能,還大幅降低了訓練和推理成本,對AI的發展產生了深遠影響。
簡單來說,就是DeepSeek讓更多的人都能用得起大模型了。隨著DeepSeek的火爆出圈,AI落地全面提速,端側AI更是進入了爆炸式增長的階段。
█端側AI,為什么會爆發?
對AI稍有了解的讀者都知道,大模型的構建和使用,包括了訓練和推理兩個過程。訓練,是通過“投喂”數據,找到更佳的模型參數,讓大模型變成可用的狀態。推理,則是將大模型投入應用,針對新數據進行預測。
訓練與推理
大模型發展的早期階段,訓練和推理都是在云端完成的。端側AI,則是指將大模型直接部署在終端設備(例如智能手機、售貨機、POS機、汽車等)上,在端側進行推理,以此提供更好的實時響應能力和數據安全性。
端側AI相比云端AI,主要區別在于算力相對較弱,以及對功耗和成本非常敏感。DeepSeek引領的大模型“平民化”熱潮,恰逢其時地解決了這個問題,為端側AI的發展掃清了障礙。
DeepSeek通過蒸餾技術和算法優化,顯著降低了大模型的存儲需求與計算量。通過技術開源和硬件適配,端側設備的AI功能集成門檻明顯下降了。基于終端設備模組有限的算力,也能夠部署一定級別的大模型,滿足AI應用場景需求。
我們以業界知名物聯網整體解決方案供應商移遠通信的方案為例。他們針對不同場景,推出了一系列高中低端AI算力模組。
其中,旗艦邊緣計算智能模組SG885G,搭載高通? QCS8550高性能平臺,具備高達48 TOPS的綜合算力。
SG885G此前已率先成功實現了DeepSeek-R1蒸餾小模型的穩定運行。實測數據顯示,其生成tokens的速度超過每秒40個tokens,且未來隨著性能的不斷優化,速度還將進一步提升,為智能終端設備帶來更強大的AI能力。
面向高端的SG560D模組,同樣來自高通平臺(QCM6490),綜合算力可以達到14 TOPS。
移遠也有來自國產平臺的智能模組。如面向中端的SG530C,采用的就是紫光展銳的UIS7885平臺,算力達到8 TOPS。
面對低端場景,移遠也能提供對應的方案。例如SG368Z和SC362Z-AP,算力為1 TOPS,適合對成本和功耗有更高要求的場景。
模組的算力,是端側AI落地的一個前提條件。但更重要的是,需要充分了解用戶的需求,在方案設計驗證、模型微調、模型部署等方面具備工程化的能力。
移遠通信在這些方面已經積累了豐富的經驗。
在方案方面,移遠針對業界各大主流模型進行了大量驗證,摸清了模型的能力邊界和適用場景。在用戶場景中,如果直接采用現成模型構建方案,會導致嚴重的精度和準確性問題。而移遠會基于用戶場景,進行模型微調,確保模型與場景完全匹配,用戶能獲得最佳體驗。
模型部署更是移遠的強項。他們深耕行業多年,對垂直行業有非常充分的了解,能夠針對不同行業用戶的場景需求,進行從小模型到大模型的適配部署。
端側AI落地,不僅考驗硬件算力,也考驗軟件算法。而算法,是基于數據不斷磨合而成熟的。移遠通信在算力、算法和數據方面,都具有自身獨特的優勢,從而形成了強大的市場競爭力,也成為行業用戶的合作首選。
接下來,我們不妨從目前端側AI最火爆的兩個應用方向,詳細看看移遠方案究竟是如何落地的。
█機器人
先來看看現在最熱門的機器人(具身智能)賽道。
具身智能是機器人智能的理論基礎,而機器人是具身智能的物理載體。目前,業界普遍認為,機器人(具身智能)是大模型技術在端側落地的關鍵場景,已經進入了高速發展的快車道。
機器人,尤其是服務類機器人,需要與用戶進行直接交互,需要應對復雜場景下的感知、決策和控制任務,對實時數據處理有極高的要求。
通過在端側集成AI大模型,服務機器人能夠在本地進行數據處理,大幅降低數據延遲,提高響應速度。用戶可以獲得更加流暢、智能、高效的機器人服務體驗。
移遠通信的端側大模型解決方案,已經成功實現了在服務機器人領域的落地。
該方案基于SG885G模組,融合了前沿的LLM(大語言模型)、RAG(檢索增強生成)與Agent(智能體)等業界主流技術,可以實現 “情景理解、知識融合、智能交互、自主決策、任務執行”等多種功能。
在移遠端側大模型解決方案的助力下,服務機器人可實現1s以內的意圖識別,解碼速率超過15 tokens/s(人的正常語速約為10 tokens/s),語音交互更加自然。
目前,在醫療康養、智能客服、接待導覽、零售導購等多個實際場景,移遠大模型解決方案賦能的服務機器人,都展現出了強大的應用價值,也吸引了行業內外的廣泛關注。
不久前,移遠通信聯合德壹發布了全球首款搭載端側大模型的AI具身理療機器人,就非常有代表性。
這款創新產品支持8自由度3D視覺導航,融合尖端AI技術、中醫理療智慧與具身智能,可以實現“無人化、個性化、精準化”的理療體驗。
這款機器人甚至可以支持無網模式。在沒有網絡連接、沒有理療師介入的情況下,它都可以快速且準確地理解用戶的自然語言指令和意圖,高效完成通用聊天、醫療領域RAG問答、指令控制等任務。
此外,德壹機器人還具備很強的觀察能力。它借助多模態感知技術(視覺+力控+紅外熱成像),實時掃描用戶身體,精準識別人體經絡與穴位。通過結合用戶健康數據與實時體征,德壹機器人能夠動態生成個性化理療方案。
目前,在亞健康調理、慢性疼痛緩解、產后康復等多個場景,德壹機器人都已投入商用,為用戶提供服務。
█AI智能無人零售
自動售貨機是大家比較常見的一個物聯網應用場景。
在多年的發展歷程中,自動售貨行業經歷了從機械式到RFID射頻技術、重力感應、靜態視覺識別、動態視覺識別等多種商品識別方式的演變。 從靜態視覺到動態視覺,均以AI視覺識別能力為基礎,且依賴于物聯網技術的支撐。
在2025世界移動通信大會(MWC)上,移遠通信宣布推出全新AI智能無人零售解決方案,采用的就是前沿的“動態視覺+邊緣計算”技術。
該方案采用高性能5G AI算力模組SG560D(同時也兼容其它多款算力模組),依托在自研算法上的深厚技術積累,對硬件推理性能進行了深度優化,可以直接對實時動態視頻流進行計算,實現精準商品識別和秒級響應速度,帶給消費者“掃碼開門、即拿即走”的無縫購物體驗。
在SKU(庫存單位)方面,該方案經過海量數據的深度訓練,具備更強的模型泛化能力,可精準識別上千種商品。方案的模型能力還能持續在線升級,不斷拓展可識別商品的種類。
在準確率方面,方案采用“單/雙攝像頭+智能算法識別”等多重機制,并結合重量等數據進行交叉驗證,可以實現高達99%的端到端識別準確率。
在支撐客戶運營方面,方案可無縫對接客戶應用程序,為其提供全棧式技術與服務支撐,實現實時數據分析,并且能夠深度洞察消費偏好。這可以助力客戶實現數據驅動的精細化運營,進一步降本增效。
目前,移遠AI智能無人零售解決方案已經與興元科技“喵星人”智能售貨機等多家客戶產品完成系統集成,并進入實地場景測試階段。
█開發板——端側AI產品開發神器
除了豐富的AI模組及解決方案,在加速端側AI應用落地的過程中,移遠通信還打造了QuecPi Alpha智能生態開發板,以高效、靈活等優勢,推動端側AI技術不斷突破。
在2025世界移動通信大會(MWC)上,該開發板正式面向全球市場發布。
所謂開發板,就是一個開發平臺。物聯網技術應用于千行百業,每個行業都有不同的場景需求。因此,需要一個開發板平臺,進行行業場景下的物聯網終端開發技術測試和驗證。
尤其是端側AI落地,很多企業用戶都需要一個平臺,驗證大模型的能力,以及性能、功耗和兼容性表現。
QuecPi Alpha智能生態開發板基于高通躍龍? QCS6490處理器打造,配備8核CPU,8GB/4GB LPDDR4X內存,AI算力高達12 TOPS。其支持Linux、Ubuntu等多種開源操作系統,并采用高通Adreno? 642L/643 GPU,在處理圖像及視頻數據等AI計算任務時,展現出卓越的靈活性和高效性。
QuecPi Alpha可以說是端側AI產品開發的一個神器,廣泛覆蓋了AIoT行業的諸多應用場景,如AI邊緣計算、工業機器人、服務/陪伴/教育/娛樂機器人、工控、多媒體終端、數字廣告牌、智能家居等。
以智慧交通和智能安全為例,QuecPi Alpha能夠在復雜場景下快速、精準地識別并標注車輛、車牌、行人等目標物體。它在邊緣計算、低延遲處理方面的優異表現,為交通管理等領域的實時決策提供了有力支持。
█結語
根據最新數據,全球端側AI設備市場規模已超過600億美元,年復合增長率(CAGR)達到22%。預計到2030年,更將超過1500億美元。
這是一個巨大的市場機遇。想要把握這個機遇,就必須在端側算力、模型適配、模型部署等方面進行深入研究和持續投入。選擇一個好的物聯網解決方案,顯然能夠以最短的周期推出滿足用戶體驗的產品,從而在激烈的市場競爭中脫穎而出。
我們期待這個市場的進一步爆發,加速推動AI的落地和普及,將人類早日帶入真正的數智時代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.