2025年,全球人工智能技術(shù)迎來了前所未有的“奇點(diǎn)時(shí)刻”。DeepSeek等通用大模型的蓬勃興起,極大地加速了AI從“實(shí)驗(yàn)室”向“生產(chǎn)線”的轉(zhuǎn)型步伐。據(jù)前瞻產(chǎn)業(yè)研究院的權(quán)威預(yù)測(cè),2025年中國(guó)人工智能市場(chǎng)規(guī)模將突破7000億元大關(guān),而行業(yè)大模型將繼續(xù)成為該年度人工智能發(fā)展的前沿?zé)狳c(diǎn)。在這場(chǎng)技術(shù)浪潮中,以視頻為核心的智慧物聯(lián)領(lǐng)域正成為AI技術(shù)落地的前沿陣地。
3月28日,大華股份發(fā)布了2024年度財(cái)報(bào),全年?duì)I收321.81億元,其中研發(fā)投入占比達(dá)到了13.09%。尤為引人注目的是,公司自主研發(fā)的星漢大模型2.0版本首次全面披露了其技術(shù)框架,并在交通、礦山、城市治理等多個(gè)領(lǐng)域?qū)崿F(xiàn)了規(guī)模化應(yīng)用。財(cái)報(bào)顯示,AI大模型正從“技術(shù)工具”向“產(chǎn)業(yè)操作系統(tǒng)”進(jìn)化的清晰路徑——通過構(gòu)建行業(yè)智能體,使AI真正成為驅(qū)動(dòng)新質(zhì)生產(chǎn)力的核心引擎。
星漢大模型2.0:構(gòu)建行業(yè)智能體,重塑行業(yè)應(yīng)用
自2023年首次發(fā)布以來,星漢大模型已歷經(jīng)兩次重大迭代。作為以視覺為核心,融合多模態(tài)的行業(yè)大模型,星漢2.0版本全面升級(jí)以視覺為核心的 V 系列大模型,以多模態(tài)為核心的 M 系列大模型和以語言為核心的 L 系列大模型,并且依托三類行業(yè)大模型,構(gòu)建行業(yè)智能體,重塑行業(yè)應(yīng)用。
視覺大模型(V系列)以視覺為核心,賦予了機(jī)器精準(zhǔn)感知與洞察的能力。通過視覺解析大模型,一方面可以實(shí)現(xiàn)算法解析效果從準(zhǔn)確走向精準(zhǔn),大幅度提升感知精度,讓小目標(biāo)檢測(cè)性能與小概率事件精準(zhǔn)度大幅提升;一方面也可以實(shí)現(xiàn)對(duì)場(chǎng)景的自動(dòng)理解,讓設(shè)備部署更為便捷。如在周界安防場(chǎng)景中,智能設(shè)備可以強(qiáng)化圖像理解,實(shí)現(xiàn)場(chǎng)景自動(dòng)分類和動(dòng)態(tài)分割,極大縮短部署周期。
多模態(tài)大模型(M 系列)則通過圖文融合技術(shù),實(shí)現(xiàn)了圖文互搜和視覺解析,同時(shí)具備 V系列全能力。該模型不僅能夠?qū)?chǎng)景中的個(gè)性化需求轉(zhuǎn)變?yōu)橥ㄓ眯枨螅s短開發(fā)周期,還能通過圖文提示,無需定制開發(fā)即可實(shí)現(xiàn)新功能。它從單純的識(shí)別走向深度理解,突破了視覺認(rèn)知能力,能夠識(shí)別各種復(fù)雜行為,如破壞設(shè)施、翻越護(hù)欄、拉車門等。此外,該模型還增廣了多模態(tài)數(shù)據(jù)協(xié)同的應(yīng)用價(jià)值,支持文搜圖、文搜行為、文搜視頻、全局圖搜、局部圖搜、全要素圖搜、跨模態(tài)組合搜索等新功能。
語言大模型(L系列)以語言為核心,具備用戶界面的文本交互能力。該模型能夠?qū)τ脩舻奈谋净蛘Z音指令進(jìn)行語義理解,并進(jìn)行任務(wù)分解、工作流執(zhí)行以及結(jié)果生成。其語言能力顯著提升,能夠深度認(rèn)知行業(yè)知識(shí)與數(shù)據(jù),推動(dòng)人機(jī)交互向人機(jī)協(xié)作轉(zhuǎn)變。在具體應(yīng)用中,系統(tǒng)可精準(zhǔn)解析如“查詢某區(qū)域某時(shí)段人群分布”等復(fù)雜指令,自動(dòng)關(guān)聯(lián)多維數(shù)據(jù)生成分析報(bào)告,實(shí)現(xiàn)從被動(dòng)響應(yīng)到主動(dòng)協(xié)作的跨越。
如果說大模型是對(duì)于文本、圖像、視頻以及音頻等多模態(tài)數(shù)據(jù)的理解和生成“思考中樞”,那么智能體則是“融合感知、決策與執(zhí)行的自主系統(tǒng)”。星漢大模型2.0構(gòu)建的行業(yè)智能體讓大模型能夠模仿人類通過各種工具的調(diào)用以解決實(shí)際問題,將離散的AI能力整合為可以進(jìn)行自主思考、規(guī)劃和任務(wù)執(zhí)行的業(yè)務(wù)系統(tǒng)。這種“感知-認(rèn)知-決策”的閉環(huán)體系,正推動(dòng)技術(shù)價(jià)值從“經(jīng)驗(yàn)驅(qū)動(dòng)”向“認(rèn)知智能驅(qū)動(dòng)”的轉(zhuǎn)變,推動(dòng)AI技術(shù)從專業(yè)領(lǐng)域迅速走向行業(yè)普惠。
星漢大模型已在多行業(yè)落地應(yīng)用
據(jù)了解,自發(fā)布以來,星漢大模型已在城市治理、公共民生、交通、交管、能源、教育、園區(qū)等十多個(gè)行業(yè)領(lǐng)域中實(shí)現(xiàn)了深度應(yīng)用,并取得了顯著成效。
在城市治理領(lǐng)域,星漢大模型可實(shí)現(xiàn)對(duì)城市中眾多事件的精準(zhǔn)描述,助力城市治理 AI 能力升級(jí)。與小模型相比,出店經(jīng)營(yíng)、流動(dòng)攤販等常用功能的平均準(zhǔn)確率提升 10%以上,對(duì)于市容市貌、公共設(shè)施管理等提供了更有力的保障。支持的場(chǎng)景數(shù)從 10 個(gè)提升至 20 個(gè),從城市街道、住宅園區(qū)等擴(kuò)展至水域河岸、建筑工地等更多領(lǐng)域場(chǎng)景,提升了大模型的應(yīng)用范圍。
在交通管理方面,大模型能夠全面解析道路、交通標(biāo)志、標(biāo)線、設(shè)施等90多種交通場(chǎng)景信息,同時(shí)處理復(fù)雜交通事件的能力也得到了顯著提升。比如對(duì)于道路拋灑物的檢測(cè)準(zhǔn)確率提高了50%,還能識(shí)別拋灑物的類型,并自動(dòng)判斷其危險(xiǎn)等級(jí),對(duì)輕微和嚴(yán)重事件進(jìn)行分級(jí)管理,有效提高了決策效率。
在礦產(chǎn)領(lǐng)域,應(yīng)用了大模型解決方案的某大型煤礦實(shí)現(xiàn)了對(duì)煤炭傳送帶進(jìn)行 20 多種智能識(shí)別功能,可實(shí)時(shí)分析運(yùn)行狀態(tài),識(shí)別錨桿、異物、水煤等異常情況并及時(shí)預(yù)警,確保煤炭傳輸平穩(wěn)。與小模型相比,其平均準(zhǔn)確率提升 10%以上,且無需規(guī)則參數(shù)配置,降低人員運(yùn)維工作量,提升效率與質(zhì)量。同時(shí),支持礦料質(zhì)量分析,包括煤塊大小分布、礦料裝載率等實(shí)時(shí)分析,提高傳送帶利用效率,把控煤炭質(zhì)量。
可以預(yù)見,隨著星漢大模型2.0與行業(yè)智能體的深化落地,將有越來越多的行業(yè)領(lǐng)域人機(jī)協(xié)作的邊界被重新定義,千行百業(yè)也將共享這場(chǎng)由大模型與智能體共同驅(qū)動(dòng)的數(shù)字化轉(zhuǎn)型紅利。
未來大模型或?qū)⒊蔀橹腔畚锫?lián)的“操作系統(tǒng)”
在技術(shù)變革的推動(dòng)下,大模型正從“技術(shù)工具”逐漸轉(zhuǎn)變?yōu)椤爱a(chǎn)業(yè)操作系統(tǒng)”。大華股份在財(cái)報(bào)中明確表示,2025年將進(jìn)一步增加投入,用于AI技術(shù)研發(fā),推動(dòng)星漢大模型在更多行業(yè)中的深度應(yīng)用。從財(cái)報(bào)中可以看出,大華股份將堅(jiān)定瞄準(zhǔn)大視頻戰(zhàn)略主航道,打造極具競(jìng)爭(zhēng)力的自研產(chǎn)品;同時(shí),深化高質(zhì)量、可持續(xù)的發(fā)展模式,與合作伙伴攜手共掘共贏互利的第二曲線業(yè)務(wù)。
未來的智慧物聯(lián)系統(tǒng),將是由無數(shù)智能體構(gòu)成的“數(shù)字生命網(wǎng)絡(luò)”。在這場(chǎng)AI重構(gòu)產(chǎn)業(yè)的浪潮中,星漢大模型2.0的進(jìn)擊不僅彰顯了大華股份的技術(shù)野心,更是中國(guó)AI從技術(shù)追趕向范式創(chuàng)新跨越的生動(dòng)縮影。當(dāng)機(jī)器開始真正理解世界,一場(chǎng)悄無聲息的效率革命已經(jīng)悄然到來。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.