今年火爆全球的DeepSeek
再度掀起了人工智能的創(chuàng)新熱潮,
人們對AI的關注與討論,
有一個生動的說法——
“有多少智能,就有多少人工”,
這背后,
實則與數(shù)據(jù)標注產業(yè)密切相關。
近年來,數(shù)據(jù)標注成為數(shù)字經濟領域的一個“熱詞”,數(shù)據(jù)標注,是對未經處理的原始數(shù)據(jù)添加標記、說明、解釋、分類和編碼的過程,將人類的視覺和思維邏輯轉化為計算機可以識別的語言,是當前人工智能技術發(fā)展和應用的基礎支撐。
當前我國數(shù)據(jù)標注產業(yè)呈現(xiàn)怎樣的發(fā)展態(tài)勢?全國哪些城市在全力搶灘?一線企業(yè)對行業(yè)發(fā)展有哪些需求和愿景?3月19日上午,全國數(shù)據(jù)標注基地先行先試現(xiàn)場會在四川成都舉行。
本次會議由國家數(shù)據(jù)局主辦、四川省發(fā)展改革委(四川省數(shù)據(jù)局)、成都市人民政府承辦。現(xiàn)場,來自國家發(fā)展改革委、工業(yè)和信息化部、人力資源和社會保障部、自然資源部等國家部委,遼寧、安徽、湖南、河北、山西、湖北等20多個省數(shù)據(jù)工作部門,省內部分(市州)數(shù)據(jù)工作部門負責同志共計200余人參會。
這場在成都舉行的行業(yè)大會
迸發(fā)的新點子,
為全國數(shù)據(jù)標注產業(yè)發(fā)展
提供了全新智力支撐。
數(shù)據(jù)標注的“成都經驗”
場景驅動
打造細分領域數(shù)據(jù)標注典型應用案例
去年,成都與沈陽、合肥、長沙、海口、保定、大同同時獲批全國首批數(shù)據(jù)標注基地建設試點名單,圍繞數(shù)據(jù)標注產業(yè)的生態(tài)構建、能力提升和場景應用等方面開展先行先試,集聚龍頭企業(yè),打造區(qū)域人工智能產業(yè)生態(tài)。
成都數(shù)據(jù)標注基地建設成效如何?在現(xiàn)場會上,成都市政府黨組成員、副市長,市發(fā)展改革委主任王鋒君在交流發(fā)言環(huán)節(jié)介紹了當前成都數(shù)據(jù)標注基地建設工作情況。
去年以來,成都加快打造帶動全川、服務全國的“人工智能+”數(shù)據(jù)標注基地,累計培育40余家數(shù)據(jù)標注核心企業(yè),形成90余個數(shù)據(jù)標注典型案例,建設儲備一批行業(yè)急需的高質量數(shù)據(jù)集,賦能大模型30余個。
推動數(shù)據(jù)標注基地建設,
成都如何“出招”?
成都朝著頂層設計、企業(yè)協(xié)同、平臺建設、行業(yè)賦能、要素保障五個方向發(fā)力。首先是體制機制保障,成都建立了“市級統(tǒng)籌+協(xié)同聯(lián)動”工作格局,在全市開展“立園滿園”行動中,產業(yè)園區(qū)尤其側重招商引資和企業(yè)服務。
政策保障也成為“關鍵一招”。通過出臺《成都市數(shù)據(jù)條例》,完善《公共數(shù)據(jù)授權運營賦能管理辦法》等配套文件,印發(fā)《成都市深化數(shù)據(jù)要素市場化配置改革工作方案》,成都為數(shù)據(jù)收集治理、流通交易、應用發(fā)展和安全保護提供法規(guī)制度支撐。近期,《成都市深化數(shù)據(jù)要素市場化配置改革工作方案》《成都市推動數(shù)字經濟高質量發(fā)展行動方案》先后印發(fā),“數(shù)據(jù)標注”成為其中一大著力點。
▲成都超算中心
成都優(yōu)化
“人工智能+數(shù)據(jù)標注”產業(yè)布局,
具體來看
積極打造數(shù)據(jù)標注“人工智能+”牽引區(qū),布局“都市產業(yè)”“產教融合”“數(shù)據(jù)服務”數(shù)據(jù)標注基地特色集聚區(qū)。其中,位于新津經濟開發(fā)區(qū)的成都市國家數(shù)據(jù)標注基地牧山園區(qū)已于3月18日正式開園,將圍繞“數(shù)據(jù)標注+”產業(yè)鏈,打造數(shù)據(jù)產業(yè)集群。
通過企業(yè)協(xié)同,成都數(shù)據(jù)標注產業(yè)發(fā)展有鏈條、有生態(tài)。成都釋放人工智能企業(yè)牽引動能,發(fā)揮人工智能1079億核心產業(yè)產值、1006家企業(yè)規(guī)模優(yōu)勢,成立人工智能、數(shù)據(jù)標注產業(yè)聯(lián)盟,組織數(shù)字經濟產業(yè)伙伴大會、數(shù)據(jù)標注賦能AI高質量發(fā)展沙龍等產業(yè)對接活動,發(fā)掘數(shù)據(jù)標注年需求超3000TB。
▲成都智算中心
在平臺建設方面,成都打造數(shù)據(jù)標注公共服務平臺。其中,成都數(shù)據(jù)集團牽頭建設的智能數(shù)據(jù)標注生成管理平臺已上線運行,助力完成數(shù)據(jù)標注任務60余個,構建數(shù)據(jù)集超過1TB。
通過開展場景創(chuàng)新,成都正在推動新技術、新產品加速轉化應用,數(shù)據(jù)標注也成為成都場景創(chuàng)新工作的發(fā)力點。聚焦城市治理等特色基礎,依托智慧蓉城應用場景實驗室持續(xù)開展“揭榜掛帥”,打造金融征信數(shù)據(jù)智慧輔助決策、智能車路協(xié)同感知等72個數(shù)據(jù)標注典型應用案例。
現(xiàn)場,新津區(qū)政府主要負責同志介紹了新津以數(shù)據(jù)標注為抓手,推動產業(yè)引進培育的相關情況。成都產業(yè)集團主要負責同志介紹了開展智能數(shù)據(jù)標注平臺建設工作情況。
數(shù)據(jù)標注的“他山之石”
人才、產業(yè)、場景、高質量數(shù)據(jù)集等要素
“一個也不能少”
現(xiàn)場會上,沈陽、合肥、長沙、海口等承擔國家數(shù)據(jù)標注基地建設任務的城市代表以及積極發(fā)展數(shù)據(jù)標注產業(yè)的城市代表相繼發(fā)言,分享了推動數(shù)據(jù)標注產業(yè)發(fā)展的“打法”。
參會代表的發(fā)言中,人才培育、產業(yè)協(xié)同、應用場景、高質量數(shù)據(jù)集等成為“關鍵詞”。
紛繁復雜的數(shù)據(jù)標注業(yè)務背后,需要龐大的人力資源支撐。在建設國家數(shù)據(jù)標注基地的過程中,沈陽構建了“1+2+6+10”的標注人才培訓體系。其中,產教融合數(shù)字人才創(chuàng)新基地已成功培養(yǎng)200 余名人工智能訓練師。開展沈陽都市圈數(shù)據(jù)標注職業(yè)技能競賽,多渠道選拔數(shù)據(jù)標注人才。軟通動力等企業(yè)與職業(yè)技術教育學校、大專院校構建訂單式人才培育體系,暢通高校和企業(yè)的人才輸送通道,實現(xiàn)“畢業(yè)即就業(yè)”人才無縫對接。
同樣在人才端發(fā)力,合肥市舉辦全國數(shù)據(jù)資源產教融合共同體成立大會,參會院校75家,與全國137 家院校對接推動建設數(shù)據(jù)資源現(xiàn)代產業(yè)學院,其中超30家院校已明確合作意向,開展數(shù)據(jù)標注產教融合對接會。2024 年培養(yǎng)人工智能訓練師891人,備案人工智能訓練師自主評價企業(yè)1家、自主評價高校7家。
如何拓寬數(shù)據(jù)標注產業(yè)市場空間?部分城市跳出自身發(fā)展空間,將產業(yè)發(fā)展觸角延伸開去。比如,隨著長三角一體化戰(zhàn)略的持續(xù)深入推進,合肥立足長三角的區(qū)位優(yōu)勢,進一步促進區(qū)域間數(shù)據(jù)資源的共享協(xié)同,為數(shù)據(jù)標注產業(yè)發(fā)展帶來強勁動力,來自上海、杭州等地的自動駕駛、金融科技等產業(yè)對高質量標注數(shù)據(jù)需求旺盛。
如何推動數(shù)據(jù)要素被高效利用?如何拓寬數(shù)據(jù)應用場景?武漢的做法是通過行業(yè)引領,以多元場景驅動產業(yè)縱深發(fā)展。武漢的數(shù)據(jù)標注產業(yè)主要覆蓋人工智能、醫(yī)療影像、自動駕駛、遙感測繪、低空經濟、數(shù)字傳媒等六大行業(yè),服務人工智能企業(yè)1000余家,包括國家級專精特新“小巨人”企業(yè)92 家、上市企業(yè)29家。
無論是應用場景,還是產業(yè)生態(tài)培育,根本上看,需要高質量的數(shù)據(jù)集,這是數(shù)據(jù)能夠被有效利用的前提。
大同通過打造高質量數(shù)據(jù)集,結合當?shù)禺a業(yè)特色,深度挖掘能源、文旅、交通等行業(yè)數(shù)據(jù)資源。例如,在能源方面,大同采集煤礦場景圖片147.33 萬張,數(shù)據(jù)樣本 11.01 萬個,匯聚形成相關數(shù)據(jù)集248個,賦能煤礦安全和煤礦生產。
數(shù)據(jù)標注的“一線聲音”
期待在技術、資本、人才、出海等方面
獲更大支持
來自公開數(shù)據(jù)顯示,根據(jù)測算,2023年我國數(shù)據(jù)標注產業(yè)規(guī)模達800億元左右。隨著國家發(fā)展改革委、國家數(shù)據(jù)局、財政部、人力資源社會保障部四部門聯(lián)合發(fā)布《關于促進數(shù)據(jù)標注產業(yè)高質量發(fā)展的實施意見》,加之人工智能產業(yè)在各地“升溫”,數(shù)據(jù)標注產業(yè)正在“加速跑”。
推動產業(yè)高質量發(fā)展,一線企業(yè)是“主力軍”,從業(yè)者有哪些意見建議?有哪些發(fā)展愿景?作為本次現(xiàn)場會的重要配套內容,在數(shù)據(jù)標注領域民營企業(yè)座談會上,北京、合肥、成都等地的數(shù)據(jù)標注企業(yè)代表共謀產業(yè)高質量發(fā)展之道。
“數(shù)據(jù)標注在支撐人工智能垂類大模型過程中,急需更多專業(yè)人才加入,比如,醫(yī)學領域的數(shù)據(jù)標注不僅僅需要掌握大數(shù)據(jù)技術的人才,還應該掌握臨床醫(yī)學知識。”樂普通盈成都科技有限公司參會代表楊尚鑫談到,目前行業(yè)對高素質專業(yè)人才的需求較大。
“全國有不少高校開設了人工智能和大數(shù)據(jù)專業(yè)課程,但是針對數(shù)據(jù)標注產業(yè),仍舊期待形成完整的課程體系來培養(yǎng)專業(yè)化的人才隊伍。”礪英數(shù)智(北京)數(shù)據(jù)技術有限公司參會代表李哲洙分享了他的觀點,在他看來,業(yè)內可以面向數(shù)據(jù)產業(yè)未來發(fā)展趨勢,規(guī)劃設計相關“數(shù)據(jù)產業(yè)學院”和數(shù)據(jù)人才培訓體系,通過產教融合方式支撐高校人才培養(yǎng),為社會輸送高素質數(shù)據(jù)人才。
“隨著人工智能、大數(shù)據(jù)行業(yè)發(fā)展,需要建立一套專業(yè)的數(shù)據(jù)標注人才標準以及人才申報體系。”安徽飛數(shù)信息科技有限公司參會代表譚昶表示,目前數(shù)據(jù)標注行業(yè)細分趨勢明顯,希望行業(yè)加快培育更多專家型數(shù)據(jù)標注人才,對這類人才給予相關政策扶持,比如,提供崗位津貼和個稅優(yōu)惠。
參會企業(yè)代表紛紛表示,作為人工智能產業(yè)的重要支撐,數(shù)據(jù)標注需要持續(xù)的技術創(chuàng)新。
如何提升技術創(chuàng)新水準?譚昶建議,可通過“揭綁掛帥”方式,推動供需精準匹配,實現(xiàn)場景提供方和企業(yè)聯(lián)合開展技術攻堅,推動數(shù)據(jù)標注項目更好落地。
有企業(yè)代表談到,可利用更加智能化的技術賦能數(shù)據(jù)標注產業(yè)發(fā)展。
“需要探索大模型和自動化工具的技術創(chuàng)新,以提升標注效率。”百度公司參會代表陳昊說,可借助相關自動化機器人標注技術,通過這一方式有效提升數(shù)據(jù)標注準確率和效率。
“通過將AI算法與數(shù)據(jù)標注平臺結合,可大幅提升整個數(shù)據(jù)標注的效率。”整數(shù)智能參會代表林群書表示,可通過加強與海外同行的溝通交流,及時了解海外前沿技術,采取業(yè)務合作的方式提升數(shù)據(jù)標注水平。
無論是技術、還是產品,不少企業(yè)都期望提速“走出去”步伐。成都小咖邦科技有限公司參會代表李逆勇建議,可打造數(shù)據(jù)跨境流通的完備機制,推動國內數(shù)據(jù)AI基礎設施能力走向全球市場。
資本也是各方關注的焦點。“建議針對數(shù)據(jù)標注設立相關專項基金,支持企業(yè)自主研發(fā),突破關鍵技術瓶頸,推動行業(yè)領軍企業(yè)做大做優(yōu)做強。”北京海天瑞聲科技股份有限公司參會代表李科說。
? 來源 | 市發(fā)展改革委
成都市《計劃報告》要點速覽,這些事與你息息相關→
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.