當人工智能忙著“看圖說話”“分析指令”,是誰在幕后教它認圖識字?答案就藏在數據標注職業工作者的鼠標和鍵盤里。
作為人工智能技術發展的基礎支撐,數據標注正扮演著越來越重要的角色。3月21日,在數據標注產業論壇上,數據標注孵化基地正式啟動運營,助力南京市玄武區培育孵化一批AI數據服務企業,為玄武數字產業化與產業數字化發展增添新動能。
同時,這也是江蘇國際港圍繞江蘇數據產業園建設,打造江蘇數據產業集聚區,助推這一新興數據產業發展的又一布局。
3月,國家數據局發布數據顯示,我國七個數據標注基地的數據標注規模再創新高,總規模達到17282TB,相當于中國國家圖書館數字資源總量的6倍左右。
風口已至,如何乘勢而上?為加快推動江蘇數據標注產業高質量發展,玄武今年動作頻頻。打造數據標注孵化基地,成為其中一大著力點。
基地啟動儀式上,江蘇國際數據港與江蘇跨境數科、科大訊飛、學府集團南京易杰智信息科技、玄武大模型工廠、江蘇聯著實業、南京郵電大學、南京理工大學、江蘇經貿、江蘇開放大學等企業、學院攜手共建,計劃培育孵化一批AI數據服務企業,建設一批具有本地特色的AI數據集,培養一批高質量AI產業人才,形成產學研用一體化的良好生態,推動數據標注產業的創新發展。
江蘇國際數據港作為江蘇省“數據要素+大模型”產業的核心載體,具備發展數據標注產業的顯著優勢。
擁有地處長三角地區的區位優勢,江蘇國際數據港基于云計算、量子加密等技術,為企業提供數據安全合規咨詢、數據分級分類安全等服務,覆蓋跨國公司雙向數據跨境、國內企業境外數據回傳、科研數據跨境等多種業務,其建設數據標注基地具有重要戰略意義。
數據標注基地的建設離不開完善的基礎設施支持。目前,江蘇國際港已經投入使用跨境專線網關設備,幫助企業解決跨境訪問中的網絡問題。同時,計劃建設包含公有云、私有云、混合云在內的云服務平臺,以及高速、可靠、可擴展的存儲系統和多元泛在、智能敏捷、綠色低碳的算力服務。
技術創新是數據標注基地發展的核心動力,玄武區數據標注領域創新建設初見成效。目前,江蘇國際港已與高校、科研機構合作,建立聯合實驗室,開展產學研合作項目,推動數據標注技術與人工智能等產業的深度融合。預計在未來3年內,江蘇國際數據港將組建10個聯合實驗室,達成20項產學研合作,為技術創新提供有力的支撐。
此外,江蘇國際港積極鼓勵企業加大研發投入,突破數據預處理、智能標注工具等關鍵技術。
完善的產業生態建設對數據標注行業發展同樣重要。江蘇國際港積極引導行業AI大模型、數據加工、數據儲存、數據脫敏、數據安全等數據產業服務商集聚。通過打造產業生態系統,實現產業鏈上下游的協同發展,提升產業的整體競爭力。同時,江蘇國際港還積極推動數據要素交易市場建設,促進數據要素的流通和交易。
值得注意的是,隨著人工智能應用的不斷深化,對數據標注的需求也愈發專業化。江蘇國際港通過多種方式培養和引進復合型數據標注人才。一方面,積極開展專業培訓,與高校合作開設相關課程,培養適應市場需求的數據標注專業人才。另一方面,通過舉辦技能競賽等方式,吸引和選拔優秀人才,提升人才的專業素養和實踐能力。
AI技術的廣泛應用,讓數據標注需求呈井噴式增長。然而,行業長期存在的數據來源模糊、隱私泄露、敏感信息不當處理等合規問題日漸突出。就此,江蘇國際港通過建立健全數據合規體系,加強對數據的分級分類管理,并搭建“國際數據流通一體化安全治理平臺”,涵蓋跨境數據合規性檢測、跨境數據安全審核等多個子系統,確保數據在標注和流通過程中的合法性和安全性。
人工智能發展離不開高質量數據集,而高質量數據集建設離不開數據標注工作。玄武區以創新為驅動,以合作為橋梁,以人才為支撐,正著力打造具有競爭力的數據標注產業集群,為長三角數字經濟高質量發展注入新動能。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.