在國家“高效辦成一件事”的決策部署,以及廣東提升“數(shù)字政府”效能的新要求下,南都大數(shù)據(jù)研究院推出“數(shù)字政府提效微記錄”專欄,面對企業(yè)群眾政務(wù)服務(wù)需求中的盲點、困點,搭建與辦事部門溝通的橋梁,針對性展開普及與疏解。同時,聚焦政務(wù)服務(wù)具體事項和服務(wù)方式,發(fā)起主題化、動態(tài)式測評與調(diào)研,挖亮點、補短板,助力標準化、規(guī)范化、便利化。
廣東提出持續(xù)提升開放數(shù)據(jù)質(zhì)量,構(gòu)建高質(zhì)量人工智能數(shù)據(jù)集。繼以“開放廣東”平臺省本級數(shù)據(jù)集為切口,觀察高質(zhì)量數(shù)據(jù)開放供給之后,本期“數(shù)字政府提效微記錄”欄目將觀察點投向“開放廣東”平臺21市的數(shù)據(jù)集。
高質(zhì)量的數(shù)據(jù)供給是人工智能發(fā)展的動力,加快公共數(shù)據(jù)高質(zhì)量開放和企業(yè)數(shù)據(jù)流通是必要之舉。梳理“開放廣東”政府數(shù)據(jù)統(tǒng)一開放平臺信息,南都大數(shù)據(jù)研究院發(fā)現(xiàn),截至今年3月15日,廣東21市開放數(shù)據(jù)集共97320個,占“開放廣東”平臺數(shù)據(jù)集總量的99.6%。但進一步觀測這些數(shù)據(jù)集的質(zhì)量及利用質(zhì)效發(fā)現(xiàn),有19個市的開放數(shù)據(jù)集存在零下載問題,其中,茂名、珠海開放數(shù)據(jù)集零下載率超過一半。
在復(fù)旦大學(xué)國際關(guān)系與公共事務(wù)學(xué)院教授、數(shù)字與移動治理實驗室主任鄭磊看來,“零下載量”確實反映出一定問題,底層問題就是供需對接不足,社會需要的數(shù)據(jù)可能沒開放,開放的數(shù)據(jù)又不是社會所需要的。政府部門應(yīng)根據(jù)社會需求來開放數(shù)據(jù)。
“開放廣東”平臺21市數(shù)據(jù)集數(shù)量。
“開放廣東“平臺上 肇慶中山開放數(shù)據(jù)相對較多
截至今年3月15日,“開放廣東”平臺上21市開放的數(shù)據(jù)集共97320個,平均每市開放4634個。南都大數(shù)據(jù)研究院梳理發(fā)現(xiàn),“開放廣東”平臺上開放數(shù)據(jù)集最多的是梅州,其次為肇慶、中山,分別開放數(shù)據(jù)集有7390個、7319個以及5830個;數(shù)據(jù)集較少的是深圳、廣州,數(shù)據(jù)集分別為851個、849個。
不過,廣州、深圳分別擁有市級層面數(shù)據(jù)開放平臺,其中,廣州市公共數(shù)據(jù)開放平臺數(shù)據(jù)集有2436個,深圳市政府數(shù)據(jù)開放平臺數(shù)據(jù)集共4391個。在2024年全國各城市數(shù)據(jù)開放前30名中,據(jù)鄭磊教授觀察,深圳數(shù)據(jù)開放水平在全國各城市中處于中上游。
數(shù)據(jù)集主題方面,21市開放的數(shù)據(jù)集以“民生服務(wù)”為主,占比為38.1%,其次是經(jīng)濟建設(shè)、社會發(fā)展、機構(gòu)團體、城市建設(shè)、衛(wèi)生健康。而在可機器讀取格式方面,XLSX、XLS占比均超過84%,CSV占比僅36.2%,距離《公共信息資源開放試點工作方案》提出可下載數(shù)據(jù)集可機讀率不低于90%,鼓勵優(yōu)先采用CSV格式還存在差距。
“開放廣東”平臺各市數(shù)據(jù)集更新頻率占比。
“開放廣東”平臺去年來未更新數(shù)據(jù)集各地市占比。
21市數(shù)據(jù)集更新頻率 僅12個標注為“實時”
數(shù)據(jù)更新是數(shù)據(jù)開放質(zhì)量的重要組成部分,數(shù)據(jù)更新不及時會導(dǎo)致數(shù)據(jù)過時,影響其在實際應(yīng)用中的價值與效用。對于開放數(shù)據(jù)集的更新頻率,國家層面明確要求“提高實時動態(tài)數(shù)據(jù)開放比重”。而“開放廣東”平臺上,21市數(shù)據(jù)集更新頻率僅10.8%的數(shù)據(jù)集明確每年更新,標注為“每月”“每季度”“每天”“每半年”“實時”“每周”“不更新”的占比共為0.3%,只有“廣州市海珠區(qū)供銷合作社下屬企業(yè)物業(yè)招租服務(wù)信息”“揭陽市機動車維修企業(yè)”“潮州市企業(yè)名稱信息”等12個數(shù)據(jù)集明確標注更新頻率為“實時”,而標注更新頻率為“其它”的數(shù)據(jù)集占比高達88.9%。
梳理21市每個數(shù)據(jù)集更新或最后修改時間還發(fā)現(xiàn),只有35.9%數(shù)據(jù)集在2024年或者2025年進行了修改更新。也就是說,去年以來“開放廣東”平臺64.1%的數(shù)據(jù)集未修改更新過,其中以梅州、肇慶、惠州的數(shù)據(jù)集居多;而深圳只有“深圳市市場監(jiān)督管理局經(jīng)營異常名錄”“深圳市民政局深圳市特困供養(yǎng)月報表”等4個數(shù)據(jù)集沒有更新,是21市中更新情況較好的。
此外,還有453個數(shù)據(jù)集更新最后修改更新時間停留在2023年以前,涉及清遠、汕頭、陽江等15市,例如“清遠市連山公安局部門三公經(jīng)費預(yù)算信息”“汕頭市拍賣企業(yè)信息”“陽江市農(nóng)業(yè)農(nóng)村局綠色食品信息”等。
“開放廣東”平臺各市數(shù)據(jù)集零下載率(注:廣州、深圳無數(shù)據(jù)集零下載)。
19市均有數(shù)據(jù)集零下載 茂名珠海零下載率最高
“開放廣東”平臺哪些地市開放數(shù)據(jù)集“打卡率”較高?哪些數(shù)據(jù)集受冷落?南都大數(shù)據(jù)研究院梳理發(fā)現(xiàn),數(shù)據(jù)集瀏覽總量前三名依次為江門、佛山、東莞,排名倒數(shù)的是揭陽、廣州、深圳。而單個數(shù)據(jù)集瀏覽量排名前十均為江門市發(fā)布的數(shù)據(jù)集,包括“江門市政務(wù)服務(wù)事項實施清單、辦理項基本信息”等,單個數(shù)據(jù)集瀏覽量靠后的是茂名市發(fā)布的數(shù)據(jù)集,包括“茂名市茂南區(qū)金融工作局權(quán)責清單信息”等。
數(shù)據(jù)集下載總量前三名為梅州、東莞、江門,排名倒數(shù)的是河源、清遠、深圳。下載量高的單個數(shù)據(jù)集為“中山市南頭鎮(zhèn)室內(nèi)固定應(yīng)急庇護場所信息”,下載量為285912人次。
值得一提的是,19個市存在數(shù)據(jù)集零下載問題,共有14182個數(shù)據(jù)集下載量為零,占比為14.6%。其中,零下載的數(shù)據(jù)集數(shù)量最多的是茂名,有2263個,例如“茂名市茂南區(qū)金融工作局依申請事項清單信息”等,其次是湛江、珠海、云浮。此外,茂名、珠海開放的數(shù)據(jù)集零下載率高達53.2%、51.7%,其次為湛江、云浮、陽江。只有廣州、深圳的數(shù)據(jù)集沒有零下載問題出現(xiàn)。
在下載/訪問比例(下載總量/瀏覽總量)方面,湛江以123%排在21市之首,開放的4611個數(shù)據(jù)集下載總量為1330478人次,瀏覽總量為1079553人次。此外,下載/訪問比例在50%以上還有潮州、梅州。而河源開放的數(shù)據(jù)集下載/訪問比例只有2.7%。
鄭磊教授一直帶領(lǐng)團隊深度研究政府數(shù)據(jù)開放,其對此提到,瀏覽量、下載量低雖然與高質(zhì)量不能完全等同,但它能反映基本需求。高質(zhì)量要分兩類情況:一是針對行業(yè)、產(chǎn)業(yè)發(fā)展高質(zhì)量數(shù)據(jù)集,主要走授權(quán)運營通道;二是關(guān)系普通百姓的高質(zhì)量數(shù)據(jù)集,如衣食住行,教育、醫(yī)療、交通、氣象等,屬于公共服務(wù)類數(shù)據(jù),只要不涉及安全和隱私,就應(yīng)該走數(shù)據(jù)開放的渠道,不應(yīng)過于抬高獲取門檻,盡可能讓企業(yè)獲取和利用。
“開放廣東”平臺各市數(shù)據(jù)集下載/訪問比例。
數(shù)據(jù)開放供需對接 不能全靠授權(quán)運營
對于開放的數(shù)據(jù)集零下載問題,鄭磊教授認為底層問題就是供需對接不夠,社會需要的數(shù)據(jù)可能沒開放,開放的數(shù)據(jù)又不是社會所需的。在其看來,數(shù)據(jù)開放平臺是供需對接的重要窗口,不能只是展示一些功能,而要有真正的供需對接服務(wù),要暢通需求反映機制。在平臺設(shè)置需求提交功能后,要有客服及時響應(yīng),并協(xié)調(diào)有關(guān)部門,能開放的要開放,不能開放的也要給予答復(fù)并給出有說服力的理由。此外,還要定期進行需求分析,對于社會有普遍需求的數(shù)據(jù)要主動開放出來,而不能靠自己拍腦袋放出一些數(shù)據(jù)。例如,數(shù)據(jù)開放度較高的杭州,后臺設(shè)有專職人員,據(jù)稱該人員說自己已經(jīng)成為公共數(shù)據(jù)開放的“12345”,接到需求單后就去協(xié)調(diào)委辦局,然后再回復(fù)用戶。
鄭磊教授還提到,公共數(shù)據(jù)開放和公共數(shù)據(jù)開放授權(quán)運營,應(yīng)該是兩種互為補充的方式,能開放的應(yīng)該首先開放,不適合開放的再去授權(quán)運營,“有些數(shù)據(jù)明明可以走開放通道,卻非要走授權(quán)運營的渠道,這是有問題的”。
公共數(shù)據(jù)開放的供需對接不能完全靠授權(quán)運營來解決,授權(quán)運營主要任務(wù)是對具有敏感性的數(shù)據(jù)進行開發(fā)利用。國家信息中心公共技術(shù)服務(wù)部發(fā)展規(guī)劃處處長王曉冬曾撰文表達類似觀點,其建議推進需求導(dǎo)向型開放,優(yōu)先圍繞數(shù)字經(jīng)濟發(fā)展、產(chǎn)業(yè)創(chuàng)新等現(xiàn)實需求,推進各部門高質(zhì)量公共數(shù)據(jù)的開放,在保證數(shù)據(jù)的可機讀性基礎(chǔ)上,向社會公眾開放內(nèi)容更為多樣、應(yīng)用價值更高的數(shù)據(jù)。在社會需求反饋上,相關(guān)部門需要進一步突出數(shù)據(jù)開放的需求導(dǎo)向和結(jié)果導(dǎo)向,定期收集社會公眾的使用反饋情況,根據(jù)反饋結(jié)果明確數(shù)據(jù)開放的重點領(lǐng)域,提高數(shù)據(jù)開放的針對性。
南都大數(shù)據(jù)研究院還注意到,目前全省多地在推進高質(zhì)量數(shù)據(jù)集建設(shè),例如廣州市政務(wù)服務(wù)和數(shù)據(jù)管理局2024年12月31日發(fā)布公告面向社會各界公開征集人工智能高質(zhì)量數(shù)據(jù)集建設(shè)成果,包括結(jié)構(gòu)化數(shù)據(jù)、文本、視頻、音頻、圖形圖像等。據(jù)稱,廣州即將在本周公布首批高質(zhì)量數(shù)據(jù)集,并進行高質(zhì)量數(shù)據(jù)集供需對接簽約;深圳提出加快打造人工智能先鋒城市行動計劃,明確重點培育醫(yī)療、教育、交通等高價值垂類數(shù)據(jù)集。
出品:南都大數(shù)據(jù)研究院
采寫:南都記者 袁炯賢
設(shè)計:張博
技術(shù)支持:南方智媒科技公司 南方智媒云
技術(shù)研發(fā):占華平
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.