隨著大模型等生成式人工智能技術(shù)的快速發(fā)展,生成內(nèi)容質(zhì)量顯著提升、生成速度明顯加快、適用場景大幅擴展,人工智能產(chǎn)業(yè)走深向?qū)崳鸩竭M入了規(guī)模化應用階段。生成合成技術(shù)開始呈現(xiàn)工具化和普及化趨勢,普通人都可以輕松地接觸到各種生成合成工具。與此同時,各種安全問題也隨之顯現(xiàn),譬如用AI生成虛假信息、AI換臉明星直播帶貨、AI實時換臉詐騙等違規(guī)甚至違法的事件頻發(fā)。
為規(guī)范人工智能技術(shù)服務應用,維護國家安全和社會公共利益,國家互聯(lián)網(wǎng)信息辦公室會同多部門發(fā)布的《人工智能生成合成內(nèi)容標識辦法》(以下簡稱《標識辦法》),秉持兼容并蓄的理念,通過技術(shù)手段管理技術(shù)問題,探索科學高效的治理手段。
一、人工智能走深向?qū)崳踩卫磉M入“深水區(qū)”
近期隨著人工智能應用技術(shù)里程碑式的突破,生成式人工智能應用呈現(xiàn)爆炸式增長,同時也出現(xiàn)了各類AI技術(shù)濫用現(xiàn)象頻發(fā)。兩會期間多名代表、委員提交議案和提案呼吁,要對AI生成內(nèi)容進行規(guī)范和治理,人工智能安全治理已從危害探討進入到實際執(zhí)法的深水區(qū)。
一是生成合成內(nèi)容質(zhì)量顯著提升,普通民眾難以辨識真?zhèn)巍?/strong>當前大模型能夠生成高真實感的文本、人像、場景、音頻,普通民眾不借助檢測工具已經(jīng)很難辨別內(nèi)容真?zhèn)巍?strong>二是生成合成數(shù)據(jù)規(guī)模快速增長,傳統(tǒng)安全治理體系面臨挑戰(zhàn)。隨著生成式人工智能技術(shù)在各個行業(yè)落地應用,生成合成內(nèi)容的數(shù)據(jù)規(guī)模快速增長,對生成內(nèi)容進行全面檢測成本太高,需要技術(shù)和政策結(jié)合才能實現(xiàn)高效治理。三是生成合成內(nèi)容適用場景大幅擴展,助長欺騙場景多樣化。由于技術(shù)成熟程度的局限,以前的偽造內(nèi)容主要針對人臉區(qū)域。隨著生成技術(shù)的突破,已經(jīng)可以實現(xiàn)高逼真的場景和動作生成,以及換臉變聲視頻的實時生成,各種新型的詐騙場景讓民眾防不勝防,急需出臺相關(guān)的治理辦法。
二、《標識辦法》開拓主動防御、全民共治的新局面
《標識辦法》從內(nèi)容標識的關(guān)鍵環(huán)節(jié)入手,以主動防御、行業(yè)自主的方式構(gòu)建全流程的規(guī)范要求,有效應對炮制虛假信息等誤用、濫用生成合成技術(shù)的行為。
一是制作平臺主動標識。《標識辦法》要求提供人工智能生成合成內(nèi)容制作服務的服務提供者在其制作內(nèi)容中添加不影響用戶使用的隱式標識,并在可能導致公眾混淆或者誤認的生成合成內(nèi)容的合理位置、區(qū)域添加顯式標識。在生成合成內(nèi)容制作源頭進行提醒提示。二是傳播平臺主動檢測。《標識辦法》明確提供網(wǎng)絡信息內(nèi)容傳播服務的服務提供者,主動核驗待發(fā)布文件元數(shù)據(jù)中是否含有隱式標識,判斷用戶的聲明內(nèi)容,采用技術(shù)手段檢測發(fā)布內(nèi)容中是否包含顯式標識或其他生成合成痕跡,并采取適當措施在發(fā)布內(nèi)容周邊添加顯著的提示標識,在生成合成內(nèi)容傳播路徑進行提醒提示。三是應用程序分發(fā)平臺主動核驗。《標識辦法》第七條要求互聯(lián)網(wǎng)應用程序分發(fā)平臺在應用程序上架或上線時,核驗提供人工智能生成合成服務應用程序的標識相關(guān)材料,在應用程序分發(fā)階段落實標識管理要求。四是網(wǎng)民用戶主動聲明。《標識辦法》第十條要求用戶在發(fā)布信息內(nèi)容時,主動聲明發(fā)布內(nèi)容的生成合成屬性,并使用服務提供者提供的標識功能添加必要的內(nèi)容標識,在生成合成內(nèi)容的發(fā)布階段進行規(guī)范要求。
三、《標識辦法》推動鑒偽技術(shù)與時俱進、對抗升級
《標識辦法》提出了明確的標識管理要求,標識數(shù)據(jù)可為鑒偽模型提供豐富多樣、來源廣泛的高質(zhì)量訓練樣本,從而推動鑒偽技術(shù)與時俱進地迭代升級,及時適應人工智能技術(shù)的高速發(fā)展進步。
一是加快數(shù)據(jù)層面的生態(tài)閉環(huán)。《標識辦法》聯(lián)動標識技術(shù)規(guī)范與鑒偽治理手段,一方面高質(zhì)量的訓練數(shù)據(jù)可以顯著提高鑒偽模型的能力和效果,另一方面,多樣化的帶標業(yè)務場景可以全面驗證鑒偽系統(tǒng)能力,從而實現(xiàn)數(shù)據(jù)層面“生成-標識-檢測”的生態(tài)閉環(huán),進一步推動基座化偽造檢測能力的構(gòu)建。二是促成多模態(tài)鑒偽的功能躍遷。《標識辦法》明確了文本、圖片、音頻、視頻等多種模態(tài)的標識方法,顯著提升用戶對各模態(tài)生成內(nèi)容感知能力的同時,也為多模態(tài)鑒偽提供了視覺錨點,加速了高質(zhì)量多模態(tài)數(shù)據(jù)集構(gòu)建。通過多模態(tài)特征對齊、動態(tài)對抗訓練等技術(shù)方法,進一步提高了多模態(tài)內(nèi)容的鑒偽能力,增強鑒偽能力的泛化性和適用性。三是推動偽造溯源的技術(shù)突破。元數(shù)據(jù)隱式標識中的平臺編碼與內(nèi)容編號構(gòu)成溯源鏈路,支持通過元數(shù)據(jù)快速定位違規(guī)內(nèi)容來源,助力偽造溯源技術(shù)的能力突破,從而實現(xiàn)更加精準地檢測識別和技術(shù)應對。
四、深度配套標識實施,建議加快鑒偽能力推廣普及
面對人工智能生成合成技術(shù)不當應用導致的內(nèi)容安全風險,《標識辦法》構(gòu)筑了全面深入的管理陣地。同時還應該配套打造與時俱進的鑒偽技術(shù)防線,融合運用管理手段和技術(shù)應對,協(xié)同推進行業(yè)自律和全民監(jiān)督的社會治理體系。
一是構(gòu)建基座化鑒偽底座模型,提升泛化適用性能。大模型生成技術(shù)迭代更新很快,平均兩個月就會出現(xiàn)新的里程碑模型,提升針對新生偽造方法的泛化能力至關(guān)重要,需要摒棄“來一個打一槍”的事后思維,構(gòu)建AI鑒偽底座模型,加強鑒偽模型的泛化適用性能,以大模型對抗大模型。二是研究精準化對抗鑒偽技術(shù),防范惡意逃避風險。針對金融詐騙、虛假信息等強對抗、高風險犯罪,造假者會通過內(nèi)容壓縮、隱蔽投毒等各種手段逃避標識義務和偽造檢測,這就需要在施加對抗意圖和手段的條件下保證高精度專項檢測能力,針對性地提升檢測效果。三是降低對無害生成內(nèi)容傳播的影響,兼顧生成內(nèi)容應用的發(fā)展與治理。從技術(shù)層面來說,正向應用和違法犯罪應用依賴的算法、模型本質(zhì)上沒有區(qū)別,因此需要從大量無害生成內(nèi)容中精準識別有害偽造內(nèi)容,保障無害內(nèi)容正常傳播的權(quán)利。四是打造全民化偽造檢測工具,推動人人可用鑒偽。全民監(jiān)督的社會共治,要加大科普力度,提高民眾對生成式人工智能的認識,同時向民眾提供易用的鑒偽服務,為普通用戶在身份驗證、信息鑒定等日常生活場景中及時發(fā)現(xiàn)偽造內(nèi)容提供便利,形成全民共治管理效能,全面保障公民隱私和財產(chǎn)安全。
*作者:曹娟 中國科學院計算技術(shù)研究所數(shù)字內(nèi)容合成與偽造檢測實驗室主任,研究員
來源:網(wǎng)信中國
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.