近期,一項保護并傳承陽江方言的人工智能科研項目在廣東海洋大學陽江校區取得初步成果,該項目通過AI技術建立陽江方言識別模型,以應對互聯網時代下面臨的傳承挑戰,同時讓搭載了陽江方言的AI更好地服務于陽江人的日常生活。
記者了解到,目前由于在互聯網背景下,方言保護面臨諸多挑戰,而陽江方言種類繁多,加上本地新生代在日常交流和學習中主要以普通話為主,這對陽江話的傳承造成一定的不利影響。
為應對這一挑戰,去年下半年,廣東海洋大學陽江校區計算機科學與工程學院教師鄧超與校內其他4名博士組成科研團隊,啟動了陽江方言大模型系統研究課題。
廣東海洋大學陽江校區計算機科學與工程學院教師 鄧超:
我2019年4月份來到陽江工作,在這個過程中我發現本人作為一個新陽江人,在日常的交流過程中,聽不懂陽江話。還有,我團隊成員有從小在陽江長大的,對陽江話他是有一定的情懷的,那么他作為一個學成歸來的AI領域的博士,他也愿意用AI技術對陽江方言的保護傳承,做一定的努力和貢獻。
鄧超表示,開展該課題首先要采集大量的數據樣本,對數據進行標注分類,接著對模型進行訓練調參優化,讓模型達到一定的準確度和識別率,并在這個過程中不斷循環迭代,一旦模型達到應用的成熟度,將會在線部署模型,例如將其運用于智能客服的熱線電話,進行實地的測試訓練和迭代優化,并且不斷調試,最終交付出產品級的應用系統。在研究中,數據采集和算力資源是項目難點。數據采集需要具有人群代表性,算力資源則依賴于大廠和運營商的支持。團隊正在與華為等廠商協調,并得到我市相關部門的支持意向。
同時,廣東海洋大學陽江校區也在建設人工智能實驗室,團隊也將爭取相應的資源支持。目前,團隊已經收集了中文文字數據集上萬條,音頻數據已錄制5000個詞語、1000條句子。
廣東海洋大學陽江校區計算機科學與工程學院教師 鄧超:
因為我們現在的人工智能技術,其實它就跟我們原來的發明蒸汽機、電力、互聯網是一樣的。它是一個通用型技術,其實它有一個特點是對行業所有的發展起到一個助推器、引擎作用的,我相信這個模型的上線,應該對陽江的社會發展和經濟產業發展一定起到很大的助攻作用。
科研團隊表示,目前也做出了許多實用性設想,例如可以開發陽江方言智能助手,服務于本地政府12345熱線服務、醫療及教育服務等,實現技術普惠;還可通過方言社交內容生成促進本土文化傳播,增強陽江人的文化歸屬感;同時結合文旅產業開發方言文創IP等,為鄉村振興注入新動能,形成文化保護與區域經濟發展的良性循環。
來源 | 陽江新聞
文字 | 李茵
攝像 | 陳偉良
編輯 | 劉帝森
審核 | 梁劍華 梁勝
終審 | 黃劉生
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.