99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

讓失去的時光重現光彩——真實世界視頻智能增強技術

0
分享至

上海科技獎勵獲獎成果科普化特別報道

坐在影院欣賞4K修復后重映的老電影時,你是否好奇過這些幾十年甚至一百多年前的影像如何像被施了魔法一樣變得色彩鮮艷、纖毫畢現?真實世界視頻智能增強技術功不可沒。

文/董 超

中國科學院深圳先進技術研究院多媒體集成技術中心主任,研究員,博士生導師。

01

無中生有的圖像超分辨率

首先,請看下圖中左邊這幅小貓的圖像,在大腦中試著將它放大2倍、4倍……認真想象每一個細節。你發現了什么?很困難,對不對?大腦里可以出現這幅圖放大之后的模糊影像,但我們很難腦補出清晰的細節。圖像超分辨率算法(簡稱超分)就是要將這幅圖像的細節無中生有地“算”出來,使之像下圖中的右圖一樣栩栩如生地展現在我們眼前。有時候,用超分對圖像或視頻進行處理也簡稱“超分”。


圖像超分辨率示意圖

左圖為原圖,右圖為超分辨率圖。

超分是圖像和視頻增強領域中最重要的基礎算法,在這個領域里,人工智能算法一直做得比人類好,很難被人類取代,這與其他領域恰好相反。更重要的是,我國原創的超分算法一直領先世界,這在人工智能領域里也是屈指可數的。

無中生有,聽著不像科學而像玄學。確實,如果是沒有理由的想象,那就不是科學。超分的科學性就在于它可以利用先驗知識來復原可靠的信息,再利用個性偏好來生成可能的細節。舉例來說,如果我們要超分一張人臉圖像,那先驗知識就是對人臉的普適性理解,如五官的數量和邊緣的形態,這些都是不言自明的常識,利用它們就可以恢復出邊緣清晰、五官正常的人臉。個性偏好就更主觀一些,例如,我們希望皮膚更加光滑水潤,眼睛更加明亮有神,那就需要生成相應的紋理來滿足個性化的需求。同樣地,對不同性別、年齡、膚色的人臉都應該生成出不同的細節。這樣一來,超分就有了兩個目標:一個是恢復真實信息,一個是生成逼真細節。實際的算法往往會結合兩者,但會根據應用場景有不同的側重點。

02

深度學習超分算法

用深度學習來做超分是我國科學家首創的,其中用到的方法名字叫SRCNN,也就是“超分辨率卷積神經網絡”的英文首字母縮寫。它借助深度學習強大的數據擬合能力,可以將缺失的信息復原和生成出來。那么,它是如何做到的呢?首先,我們要解釋一下傳統的插值算法,這可是超分算法的鼻祖,它的基本原理可以逐步拓展到深度學習中。所謂插值,就是在兩個像素之間插入一個新的像素,借助某些數學公式,就可以計算出新像素的數值。最簡單的公式就是求平均數,也就是讓插入的像素是周圍像素的均值。這樣可以很容易地補充大量像素,但超分后的圖像會過于平滑,不符合人們對自然圖像的理解。于是,我們可以進一步地把插“像素”變成插“圖像塊”,也就是讓新的圖像塊來自原有圖像塊的某種組合,組合出的圖像塊會自然保留原有圖像塊的性質,也就更像自然圖像。然而,直接組合圖像塊會帶來模糊的現象,而且無法生成新的細節。為了解決這一問題,我們就要將組合圖像塊改成組合圖像塊的特征,這樣可以避免純像素疊加帶來的噪聲,也可以讓復原出的圖像塊更加自然。同時,我們也需要求助于外部的圖像數據庫,以此來獲得更豐富的先驗信息。那么,如何體現圖像塊的特征,又如何利用數據庫的信息?機器學習算法就應運而生了。它可以通過特定的學習機制,讓算法從數據中自行學習特征,再從特征中復原出自然圖像。

深度學習是機器學習的一種,也是目前為止最高效、最易拓展的方式。通過深度學習來做超分,可以極大地提升超分效果。最早的深度學習超分模型SRCNN可以分成3個功能部分,分別是特征提取模塊、非線性映射模塊和圖像復原模塊。模型全部由卷積層連接而成,層數只有3~5層。后來,更加先進的模型通過引入殘差模塊、密集連接、注意力機制和歸一化層,可以將網絡深度增加至上百層,其擬合能力也成幾何倍數增長。在模型訓練階段,需要通過損失函數來確定優化目標,讓深度網絡可以在特定的方向上優化參數。如果想要復原真實信息,那么優化損失函數就是在讓輸出圖與理想圖之間的均方誤差變小。如果想要生成更多細節,就可以加入判斷圖像是否符合自然圖像分布的判別函數以及特征層面的視覺相似性函數,來增加輸出圖像的真實度。除此之外,我們還可以借助其他領域的模型(如擴散生成模型和圖像分割模型)作為輔助,讓超分效果更上一層樓。經過10年的發展,目前的深度學習超分模型已經非常強大,它們具有上億的參數,可以從幾千萬張圖像中學習,且達到人眼都無法識別出的逼真程度。下圖展示了傳統的插值算法、首個深度學習超分模型SRCNN和目前最新的超分算法SUPIR的效果差異,從中可以看到技術的巨大進步。


不同超分算法效果

左圖為插值算法超分結果,中圖為SRCNN 超分結果,右圖為SUPIR 超分結果。

03

復雜多變的真實世界視頻

然而,要復原真實世界的視頻,只有超分還遠遠不夠。前面所講的超分只是在理想情況下的算法,而真實世界的數據要復雜得多。什么是理想情況,什么又是真實世界呢?所謂理想情況,就是假設輸入圖像是清晰的自然圖像,且與訓練數據庫中的圖像有一致的分布。真實世界中的視頻(或者說是現實生活中可以直接獲取的視頻)往往都存在各種各樣的問題,例如,20世紀80年代的《西游記》,除了分辨率低以外,還含有因壓縮、失焦、模糊、膠片損壞等產生的畫質損失。更麻煩的是,這些損失成因各異,難以用確定的、統一的數學模型進行描述,從而失去了求解逆問題的可能性。當這些失真交織在一起時,超分算法就會將噪聲當成細節進行放大,將模糊當成平坦區域進行忽略,從而造成更加嚴重的畫質問題。除此之外,視頻原有的色彩也不夠鮮艷,還需要額外的算法來增強。如此一來,復原真實世界的視頻就成了一個復雜的綜合性工程,其難度遠高于理想情況下的單一算法。

04

真實世界視頻智能增強技術

為了應對真實世界中復雜多樣的畫質問題,我們采用了兩條相輔相成的技術路線,分別是“真實世界退化建模”和“內容自適應超分”,它們一個關注真實信息的復原,一個關注內容細節的生成。真實世界退化建模看似是個數學問題,實際是個仿真問題。由于我們無法得知真實的退化是如何形成的,也就無法通過數學公式來準確描述。但是,我們可以想辦法生成相似的退化類型,然后擴大退化的范圍,從而將各種復雜的退化都囊括其中。繼而用大退化空間來訓練大模型,讓模型具備處理各種復雜退化的能力。我們所采用的退化模型叫高階數多層次退化模型,它不僅包含了各種常見的退化類型,如高斯噪聲、失焦模糊、壓縮偽影等,還包含了它們的各種線性和非線性組合。這樣模擬出來的退化非常復雜,范圍也很大,足以包含真實世界場景中的各種退化類型。


真實世界退化仿真建模示意圖

內容自適應超分,顧名思義,就是要讓算法對不同的內容進行個性化的生成。我們主要將人臉和各種風景通過算法分割出來,再分別進行特異性訓練。以人臉為例,它往往是視頻里的重點關注區域,有著更加鮮明的圖像特征,我們通過收集大量人臉數據,讓模型生成出更逼真的人臉細節。在算法層面,模型會增加一個語義分割模塊和內容調制模塊。語義分割模塊會將圖像按照內容進行分割,然后由內容調制模塊將這些分割的信息重新整合(即空間變換函數),再輸入到每一個卷積層中,來調整它們的參數(即調制網絡)。最后再配合與內容對應的判別器作為損失函數,就可以輸出內容自適應的清晰圖像。


內容自適應超分算法示意圖

除此之外,真實世界視頻智能增強技術還包含前處理去噪算法、后處理色彩增強算法、視頻插幀算法等,這些算法從時域、空域、色域等各個方面來提升視頻畫質,這才有了“讓失去的時光重現光彩”的能力。這項技術已經被成功應用在了上百部歷史視頻增強當中,其中包括央視建黨百年慶祝晚會現場的《開國大典》視頻和中共一大會場的全部影像資料,也獲得了2022年度上海市技術發明獎一等獎。但是,這項技術的開發還只是剛剛開始,它能生成的細節還很有限,我們期待未來有一天,可以將經典的四大名著影視劇都搬到4K熒幕上,讓失去的時光更好地重現光彩。

*本文相關成果“真實世界視頻智能增強技術及國產化應用”榮獲2022年度上海市技術發明獎一等獎。

上海人工智能實驗室

XPixel視覺團隊

更多精彩內容見

《科學畫報》2024年第5期



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
27分鐘6犯!勇火大戰第1個被罰下的人來了!最硬的人都不如庫里硬

27分鐘6犯!勇火大戰第1個被罰下的人來了!最硬的人都不如庫里硬

嘴炮體壇
2025-04-27 12:03:22
全國哪里大米最好吃?經評比:這10種大米較為有名,有你家鄉嗎?

全國哪里大米最好吃?經評比:這10種大米較為有名,有你家鄉嗎?

味谷的廚房
2025-04-26 11:41:26
印巴激烈交火之際,巴基斯坦向中國求援,增加100億元人民幣額度

印巴激烈交火之際,巴基斯坦向中國求援,增加100億元人民幣額度

國際阿嘗
2025-04-27 15:17:01
僅一夜,自愿降薪加盟,組史詩級陣容,這讓其他隊怎么打

僅一夜,自愿降薪加盟,組史詩級陣容,這讓其他隊怎么打

青山隱隱啊
2025-04-27 10:27:16
開始追趕?26歲姆巴佩打進生涯首粒任意球,梅西進66粒C羅進64粒

開始追趕?26歲姆巴佩打進生涯首粒任意球,梅西進66粒C羅進64粒

直播吧
2025-04-27 10:20:16
日本5公斤大米均價約214元,有游客赴韓買米,還吐槽:“日本米價太高了”

日本5公斤大米均價約214元,有游客赴韓買米,還吐槽:“日本米價太高了”

每日經濟新聞
2025-04-27 15:11:56
太有錢了!二姐回國后帶瑾汐去掛水,送49700元的梵克雅寶手鏈

太有錢了!二姐回國后帶瑾汐去掛水,送49700元的梵克雅寶手鏈

阿矗論古今
2025-04-27 16:11:11
江蘇65歲阿姨感染艾滋病,查明原因,醫生:這個細節被忽視了

江蘇65歲阿姨感染艾滋病,查明原因,醫生:這個細節被忽視了

黃家湖的憂傷
2025-03-31 17:26:16
徹底不顧吃相了!底線爛掉的信號,還不夠明顯?

徹底不顧吃相了!底線爛掉的信號,還不夠明顯?

胖胖說他不胖
2025-04-27 16:58:10
都是信仰耶穌,基督教和天主教有何區別?一文給你解釋清楚

都是信仰耶穌,基督教和天主教有何區別?一文給你解釋清楚

爆史君帶你讀歷史
2025-04-26 21:27:53
絕美[玫瑰]

絕美[玫瑰]

動物奇奇怪怪
2025-04-27 13:38:28
女生穿瑜伽褲,到底是什么心理?原因太真實了!

女生穿瑜伽褲,到底是什么心理?原因太真實了!

健身S叔
2025-03-22 18:09:52
西部有大事,西疆必定無憂

西部有大事,西疆必定無憂

這才是戰爭
2025-04-26 17:50:50
大冷門!張本美和決賽2:3輸球,無緣冠軍,印度斬獲挑戰賽冠軍

大冷門!張本美和決賽2:3輸球,無緣冠軍,印度斬獲挑戰賽冠軍

國乒二三事
2025-04-27 15:42:43
目前中國過得最好的10類人,其中有一類被人看不起

目前中國過得最好的10類人,其中有一類被人看不起

李昕言溫度空間
2025-04-23 19:22:32
國乒世乒賽今晚19-30CCTV5直播預告及賽程安排

國乒世乒賽今晚19-30CCTV5直播預告及賽程安排

曦言說
2025-04-27 14:02:32
項立剛:留學即精英時代已經結束,今天的海歸,能和錢學森相比嗎

項立剛:留學即精英時代已經結束,今天的海歸,能和錢學森相比嗎

阿矗論古今
2025-04-27 13:43:52
張召忠:美國就算一動不動,中國20年也追不上,中美差距那么大?

張召忠:美國就算一動不動,中國20年也追不上,中美差距那么大?

紅色鑒史官
2025-04-26 18:55:03
以色列猛批西班牙終止子彈采購合同

以色列猛批西班牙終止子彈采購合同

參考消息
2025-04-25 11:21:09
0.1秒逆天絕殺!掘金2-2快船,哈登戈登打群架,約基奇36+21+8

0.1秒逆天絕殺!掘金2-2快船,哈登戈登打群架,約基奇36+21+8

籃球掃地僧
2025-04-27 08:50:12
2025-04-27 19:20:49
科學畫報 incentive-icons
科學畫報
中國最悠久的綜合性科普期刊
528文章數 31868關注度
往期回顧 全部

科技要聞

兩萬字看懂先進封裝

頭條要聞

消息稱哈馬斯愿釋放所有被扣押人員 換停火5年

頭條要聞

消息稱哈馬斯愿釋放所有被扣押人員 換停火5年

體育要聞

我們來自北極圈,我們有全球最恐怖的主場!

娛樂要聞

24歲女星夏依丹離世!死因讓人心碎

財經要聞

事關離境退稅 商務部等六部門最新發聲

汽車要聞

蔚來李斌的"十年磨一劍" 從看得見 到看不見

態度原創

游戲
健康
藝術
本地
公開課

AL強勢橫掃NIP!網友:NIP六連敗,騎士之路在招手了!

唇皰疹和口腔潰瘍是"同伙"嗎?

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 沁源县| 鹤峰县| 东源县| 萍乡市| 葫芦岛市| 曲阜市| 兴海县| 辽宁省| 云和县| 安塞县| 石家庄市| 建宁县| 桓台县| 常宁市| 惠来县| 崇信县| 沽源县| 承德市| 四川省| 双桥区| 文昌市| 新乡县| 景德镇市| 梁山县| 台北市| 延安市| 闸北区| 阿尔山市| 兴隆县| 崇左市| 高安市| 阿拉善左旗| 资阳市| 汶上县| 双柏县| 海口市| 乌鲁木齐市| 新蔡县| 文山县| 邵武市| 台南市|