2024-06-07
圖像與視頻生成技術(shù),作為現(xiàn)代科技領(lǐng)域的一大亮點,正逐漸改變著我們的視覺體驗。6月3日,西南財經(jīng)大學(xué)天府學(xué)院邀請華中科技大學(xué)博士生導(dǎo)師,中國圖象圖形學(xué)會理事桑農(nóng)教授于綿陽校區(qū)學(xué)術(shù)報告廳開展了以“圖像與視頻生成揭秘”為主題的講座。本次講座由學(xué)校黨委副書記、副校長袁勛主持。

桑農(nóng)講座現(xiàn)場
講座中,桑農(nóng)闡明了本次講座會以“生成式AI概述”“圖像生成圖像”“文本生成圖像”以及“視頻生成”四個部分進(jìn)行講解。在第一部分中,從人類藝術(shù)創(chuàng)作與計算機(jī)AI技術(shù)的關(guān)系進(jìn)入主題,提出了“計算機(jī)能否取代人類進(jìn)行藝術(shù)創(chuàng)作?”的問題,他認(rèn)為計算機(jī)AI技術(shù)有很大希望取代人類進(jìn)行藝術(shù)創(chuàng)作,對接下來詳細(xì)介紹圖像的生成過程奠定基礎(chǔ)。

天府學(xué)子認(rèn)真聽講
在“圖像生成圖像”部分中,桑農(nóng)重進(jìn)行了詳細(xì)的講解,同時提出了兩種其自我總結(jié)的圖像生成方式——自我生成方式和對抗生成方式。隨后,他以通俗易懂的話語以及更簡介明了的流程圖方式給學(xué)子們介紹了圖像的自我生成的第一個基本構(gòu)架——編碼器生成圖片的運(yùn)作原理,其實質(zhì)上是對加噪后的圖像進(jìn)行編碼,又經(jīng)過一種code模式后解碼生成。在桑農(nóng)講解流程的過程中也點明了其受潛在空間分布不聚集影響的缺點。其后,又簡要說明第二個基本構(gòu)架,也就是從AE到VAE的直觀轉(zhuǎn)換過程的理解,實質(zhì)上是使解碼的噪聲具有魯棒性。隨后,又將對抗式生成方式中的以循環(huán)生成對抗網(wǎng)絡(luò)為代表的幾個基本構(gòu)架及其存在的缺點等進(jìn)行了簡單的概述。通過了解原理,可以更加明白圖像生成圖像的技術(shù)在圖像翻譯領(lǐng)域中的廣泛應(yīng)用。
講座過程中,桑農(nóng)還對“文本生成圖像”以及“視頻生成圖像”進(jìn)行了闡述。他用流程圖解釋了文本生成的模型架構(gòu)由文本編碼器、生成模型、解碼器組成,其中特別需要注意文本與圖像對齊。文字與圖像生成圖像的講解后,教授又解釋視頻生成圖像是由前兩種共同控制而形成,進(jìn)而對前面的內(nèi)容進(jìn)行小結(jié)。
論壇結(jié)束之際,桑農(nóng)提到,圖像生成技術(shù)正處于快速發(fā)展的階段,它所帶來的創(chuàng)新和變革是前所未有的,通過今天的講座,也僅僅觸及了其潛力的表面。他鼓勵大家繼續(xù)關(guān)注這一領(lǐng)域的最新進(jìn)展,將理論轉(zhuǎn)化為現(xiàn)實中的應(yīng)用,也鼓勵天府學(xué)子能夠?qū)⒆约核鶎W(xué)的理論知識應(yīng)用到實踐層面,真正做到知行結(jié)合。袁勛在發(fā)言中也表示,希望作為新一代青年的天府學(xué)子們能夠運(yùn)用想象力、創(chuàng)意和批判性思維在未來繼續(xù)突破圖像生成技術(shù)的界限,賦予圖像新的生命。
團(tuán)委宣傳部:張寧
攝影:沈雨豪
初審:呂碧蓮
復(fù)審:李定峰
終審:車學(xué)文
2024年6月5日