[PConline 雜談]AI絕對可以稱(chēng)得上是這幾年最火爆的話(huà)題。從Alpha Go擊敗頂尖圍棋選手開(kāi)始,越來(lái)越多人意識到在很多領(lǐng)域,AI已經(jīng)能夠用接近人類(lèi)的思維,更高效地完成任務(wù)。在很多領(lǐng)域,AI甚至已經(jīng)可以涉及甚至部分取代之前只能由人類(lèi)擔任的工作,例如機器翻譯有了AI加持后,譯文的質(zhì)量在很多場(chǎng)景下已經(jīng)達到了可用的程度,電腦和互聯(lián)網(wǎng)變得越來(lái)越聰明了。
▲AI加持的翻譯GNMT比之前的PNMT更加接近人工翻譯
然而長(cháng)久以來(lái),很多人依然認為,在一些體現人類(lèi)獨創(chuàng )性思維的領(lǐng)域,仍是AI的禁區。例如藝術(shù)和繪畫(huà),很難想象出AI能和人的想象力和手藝一較高下。
但是,近年AI在圖形學(xué)的進(jìn)展,卻讓人驚呼時(shí)代真的變了!不少高質(zhì)量的AI繪畫(huà)方案紛紛面世,即使你完全不會(huì )畫(huà)畫(huà),憑借著(zhù)寥寥幾筆涂鴉,甚至簡(jiǎn)單一兩句乃至幾個(gè)詞的描述,就能夠通過(guò)AI生成美輪美奐的繪畫(huà),簡(jiǎn)直如同黑科技,尤其是最近在Google Colab開(kāi)源的Disco Diffusion,全世界都玩瘋了!
▲Disco Diffusion已經(jīng)可以繪制如此高質(zhì)量的圖畫(huà)了!
AI繪畫(huà)并不是一蹴而幾的,它隨著(zhù)算力的增強,以及算法的完善,慢慢修煉到了如今的功力。那么在這幾年,都有些什么令人印象深刻的AI繪畫(huà)方案?今天,就來(lái)介紹一些相當值得把玩的AI繪畫(huà),來(lái)看看AI在如何一步步在藝術(shù)領(lǐng)域挑戰人類(lèi)的吧。
Paintschainer
這可能是最早出圈的AI繪畫(huà)方案了。Paintschainer在早幾年就引起了人們的注意,它并不能完全靠自己來(lái)畫(huà)一幅畫(huà),Paintschainer的主要作用是給線(xiàn)稿上色,其效果已經(jīng)可以追上一些比較簡(jiǎn)陋的人工上色作品。
Paintschainer GitHub主頁(yè):https://github.com/pfnet/PaintsChainer
Paintschainer Demo:https://petalica-paint.pixiv.dev/index_zh.html
Paintschainer在當時(shí)之所以突然爆火,是因為人們突然發(fā)現,AI居然是可以辨認線(xiàn)稿內容的!Paintschainer的驚人之處,在于它能夠識別線(xiàn)稿的內容,例如一張美少女人像,它可以識別某部分屬于皮膚,某部分是頭發(fā),某部分是衣服,某部分是背景,然后分別涂上適當的顏色。不僅如此,它的上色范圍還相當精準,盡管線(xiàn)稿沒(méi)有封閉,但顏色依然會(huì )保留在適當的范圍,而不會(huì )涂得滿(mǎn)地都是——用過(guò)PS中油漆桶工具上色的朋友,應該知道這是什么意思。
▲AI可以分辨對于電腦來(lái)說(shuō)很抽象的線(xiàn)稿,并自動(dòng)上色
▲使用簡(jiǎn)單的彩色線(xiàn)條作顏色指定ho后,上色更精確,效果甚至已經(jīng)和人工上色不相上下了
在很多人的固有認知中,電腦很難“理解”圖像,從照片中辨認、總結出內容物是什么。然而Paintschainer卻做到了更高的層次,能夠“理解”線(xiàn)稿這樣比起寫(xiě)實(shí)照片更加抽象的圖像。盡管Paintschainer并不完美,但它已經(jīng)足以讓人們對于A(yíng)I的強大有了更加貼切的體驗。
NV GauGAN
NV是顯卡界的大拿,無(wú)數游戲玩家將老黃視為偶像。而NV同樣是AI算力的重要貢獻者,它早早在A(yíng)I領(lǐng)域布局了多枚棋子,到如今NV在A(yíng)I領(lǐng)域無(wú)論是硬件還是配套的軟件,都達到了很高的水平——游戲玩家如果用過(guò)NV增強畫(huà)質(zhì)的DLSS AI算法,一定深有體會(huì )。
DLSS并非是NV在圖像AI領(lǐng)域的唯一體現,實(shí)際上,NV近年的一個(gè)開(kāi)源AI項目SPADE/GauGAN,就讓人嘖嘖稱(chēng)奇。
NV SPADE GitHub主頁(yè):https://github.com/NVlabs/SPADE
NV GauGAN 2 Demo:http://gaugan.org/gaugan2/
GauGAN是一個(gè)NV使用AI生成圖像的方案,和上文介紹的線(xiàn)稿上色AI相比,GauGAN的強大之處就在于它可以生成完成度極高的圖像,而前提是只需要你涂抹幾筆,用不同顏色的色塊和線(xiàn)條意思一下,GauGAN就可以明白你的意思,還你一張逼真度極高的照片。
而GauGAN一直處于發(fā)展中。今年,GauGAN還推出了第二代,除了依然可以通過(guò)簡(jiǎn)筆畫(huà)生成照片,現在還能夠通過(guò)文字描述來(lái)生成圖像了!
在GauGAN 2當中,用戶(hù)只需要輸入描述畫(huà)面的文字,AI就可以自動(dòng)生成對應的畫(huà)面。而且,生成的速度非常驚人,幾乎就是即時(shí)的。例如下圖,輸入“Ocean”出現海,繼而輸入“waves”則會(huì )出現波浪,繼續輸入“hitting rocks on the beach”則又繼續生成海灘和巖石,效果非常驚人。
此外,GauGAN還支持用戶(hù)手動(dòng)涂抹修改。如果想要對生成的內容做調整,就可以直接用簡(jiǎn)筆涂鴉,AI會(huì )如魔法般變出逼真的對應內容。
GauGAN之所以有如此大能,是因為使用了對抗網(wǎng)絡(luò ),大量數據經(jīng)過(guò)機器訓練后,使用生成器和鑒別器來(lái)識別對應元素,從而匹配數據生成圖像。據了解,GauGAN 2使用了1000萬(wàn)張圖像進(jìn)行訓練,藝術(shù)家使用它不僅可以生成現實(shí)的風(fēng)景,還可以生成天馬行空的藝術(shù)場(chǎng)景,這超越了很多人以往對電腦插手藝術(shù)的固有印象。
Disco Diffusion
這可能是今年最為人矚目的繪畫(huà)AI了!Disco Diffusion一經(jīng)面世,就刷爆了全球各大社交媒體,它顛覆了很多人對AI的認知。
▲你敢相信,這是AI作出來(lái)的畫(huà)?
如果說(shuō)GauGAN的強大之處,在于可以憑借人的簡(jiǎn)單想象就生成逼真圖像,那么Disco Diffusion就更進(jìn)一步,不僅可以進(jìn)行復雜的想象,而且還可以生成各種畫(huà)風(fēng)的繪畫(huà)!
Disco Diffusion是一個(gè)運行在Google Colab上的AI,如果要使用它,需要擁有Google賬號并且能訪(fǎng)問(wèn)Google,國內的用戶(hù)可以自行解決這方面的問(wèn)題。Disco Diffusion的程序是面向公眾公開(kāi)的,在使用之前,我們可以先將其保存到自己的Google Drive網(wǎng)盤(pán),以方便進(jìn)一步的編輯。
Disco Diffusion:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
Disco Diffusion GitHub主頁(yè):https://github.com/alembics/disco-diffusion
Disco Diffusion的強大之處,在于你給出一段描述文字,就能夠生成高質(zhì)量的畫(huà)作。盡管它沒(méi)有圖形界面,但使用起來(lái)并不復雜,進(jìn)入到“Setting”當中,可以設置名稱(chēng)(AI生成的繪畫(huà)會(huì )保存到Google Drive中對應的文件夾)、尺寸(不要設置太大,保持默認即可)、步數(保持默認即可)等等。
接著(zhù),進(jìn)入到“Prompts”(提示詞)的設置當中,這就是最關(guān)鍵的地方了。在Prompts中,你可以輸入描述繪畫(huà)的詞句,例如官方給出的實(shí)例為“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”, “yellow color scheme””,意思大致為“奇異燈塔的美麗繪畫(huà),在洶涌的血海中閃耀著(zhù)光芒,參考greg rutkowskiThomas kinkade的畫(huà)風(fēng),以及artstation網(wǎng)站上流行的風(fēng)格”“黃色主調”。
然后點(diǎn)擊“代碼執行程序”中的“全部運行”,靜靜等待即可。運算過(guò)程可能長(cháng)達幾十分鐘乃至數小時(shí),運算是在Google的云服務(wù)器上運行的,對本機電腦性能沒(méi)要求。隨后,Disco Diffusion就生成了這樣一副繪畫(huà)!
在很多人眼里,AI能夠生成這樣的一幅畫(huà)是非常驚人的,其完成度甚至不屬于一些真正的畫(huà)手。而Disco Diffusion生成這樣的一幅畫(huà),流程要比手工作畫(huà)來(lái)得更快,而且改一下提示詞,又能生成另外不同風(fēng)格的畫(huà)了。
▲同樣的Prompts提示詞,僅僅更換了作者風(fēng)格的關(guān)鍵字,Disco Diffusion就可以生成不同的畫(huà)風(fēng)
Disco Diffusion對提示詞的要求很寬松,完全可以用簡(jiǎn)單的詞語(yǔ),甚至是機翻來(lái)應對。例如筆者填入了“a modern city at night,super wide angle,artstation”這樣簡(jiǎn)單的Prompts,就生成了下面這幅畫(huà)作。
Disco Diffusion有很多潛力可發(fā)掘。例如使用算力更強的云服務(wù)、設置更多次的迭代算法、提供更具體的提示詞、甚至給到參考圖片,都能夠生成更高質(zhì)量、更多種風(fēng)格的畫(huà)作。下面是一些來(lái)自互聯(lián)網(wǎng)的利用Disco Diffusion生成的作品,大家可以感受一下。
▲Prompts:The Vast Viridescent Hillside lacks Rationality and obfuscates its Beauty
▲Prompts:when you have taken everything away, what remains? will you walk this road all the way to the heart of the galaxy?
▲Prompts:forbidden aesthetic
毫無(wú)疑問(wèn),Disco Diffusion的出現,顛覆了很多人的三觀(guān)。這個(gè)AI所生成的繪畫(huà),甚至已經(jīng)可以說(shuō)擁有一定的藝術(shù)感了。盡管它對于動(dòng)物和人物的繪制仍存在短板,而且也并不能勝任人物、場(chǎng)景設計這樣具體的、需要扣細節的工作,但無(wú)論是給普通人一場(chǎng)視覺(jué)盛宴,還是給行業(yè)人員找找靈感,都已經(jīng)綽綽有余了。
可以說(shuō),Disco Diffusion將繪畫(huà)AI推向了一個(gè)新高度,繪畫(huà)這種講究審美、講究靈感的技藝,也不再專(zhuān)屬于人類(lèi)了。
Tiamat
Disco Diffusion依托在Google Colab上,對于國內用戶(hù)來(lái)說(shuō)有網(wǎng)絡(luò )方面的門(mén)檻,而且界面說(shuō)不上易用,還需要用英文來(lái)撰寫(xiě)提示詞(盡管可以機翻)?,F在,對國人更友好的AI繪畫(huà)方案,正在路上。
最近,一款名為T(mén)iamat的繪畫(huà)AI在國內展開(kāi)了測試。根據內測者微博用戶(hù) @春卷 的體驗反饋,它的界面比較友好,而且可以用中文來(lái)給AI命題,效果還相當不錯。
和Disco Diffusion相比,Tiamat的本土化做得好很多。例如,它甚至能根據詩(shī)詞來(lái)繪畫(huà),畫(huà)面效果相當好,還頗有意境。在微博、小紅書(shū)平臺上,都可以找到很多這樣的案例。
▲Prompts:天蒼蒼,野茫茫,風(fēng)吹草低見(jiàn)牛羊(來(lái)自微博 @春卷)
▲Prompts:海壓竹枝低復舉,風(fēng)吹山角晦還明(來(lái)自小紅書(shū) @青柑普洱不甜_Tiamat)
▲Prompts:簾卷落花如雪,煙月,誰(shuí)在小紅亭(來(lái)自小紅書(shū) @5+1=6)
可見(jiàn),Tiamat的AI方案還是有吸引人的獨到之處的。不過(guò)目前Tiamat目前仍處于內部測試階段,如果想要親自體驗,可以通過(guò)下面的鏈接來(lái)申請測試資格。
Tiamat內測申請:https://tiamat-ai.feishu.cn/share/base/shrcn2uXL8wNiveykIFYqWSzsPf
希望Tiamat能夠盡快推出公開(kāi)的版本,讓更多國人感受到AI繪畫(huà)的魅力吧。
總結
隨著(zhù)硬件性能的進(jìn)步以及算法的改進(jìn),AI仍在飛速發(fā)展。AI在繪畫(huà)方面的建樹(shù),已經(jīng)讓人咋舌,大家有條件的話(huà),強烈推薦把玩一下Disco Diffusion,感受AI作畫(huà)的魅力。未來(lái)AI會(huì )在更多方面挑戰人類(lèi)的靈智嗎?我們拭目以待吧。