美的冰箱e2是什么問(wèn)題(美的冰箱出E2)
前沿拓展:
——"一片向日葵花海在星空下閃爍。"
本來(lái)只是在有限的想象力之內(nèi)挑了梵高的兩幅名畫(huà)加以簡(jiǎn)單概括,結(jié)果AI吞掉這句描述后,居然就吐出了一張張極富沖擊力的圖像:
圖源:Simon_阿文 微博
沒(méi)有參考圖像,也并非簡(jiǎn)單的兩幅圖像的拼接融合,而是真正基于文字描述,在充分的想象力下,從無(wú)到有地進(jìn)行了繪畫(huà)創(chuàng)作。
而就在不到一年的時(shí)間內(nèi),這樣的AI畫(huà)手開(kāi)始井噴式地出現(xiàn)——
近期在海內(nèi)外爆火的免費(fèi)AI作畫(huà)工具Disco Diffusion,輸入簡(jiǎn)單的文字描述就能在線生成圖像,其畫(huà)面之精細(xì),想象力之超絕讓不少人直呼“AI比我都浪漫”:
圖源:開(kāi)發(fā)者推特
一度登上蘋(píng)果應(yīng)用商店的圖形與設(shè)計(jì)排行榜榜首的Wombo,只要下載App,上傳圖片或輸入關(guān)鍵詞,再選擇平臺(tái)給予的風(fēng)格,幾秒之后就能生成圖片,其超絕的想象力被無(wú)數(shù)用戶玩出了花:
圖源:網(wǎng)絡(luò)
還有通過(guò)聊天出畫(huà)的Midjourney,用戶進(jìn)入聊天軟件Discord,并被邀請(qǐng)到相應(yīng)的小組中后,就能像是真的與畫(huà)手隔著網(wǎng)線交流一樣,說(shuō)出自己的需求,而AI也會(huì)在群中實(shí)時(shí)更新的繪畫(huà)進(jìn)度:
圖源:網(wǎng)絡(luò)
OpenAI上個(gè)月剛剛推出的DallE2,其生成結(jié)果的精準(zhǔn)度、對(duì)人物的識(shí)別能力震驚了整個(gè)技術(shù)圈,甚至都有讀者用這一AI出了一整本畫(huà)集,整整1000張圖片:
圖源:作者個(gè)人主頁(yè)
更不用說(shuō)谷歌新鮮出爐的Imagen,不管多長(zhǎng),多具體,多不符合現(xiàn)實(shí)邏輯的離奇描述詞,都可以精準(zhǔn)地從文字生成真實(shí)準(zhǔn)確的圖像:
圖源:谷歌官網(wǎng)
驚人的技術(shù)迭代速度、破圈式的熱度、震驚了繪畫(huà)圈的色彩、構(gòu)圖、想象力和創(chuàng)作力,似乎都在表示,這些AI畫(huà)手們,正在逐漸在繪畫(huà)領(lǐng)域中掌握”畫(huà)語(yǔ)權(quán)“。
對(duì)此,有人歡欣鼓舞,認(rèn)為技術(shù)的革新將為藝術(shù)領(lǐng)域帶來(lái)全新的思考方式和改變,有人惶惶不安,擔(dān)憂來(lái)勢(shì)洶洶的AI畫(huà)手將摧毀一大批中低端繪畫(huà)崗位,甚至有人怒斥AI將藝術(shù)變?yōu)榱藛渭兊臄?shù)據(jù)游戲,使得繪畫(huà)失去了意義和靈魂......
議論連續(xù)不斷,熱度居高不下,AI繪畫(huà)這一名詞開(kāi)始逐漸出圈,在谷歌的關(guān)鍵詞搜索趨勢(shì)中,AI painting的搜索熱度自去年下半旬就開(kāi)始逐漸高漲,到現(xiàn)在已經(jīng)達(dá)到了一個(gè)新的高峰:
熱議之下,已經(jīng)有這樣的聲音出現(xiàn):
AI繪畫(huà),元年已至。
···
且先不論這一發(fā)言是否正確,所謂的AI畫(huà)作,到底是嚴(yán)格按照代碼邏輯運(yùn)行,風(fēng)格單一的產(chǎn)物,是AI的隨機(jī)拼接游戲,抑或是真能如人類(lèi)畫(huà)手一般依照主題構(gòu)想畫(huà)作?
AI們都畫(huà)了什么,它們又能畫(huà)多少?
AI畫(huà)手的第一批體驗(yàn)者們,當(dāng)時(shí)就抱有著這樣的疑惑。PPT設(shè)計(jì)師阿文就是其中之一。
今年4月份時(shí),他偶然看到一個(gè)畫(huà)手朋友在微博展示了一組AI作畫(huà)的作品,效果驚人,朋友作為專(zhuān)業(yè)畫(huà)手也給予了很高的評(píng)價(jià),他便也對(duì)這個(gè)叫做Disco Diffusion的工具起了興趣。
這是一款基于谷歌的技術(shù)框架開(kāi)發(fā)的AI作畫(huà)工具,部署在谷歌Colab(一個(gè)可以通過(guò)瀏覽器編寫(xiě)和執(zhí)行代碼的線上托管平臺(tái))上,訓(xùn)練畫(huà)作所需的算力也由谷歌免費(fèi)提供,而只需要修改代碼中的一個(gè)部分的文字描述,就能生成畫(huà)作:
文字描述擁有畫(huà)種描述、內(nèi)容描述、畫(huà)家描述、參考渲染方式、顏色描述五個(gè)維度,用戶不用修改代碼,而是只要從這幾個(gè)方面進(jìn)行調(diào)整和修改,就可以生成圖像。
不過(guò),鑒于是初玩,阿文只謹(jǐn)慎地修改了默認(rèn)文本中的兩個(gè)關(guān)鍵詞:A beautiful painting of a starry night(原singular lighthouse), shining its light across asunflower sea(原tumultuous sea)by greg rutkowski and thomas kinkade, Trending on artstation.” "yellow color scheme“,也就是將默認(rèn)的”一座在驚濤駭浪中閃耀的奇異燈塔”改成了“一片在星空下閃耀的向日葵花海”。
而AI吐出的第一張圖片是這樣的:
圖源:Simon_阿文 微博
這是一張超乎了阿文想象的畫(huà)作,色彩、構(gòu)圖都擁有超絕的美感和想象力。
而Disco Diffusion本身可以根據(jù)一句描述產(chǎn)出多張不同的圖片,于是,阿文在無(wú)比期待中,迎來(lái)了掛機(jī)渲染之后的另外幾幅作品:
圖源:Simon_阿文 微博
簡(jiǎn)單的文字描述外加一點(diǎn)點(diǎn)天賜般的運(yùn)氣,誕生了數(shù)張色彩構(gòu)圖豐富大膽,如同夢(mèng)境般的畫(huà)作,最終一舉出圈,在微博超過(guò)兩萬(wàn)人轉(zhuǎn)發(fā),并紛紛表示震驚“給跪”。
也因此,大批用戶紛紛涌入,開(kāi)啟了腦洞大開(kāi)的AI花式作畫(huà)。
有將參考畫(huà)師改為吳冠中,直接得到一張水墨畫(huà):
圖源:網(wǎng)絡(luò)
還有應(yīng)用了虛幻引擎風(fēng)格,生成的仿佛游戲頁(yè)面一樣的畫(huà)作:
圖源:網(wǎng)絡(luò)
當(dāng)然,偶爾也會(huì)有人喂出了一些有些詭異的圖片:
圖源:推特Mike Franchina
......
在那之后,阿文也試用了另一款叫做Midjourney的工具,同樣是“星空下的向日葵海“的描述,不過(guò)這次的生成結(jié)果則恰如其分地落在了他的想象力內(nèi):
圖源:Simon_阿文 微博
“就像是一個(gè)聽(tīng)話版的Disco Diffusion。”阿文笑道。
在嘗試多次后,他覺(jué)得Midjourney的想象力是比不上Disco Diffusion的,但好處是速度夠快,五分鐘就能成圖,而且不至于像Disco Diffusion那樣,有搶奪創(chuàng)作主導(dǎo)權(quán)的“野心”,是更適合藝術(shù)創(chuàng)作者的輔助工具。
還有更多像阿文這樣的藝術(shù)創(chuàng)作者,走上了探索AI繪畫(huà)工具的道路,并開(kāi)始逐步挖掘各自的潛力。
比如主陣地是移動(dòng)端的Dream,它的整體作畫(huà)風(fēng)格更偏向于夢(mèng)幻柔和:
圖源:網(wǎng)絡(luò)
而諸如DALL·E2、Imagen之類(lèi)的畫(huà)手,則是在如何更準(zhǔn)確地理解文字描述、更好地組合繪畫(huà)風(fēng)格,最后生成更精確而言之有物的事物和人物的方向努力。
當(dāng)然,除了這些從無(wú)到有的“高端創(chuàng)作者”,近幾年也火過(guò)一批更加親民的AI畫(huà)手們。
比如在去年一度火爆外網(wǎng)AnimeGAN,可以實(shí)時(shí)地將人像轉(zhuǎn)為漫畫(huà)模樣,也是在線部署,火到要排隊(duì)幾個(gè)小時(shí)才能玩到:
圖源:網(wǎng)絡(luò)
去年在日推被瘋轉(zhuǎn)的AI,簡(jiǎn)陋的草圖一經(jīng)它手就會(huì)變成精致可愛(ài)的二次元萌妹:
圖源:高坂 推特視頻
還有可以任意推斷兩張人物圖像的子世代長(zhǎng)相的Artbreeder,不僅幾秒就能出圖,還可以通過(guò)超多參數(shù)微調(diào)產(chǎn)出人物的長(zhǎng)相:
圖源:網(wǎng)絡(luò)
再出圈一點(diǎn),抖音、微信或QQ中的將人物照片轉(zhuǎn)變?yōu)槠渌L(fēng)格的AI濾鏡,也能被算進(jìn)AI作畫(huà)的范疇里。
這樣看來(lái),AI畫(huà)手們作畫(huà)內(nèi)容的范圍覆蓋之廣,比起一些人類(lèi)畫(huà)手也是不遑多讓。
其屢屢出圈的熱度,更證明了在普通觀眾眼中,AI的畫(huà)作們有著足夠的沖擊力和觀賞價(jià)值。
···
接下來(lái),讓我們換一個(gè)角度來(lái)看AI繪畫(huà)。一張成品畫(huà)作由什么組成?在現(xiàn)實(shí)中是紙張和各種材料制成的筆墨水彩,而儲(chǔ)存在電子設(shè)備中的一張圖像,本質(zhì)上則是一個(gè)像素點(diǎn)矩陣,每個(gè)都由 RGB(Red、Green、Blue)三個(gè)顏色通道組成。
圖源:網(wǎng)絡(luò)
因此,AI繪畫(huà)也就相當(dāng)于一個(gè)可以逐漸產(chǎn)生像素,進(jìn)行圖像生成的計(jì)算機(jī)模型。
模型是人工智能中的一個(gè)概念,我們可以將其通俗地理解為一種從輸入到輸出的函數(shù)。
要讓這個(gè)函數(shù)輸出我們期待的像素點(diǎn)矩陣,首先需要賦予它很多“參數(shù)”,相當(dāng)于函數(shù)中的變量,這些變量涉及繪畫(huà)中每一筆的位置、形狀、顏色,甚至是覆蓋關(guān)系、筆觸組合等多個(gè)屬性。
有了這樣一個(gè)擁有龐大“變量”的“函數(shù)”,還要再基于海量的已有圖像進(jìn)行訓(xùn)練,也就是找到效果最好,最合適的一組參數(shù)的過(guò)程。
而這樣一個(gè)繪畫(huà)模型所需的參數(shù)量和訓(xùn)練數(shù)據(jù)集非常龐大,不僅如此,也很難讓計(jì)算機(jī)去理解“創(chuàng)作”這種比較抽象的概念。
因此,誕生之初的AI作畫(huà),說(shuō)是依照邏輯執(zhí)行任務(wù)也并無(wú)不妥。
轉(zhuǎn)機(jī)則發(fā)生在2014年。
這一年,一位名叫Ian Goodfellow的AI從業(yè)者發(fā)明了一種叫做對(duì)抗生成網(wǎng)絡(luò)(Generative Adversarial Network,簡(jiǎn)稱(chēng)GAN)的算法,徹底改變了圖像領(lǐng)域。
圖源:論文
對(duì)抗生成網(wǎng)絡(luò)主要包含兩個(gè)結(jié)構(gòu),一個(gè)是生成器(Generator),一個(gè)是判別器(Discriminator),而其核心思想則是“對(duì)抗博弈”,我們可以感性地將其理解為“道高一尺,魔高一丈”。
什么意思?生成器的主要任務(wù)是生成盡可能真實(shí)的圖像,而判別器則負(fù)責(zé)辨別眼前的圖像到底是有機(jī)器生成的,還是來(lái)源于真實(shí)世界的圖片,這樣,生成器在圖片生成的過(guò)程中“造假”技術(shù)變得越來(lái)越強(qiáng),而判別器的“打假“技術(shù)也將越來(lái)越精湛,在這雙方的對(duì)抗博弈之中,最終產(chǎn)出的圖片也將越來(lái)越真實(shí)。
對(duì)抗生成網(wǎng)絡(luò)提出的兩年內(nèi),圖像生成任務(wù)有了大跨步的發(fā)展,一些有趣的應(yīng)用,如老照片修復(fù)、換臉、素描上色,更是如雨后春筍一般應(yīng)運(yùn)而生。
我們上面所提到的Artbreeder、草圖生成頭像等從已有圖片合成新圖片的應(yīng)用,也是在此之后開(kāi)始有了萌芽。
而在2016年,Scott Reed等AI研究者又首次提出了基于GAN的文本生成圖像(Text to Image)。
圖源:論文
就像人類(lèi)擁有五感一樣,AI也有自己聽(tīng)覺(jué)和視覺(jué),也就是AI研究者們劃分出來(lái)的計(jì)算機(jī)視覺(jué)(Computer Vision,簡(jiǎn)稱(chēng)CV)、自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP)、語(yǔ)音識(shí)別(Automatic Speech Recognition,簡(jiǎn)稱(chēng)ASR)等研究領(lǐng)域。
而文本生成圖像,則是將計(jì)算機(jī)視覺(jué)的自然語(yǔ)言處理兩種領(lǐng)域連接了起來(lái),也被稱(chēng)為多模態(tài)學(xué)習(xí)(MultiModal Learning),可以說(shuō),這種技術(shù)是今天AI繪畫(huà)的重要基礎(chǔ)。
但要讓AI學(xué)會(huì)”通感“,難度也可想而知,一開(kāi)始,AI只能在受限的數(shù)據(jù)集內(nèi)取得成果,得到的分辨率也不高,同時(shí),AI也受限于機(jī)器對(duì)于人類(lèi)自然語(yǔ)言的理解,因此,文本生成圖像的進(jìn)展并不迅速。
直到2021年1月5日,DALL·E模型橫空出世。
圖源:OpenAI官網(wǎng)
模型的出生地,OpenAI實(shí)驗(yàn)室是全世界最著名的AI實(shí)驗(yàn)室之一,2015年底成立,同為特斯拉、SpaceX,以及推特等多家公司掌權(quán)人的AI產(chǎn)業(yè)界頂流馬斯克,就是這家實(shí)驗(yàn)室的創(chuàng)始人之一。
而模型的名字DALL·E取自超現(xiàn)實(shí)主義藝術(shù)家薩爾瓦多·達(dá)利(Salvador Dali)和皮克斯機(jī)器人WALLE,可以從文字說(shuō)明直接生成圖像。
DALL·E對(duì)圖像生成領(lǐng)域投下了一記重磅炸彈,圈內(nèi)諸多大佬轉(zhuǎn)發(fā)點(diǎn)贊,其本身更是被稱(chēng)為2021年第一個(gè)令人興奮的AI技術(shù)突破,甚至被譽(yù)為幾乎實(shí)現(xiàn)了類(lèi)人智力的模型。
究其原因,則是因?yàn)樗谖谋旧蓤D像上的驚人表現(xiàn)。
基于同在OpenAI開(kāi)發(fā)的模型,也就是擁有1750億的巨量參數(shù),截至現(xiàn)在仍是業(yè)界公認(rèn)最強(qiáng)的語(yǔ)言模型GPT3,DALL·E在語(yǔ)言理解上的能力有了一個(gè)驚人的提升——
能夠創(chuàng)建擬人化(即類(lèi)人)的動(dòng)物和對(duì)象:
圖源:OpenAI官網(wǎng) 穿著芭蕾裙遛狗的小白蘿卜插畫(huà)
能將某些對(duì)象或概念合并至單個(gè)圖像中:
圖源:OpenAI官網(wǎng) 由豎琴制成的蝸牛,帶有豎琴紋理的蝸牛
還能補(bǔ)全圖像的缺失部分、控制場(chǎng)景的視點(diǎn)和渲染場(chǎng)景的3D樣式、將某個(gè)對(duì)象的內(nèi)部和外部結(jié)構(gòu)全部都”想象出來(lái)“。
其實(shí),OpenAI同天還推出了一款叫做CLIP的技術(shù)框架,這一款能將文本與圖像聯(lián)系起來(lái)的特殊的”圖像識(shí)別“,與一般的通過(guò)自行車(chē)、蘋(píng)果等確定單詞識(shí)別圖像不同,它是通過(guò)一段文字描述來(lái)識(shí)別圖像的。
圖源:OpenAI官網(wǎng)
以這兩款技術(shù)的誕生為標(biāo)志性事件,語(yǔ)言理解和圖像生成任務(wù)多年來(lái)的技術(shù)積累,以”AI作畫(huà)“為載體,開(kāi)始集中爆發(fā)。
2012年底,基于類(lèi)別引導(dǎo)的擴(kuò)散模型(Guided Diffusion)出現(xiàn),再結(jié)合CLIP,一并組成了上文中提到的火爆全網(wǎng)的Disco Diffusion背后的核心技術(shù)。
準(zhǔn)確地說(shuō),Disco Diffusion會(huì)先通過(guò)圖像擴(kuò)散模型(Diffusion Model),對(duì)現(xiàn)有的生成圖像進(jìn)行一次又一次的”去噪“,也就是減少圖像生成中的干擾部分,使其變得越來(lái)越清晰的一個(gè)過(guò)程,反復(fù)進(jìn)行這個(gè)過(guò)程就被稱(chēng)為”迭代“。
而在每次迭代時(shí),CLIP則負(fù)責(zé)利用其圖像識(shí)別技術(shù),依據(jù)文本提示對(duì)現(xiàn)有的圖像擴(kuò)散模型進(jìn)行評(píng)估,并為其提供下次迭代的”方向“,這樣,生成的圖像也就會(huì)和文本提示的匹配度越來(lái)越高,圖像的精細(xì)度也會(huì)逐漸增加。
圖源:網(wǎng)絡(luò)
就這樣,CLIP負(fù)責(zé)從文本特征映射到圖像特征,然后指導(dǎo)一個(gè)生成對(duì)抗網(wǎng)絡(luò)或擴(kuò)散模型生成圖像,自此之后就成為了文本生成圖像的一種基本”套路“。
這還沒(méi)完,今年4月份,OpenAI對(duì)DALL·E做了升級(jí),推出了更高分辨率、更低延遲的DALL·E2:
圖源:OpenAI官網(wǎng)
這一技術(shù)架構(gòu)已經(jīng)脫離了簡(jiǎn)單的素材拼接,而是確實(shí)理解了許多抽象概念——比如空間、光照,甚至是對(duì)現(xiàn)實(shí)中不存在的圖像的想象:
圖源:OpenAI官網(wǎng) 宇航員在太空中騎著一匹馬
但文本到圖像領(lǐng)域的SOTA(State Of The Art,指在特定任務(wù)中目前表現(xiàn)最好的方法或模型)才被OpenAI保留了一個(gè)月,谷歌就站了出來(lái)——
5月24日,谷歌大腦研究團(tuán)隊(duì)推出了Imagen模型,使得機(jī)器的想象力又到達(dá)了一個(gè)新的高度。
在論文中,Imagen與其他圖像生成模型都在目前最有影響力的計(jì)算機(jī)視覺(jué)數(shù)據(jù)集之一的COCO上進(jìn)行測(cè)試,與DALL·E,DALL·E2,GLIDE等同領(lǐng)域模型對(duì)比,Imagen生成的圖像與真實(shí)圖像的差別是最小的。隨著一個(gè)又一個(gè)革命性的技術(shù)框架出現(xiàn),一個(gè)又一個(gè)具有影響力的科研團(tuán)隊(duì)進(jìn)入賽道,AI作畫(huà)開(kāi)始從粗糙走向?qū)I(yè)。從AI的隨機(jī)組合游戲,到理解文本描述開(kāi)始”想象“,AI是真的一步一步拿起了畫(huà)筆。
···
"我認(rèn)為今年就是AI繪畫(huà)元年。"
PPT設(shè)計(jì)師阿文這樣表示。
數(shù)量井噴,技術(shù)迭代速度極快的AI繪畫(huà)工具,不僅熱度出圈,身邊的藝術(shù)設(shè)計(jì)、繪畫(huà)等領(lǐng)域的很多專(zhuān)業(yè)畫(huà)手們也紛紛給予了非常積極和正面的評(píng)價(jià)。
尤其是其所展現(xiàn)的“想象力”,幾乎是將手伸到了人類(lèi)認(rèn)為只有自己才能做到的領(lǐng)域,背靠網(wǎng)絡(luò)上現(xiàn)存的所有圖像庫(kù),再加上驚人的識(shí)別能力和融合速度,AI總是能在極短的時(shí)間內(nèi)產(chǎn)出各種匪夷所思的繪畫(huà)思路和結(jié)果。
于是,這樣一個(gè)觀點(diǎn)逐漸在焦慮中成為了一種主流:
AI畫(huà)手會(huì)不會(huì)代替掉一些中低端畫(huà)手?
對(duì)于這個(gè)問(wèn)題,阿文給出了否定的回答:
”即使是現(xiàn)在大熱的Disco Diffusion和DALLE·E,也沒(méi)有投入到生產(chǎn)項(xiàng)目當(dāng)中,因此最多接觸到這些工具的人群,依然還是圈內(nèi)的設(shè)計(jì)師們,所做的也都是前沿的嘗試,還沒(méi)有到產(chǎn)品商業(yè)化的地步。“
而且更重要的一點(diǎn)是,現(xiàn)在的AI畫(huà)手對(duì)于真正的甲方來(lái)說(shuō),還不夠”聽(tīng)話“。
比如,就當(dāng)下的AI繪畫(huà)來(lái)說(shuō),“關(guān)鍵詞”極其重要,如何編寫(xiě)結(jié)構(gòu)合理,語(yǔ)句優(yōu)美的英文描述句,以便于AI充分識(shí)別和理解,這是出畫(huà)的核心。
對(duì)關(guān)鍵詞的極高要求,使得AI作畫(huà)并不能像很多人類(lèi)畫(huà)手那樣”指哪打哪“,尤其是在面對(duì)一些莫測(cè)難尋的甲方需求時(shí),就顯得更呆了。
圖源:Simon_阿文 微博 與友人的吐槽
并且,關(guān)鍵詞稍有不慎,人工智能就可能不再智能。
比如像這張畫(huà),將動(dòng)畫(huà)大師”宮崎駿“加入描述詞后,AI直接將老人家的頭像生硬拼湊到了畫(huà)面中:
圖源:網(wǎng)絡(luò)
這也是AI繪畫(huà)廣為人詬病的另一點(diǎn):在具象內(nèi)容,尤其是人物生成上的能力偏弱。看似沖擊力十足卻缺乏邏輯和細(xì)節(jié)的畫(huà)面,沒(méi)有哦內(nèi)核的概念拼湊......還有更多問(wèn)題,都使得AI作畫(huà)不可能百分之百地展現(xiàn)完美的效果。
圖源:網(wǎng)絡(luò) wombo生成的沒(méi)有意義的色塊拼接
因此,至少對(duì)現(xiàn)在的AI繪畫(huà)工具來(lái)說(shuō),人類(lèi)畫(huà)手后期的調(diào)整和加工必不可少。
并且,技術(shù)較為前沿,且需要一定藝術(shù)知識(shí)的AI作畫(huà)工具,最先接觸與最熟悉的第一批用戶,一定也都是畫(huà)手和設(shè)計(jì)師,即產(chǎn)業(yè)中的乙方。而且越到后期,AI工具就越需要關(guān)鍵詞輸入之外的更多知識(shí),比如具體到代碼層面的參數(shù)調(diào)整。因此,即使是走到了產(chǎn)業(yè)化的一步,甲方首先接觸到的,也更有可能是”會(huì)使用AI的乙方“,而并非AI本身。
作為”會(huì)使用AI的乙方“的阿文,還提出了另一種觀點(diǎn):
AI繪畫(huà)的出現(xiàn),反倒會(huì)讓很多畫(huà)手有了新的契機(jī),能夠借助AI工具成為高端畫(huà)師。
畫(huà)工、想象力、底圖、靈感......諸多不足都可以由AI繪畫(huà)工具來(lái)補(bǔ)足,只要在這些圖的基礎(chǔ)上進(jìn)行二次創(chuàng)作,就很有可能夠到更高的門(mén)檻。
阿文現(xiàn)在就在努力將AI繪畫(huà)工具納入自己的工作流程中,比如他在微博就展示過(guò)這么一個(gè)例子:首先用Disco Diffusion生成相應(yīng)的紋理,然后再到三維建模工具blender里貼圖,最后再搭場(chǎng)景:
圖源:Simon_阿文 微博
至于版權(quán)問(wèn)題,阿文表示,AI作畫(huà)工具在使用時(shí),確實(shí)有通過(guò)描述詞進(jìn)行了“畫(huà)風(fēng)抄襲”的可能性,因此他建議,盡量使用已經(jīng)過(guò)世的藝術(shù)家的風(fēng)格,如果使用了某位風(fēng)格鮮明的當(dāng)代藝術(shù)家作為關(guān)鍵詞,或者使用了某部商業(yè)作品作為參考畫(huà)作時(shí),還是盡量避免商用。
不過(guò)他也提到,比如Disco Diffusion并不是所謂的描圖、素材拼接或組裝,而是依據(jù)技術(shù)框架對(duì)圖像進(jìn)行了規(guī)律和技法的提煉,然后再進(jìn)行模仿,所以“畫(huà)風(fēng)抄襲”的風(fēng)險(xiǎn)不是很大。
另外,Disco Diffusion現(xiàn)在的所有代碼已經(jīng)開(kāi)源,且遵循MIT開(kāi)源協(xié)議,也就是別人可以進(jìn)行閉源修改代碼,且無(wú)須經(jīng)過(guò)版權(quán)說(shuō)明,就能復(fù)制甚至銷(xiāo)售衍生的產(chǎn)物:
圖源:阮一峰博客
至于一些二次元頭像生成器,阿文則開(kāi)玩笑地表示“技術(shù)不到家,抄得還不夠像”,因此甚至都到不了“畫(huà)風(fēng)抄襲”的地步。
···
然而,上述解答依舊不能讓所有人安下心來(lái)。
在更深層次的思考中,有人擔(dān)心AI是否會(huì)殺死繪畫(huà)的意義,就像當(dāng)年的攝影技術(shù)之于寫(xiě)實(shí)繪畫(huà),或者像今天的AI之于圍棋。
攝影技術(shù)誕生于兩百年之前,一經(jīng)應(yīng)用便迅速取代了繪畫(huà)的記錄留影功能,一度使得諸多傳統(tǒng)畫(huà)家認(rèn)為繪畫(huà)將在攝影技術(shù)下的逼迫下逐漸消亡。
而AI進(jìn)入圍棋則始于2014年的AlphaGo,在人工智能那幾乎是無(wú)法超越的計(jì)算能力下,多國(guó)的圍棋黑馬和明宿皆被一一斬于馬下。
“但是攝影之于繪畫(huà)藝術(shù),其實(shí)并沒(méi)有嚴(yán)重到‘摧毀’的地步。”
阿文解釋道。
當(dāng)時(shí)的繪畫(huà)看似在攝影的“逼迫”下失去了其實(shí)用價(jià)值,轉(zhuǎn)為了純粹的藝術(shù)領(lǐng)域,但實(shí)際上,攝影在視覺(jué)經(jīng)驗(yàn)上的真實(shí)性,使得很多畫(huà)家開(kāi)始更多地關(guān)注繪畫(huà)本身的特質(zhì),試圖以繪畫(huà)對(duì)現(xiàn)實(shí)乃至精神世界進(jìn)行更豐富的演繹,后印象派、野獸派等新興流派就是因此得而誕生。
而到了今天,攝影不僅有最實(shí)用的記錄功能,自身也是一門(mén)獨(dú)立的藝術(shù)學(xué)科,有著構(gòu)圖和色彩領(lǐng)域的只是體系;而繪畫(huà)在藝術(shù)性不失的同時(shí),留影功能也開(kāi)始逐漸復(fù)蘇,甚至因?yàn)槠洫?dú)特的筆觸帶來(lái)了更多美的享受。
而類(lèi)比到AI繪畫(huà)上來(lái)也一樣,這無(wú)疑是對(duì)于現(xiàn)在繪畫(huà)的一種沖擊,但新老技術(shù)之間并非你死我活的競(jìng)爭(zhēng)關(guān)系,而是相互融合,共同進(jìn)化發(fā)展的一種趨勢(shì)。
那么AI圍棋的到來(lái)呢?
柯潔曾評(píng)價(jià)AI時(shí)代的圍棋為“無(wú)聊透頂,使人類(lèi)棋手喪失了存在的意義”,在諸多的AI大戰(zhàn)人類(lèi)棋手,AI預(yù)測(cè)圍棋勝率的事件中,已經(jīng)有觀眾開(kāi)始對(duì)這種戲碼失去興趣:
圖源:網(wǎng)絡(luò)
因此,有不少人便也覺(jué)得,AI繪畫(huà)會(huì)像AI圍棋一樣,逐步殺死繪畫(huà)的意義。
一位畫(huà)師在談?wù)撨@一話題時(shí),表達(dá)了如下觀點(diǎn):
“我覺(jué)得藝術(shù)創(chuàng)作很多時(shí)候是基于藝術(shù)家較獨(dú)一無(wú)二的性格、境遇、或者一閃而過(guò)的某種激情,是為了抒發(fā)自我,表達(dá)內(nèi)心的感情而存在的。但AI只是基于圖像庫(kù)去分析并重組,并沒(méi)有任何目的和情緒,所以實(shí)在難以稱(chēng)得上是‘具有靈魂’。”
但具有靈魂,產(chǎn)生共鳴,一定是要了解作者背后的情緒嗎?
阿文舉了一個(gè)這樣的例子:當(dāng)你走進(jìn)一個(gè)美術(shù)館,看到一幅畫(huà),然后被打動(dòng)了,很多時(shí)候你可能不知道背后的作者是誰(shuí),要抒發(fā)什么樣的感情,但有些畫(huà)作就是能在觀眾看見(jiàn)的瞬間,便與其產(chǎn)生共鳴,而觀眾能產(chǎn)生這樣的感受,這幅畫(huà)作就是有意義的。
而當(dāng)我們?cè)倩剡^(guò)頭,去看那張出圈的“星空下的向日葵海”,到這里,我們已經(jīng)完全知道了這幅畫(huà)作創(chuàng)作的全過(guò)程,及其中的技術(shù)細(xì)節(jié),也知道AI在創(chuàng)作這幅畫(huà)的時(shí)候是不具有任何,或者說(shuō)類(lèi)似人類(lèi)畫(huà)家那樣的情緒。
但翻開(kāi)這幅作品的評(píng)論和轉(zhuǎn)發(fā),即使知道這是AI,依然覺(jué)得“充滿意境”“浪漫無(wú)比”“有被感動(dòng)到”的評(píng)論數(shù)不勝數(shù)。
“就像是AI在賽博朋克時(shí)代夢(mèng)到了梵高。”
AI繪畫(huà)背后的技術(shù)仍在快速迭代,產(chǎn)出的畫(huà)作越來(lái)越多,而關(guān)于其產(chǎn)出作品有無(wú)意義的爭(zhēng)論,在可預(yù)見(jiàn)的未來(lái)仍將繼續(xù)。
AI繪畫(huà)的終點(diǎn)是什么?是成為人類(lèi)畫(huà)手最完美的繪畫(huà)輔助者,還是一步一步補(bǔ)足其邏輯性、想象力、創(chuàng)造力,成為一名真正可以與人類(lèi)并肩的畫(huà)手?
我們現(xiàn)在也只能站在星空下的向日葵海中,靜靜等待那個(gè)答案的到來(lái)了。采寫(xiě):南都見(jiàn)習(xí)記者楊博雯
拓展知識(shí):
- NIGAO集成灶售后服務(wù)電話10-23
- 1麻將機(jī)故障代碼-3(如何解決常見(jiàn)問(wèn)題)。
- 2洗碗機(jī)故障代碼大全(如何識(shí)別和解決常見(jiàn)問(wèn)題)。
- 3pt32700Y板壞怎么維修(維修pt32700Y板壞問(wèn)題)
- 4洗衣離合器維修(如何自行檢修并解決故障)。
- 5羅曼斯指紋鎖維修電話(羅曼斯指紋鎖維修電話)
- 6海信遙控器壞了怎么修(快速修復(fù):如何解決海信遙控器故障?)
- 7空夢(mèng)保險(xiǎn)柜廠家電話(空夢(mèng)保險(xiǎn)柜廠家電話:一鍵咨詢,安全可靠)
- 8康佳14時(shí)電視機(jī)故障(康佳14時(shí)電視機(jī)故障分析)
- 9熱水器e3錯(cuò)誤代碼(熱水器E3錯(cuò)誤代碼:解析與排除指南)
- 10空調(diào)外機(jī)5根電線怎么接線圖(詳細(xì)圖解步驟)
-
洗衣機(jī)馬達(dá)怎么試(洗衣機(jī)馬達(dá)測(cè)試方法)
2025-06-07
-
合肥高新區(qū)燃?xì)庠钣蜔煓C(jī)維修(如何自行解決常見(jiàn)故障)
2025-06-07
-
貝格爾空氣源熱泵售后維修電話(貝格爾空氣源熱泵售后維修電話)
2025-06-07


