下載客戶端

登錄

AI繪圖到底是天才畫手，還是潘多拉魔盒？

2022-08-16 07:15

來源：澎湃新聞·澎湃號·湃客

聽全文

原創(chuàng) 分享生活的靈感 Voicer

汽車在紐約上空飛行、中世紀(jì)居民頭戴VR眼鏡、宇航員在火星表面跳街舞、大衛(wèi)雕塑愛打碟、古埃及的動物壁畫玩電腦……歡迎來到AI繪圖的世界！

輸入文字就能得到你想要的任何畫面，無論多么荒誕無理的要求，無論定制Edward Hopper畫風(fēng)還是寶麗來膠片，AI都能“使命必達(dá)”。

聽上去如此夢幻的跨時代工具，似乎是下一波新技術(shù)浪潮的抬頭，2022也被稱為“AI繪圖元年”。但是它就像任何一項(xiàng)新技術(shù)一樣，難免伴隨爭議：究竟是開啟了一個全新繪畫時代，還是打開了潘多拉魔盒？無論你做何感想，AI繪圖時代已經(jīng)不可逆轉(zhuǎn)地到來。

!ATTENTION!

以下圖片純屬AI虛構(gòu)

如有雷同，純屬巧合

● “一個人坐在辦公室隔間里，用鍵盤打字，壓力重重的樣子 - 文藝復(fù)興繪畫風(fēng)格”

● “金毛尋回犬小狗坐在小餐館里喝咖啡，看起來很憂郁 - Edward Hopper風(fēng)格”

● “戰(zhàn)斗中戴著士兵頭盔的貓貓?zhí)貙?- 二戰(zhàn)歷史攝影風(fēng)格，黑白”

● “一張非常細(xì)節(jié)、復(fù)古、顆粒感的紐約市汽車飛行照片（1936 年）”

● “宇航員b-boy組合在火星上表演 - 寶麗來風(fēng)格”

● “用柯達(dá)專業(yè)Portra 400膠卷拍攝的外星人肖像 - 由Annie Leibovitz掌鏡”

● “米開朗基羅的大衛(wèi)雕塑正戴著耳機(jī)打碟”

● “在太空邊緣奔跑，奔向星球，平靜，抵達(dá)深淵 - 數(shù)字藝術(shù)風(fēng)格”

以上這些畫面都來自今年最熱門的AI繪圖平臺DALL·E 2（ig：@openaidalle），AI制作它們的時間，可能不到一分鐘。

不管是照片還是繪畫，你想到什么，AI就能呈現(xiàn)什么。真有那么神奇嗎？今天我們就先從DALL·E 2聊起。

創(chuàng)造奇跡的DALL·E 2

到底是何方神圣？

● DALL·E logo

作為AI繪圖的大勢平臺，DALL-E 2的火爆常常讓人忘記這個程序今年4月才剛剛推出。

初代DALL-E誕生于去年，在此基礎(chǔ)上進(jìn)行了升級的DALL-E 2圖像分辨率更高，對指令的理解也更準(zhǔn)確。

● 輸入“日出時狐貍坐在田野上的畫作，莫奈風(fēng)格”，左右分別為第一代和第二代AI交出的作業(yè)

“DALL-E”的名字來自《機(jī)器人總動員》中的機(jī)器人瓦力（WALL-E）和超現(xiàn)實(shí)主義畫家達(dá)利（Dalí）。它也確實(shí)在功能上兼顧了兩者：一個能制作超現(xiàn)實(shí)主義圖像的機(jī)器人。

● 左：半人半機(jī)器版達(dá)利，右：瓦力版蒙娜麗莎，都由DALL·E 2繪制

在DALL-E 2宇宙里，腦洞有多大，世界就有多大。

你只需要給它一些描述語，包括畫面內(nèi)容、參考畫風(fēng)/畫家、形式（攝影/繪畫/雕塑）、工具（xx膠卷/鏡頭），剩下的就全部交給它。

● “古埃及壁畫上的動物神明正在使用計算機(jī)”

● “數(shù)千個星系的超深場天文學(xué)照片”?靈感來自韋伯望遠(yuǎn)鏡拍下的圖像

比如說，可以畫成什么樣？DALL·E 2官網(wǎng)給出了兩組詞條：

A組詞條描述行為：

“像狂熱科學(xué)家一樣混合化學(xué)物質(zhì)”

“購買雜貨”

“從事AI研究?”

B組詞條描述風(fēng)格/狀態(tài)：

“兒童蠟筆藝術(shù)?”

“1980年代在月球上”

“和90年代科技產(chǎn)品一起待在水下”

“浮世繪風(fēng)格”

……

把A組和B組連詞成句，就能得到以下這些奇妙結(jié)果。

●

不過，DALL·E 2不僅會創(chuàng)造圖像這么簡單，還可以在現(xiàn)成圖片上施展魔法。它能在照片里加入任何元素，并對陰影、反射和紋理進(jìn)行細(xì)致處理，讓新照片毫無違和感。

比如，我們要求DALL·E 2在美術(shù)館照片上加一只柯基，并要求它分別出現(xiàn)在二次元畫作上和三次元展館里，AI就會自動計算柯基應(yīng)該出現(xiàn)的樣子。

● 在照片的1??2??3??位置分別加入柯基會是什么效果？

當(dāng)然你也可以丟給DALL·E 2一張畫作，讓它以此為靈感去創(chuàng)作，《戴珍珠耳環(huán)的少女》從此便有了多個模樣。

● DALL·E 2版《戴珍珠的少女》

● 給蒙娜麗莎換個莫西干頭發(fā)型，或是狗狗換小貓，都不在話下

DALL·E 2究竟是如何工作的？

OpenAI曾對此做過視頻解釋。和大多數(shù)AI一樣，DALL·E 2的根本原理是算法。通過深度學(xué)習(xí)大數(shù)據(jù)，從而掌握內(nèi)在邏輯。運(yùn)用在繪圖領(lǐng)域的話，就是對海量的主題圖片作歸類總結(jié)。

比如成千上萬的“考拉”圖片構(gòu)成一個網(wǎng)絡(luò)，而“摩托車”圖片則是毫不相干的另一個。當(dāng)用戶輸入“考拉騎摩托車”時，AI就把這兩個網(wǎng)絡(luò)交叉組合，并從中選出符合要求的圖片。

● 如果對DALL·E 2生成的結(jié)果不滿意，用戶可以進(jìn)行修改，這些修改也在不斷幫助DALL·E 2變得更準(zhǔn)確

AI繪畫正在占領(lǐng)賽博世界

● “機(jī)器人夢見電子羊”（cr：Sam Altman）

看到這里，如果你已經(jīng)迫不及待要上手感受下DALL·E 2，那么很遺憾：DALL·E 2目前并未對大眾開放。雖然可以申請加入waitlist，但大多情況下你只能拿著愛的號碼牌，陷入無盡的等候。

遠(yuǎn)水解不了近渴。一款與DALL·E 2極為相似、且對公眾開放的免費(fèi)工具DALL-E mini引起了大家的興趣。

它與DALL·E 2并無直接關(guān)系（現(xiàn)已改名Crayon），功能卻基本一致。只要提交描述，它就能在極短時間內(nèi)生成圖片——雖然質(zhì)感與DALL·E 2存在肉眼可見的差距，但是對于圖個新鮮的網(wǎng)友們來說已經(jīng)足夠。

● “泳池派對的黑客”（cr：weirddalle）

● “當(dāng)黑武士遇見pingu”（cr：weirddalle）

● “腹語人偶版扎克伯格”（cr：weirddalle）

對于更“資深”一點(diǎn)的玩家來說，AI繪畫工具早已是任君挑選。除了DALL·E 2，如今受到關(guān)注的AI工具還包括：Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。

這些工具使用起來難易程度不一，比如CogView是國內(nèi)團(tuán)隊(duì)開發(fā)的AI工具，僅支持中文搜索。而Disco Diffusion充滿代碼的界面略為趕客，需要跟著教程一步步操作。

我們也玩了一把！

在AI繪圖app“dream by wombo”（可免費(fèi)下載）上，我們試著以“voicer”為關(guān)鍵詞，分別生成了“吉卜力”“蒸汽朋克”“浮世繪”“達(dá)利”風(fēng)格的圖片。

● 你最中意哪個？

當(dāng)然最終效果也大多與AI工具的操作難易程度成正比。CogView生成的圖片多少帶點(diǎn)AI痕跡，而Disco Diffusion的玩家社區(qū)，早已成為浪漫想象力與美術(shù)功底的競技場。

這些原本就是高超畫手的用戶們，與Disco Diffusion不斷磨合調(diào)教，創(chuàng)作出無數(shù)難以辨別AI繪畫痕跡的優(yōu)秀作品。

● “Father Time”（cr：@noah__proctor）

● 比起DALL·E 2，Disco Diffusion似乎更擅長描繪恢弘的場景（cr：@discodiffusion）

● Disco Diffusion社區(qū)用戶總結(jié)了在同一描述下，各個畫家的關(guān)鍵詞會生成的不同風(fēng)格，截圖為其中一部分

雖然2022被成為“AI繪畫元年”，但“AI繪畫”絕非一個全新概念。

只是在這項(xiàng)技術(shù)發(fā)展早期，人們對此態(tài)度并不樂觀。而當(dāng)時算法也還沒有那么強(qiáng)大，AI的作品停留在學(xué)齡前兒童水平。

● 即便是現(xiàn)在，DALL·E 2還是會生成兩個手掌長在一起這樣視覺錯亂的圖片

不過人們對于AI作畫的探索并未就此停止，反而奮勇向前。在互聯(lián)網(wǎng)流行AI作畫之前，實(shí)體AI作畫就已經(jīng)受到不小的關(guān)注。

根據(jù)2018年的報道，當(dāng)年國際機(jī)器人藝術(shù)大賽的獲獎名單里有不少對AI作畫的實(shí)驗(yàn)。

加拿大藝術(shù)家Joanne Hastie制作了由編程控制繪畫的機(jī)械臂；美國藝術(shù)家Pindar Van Arman創(chuàng)造的AI機(jī)器人，可以模仿所給圖片繪畫；泰國機(jī)器人實(shí)驗(yàn)室CMIT Robotics則可以捕捉人類在繪畫時的每一個動作軌跡，機(jī)器人通過精準(zhǔn)復(fù)制動作，從而完整復(fù)刻人類的畫作。