- +1
AI繪圖到底是天才畫手,還是潘多拉魔盒?
原創(chuàng) 分享生活的靈感 Voicer
汽車在紐約上空飛行、中世紀(jì)居民頭戴VR眼鏡、宇航員在火星表面跳街舞、大衛(wèi)雕塑愛打碟、古埃及的動物壁畫玩電腦……歡迎來到AI繪圖的世界!輸入文字就能得到你想要的任何畫面,無論多么荒誕無理的要求,無論定制Edward Hopper畫風(fēng)還是寶麗來膠片,AI都能“使命必達(dá)”。
聽上去如此夢幻的跨時代工具,似乎是下一波新技術(shù)浪潮的抬頭,2022也被稱為“AI繪圖元年”。但是它就像任何一項(xiàng)新技術(shù)一樣,難免伴隨爭議:究竟是開啟了一個全新繪畫時代,還是打開了潘多拉魔盒?無論你做何感想,AI繪圖時代已經(jīng)不可逆轉(zhuǎn)地到來。
??
!ATTENTION!
以下圖片純屬AI虛構(gòu)
如有雷同,純屬巧合
● “一個人坐在辦公室隔間里,用鍵盤打字,壓力重重的樣子 - 文藝復(fù)興繪畫風(fēng)格”
● “金毛尋回犬小狗坐在小餐館里喝咖啡,看起來很憂郁 - Edward Hopper風(fēng)格”
● “戰(zhàn)斗中戴著士兵頭盔的貓貓?zhí)貙?- 二戰(zhàn)歷史攝影風(fēng)格,黑白”
● “一張非常細(xì)節(jié)、復(fù)古、顆粒感的紐約市汽車飛行照片(1936 年)”
● “宇航員b-boy組合在火星上表演 - 寶麗來風(fēng)格”
● “用柯達(dá)專業(yè)Portra 400膠卷拍攝的外星人肖像 - 由Annie Leibovitz掌鏡”
● “米開朗基羅的大衛(wèi)雕塑正戴著耳機(jī)打碟”
● “在太空邊緣奔跑,奔向星球,平靜,抵達(dá)深淵 - 數(shù)字藝術(shù)風(fēng)格”以上這些畫面都來自今年最熱門的AI繪圖平臺DALL·E 2(ig:@openaidalle),AI制作它們的時間,可能不到一分鐘。
不管是照片還是繪畫,你想到什么,AI就能呈現(xiàn)什么。真有那么神奇嗎?今天我們就先從DALL·E 2聊起。
創(chuàng)造奇跡的DALL·E 2
到底是何方神圣?
● DALL·E logo作為AI繪圖的大勢平臺,DALL-E 2的火爆常常讓人忘記這個程序今年4月才剛剛推出。
初代DALL-E誕生于去年,在此基礎(chǔ)上進(jìn)行了升級的DALL-E 2圖像分辨率更高,對指令的理解也更準(zhǔn)確。

● 輸入“日出時狐貍坐在田野上的畫作,莫奈風(fēng)格”,左右分別為第一代和第二代AI交出的作業(yè)“DALL-E”的名字來自《機(jī)器人總動員》中的機(jī)器人瓦力(WALL-E)和超現(xiàn)實(shí)主義畫家達(dá)利(Dalí)。它也確實(shí)在功能上兼顧了兩者:一個能制作超現(xiàn)實(shí)主義圖像的機(jī)器人。

● 左:半人半機(jī)器版達(dá)利,右:瓦力版蒙娜麗莎,都由DALL·E 2繪制在DALL-E 2宇宙里,腦洞有多大,世界就有多大。
你只需要給它一些描述語,包括畫面內(nèi)容、參考畫風(fēng)/畫家、形式(攝影/繪畫/雕塑)、工具(xx膠卷/鏡頭),剩下的就全部交給它。
● “古埃及壁畫上的動物神明正在使用計算機(jī)”


● “數(shù)千個星系的超深場天文學(xué)照片”?靈感來自韋伯望遠(yuǎn)鏡拍下的圖像比如說,可以畫成什么樣?DALL·E 2官網(wǎng)給出了兩組詞條:
A組詞條描述行為:
“像狂熱科學(xué)家一樣混合化學(xué)物質(zhì)”
“購買雜貨”
“從事AI研究?”
B組詞條描述風(fēng)格/狀態(tài):
“兒童蠟筆藝術(shù)?”
“1980年代在月球上”
“和90年代科技產(chǎn)品一起待在水下”
“浮世繪風(fēng)格”
……
把A組和B組連詞成句,就能得到以下這些奇妙結(jié)果。








●不過,DALL·E 2不僅會創(chuàng)造圖像這么簡單,還可以在現(xiàn)成圖片上施展魔法。它能在照片里加入任何元素,并對陰影、反射和紋理進(jìn)行細(xì)致處理,讓新照片毫無違和感。
比如,我們要求DALL·E 2在美術(shù)館照片上加一只柯基,并要求它分別出現(xiàn)在二次元畫作上和三次元展館里,AI就會自動計算柯基應(yīng)該出現(xiàn)的樣子。



● 在照片的1??2??3??位置分別加入柯基會是什么效果?當(dāng)然你也可以丟給DALL·E 2一張畫作,讓它以此為靈感去創(chuàng)作,《戴珍珠耳環(huán)的少女》從此便有了多個模樣。








● DALL·E 2版《戴珍珠的少女》
● 給蒙娜麗莎換個莫西干頭發(fā)型,或是狗狗換小貓,都不在話下DALL·E 2究竟是如何工作的?
OpenAI曾對此做過視頻解釋。和大多數(shù)AI一樣,DALL·E 2的根本原理是算法。通過深度學(xué)習(xí)大數(shù)據(jù),從而掌握內(nèi)在邏輯。運(yùn)用在繪圖領(lǐng)域的話,就是對海量的主題圖片作歸類總結(jié)。
比如成千上萬的“考拉”圖片構(gòu)成一個網(wǎng)絡(luò),而“摩托車”圖片則是毫不相干的另一個。當(dāng)用戶輸入“考拉騎摩托車”時,AI就把這兩個網(wǎng)絡(luò)交叉組合,并從中選出符合要求的圖片。


● 如果對DALL·E 2生成的結(jié)果不滿意,用戶可以進(jìn)行修改,這些修改也在不斷幫助DALL·E 2變得更準(zhǔn)確AI繪畫正在占領(lǐng)賽博世界
● “機(jī)器人夢見電子羊”(cr:Sam Altman)看到這里,如果你已經(jīng)迫不及待要上手感受下DALL·E 2,那么很遺憾:DALL·E 2目前并未對大眾開放。雖然可以申請加入waitlist,但大多情況下你只能拿著愛的號碼牌,陷入無盡的等候。
遠(yuǎn)水解不了近渴。一款與DALL·E 2極為相似、且對公眾開放的免費(fèi)工具DALL-E mini引起了大家的興趣。
它與DALL·E 2并無直接關(guān)系(現(xiàn)已改名Crayon),功能卻基本一致。只要提交描述,它就能在極短時間內(nèi)生成圖片——雖然質(zhì)感與DALL·E 2存在肉眼可見的差距,但是對于圖個新鮮的網(wǎng)友們來說已經(jīng)足夠。
● “泳池派對的黑客”(cr:weirddalle)
● “當(dāng)黑武士遇見pingu”(cr:weirddalle)
● “腹語人偶版扎克伯格”(cr:weirddalle)對于更“資深”一點(diǎn)的玩家來說,AI繪畫工具早已是任君挑選。除了DALL·E 2,如今受到關(guān)注的AI工具還包括:Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。
這些工具使用起來難易程度不一,比如CogView是國內(nèi)團(tuán)隊(duì)開發(fā)的AI工具,僅支持中文搜索。而Disco Diffusion充滿代碼的界面略為趕客,需要跟著教程一步步操作。
我們也玩了一把!
在AI繪圖app“dream by wombo”(可免費(fèi)下載)上,我們試著以“voicer”為關(guān)鍵詞,分別生成了“吉卜力”“蒸汽朋克”“浮世繪”“達(dá)利”風(fēng)格的圖片。



● 你最中意哪個?當(dāng)然最終效果也大多與AI工具的操作難易程度成正比。CogView生成的圖片多少帶點(diǎn)AI痕跡,而Disco Diffusion的玩家社區(qū),早已成為浪漫想象力與美術(shù)功底的競技場。
這些原本就是高超畫手的用戶們,與Disco Diffusion不斷磨合調(diào)教,創(chuàng)作出無數(shù)難以辨別AI繪畫痕跡的優(yōu)秀作品。
● “Father Time”(cr:@noah__proctor)
● 比起DALL·E 2,Disco Diffusion似乎更擅長描繪恢弘的場景(cr:@discodiffusion)
● Disco Diffusion社區(qū)用戶總結(jié)了在同一描述下,各個畫家的關(guān)鍵詞會生成的不同風(fēng)格,截圖為其中一部分雖然2022被成為“AI繪畫元年”,但“AI繪畫”絕非一個全新概念。
只是在這項(xiàng)技術(shù)發(fā)展早期,人們對此態(tài)度并不樂觀。而當(dāng)時算法也還沒有那么強(qiáng)大,AI的作品停留在學(xué)齡前兒童水平。
● 即便是現(xiàn)在,DALL·E 2還是會生成兩個手掌長在一起這樣視覺錯亂的圖片不過人們對于AI作畫的探索并未就此停止,反而奮勇向前。在互聯(lián)網(wǎng)流行AI作畫之前,實(shí)體AI作畫就已經(jīng)受到不小的關(guān)注。
根據(jù)2018年的報道,當(dāng)年國際機(jī)器人藝術(shù)大賽的獲獎名單里有不少對AI作畫的實(shí)驗(yàn)。
加拿大藝術(shù)家Joanne Hastie制作了由編程控制繪畫的機(jī)械臂;美國藝術(shù)家Pindar Van Arman創(chuàng)造的AI機(jī)器人,可以模仿所給圖片繪畫;泰國機(jī)器人實(shí)驗(yàn)室CMIT Robotics則可以捕捉人類在繪畫時的每一個動作軌跡,機(jī)器人通過精準(zhǔn)復(fù)制動作,從而完整復(fù)刻人類的畫作。

● Joanne Hastie創(chuàng)造的抽象作品
● 只要人類先畫一遍,CMIT Robotics就能近乎完美地復(fù)刻
● Van Arman的AI機(jī)器人可以根據(jù)動態(tài)熱力圖來調(diào)整作畫而在四年后的今天,AI機(jī)器人作畫顯然又向前邁進(jìn)一大步。在今年威尼斯雙年展上亮相的AI藝術(shù)家“Ai-Da”,是一個擁有機(jī)械臂、外形酷似人類的機(jī)器人。
和街頭畫家一樣,Ai-Da用機(jī)械臂繪制人物肖像,并且配置了和人類對話的智能程序及發(fā)聲器,可以邊作畫邊與繪畫對象攀談。
● Ai-Da和她的自畫像

● Ai-Da的肖像作品
● 世界上第一幅由AI機(jī)器人繪制的英國女王肖像天才畫手還是恐怖黑箱?
● “人們戴著VR眼鏡的中世紀(jì)畫作”,由DALL·E 2生成當(dāng)AI繪畫的實(shí)力越來越強(qiáng)勁,問題也隨之而來:它會替代傳統(tǒng)繪畫嗎?畫手們是否會面臨集體失業(yè)?
有人對此保持樂觀。畢竟雖然AI很強(qiáng)大,但本質(zhì)上還是依賴人類的原創(chuàng)。它沒有獨(dú)立創(chuàng)造某種風(fēng)格的能力,而Edward Hopper有。


● 無論美漫風(fēng)格、數(shù)字藝術(shù)風(fēng)格還是寶麗來,DALL·E 2都是參照人類創(chuàng)造出的現(xiàn)有風(fēng)格也有人對此非常悲觀。雖然高端畫師暫時還不會被取代,但是普通畫手的創(chuàng)作卻可能變得越來越不值錢。
此外,AI繪圖還面臨著更多問題。
一個月前,DALL·E 2發(fā)布了一張AI圖片,描述語為“一個男人舉起雙臂和雙手,用手勢表示‘這么多’”。
● DALL·E 2生成結(jié)果這張生成圖片里的男子,有點(diǎn)像每年蘋果發(fā)布會上的喬布斯,立刻引發(fā)了網(wǎng)友不滿:為什么“一個男人”=“年輕的白人男性”?難道AI世界也奉行白人中心主義嗎?
但是考慮到DALL·E 2的運(yùn)行邏輯,它也許只是這個充滿偏見的世界的縮影。
它的學(xué)習(xí)素材都來自人類的圖片——如果人類的圖片世界本身就充滿偏見和刻板印象,又怎么期待AI能根據(jù)“A man”的描述語生成黃種人或黑人?或者根據(jù)“護(hù)士”的描述語,生成男女比例對等的圖片?
● DALL·E 2生成的“建筑工人”圖片
● DALL·E 2生成的“空乘人員”圖片更嚴(yán)重的問題可能來自法律糾紛。
AI繪圖是否會重蹈AI換臉技術(shù)的覆轍,被用來做一些侵犯他人權(quán)利的事情?如果AI能夠隨意生成他人的照片,那么狗仔們是否從此有了造謠利器,而政客們也有了陷害對手的把柄?
(亞利桑那州立大學(xué)計算機(jī)技術(shù)教授)
圖片版權(quán)是一個更難厘清的問題。關(guān)于AI生成圖片能否商用,各平臺眾口紛紜。通過學(xué)習(xí)他人畫作生成的作品,是否會侵犯到原作者權(quán)益?這給知識產(chǎn)權(quán)領(lǐng)域提出了新的思考。
如果AI繪圖有一天完全成為大眾工具,那么現(xiàn)實(shí)與虛擬的邊界無疑將被進(jìn)一步模糊。


● 網(wǎng)友Aditya Ramesh使用DALL·E 2將維多利亞式房屋改造成現(xiàn)代房屋,把特斯拉變成老爺車,把iPhone變成老式電話200年前攝影技術(shù)誕生時,給繪畫帶來的最大沖擊即是“真實(shí)感”——我們可以不相信繪畫,卻不能不相信一張真實(shí)的照片。然而200年后蓄勢待發(fā)的AI繪圖技術(shù)反其道而行之,進(jìn)一步消解了圖像的真實(shí)性。
等到AI繪圖真的占領(lǐng)互聯(lián)網(wǎng)的那一天,我們還能相信眼睛看到的任何一張圖片嗎?

原標(biāo)題:《AI繪圖到底是天才畫手,還是潘多拉魔盒?》
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




