大家都在用哪个ai绘画(画师们该感到害怕吗)
《不要温和地走进那个良夜》,这首英国诗人狄兰·托马斯写给病危父亲的诗歌,在2022年成为中国美术学院图像与媒体艺术类专业复试的命题创作试题。
长期进行现代诗创作的苏拉用AI绘图工具给出了心目中的答案:星空中温润、细腻的玫瑰色黑洞。苏拉告诉南方周末:“我写诗时最经常做的就是生成不同的意象,经常会结合一些奇怪的词,而AI绘画马上可以把这个世界上从来没有的东西展现出来。”
《不要温和地走进那个良夜》,苏拉用AI创作。 (受访者供图/图)
2022年8月31日,由AI生成的画作《空间歌剧院(Théâtre D'opéra Spatial)》在美国科罗拉多州博览会的数字艺术类美术比赛中获得第一名。该奖项的授予引起很大争议,有人感叹“艺术的死亡在我们眼前展开”,也有人表示“凭借AI作品获奖并不能证明你就是艺术家”。
AI生成画作《空间歌剧院(Théâtre D'opéra Spatial)》。 (资料图/图)
面对争议,创作者表示自己并没有违反任何规则,提交作品时也标注出了所使用的AI绘画平台。两位评委事后表示不知道该标注指的是AI工具,但即使知道了也不会改变自己的选择。
2022年,AI绘画工具迎来了飞跃性的发展,在生成结果的质量和速度上都有了显著提升,几秒钟内便可以生成画面优美的高清图片。8月22日,生成速度极快、且具有较高艺术观赏性的AI绘画算法Stable Diffusion宣布开源,再次让AI绘画成为热点。
故事从装饰房间开始
2019年,一个朋友到自由职业工程师Angus Russell(安格斯·拉塞尔)家里做客时说道:“你们家墙上有点光秃秃的。”说者无心,听者有意,拉塞尔和女朋友决定找些艺术品来装饰。
几乎逛遍所有墙面艺术品店铺后,拉塞尔发现市面上的作品都无法与自己的经历、情感产生关联。他突发奇想:能否购买一幅AI生成的画作,或者自己用AI创作一幅完全个人化的作品?
搜寻过程中,拉塞尔了解了AI艺术的发展状况,包括2018年佳士得拍卖行以43.25万美元售出的由法国艺术团体Obvious创作的AI画作《爱德蒙·贝拉米肖像》,以及Deepart.io这样能够体验AI生成画作的平台。当时,输入参数让AI作画的工具,给出的结果大多不尽人意,更“智障”而非“智能”,像《爱德蒙·贝拉米肖像》这类精品画需要制作团队具备较强的编程功底,利用GAN算法(Generative Adversarial Network,即“生成对抗网络”)生成。就连《爱德蒙·贝拉米肖像》本身使用的算法也非Obvious原创,而来自一位艺术家在网上的分享。
当时像Deepart.io这样开放给大众使用的AI生成画作功能,本质上是“风格转换”(style transfer),某种程度上可以理解成给原图加一个画家风格滤镜,比如梵高风格的自由女神像,莫奈风格的悉尼歌剧院等等。
搜寻结束后,拉塞尔发现了市场空白——没有能够购买AI生成画作的平台。于是,他萌生了更大的计划——开发平台,帮助更多人用AI画作装饰自家墙面。他首先开了一家网店来进行“市场调查”,以30到50澳元标价售卖自己生成的AI作品,看是否有人购买。确定有市场后,拉塞尔花了一个月时间利用开源代码搭建起了Nightcafe,一个让使用者免费生成画作,并提供付费购买制作装饰画实物的平台。
起初,网站收入寥寥,拉塞尔每个月还要负担网站运行的费用。某次,有用户一口气生成了1500张图,并没有购买任何成品。拉塞尔为这1500张图支付了200澳元左右的费用,恨不得关掉这个网站。冷静下来,他引入了点券机制,每个用户每天获得固定数量的免费点券来生成画作,用完即止。该机制实行当日,不少人发邮件询问如何能购买更多点券。网站由此走向收支平衡。
2021年,VQGAN CLIP算法的结合使用让AI绘画踏入新阶段,真正实现了较高质量的“输入文字生成图像”。这两种机器学习算法彼此独立,前者擅长根据原有图像生成相似的图像,而后者能够给图像与文字的匹配程度打分。两个算法互相配合,多次迭代后,便能生成一张符合使用者输入文字的最佳图像。
算法开源后,拉塞尔将其引入了自己的网站。2021年10月,有人将自己在网站上用AI生成的图片分享在国际著名社交网站Reddit,登上了热度榜单。分享者输入的指令是“被雾笼罩的废弃监狱”,得到的图片是雾气下的阴森楼房,还有一排铁栅栏悬在空中。这幅图中的建筑结构存在一定问题,整张图也并不非常惊艳,但AI展现的绘图功能还是吸引了不少人,他们循迹涌入Nightcafe。“该帖走红后的两天内,网站生成的图片数量超过了建站两年来生成的总和。最高峰的时候网站一天生成了一万张图片。”拉塞尔告诉南方周末。
在拉塞尔看来,当时技术下的AI绘图更适合用于创作一些抽象的内容,例如梦境和鬼屋,但对于具象化的作品则很难完美实现,比如一个结构科学的房子,或者身材面部比例合理的人像。
这一缺憾在一年后,也就是2022年得到了改善。这一年,扩散模型(Diffusion Model)凭借更出色的生成结果取代了对抗生成网络(GAN),成为图像生成领域更偏爱的算法。由此衍生出了Clip Guided Diffusion、Dall E2、Stable Diffusion等新的算法,以及基于这些算法搭建的AI画作生成平台Disco Diffusion、Dall·E2和Stable Diffusion。
进步神速的AI画手
2022年3月6日,有着影视和游戏从业经验的FeiArt第一次使用Disco Diffusion。进入网站后,指令框中已然存在一行文字,“一个很漂亮的、在海边的灯塔”,并配上了某艺术家风格。点击生成后,FeiArt解锁了第一次AI创作体验,得到了一张灯塔的图片。
Disco Diffusion(以下简称DD)为开源代码,灯塔是网站给所有新用户的预设引导,象征AI绘画行业的探路灯。得到灯塔图片后,FeiArt又输入了几个指令,让AI生成大楼、车辆:“做了几幅之后我就傻了,没想到机器真的能看懂我的指令,还能给出相应的图像。”
FeiArt表示,DD生成的图像虽然颜色、创意特别好,但仍存在不少问题,比如缺乏主体性,画面透视混乱,而且无法画出比例合理、五官清晰的人。然而,他已经可以想象到这项技术发展完善后能带给影视、游戏行业的冲击,于是“迫不及待地开始研究”。
DD并不是以软件形式推出的,而是直接在浏览器中编写和运行代码。使用者还可以根据自己的需要对算法进行优化。FeiArt表示,自己便是“全球范围内最早对DD进行优化的人之一”,他让算法接触大量的人脸图片数据,并在此基础上学会画人。
作为当时少数掌握高级AI绘画技巧的人,FeiArt曾想过将生成的作品当作艺术品进行售卖。整个4月,FeiArt都埋头创作,生成了365张中国山水画,并为每张图配上一首AI作的诗。当他做完这个系列作品,还没来得及发布,效率更高的AI绘图软件Midjourney出现了。
FeiArt用AI做的山水画系列中的一幅。 (受访者供图/图)
DD时代下,生成一张图可能要半小时,而Midjourney(以下简称MJ)生成四张图不到一分钟。“我瞬间觉得没意思了,整个行业迅速迭代,至少几万人现在都能做出我的作品了。”FeiArt告诉南方周末。
和DD相比,MJ在使用方面也有不小的变化。使用者不再需要面对代码,只需要在Discord社群中输入指令便可得到结果。该变化不仅为使用者带来了便利,而且营造了一个开放性社区。在这个社区,每个人都可以看到其他人所使用的指令关键词,这意味着创作不再神秘,人们可以互相模仿。
此时,“画”出一幅好画的关键不再是掌握训练AI的办法,而是有效描述自己想要的画面,比如在内容描述完后加一个“Art Station”(一个综合CG视觉艺术网站名字),AI生成的图片质量会比较高,再比如“高细节”“电影打光”等描述能赋予图片不同质感。有人更是整理出了“AI绘画秘籍200关键词”“画派关键词——XX类”等关键词手册。
AI理解这些关键词似乎尚需时日,比如没法很好地演绎“美丽的”这种宽泛的形容词,需要使用者同时给出特定艺术家、设计师的名字,这无疑提升了专业门槛。
2022年8月,功能强大的AI绘画平台Stable Diffusion(以下简称SD)开始内测。FeiArt对SD团队开源的做法感到震撼:“SD最初用于训练的4000台A100的显卡价值不菲(每台价格一至两万美元),很难想象他们有着怎样的财力,抱着怎样的理念,或者说为人们做贡献的精神去把这个东西放出来的。它的价值之高,对业界的影响之大,说是AI革命都不过分。”
SD背后的公司为Stability AI,创始人兼主要投资人埃马德·莫斯塔克(Emad Mostaque)毕业于牛津大学,拥有技术与对冲基金背景。该平台源于他2021年染上了新冠肺炎卧床期间,与七岁的女儿一起探索AI绘画:莫斯塔克提供算法模型,女儿给出创作想法。当时斋月即将结束,女儿以穆斯林家族、社区内外的团结作为主题进行了生成。算法最初给出的16张图女儿都不太满意,并一张一张向莫斯塔克解释画面与自己预想的出入。历经六个小时,两人最终得到了满意的作品,该作品以3500卢比的价格售出。
七岁女儿的创作让莫斯塔克意识到,这是一项能够让几乎所有年龄段的人都受益的技术,应该让所有人都有机会使用。如今,SD模型能在消费级显卡上的10GB显存下运行,并在几秒钟内生成512x512像素的图像。
据FeiArt介绍,SD在不到一个月的时间内,产出AI图画的数量已经超过了人类画家过去几十年在Artstation网站上作品的总量。
“打不过就加入”
2022年6月11日,《经济学人》杂志选择用MJ生成的AI绘图作为当期杂志的封面,报道主题“人工智能新前沿”同时也是给AI输入的绘图指令。编辑部表示,生成图片本身较为轻松,但是找到能生成合适图片的指令却并不简单,他们尝试了250次,生成1000张图片后才最终确定了这个拼贴风格的封面。
AI设计的《经济学人》封面。 (资料图/图)
“我们想指出,目前AI绘画的基础模型与好莱坞电影所钟爱的杀手机器人还相差甚远。”编辑部在社论中列出了多组试验结果,其中不乏直接给出指令里没有的棋盘、将长篇指令词直接堆积在画面中间的无厘头图片,“它们(AI)确实很厉害。但是我们认为,至少在接下来的几期中,还是应该坚持与人类插画师合作。”
画师或许是受到AI绘画最直接影响的群体,他们对于AI绘画的态度已然两极分化。不少画师公然批评用AI生成作品的人,认为“这样不道德,应该让艺术家来做”,对于AI生成的作品本身,则表示“细看是一堆垃圾”。
2022年8月29日,AI绘画网站mimic的测试版上线,该网站主攻日系二次元画风头像,允许用户上传图像让AI学习并输出相同画风的AI画作。mimic刚发布便遭到了大量日本画师的抵制,他们发表了“禁止将我的作品用于AI作画”的声明,有人甚至删除了发在推特上的画作,怕有心之人盗用上传至平台。一天后,平台宣布整改。
然而,正如19世纪的“新技术”摄影既没有被画家的联名反对淹没,又没有造成绘画的“死亡”,如今的AI绘画也在一片抗议声中获得了不少“打不过就加入”的拥护者。
位于杭州的设计师AIBEN同样从早期就开始关注AI绘画,并持续探索与创作。起初,他将AI生成的国画分享给一个专门做国画的朋友,对方指出“这个作品看起来像那么回事,但是缺少国画最重要的笔触,就是看不出画笔的痕迹,只能说是有一定商业装饰价值,但没有任何艺术价值”。
AIBEN用AI创作的场景图。 (受访者供图/图)
AIBEN也能看出一些AI作品的问题,比如人的五官怎么都生成不好,但他并没有因此放弃,而是在AI允许的范围内持续探索,比如画一些古风向的人物时会输入“没有脸”的关键词来避免生成扭曲的五官。到了8月底,AIBEN把新作品分享给那位朋友,对方感叹“AI太恐怖了,感觉设计师要失业了”。甚至有策展人看到他在社交平台分享的作品,主动说要帮他包装策展。
AIBEN用AI创作的人物图片。 (受访者供图/图)
游戏场景原画师秦天对AI绘图工具持完全肯定的态度。他在业余时间利用AI创作了多套作品,表示应用AI后可以节省80%的绘画时间。在社交平台上得到较高关注的古风武侠AI创作《赵客缦胡缨》便是秦天在AI的辅助下,用大约七个小时做出来的,其中秦天的主要工作是输入指令,不断对AI生成的图片进行迭代,最后再对满意的图片进行细节方面的手动修改。
秦天借助AI创作的《赵客缦胡缨》。 (受访者供图/图)
在秦天看来,AI绘图的出现和3D辅助非常相似,它们都受到了很多传统绘画、模型制作的质疑,但是最终都会成为划时代的工具。“就好比最早用笔画画,后来用数位板去创作,再后来用波普艺术去合成、复制、拼贴,到现在 AI用绘画逻辑去组合元素来实现你的想法。”秦天说,“有人说自己用AI创作出来的是艺术品,我觉得也完全没有问题。”
苏拉就职于摩根斯坦利,有着一份令大多数人羡慕工作的她却早早开始上班摸鱼:“因为我觉得未来肯定是人工智能时代,我们这些职业迟早被淘汰,到时被重视的会是思想和理念。”而她摸鱼在做的,便是写诗,如今的自我身份认同也是一名诗人。
诗人苏拉成了AI绘图的使用者,目标是“搞艺术”,具体方式是“画诗”:“艺术和技术是不一样的,我想试试能不能通过这个技术手段来做到艺术家做的事情。有很多AI绘图做得非常好看,但是看久了会腻,因为它们美则美矣,没有深层含义。而我的诗里包含了个人的情感与思考。”
苏拉画的第一张图是《白孔雀》,原诗结尾为“以分解的姿势踩在不断延长着边际灰与银的夜曲中——/在后退的,柔软身体。海水”。于是苏拉给AI的指令为“白色的孔雀飞在天上,背景中有美丽的大海和灿烂的天空”,第一个平台给她生成了一个酷似母鸡的形象,使用后续发布的优化版平台后,苏拉才得到了一张白孔雀图。
苏拉最初用AI创作得到的酷似白母鸡的《白孔雀》。 (受访者供图/图)
《白孔雀》,苏拉用AI创作得出的满意版。 (受访者供图/图)
但她仍不满意,觉得自己只是在描述画面。在绘制《海格与利安德》这首诗时,苏拉尝试更进一步。诗歌描写的是一对悲剧的恋人,“不要让太阳月亮唤醒/他们永恒的蓝”以及“灯塔用尽了心跳——/黑暗的打字机,/流出一首星辰组成的诗”,而苏拉以恋人的形象作为画面基础,并在诗歌意象中挑选了蓝作为基本颜色、星光作为肌理,最后以雕塑和泼墨质感来展现立体与梦幻。
《不要让太阳月亮唤醒他们永恒的蓝》,苏拉用AI创作。 (受访者供图/图)
在苏拉看来,这是一张独立、完整的作品,唯一的遗憾是画中情侣看起来很有生命力,没有体现出两人已经去世、只是骸骨相拥的状态。如今,苏拉报名了纽约艺术学生联盟的线下课,深入学习绘画。
潘多拉的魔盒
2022年5月,随着AI绘图质量与速度的大幅提升,产生的作品也逐渐迈入新高度。建筑设计师马纳斯·巴蒂亚(Manas Bhatia)利用AI设计了一个可持续发展的未来乌托邦城市,这个未来城市中高耸的摩天大楼被海藻外墙所包围,外墙既是垂直花园,也是生物空气净化塔。巴蒂亚提出,AI绘图工具可以帮助建筑师更好、更有效地规划未来建筑,一次性生成和测试多个解决方案,节省不少时间和成本。
Manas Bhatia用AI创作的未来乌托邦城市。 (资料图/图)
为热门影视IP制作粉丝向内容的创意总监史蒂夫·科尔森(Steve Coulson)用AI绘图工具制作了漫画《夏日岛》。漫画讲述的是一个怪物被社区接受的故事,映射的便是现实中的AI绘图工具。从单张设计图到动画,AI的潜力不止于此。有网友利用AI生成的图片做出了视频,模拟世界的发展过程,其中包括宇宙的演变、生物的进化和人类文明的发展。FeiArt也在中秋节用AI生成的图片做了一个嫦娥奔月视频。
拉塞尔在采访中提到自己网站的使用者大多是体验派,部分使用者更是将AI当作辅助心理治疗的工具。拉塞尔曾有一段时间每周都会收到一位女士的感谢信,她在信中讲到,自己每次遇到精神状况,都会到AI绘画平台上疏解情绪。
创作工具本身也在迅速地变化升级。一方面,众多AI算法的开源为更多AI平台的出现创造了机会。原版的AI绘画工具基于英语,而本地化后的新生平台使用当地语言,对当地文化与艺术风格也有了更好的理解与呈现。国内的Tiamat人工智能艺术社区便是基于DD v5的技术开发,同时引入了更多中国风的元素。比如2022年8月底开始内测的AI绘画平台文心·一格能准确画出国外平台所无法理解的“驴打滚”“佛跳墙”等中国特色菜。
另一方面,AI也在不断发展,完成越来越多超乎想象的任务。SD开源后,向量图形编辑器、原型设计工具Figma以及图像处理软件Photoshop都引入了AI绘图插件。莫斯塔克表示创始团队看到这些更新也很惊喜,并进一步透露出SD接下来会公开的功能,包括AI视频剪辑与音频剪辑功能:“实际上我们已经能做到很多,只是不想吓到大家,所以一点一点公布。”
在莫斯塔克的畅想中,未来人们不再需要制作PPT,只要告诉AI自己想要什么样的PPT;影视剧也能做到个人化定制,根据自己的需求和想象即时生成。这一点也符合科尔森的预期,他在采访中提到自己喜欢这种可能到来的完全民主化:“当我可以创造自己的艺术或故事时,我为什么要对别人的艺术或故事感兴趣?”
如同潘多拉的魔盒,AI绘画工具的飞速发展也带来了不少争议,最主要的便是版权和可能带来的失业问题。科尔森创作《夏日岛》时,为了保持画面风格统一,输入了某些漫画家的名字作为关键词,在一次采访中他对此也提出了质疑:“这里存在一个巨大的伦理问题。如果我让AI以尼尔·亚当斯(代表作《绿灯侠和绿箭侠》)的风格生成图像,这对他本人来说意味着什么?”
莫斯塔克并没有否认AI绘画可能带来的失业问题,但他这么告诉南方周末:“AI能创造的工作岗位的数量将让它所取代的工作岗位的数量相形见绌。任何这些创作者都可以利用这种技术,使他们的作品变得更好,这将是大家都需要的。”
南方周末特约撰稿 陆宇婷 南方周末实习生 刘嫄媛
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com