外网爆火的 4 款「你说我画」自动作画工具，我们测了下，有 1 款的确超强

先来欣赏几张美丽的场景图吧。

色彩搭配和谐、构图得当有冲击力，一眼看过去大部分的人也许都会认为它们是出自哪位技艺成熟的画家之手，然而以上图片其实均截取自 YouTuber Quick-Eyed Sky 的 Disco Diffusion 三分钟展示视频。

Disco Diffusion 是一个输入关键词就出图的 AI 创作程序，已经在GitHub 的开源，任何人都可以玩。但由于还没像软件那样封装起来，目前只是在谷歌的 Colaboratory（又称 Colab）中以代码的形式呈现。

近年来，人工智能技术发展迅速，在艺术创作领域，像 AI 写作、AI 绘画、甚至 AI 编曲等早已不是什么新鲜事。随着更加友好的人机交互界面的推广，如今普通大众只要打开开发者提供的网页，轻松几步就能体验 AI 技术的魅力了。

这次我们给出了四款号称用嘴就能画画（输入关键词就能出稿）的人工智能创作工具来告诉大家它们如何使用，顺便做一个使用方法和出图效果上的比拼，看看哪款 AI 最易上手，效果最好。

Disco Diffusion：百依百顺的乙方

Disco Diffusion 由艺术家 Somnai 设计，拥有强大的关键词转图像能力，并且由于代码托管在 Colab 上，所有渲染过程都可以在线上进行，不需要依赖使用者的电脑来运算。

▲创作者的 Twitter

▲Somnai 用 Disco Diffusion 制作的视频

初次打开 Disco Diffusion 的使用界面你可能会被大量的代码吓到，但实际上只要按照如下步骤调试，要使用它还是很简单的。

▲满是代码的界面容易让人望而却步

首先往下拖动网页找到第三项「Settings」，在右手边「Basic Settings」中我们可以对生成图像的品质进行设置。

「Step」是指 AI 生成迭代的次数，「Step」数值越多，运算时间越长，不过艺术品某程度上是偶然性和美的碰撞，运算次数多，不代表出来的作品就好看。

下方的「width height」是指成图的图片尺寸，此处只能输入 64 的倍数（比如 1280, 768），尺寸越大渲染时间越长。

在「Settings」中还有一个叫「Init Settings」的部分，在「init_image」中输入图片的地址，可以让程序以某图片为基础参照着进行运算。

点击下图圈选部分将本地图片上传，然后选中列表中的图片，在右键菜单中找到「复制路径」复制地址，再粘贴到「init_image」上即可。

接下来就是最重要的通过关键词描述画作内容部分。下拉找到「Settings」中的「Prompts」项，看到「text_prompts」。

▲语句中的方括号和引号不要改动

在「text_prompts」中代码中默认的语句为：

"A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.", "yellow color scheme"

翻译过来就是：

由画家 Greg Rutkowski 和 Thomas kinkade 绘制的关于一座在汹涌的血海中闪耀的奇异灯塔的作品，以 Artstation 为参考库，黄色配色。

「beautiful painting」为画种，你可以将它改为「ink painting（墨水画）」「oil painting（油画）」「comic（漫画）」等等。

「a singular lighthouse, shining its light across a tumultuous sea of blood」是内容描述，决定了你的画面中将出现什么，这里自由发挥即可。

「greg rutkowski and thomas Kinkade」是成图更接近哪位画家的风格，此处可以输入不止一位画家。

「Trending on artstation」是画作的参考平台，即 AI 主要从哪个平台获取参照，可以输入的平台有「Facebook」「Pixiv」「Pixbay」等等。

「yellow color scheme」是整个画面的主色调为黄色。

要改变画的内容，只需按照格式调整语句中相应的关键词（注意逗号，双引号等要用英语）。

除了更换关键词，你还可以设定每个关键词的权重，比如当我的画家风格为「Van Gogh and Monet(梵高和莫奈)」时，我可以写成「Van Gogh:3」 and 「Monet:2」，即作品三分像梵高，两分像莫奈。

有时候如果想让某个元素不要在画面里出现，我们还可以设定数值为负数。

▲请给我一张三分像梵高，两分像莫奈的万里无云的天空画

最后我们还可以在第四项「Diffuse！」中的「n_batches」设置一次生成多少张图（变体），也即如果此处输入 5，则最终可以得到 5 张图（图越多需要的时间越长）。

将以上重要参数设置完成以后，在页面的上方点击「代码执行程序」按钮，在菜单中选择「全部运行」后程序即开始运算。

免费用户一般分配到的是 Colaboratory 的 Tesla K80 显卡电脑，线上渲染速度比较慢，一张默认尺寸和迭代次数的图大概需要一个半到两小时才能完成。

如果等不及的也可以选择「连接到本地运行时」用自己电脑的显卡进行渲染，但是需要用到「Jupyter 笔记本服务器」等工具，这里就不作展开了。

接下来便是漫长的等待过程，拉到「Diffuse！」底部时你可以看到自己的图片从一片模糊到逐渐清晰的变化过程。

▲程序底部有运算持续时间和目前步骤显示

根据之前程序提供的默认语句，我生成了一张海上灯塔的图片，画面效果一流，用来做桌面背景完全没问题。

接下来我又改动了一些参数，再生成了两张图，描述语句如下：

A painting of a robot angel, flapping her wings in the night sky by Shirow Masamune, Trending on artstation, blue color scheme.（一张机械天使在夜空中挥动翅膀的画，士郎正宗创作，以 Artstation 为参考库，蓝色配色）

▲默认画质，耗时 1.5 小时

Cyberpunk station.（赛博朋克车站）

▲448*448 像素，耗时 45 分钟

首先这两张图片都可以算得上是切题。「机械天使」图虽然没能体现「夜空」这个关键词，但构图有特色，天使也能展示出明显的机械感，至于画有没有士郎正宗的神韵就见仁见智了。

在「车站」图的上方我们能看到列车、电缆等要素，红色、绿色的霓虹灯、屏幕等也是典型的赛博朋克元素，美中不足的就是完成度不高。

NightCafe Creator：风格迁移神器

相比起 Disco Diffusion，NightCafe 用起来就简单多了。

NightCafe 的网页提供了两款智能绘图工具，左边的「Text to Image（文本转图像）」是类似于 Disco Diffusion 的输入关键词生成图工具，右边的「Style Transfer（风格迁移）」可以把用户上传的照片换成名画风格。

先来测试第一个功能。在「Your text prompt」下方的方框中输入关键词，如：A city surrounded by machine（被机械保包围的城市），然后在下方 16 种风格选取一个。

拉到底部选择是纹理优先（Artist）还是构图优先（Coherent）后点击最下面的「CREATE」，等待几分钟，一张方形的图就生成了。

▲成图过程

如果不满足于默认图像的尺寸，你还可以在关键词输入界面打开「Show advanced options（显示高级选项）」。在此模式下你不仅能自定义图像的尺寸，还可以设定多张参考的底图。

风格转移工具的使用也很简单。上传一张照片，从 64 种名画风格中挑选一个，再等 1-2分钟，一张惊艳的图片就诞生了。

将之前灯塔、车站和天使的关键词去掉作者和参照库后输入到 NightCafe Creator ，我们得到了以下三张图片。

▲关键词：一座在汹涌的血海中闪耀的奇异灯塔，黄色配色

▲关键词：一张机械天使在夜空中挥动翅膀的画，蓝色配色

▲关键词：赛博朋克车站

所有图片里效果最好的个人认为是天使的画，虽然走的是较为抽象的路线，但那一双像卫星的太阳能接收翼的翅膀还是体现出了机械和天使的组合元素，角色的动作也很生动，在 AI 的启发下我忍不住也参照着画了一张。

▲ 右边是我自己参照绘制的.自认没有 AI 画得有意思

赛博朋克车站的效果中规中矩，而灯塔图的效果就很一般了，画面中出现了很多相似的灯塔，能看起来是为了铺满画面而多次复制导致的。

Cogview：中文关键词，一次八张图

Cogview 是本次测试中唯一支持中文输入的 AI 工具（字数限制为 2-30 中文字符），由清华大学的唐杰团队研发，出图时间为 1-5 分钟不等，一次可以生成八张图，但尺寸不可调。

从输入英文关键词网页会翻译为中文再运算这一点推断，该程序应该是以汉语为语言进行训练的，在一堆只能用英文输入的同类 AI 中显得难能可贵。

▲该团队去年发表的论文

其实这款程序最擅长的是真实的照片生成，而非艺术绘画。比如当我们输入「黄豆组成的字母 b」时，AI 会给我们八张符合描述的真实照片。

▲已在各个搜索引擎确认过网上并无现成的类似图片

而之前的 NightCafe Creator 无论怎么切换风格也只能产出类似下图的「艺术作品」。

当关键词是与绘画有关时， Cogview 就略逊一筹了，比如当我们想用「Oil Painting Style（油画风格）」风格生成一座之前描述的塔，八张成图还是更像照片而非画作。

赛博朋克车站的画面效果要好很多，可能是由于本身是建筑物，而且该描述本身也适合写实风格。

在重新生成灯塔的图时为了让它更像画作，我切换成了水墨风格。Cogview 是这么多款 AI 里面唯一真实地还原了「sea of blood（血海）」的，不过有点诡异就是了。

机械天使的油画出图效果就一言难尽了，八张成图都过于抽象，难以评价。

不过据说我们现在习惯了的俊美人形带洁白翅膀的天使形象其实是文艺复兴时期经过美化的。《旧约》中描述的天使的外貌本就是千奇百怪的，毕竟天使是超越人类认知能力的存在，怎么可能和人长得一样呢？

▲旧约中描绘的座天使

WOMBO Dream：界面美观，作品重艺术感

WOMBO Dream 这款工具我们曾经在另外一篇介绍 AI 绘画的文章里介绍过，它的界面我认为是本次介绍的几款中最好看的，成图时间也是几款中最短的，约为 30 秒。

操作过程和 NightCafe Creation 很像这里就赘述了，直接上图。

▲关键词：一张机械天使在夜空中挥动翅膀的画，蓝色配色

▲关键词：一座在汹涌的血海中闪耀的奇异灯塔，黄色配色

▲关键词：赛博朋克车站

由于该程序只支持最多 100 个英文字母的输入，有些关键词就不得不被迫删减。从三张图片中我们可以看到 WOMBO Dream 的成图十分追求「画感」。

所谓「画感」，简单来说就是让人一看就会认为这一张画出来的作品，而不像摄影或者 3D 模型摆拍。当然，程序自带的塔罗牌式画框对「画感」的形成也许有帮助。

▲在画廊中右键另存为可以保存不带画框的图片

总结

总的来说，四款 AI 作图工具各有千秋，且都是网页版，免费使用。

Disco Diffusion 可以实现最复杂的关键词描述，支持自设置的参数很多，是一个待探索的巨大宝库，但是成图时间长，操作界面也相对复杂。

NightCafe Creator 和 WOMBO Dream 都能快速产出作品，前者可以对画面尺寸进行设置，也能容纳更多的关键词，但后者界面更好看，出图自带画框。

Cogview 的好处是支持中文关键词，在现实照片生成这方面有优势，无法自定义图片尺寸。

在多款 AI 设计工具火热以后，有人开始担心画家的工作会不会被取代。在 Disco Diffusion 爆红以后，公众号「设计青年实验室」请了几位设计大咖探探自己对 AI 作画的感受，其中插画师疯景是这样说的：

如果有一天 AI 取代了更多的价值，那么我会努力去寻求新的价值，船到桥头自然直。

生产力的发展带来的是生产方式的变革。我们都知道印象派的诞生是源于 19 世纪摄影技术的发明，当人们意识到无论怎么画都不可能比照相机逼真的时候，朦胧、个性、抽象等反而成为弥足珍贵的东西。

▲莫奈的代表作《日出印象》

如今，AI 画手的出现又重新对我们的艺术界发出了挑战，艺术家们为捍卫领土又会以什么样的策略迎战呢？我们不妨拭目以待。

Disco Diffusion: https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

Cogview：https://agc.platform.baai.ac.cn/CogView/index.html

WOMBO Dream：https://www.wombo.art/

NightCafe Creator：https://creator.nightcafe.studio/

本文来自微信公众号“APPSO”（ID:appsolution），作者：方玮玲，36氪经授权发布。

Disco Diffusion：百依百顺的乙方

NightCafe Creator：风格迁移神器

Cogview：中文关键词，一次八张图

WOMBO Dream：界面美观，作品重艺术感

总结

推荐内容

外网爆火的 4 款「你说我画」自动作画工具，我们测了下，有 1 款的确超强

小组件、新兴熟人社交App突围、法国产品再出圈......Q1 App出海都有哪些新气象？

疫情结束，我一定要买这三大件

1块钱的脱口秀课，养出多少好韭菜？

辉瑞“神药”，中国制造

做出最失败的手机、最成功的智能音箱后，亚马逊透露下一个硬件野心

苹果真的要做游戏手柄了，灵感来自任天堂？

苹果留给 iOS 开发者的时间不多了：30 天内必须更新旧版本

减少充电器让苹果节省了55万吨矿石，但仍有消费者为此维权

苹果要下架这些应用，微信逃过一劫

微信全新功能上线，128G 内存手机有救了？

无人配送车，行驶在疫情下的上海

36氪独家 | 「领鹊科技」获IDG领投近亿元A轮融资，腻子乳胶漆喷涂一体机器人已实现量产

36氪首发丨研发零碳固体氧化物燃料电池，「通微新能源」完成天使轮融资

万达商管再冲刺上市：承诺三年要赚220亿元，王健林夫妇提前套现

宁波银行：能否走出长三角或成估值闸口

剧本杀之后，tufting也伸向年轻人的钱包

五一电影档，悬了

2 亿人撑起「零工经济」，被催熟的灵活用工

新丽传媒，沦为阅文“工具人”？

我在B站直播弹幕互动游戏，月入20万

星期六股份想“脱鞋”，遥望虚拟人路难走

徐峥夫妇，一对商人

爆火的露营：“钱景”两极分化，有人年入千万，有人一路踩坑

这个年轻的星系，让天文学家很意外，这是怎么回事呢？

豆瓣不识阿北

累亏超百亿的喜马拉雅，传第二波裁员进行时……

疫情保供难题下，零售业的努力与创新

研发投入不足3%，网红防晒的“黑科技”谜局

最前线 | 董事长减持13亿元，“光伏茅台”隆基正遭遇连环利空事件

适当应用国产盐酸达泊西汀（大犀牛），夫妻生活质量直线上升

如何读书和思考？2022全国职场人阅读报告重磅发布

张勇卸任天猫、淘宝公司董事长兼总经理，戴珊接任

“绝地求生”：卧底加密货币圈的一些发现（上）

“绝地求生”：卧底加密货币圈的一些发现（中）

交出最差业绩后，心动在这狂砸20亿，TapTap会是下一个B站吗？

一键「智能召唤」后，特斯拉撞上350万美元的私人飞机

B站400万网友顶一条视频，求被余华翻牌？

微信内测朋友圈内容转发，网友：越发Q里Q气

知乎靠“港”上岸

数字藏品：新业态？新增长？抢抓先机，文旅企业要这么做

抖音和健身，谁更需要刘畊宏？

肠道中的微生物会影响我们的饮食吗？

国际科学家联盟：人类泛基因组项目正在开展

小冰框架首次公布视觉外貌！《阅向未来》同步上线

中国版太空“厨房自由” 如何烹煮食物？

首个与地球“亲密接触”的星际来客诞生！西拉杰发表长文

数字科技赋能国货崛起！“星火·链网”助力企业品牌建设

最新研究：钙钛矿/硅串列太阳能电池首次通过实验证明

6分钟内实现6倍以上原油回收！木质素基聚氨酯泡沫研发成功

可得性偏差：如何克服常见的认知扭曲

最前线 | 甲骨文企业可持续发展调研：73%中国受访者认为人工智能可在人类难以突破的领域取得成功

盈利反转，营收恶化，中免渡劫差点火候

商人罗振宇做生意，知识付费的风却停了

为了这双手套，大厂们又卷起来了

现在去开家普拉提店还来得及吗？

大脑切片全球直播：记忆仅有20秒，他被写进12000篇论文

科学家发现惊人新证据：翼龙可使用黑色素控制羽毛的颜色

第七个“中国航天日”即将到来！一起来看看天空中闪耀着的“星”

科学家开发出可穿戴皮肤贴片！可连续跟踪血压和心率

碱性体系液流电池用膜材料规模化制备及应用获新进展！

谈虎色变！二维层状材料实现抗生素水高效纯化

估值35亿美元！新一代数字银行在欧洲异军突起

百度地图公布新能源出行大数据 “充电圈”功能再升级！

打通新能源车主充电“最后一公里”！社区建桩难、充电难怎么办？

爆火的数字藏品多了 鲸探试水“实体化”！

氢能产业《规划》出台 行业将如何布局？

重磅！我国首次发布对地观测卫星激光测高产品

布局“东数西算”！数据中心行业迎来新机遇

快讯！25位华人专家当选俄罗斯工程院院士

富豪大战？比尔盖茨做空特斯拉惹怒马斯克

2021全球生物制药十大融资事件：两家中国公司上榜，艾博生物成吸金王

1—3月报告：国内游戏收入同比增3%，低于去年同期

甲状腺癌飙升 20 倍，是我们做错了什么吗？

爆火的数字藏品多了鲸探试水“实体化”！

氢能产业《规划》出台行业将如何布局？

第七个“中国航天日”即将到来这些科学之“星”你知道吗？

碳中和目标之下实施路线图有哪些？

科技对抗用人压力擎朗机器人助力餐厅智慧化转型！