最近科技圈的一项重磅的突破:人工智能 AI 具有了直逼人类画家的绘画能力,几乎可以以假乱真。
AI 领域在最近今年内的突破可以说是创新和进展不断,几天不见就好像已经有了天翻地覆的变化。
曾经有人问,尽管计算机再聪明,它们能够绘出精致的油画吗?能够谱写动人的诗歌吗?能够编写恢弘的交响乐吗?这些问题都是在质疑作为以冰冷逻辑见长的计算机的真正智慧。而今天随着人工智能的发展,计算机都已经慢慢在具备这些能力。文字到图像(text-to-image)算法就是朝这个方向又走了一步。
我们似乎也需要重新思考和定义计算机和人类智慧的真正差距,直到我们被真正赶上的那一天。
目前公开发布的文字到图像算法有:最早由初创公司 Stability AI 和德国 LMU Munich 大学的研究人员提出 Stable Diffusion(稳定发散)算法,openAI 的 Dall-E 2,谷歌的 Imagen 等等,而且几乎都是在最近获得了突破性的进展。
这些算法实现细节各有不同,基本原理都是需要大量的图像和描述文字进行“训练”,即通过学习图像和文字之间的联系,得到不同文字描述和图像的关系。在图像生成步骤,模型通过用户的文字输入,理解文字描述的物体,生成正确的图像和它们之间的关系,甚至生成对应的图像风格。也就是说这些 AI 模型不仅学习了世界上各种物品的名称和图像,甚至能够掌握物品之间的联系、动作,甚至能够从过去艺术家的作品中学习他们的风格。
几个研究 AI 的公司话费了巨额算力,利用开放互联网上爬取的海量图片及其描述训练得到了不同的文字转图片模型。
值得注意的几点是,AI 生成的图片在很多方面依然会有很多漏洞甚至差错,有时甚至就是文不对题的,但是有一定比例的作品已经可以达到非常逼真准确的水平,已经逼近人类的艺术家。这就已经足够对艺术创作行业造成革命性影响。
所以可以预料的是,在很多人对这一技术表示惊叹的同时也会有很多人对其表示忧虑甚至抗议:因为这会挤占很多插画师,艺术家的市场。尽管每次技术革新都会不可避免地对一部分社会工作进行替代,但这一次的替代会是极具颠覆性的。
比如文章开头的这幅画,就是作者完全通过不断调整文字描述,从 AI 模型生成获得。是的,这是一幅完全由 AI 绘制的作品,并在今年一个艺术展上获得了头奖。
当然,此举引起渲染大波,很多人,包括很多艺术家对这一行为表示忧心忡忡,和愤怒。未来已经到来,而我们依旧对它手足无措。
这一技术提出对 AI 从业者们提出了更多伦理问题等着我们去解决。比如,AI 绘画的训练会采用大量艺术家的作品作为训练,那么最后生成的作品如果采用了她的风格,这一作品应该属于谁?
假设 AI 能够掌握一个当前仍然活跃的艺术家的风格,再取代她的作品,这会对作者多年的辛苦构思和创作带来多大的不公平?
另外:如何防止这个技术被滥用制作宣传虚假信息?如何防止 AI 生成暴力色情,或者是其他糟糕内容的图片?图片训练数据中带来的偏见和如何解决?还有等等问题需要我们回答。
更重要的是,这个新的技术也将对我们提问:我们和机器的差别究竟在哪里?我们真正能够被称作人类特有的对艺术的理解和创造力的核心究竟在哪里?我们所谓的人性究竟应该如何定义?
AI 的创造性能够在模仿,组合,从而创新。但是它依旧只能通过它自身学习的训练集中的数据进行重新组合,对已有的风格进行模仿。恐怕在短时间内它还不能够真正创造出一个全新的风格。这可能依然是我们作为人类的优势:去想象不可想象的新世界,探索新的创作方式。
或许 AI 技术可以逼迫我们不断去探寻艺术和人类智慧最核心的那一部分,那最不可替代的一部分。
当然同时可以预见,很多人会对这一技术抱有怀疑和负面态度。一个数字插画家在推特上对这一技术的公开表达了强烈的不满:https://t.co/JUSW0x8Woa
同时,也有人对 AI 艺术表示了一定的支持,比如这位 Youtube 播主:https://youtu.be/NiJeB2NJy1A
她的理由是,AI 绘画尽管拥有了极强的能力,但是和真正专业的画师还有很大的差距。一个不通绘画的新手可以通过这一技术获得不错的作品,但是一个专业的画师可以通过 AI 获得一个草稿,一个灵感,或者一些可以重复利用的元素,大大提高作画的水平,能力,等等。在一个完美的世界里,人类通过技术的革新不断提高自身的能力。然而在现实世界,人类往往又要遭受技术带来的副作用。
另一个例子,接下来的钢琴表演完全由 AI 生成:
这是不是意味着,未来艺术表演,乃至我们的所有文字,娱乐创作,都可以被 AI 取代?
我甚至能够想象一个类似黑镜子式的故事剧情:在一个赛伯朋克的未来城市,AI 能够生成我们所有的文化艺术作品。我们所欣赏的音乐,诗歌,甚至小说,电影,等等等等,只需要我们极少的输入和反馈,就能够完全通过 AI 生成。未来的文化艺术娱乐可能完全定制化,人性化。
这样的一个世界,会是我们对自身通过艺术的终极表达?抑或,这样的艺术可能同时又是完全没有灵魂的,我们的艺术欣赏将完全失去人性?
我不知道这样的社会会是一个乌托邦,还是一个违背人性的反乌托邦?还是兼而有之?我无法想象,也不敢想象。
最后,我在一个开放的图片生成实验网站 Dream Studio 注册的账号,生成了一些梵高风格的作品。如果你有兴趣,可以亲手试玩这一个技术。
无论你对这一技术的看法如何,有一点几乎可以肯定的是:一旦潘多拉的魔盒被打开,没有再被关上的可能。技术会像脱缰的野马一样载着我们飞跃向前。我们所能做的就是能够希望通过伦理、制度、哲学等等方面的讨论,紧紧抓牢小马身上的缰绳,而不是被完全甩脱。
参考资料:
- https://stability.ai/blog/stable-diffusion-public-release
- https://openai.com/dall-e-2/
- https://en.wikipedia.org/wiki/Stable_Diffusion
- https://towardsdatascience.com/stable-diffusion-best-open-source-version-of-dall-e-2-ebcdf1cb64bc
- https://huggingface.co/spaces/stabilityai/stable-diffusion/discussions/2361
- https://replicate.com/stability-ai/stable-diffusion/examples
- https://www.nytimes.com/2022/09/02/technology/ai-artificial-intelligence-artists.html
- https://beta.dreamstudio.ai/
- https://strikingloo.github.io/stable-diffusion-vs-dalle-2
Leave a Reply