1 新的技术革命

不知不觉 ChatGPT 已经半岁多了。

只有短短的半年,AI 是如此疯狂地吸引了如此多人的关注。我感觉科技圈又终于又有了一派生机勃勃的景象。开源圈,学术界和工业界开始快速地迭代产品追赶 ChatGPT。

AI 的发展甚至吸引了人类学家,历史学家和哲学家对人类存在的思考,社会学家对人类未来工作的忧虑。一时间百家争鸣。

比尔盖茨在他的博客里宣称:AI 时代已经到来了。大家开始热烈地讨论人工智能的应用场景,发展方向和工作的未来。人类社会又来到了一个充满机遇和挑战的大航海时代。

我在挺早一段时间开始关注大数据和人工智能。那时候热门的词汇只有提到大数据,人工智能还是实验室和象牙塔里的玩具。步入职业生涯之后我见证了 AlphaGo 的进步,和 DeepMind 合成蛋白的突破。

我对 AI 技术一直非常乐观和兴奋,但还是低估了人工智能在最近的几年里快速发展:从大数据处理、预测,图像识别,到后来的 ChatGPT。我感觉已经在拼命追赶新闻和知识,但还是有种要被科技时代甩下的感觉。

我觉得是时候开始记载一些我的感想片段,和零碎的观察,以让我更加有意识地度过这个时代。

胡言乱语,但求能够提供一些不一样的视角。

2 大型语言模型(LLM)能力

人工智能的发展并不是一蹴而就。我们的生活里其实早已经遍布人工智能。

我们有强大的社交网络和推荐、搜索算法,有了即时呈现在我们眼前的消息和视频流,有了主导我们商业、物流、金融等等大规模数据的统计模型,有了智能的视频监控,自动驾驶,甚至还包括 Siri 和智能音箱等助手。这些都是人工智能在不同方面的应用。

互联网发展到今天,几乎在其每个角落都有大规模数据的收集、学习,和优化。以 ChatGPT 为代表的大型语言模型(LLM,Large Language Model)也是这个过程的一个延伸。它的横空出世离不开长时间的积累和发展。人工智能的发展和其他技术一样有一个厚积薄发的过程。

人们往往高估了一年的进步,但是往往低估十年的进步。

几年前的人工智能在自然语言方面的发展水平还很有限,可以输出简单的对话,但是往往词不达意,而且往往会简单重复几句话甚至直接岔开话题。Siri 的出现给人眼前一亮,但很被人遗忘,因为它功能很少,使用场景不多,给人感觉鸡肋。

谷歌长年耕耘人工智能,提出了基于变换器(Transformer)的架构和 BERT 模型,奠定了人工智能未来一段时间的发展方向并大大提高了基于人工智能翻译的水平。2020 年 openAI 推出的 GPT-3 已经有了突飞猛进的进步,初具非常优秀的对话能力,甚至能够生成简单的代码样例,但是同时错误也很多,并没有引起人们的广泛注意。

直到 ChatGPT 横空出世,技惊四座。在发布不到一年的短短时间里,目前最新的大规模语言模型已经有了近乎人类的语言能力:

  • 自然对话,写作,完成简单的命令和形成文字稿的能力;
  • 对现有的文字进行总结,与简单问答;
  • 学习你的写作风格,根据你规定的风格和格式输出文字;
  • 利用外部工具,比如搜索,利用计算器,发布博客,甚至调用一切 API;
  • 为你出点子,帮助你进行头脑风暴;
  • 为程序员们生成代码,解释代码;

以最最知名的 ChatGPT 为例,其流畅的文书写作的能力可能要颠覆所有文书类的工作。或许有可能,人类能够从所有繁重的文书中解脱出来?

大型语言可能会成为我们每一个人的文秘,助理,程序员,私人教师。它们不仅具有优秀流畅的写作能力,能够安排我们的工作,甚至独立完成简单的搜索,研究,和实现简单的程序。

学校可以通过人工智能对学生进行指导,通过人工智能帮助回答课本里的作业。普通人可以利用人工智能回答法律,经济,金融上的问题。作家编剧可以通过它获得灵感,甚至完成整篇的作品。所有人类社会通过正式文字交流的过程都会出现大量的人工智能的身影。

针对大规模语言模型(LLM)输出不准确,即“白日梦”(Hallucination)的问题,目前业界一个主要研究方向是发展大规模语言模型的“理性思考”能力,例如通过更加强化的训练,和使用外部工具获得更加准确的结果。

如果未来 AI 能够有更加严密的数据处理,归纳,和分析的能力,有可能公司的财报,行业调研分析,甚至小规模产品原型,都能够通过人工智能完成。

那个时候我们的工作会是什么呢?

3 大规模语言模型的意义

来自陆奇对大规模语言模型的演讲

早在1995-1996年,通过PC互联网迎来一个拐点。那时我刚从CMU(卡内基梅隆大学)毕业。大量公司层出不穷,其中诞生了一家伟大公司叫Google。为什么会有这个拐点?为什么会有爆炸式增长?把这个观点讲清楚,就能把今天的拐点讲清楚。

原因是,获取信息的边际成本开始变成固定成本。

一定要记住,任何改变社会、改变产业的,永远是结构性改变。这个结构性改变往往是一类大型成本,从边际成本变成固定成本。

陆奇

我曾经对计算机,和互联网技术着迷,这个热情一直延续到今天。其中一个重要的原因是:这是一片新的创造性的空间。有一台连上互联网的笔记本,利用市场现有的软件和服务,你可以在很短时间内注册,安装,运行一个公开的小型的网站。我当时立刻就开始对计算机技术感兴趣。

互联网和计算机技术能够给你带来强大的能力,能够极大地放大你的创新动力。(用今天的话说,应该叫做“赋能”。)它能够为你的创造力提供一个更加广阔的舞台。

新的技术也在不断演化使得创作和知识获取的成本更低。比如移动应用的普及,比如翻译,导航,和社交网络的分享。以往需要更高时间成本筹划、交流,甚至需要专业知识的行为,可以很快用一根大拇指完成。

纽约大学教授 Clay Shirky 在《人人时代》 (Here Comes Everybody)这本书中描述互联网时代的发展,提到过一个相似的观点:技术的革新会降低人类创作的门槛,很多专业性很强的职业都会被技术的创新带给普通人,从而带来新的生产力和创新。比如活字印刷带来了文化上的繁荣,互联网的普及改变了整个世界的经济。

人工智能和大规模语言的流行给了我同样的感受:它大大降低了信息获取和创作的成本。在以往,信息的获取需要通过搜索,社交,和推荐等等,现在有了一个 ChatGPT,可以通过一个非常简单的界面回答你以前想问却无法提问的问题。更重要的是,它可以快速生成新的文字和代码,解决所有文书需要,和简单的编程工作。

它不仅大幅改进了人类获取、处理信息的渠道,还有潜力革命人类对新的信息和知识的生成。它可能完全改变人类与计算机的交互。

随着技术的不断成熟和推广,大型语言模型和其他各类人工智能将在不久的将来,对生产力和创造力产生巨大的激发和释放。

直到今天,我对技术依旧抱有很强的情怀之心。我相信技术还会继续发展,最终将人类拉近,将世界变小,为全人类搭一个创造分享的舞台。

4 如何顺应新的时代

对于我们自身,如何在未来几年应对如此快速的技术变革?

我有一点猜想是:无论未来技术如何快速变化,社会对人类的很多要求会是始终如一的。

4.1 自律性和主动性

如上提到,人工智能已经渗透入我们生活的点滴。大规模语言模型进一步进入我们的生活也只是早晚的问题。可能在不久的将来,我们在网络上看到的很大比例的文字,都会是人工智能的生成。

然而就算在信息爆炸的时代,想要静下心来读书学习依旧是一个奢侈品。在进入一个新的时代,信息的获取变得更加容易,但也更加重要。

信息时代给了我们更加便捷的学习机会,但是同时也给了我们无穷无尽的诱惑。

未来,更低成本的创作也会带来大量”廉价“的内容。能够有主动性避免”娱乐至死“,会是第一步。人工智能可能会替代我们所有人的工作吗?当然不会是所有人,起码在短时间内。我们首先必须保持足够的自律性和清醒,才不会被时代所抛弃。

技术的发展应该顺应人性,而不是将我们带进一个“美丽新世界”。

4.2 学习能力

在人工智能时代,我们除了需要继续学习的主动性,还需要有学习的能力。

我对人类的自身能力依旧保持着很深的执念——人类依旧需要掌握足够的能力。一个优秀的电子秘书和助手不能够代替我们的深度思考。

但可能,人工智能能够不断地将我们带出机械重复的工作,使我们专注于更加高层次的创造力。

就以程序员为例,人工智能已经可以快速地生成代码,解 Leetcode 题,甚至生成一个小型网站。它的能力可以解决很多程序员常见的问题:比如生成重复的代码,减轻需要背记的知识的负担。但是依然无法替代大规模的代码组织和对逻辑的精确的描述,尤其是代码背后精巧的架构设计。我相信在很长一段时间里,软件仍需要大量人类工程师的智慧。

总而言之:人工智能可以增强程序员的能力,但依旧无法抹平一个普通的程序员和优秀的工程师(比如 Jeff Dean)的差距。我相信在其他很多专业领域依旧会是如此。

所幸的是,人工智能能够教会我们很多新的知识和能力。我们未来的学习,一定会大量借助人工智能。

在技术发展如此迅猛的今天,终身学习可能会成为更多行业的必须。例如一名技术人在推特上说:AI 不会取代你,但是使用 AI 的人可能会。

AI will not replace you. A person using AI will.

@santiago

4.3 鉴别能力和批判性思考

这段视频表面上是对比尔盖茨的采访,然而你只要仔细地观察,你还是会发现蛛丝马迹:这实际上是一个通过人工智能配音加对嘴型的“采访”,为的是宣传一些特定的说辞。

在人工声音图像合成如此成熟的今天,网上流传的视频应该会愈发逼真。我相信这段视频就已经有不少受众,很难想象未来的视频会有更多的。

未来的互联网和媒体,可能眼见都不能为实了。

任何技术的发展都是双刃剑,因为无论好人还是怀揣恶意之人都能够使用技术。偏见和自负是刻在我们基因深处的弱点。而人工智能技术会愈发有效地利用这一弱点。

这个问题会是我们未来社会最大的挑战和难题。如果人工智能能够达到如此拟人的地步,我们未来将会如何应对虚假信息的传播?

对于个人来说,培养自身的批判性思考会愈发重要:我们需要学会广泛地吸纳多种角度的新闻和意见,并时刻检视我们自身的偏见。

4.4 审美的能力

这可能是我个人一个比较小众的观点:在未来信息的生成都已经高度自动化的年代,我们需要非常强的审美和评判能力。这和上文提到的专业知识和鉴别能力是相辅相成的。

无论人工智能的艺术生成能力发展到如何强大,人类才是所有创作的最终消费者。只有人类的欣赏才能够赋予人工智能以意义。

如果文字和多媒体的生成都能够被自动化,人类作为信息的消费者需要主动地筛选、评估信息,哪一些是“美”的,哪一些是虚假,廉价,大规模生产的商品。

人工智能通过人类输出的大量图片和文字进行训练,它的能力完全基于人类的输出,在今天是如此,在未来也是如此。也就是说,如果我们希望人类社会和人工智能相互依存地发展,离不开我们对它的引导。它未来发展也离不开人类自身对“美”和“丑”的评判,和创新力和灵感。在未来,“匠心”会比“匠气”更重要。

5 小结

我们可能正处于一个技术革命的时代。我会花更多时间学习,并希望能够在这个博客继续我的胡言乱语。

这个世界唯一不变的就是不断的变化。我们只有以更加开放的心态拥抱变化,快速学习才能够不会落伍。