Feb 12, 2023

我们需要会说话的AI

记得GPT语言模型的第一次火爆，是微软收购Github之后，发布了Copilot，一个能够帮助程序员自动编写代码的工具。它的出圈程度自然不能和当下的ChatGPT比，但当时已经有很多人在讨论，想不到AI可以替代的第一份工作是程序员。而ChatGPT的火爆则是把“AI可以替代的工作”这个话题指向了技术以外的行业。

有意思的是，编程语言和人类的自然语言，在GPT这种语言模型看来，差别可能没那么大，以至于都可以用同一种神经网络模型。如果你同时体验过Copilot和ChatGPT，应该能够体会到，它们的能力表现也非常相似。简单来说就是，这样的语言模型，核心确实是语言能力，而不是其它。你既不能指望Copilot真的帮你写代码，也不能指望ChatGPT跟你讲的话“走心”。

事实上，语言模型就像一只拥有超级算力的鹦鹉，话讲得很好听，甚至看起来有性格……应该收回这句话，因为鹦鹉其实还有自我和灵魂，不过和鹦鹉一样，它并没有对人类的知识和逻辑的判断能力。

但ChatGPT非常容易让人迷惑，它将人们的注意力吸引到语言以外的其它方面。这并不奇怪，我们对语言的掌握，是一种近乎“透明”的状态，不会特别去注意语言本身——除了语文课。所以，一旦人工智能的语言表达能力超过一个阈值（我想ChatGPT是达到了），人们的注意力就必然不在语言上，而是在语言承载的信息和逻辑上来了。

这不是你的错，我们的大脑必然是这样的，不然语言无法发挥它的作用：信息交流的载体。载体是不能喧宾夺主的。所以一旦你体验过ChatGPT就会发现，它提供的信息时常错误，而且有时逻辑不通，甚至连简单的小学数学都不会。但也许你并不会去赞赏它显而易见的优点：几乎掌握了人类的所有常见语言，而且很流利，理解和表达复杂的句式与内容都没问题。单就对知识的掌握而言，一个小学高年级学生应该可以很快发现ChatGPT常常胡扯；但对语言的掌握而言，我相信它超过了许多人，特别是不经常写作的人。

了解到这一点后，我们可以有意识地，就像上语文课的时候一样，把语言能力从智能中相对独立出来。我想，中国人对此并不陌生，就像我们写高考作文，主要是考察你对辞藻的掌握能力，而不是考察你的知识和思想有多丰富。一个在数学、物理或历史、地理方面拿低分的学生，高考作文完全可能拿高分。同样的，ChatGPT写高考作文属于小菜一碟。

我非常喜爱的华裔科幻作家特德·姜最近写了一篇文章，他将大型语言模型比喻为把互联网的信息压缩在一张模糊的JPEG图片文件上，对人类未来可能依赖这样的神经网络获取信息的方式感到担忧。就语言模型对信息的掌握程度而言，确实如此，但这却并不是语言模型的目的。特德·姜对语言应该有更深的体会，他的作品《你一生的故事》（被改编成电影《降临》）中，“语言是思维的载体”这一点被体现得淋漓尽致，甚至来到了“语言是现实的载体”的幻想中。但是在我们的现实中，GPT并不是现实的载体，它甚至不必要是信息或思维的载体。

在对语言的认知上，我们很容易落入人类中心主义的论调中。我们喜欢能听懂人话的小狗，小猫，同时又怀疑他们是否真的听懂了。AI掌握了人类语言，变得更像是一种宠物。但事实上，AI并不需要掌握人类的语言，就能在许多智能方面超过人类：信息检索、复杂计算、图片识别、一些特定的推理和预测……在准确性和速度上都是人类无法匹敌的。但仅仅因为AI曾经还没有掌握人类的语言，普通人很难和AI进行交流，人们会觉得AI“很笨”，可能不如一条边牧。

这也不是我们的错，AI的A毕竟是Artificial，人造的智能就是人关心的智能。这种智能毕竟是为人类服务的。但也别忘了，人类充当智能的造物主的时候，牢记我们的神话故事中关于神的造物忤逆甚至背叛神的故事——在此我愿意将这类故事的寓言视为一种反思，创造和掌控是两件事。特别是现在，我们真正能够创造智能，智能是更难以掌控的。

在这种伦理挑战下，AI掌握语言能力显得更加可贵。回顾人类智能的进化史，我们通过考古人类学、遗传学和动物学的观察，基本能够确定人类语言能力的起源。从大脑皮层来看，语言几乎是我们获得的最后一种主要的智能，是我们十几二十万年前成为“智人”的关键。语言学家乔姆斯基认为，人类的语言具有结构上的一致性，这是天生的生理能力。而我想，语言模型可以从效果上侧面印证，确实可以通过像神经网络这样的简单结构，在超大的规模上生成像语言这样复杂的能力。

通常，具有社会性的动物，如果个体的智慧越高，那么语言能力就会越复杂。自然界中，像鲸类这样的高智慧动物，他们的语言至今还在被人类研究和破解。而蜜蜂和蚂蚁的语言相对简单，却足以说明社会性动物是必须要有语言的。人类的社会像蜜蜂和蚂蚁一样庞大，人类的个体又比鲸更加聪明，我们的语言是那么的庞大而复杂，是我们必然的需求。

人与人之间的沟通的必要性不需要多说。而人与AI，应该说任何一个人类个体和AI的沟通能力，由于有了AI语言模型，得到了突飞猛进。这个意义不亚于当初人类学会说法。学会说话后，人类发展出了复杂社会，发明文字后，属于人类的文明真正诞生了。当与AI的交流不需要通过技术性的语言，而是人类天生掌握的语言之后，一个新的社会诞生了，这是一个真正的AI的时代——也是人类历史上第一次，能够引入另一种能与自己全社会对话的智能存在。

换句话说，我们发明了会说人话的AI，是我们与AI的交流合作扩大到全社会的层面的一种历史性的需要。

欣喜，激动，但又充满挑战。未来，太值得期待了，“别问是劫是缘”！

我们需要会说话的AI

Read This

北京再见，杭州你好

我们需要会说话的AI

Subscribe

Read This

北京再见，杭州你好