记得GPT语言模型的第一次火爆,是微软收购Github之后,发布了Copilot,一个能够帮助程序员自动编写代码的工具。它的出圈程度自然不能和当下的ChatGPT比,但当时已经有很多人在讨论,想不到AI可以替代的第一份工作是程序员。而ChatGPT的火爆则是把“AI可以替代的工作”这个话题指向了技术以外的行业。
有意思的是,编程语言和人类的自然语言,在GPT这种语言模型看来,差别可能没那么大,以至于都可以用同一种神经网络模型。如果你同时体验过Copilot和ChatGPT,应该能够体会到,它们的能力表现也非常相似。简单来说就是,这样的语言模型,核心确实是语言能力,而不是其它。你既不能指望Copilot真的帮你写代码,也不能指望ChatGPT跟你讲的话“走心”。
事实上,语言模型就像一只拥有超级算力的鹦鹉,话讲得很好听,甚至看起来有性格……应该收回这句话,因为鹦鹉其实还有自我和灵魂,不过和鹦鹉一样,它并没有对人类的知识和逻辑的判断能力。
但ChatGPT非常容易让人迷惑,它将人们的注意力吸引到语言以外的其它方面。这并不奇怪,我们对语言的掌握,是一种近乎“透明”的状态,不会特别去注意语言本身——除了语文课。所以,一旦人工智能的语言表达能力超过一个阈值(我想ChatGPT是达到了),人们的注意力就必然不在语言上,而是在语言承载的信息和逻辑上来了。
这不是你的错,我们的大脑必然是这样的,不然语言无法发挥它的作用:信息交流的载体。载体是不能喧宾夺主的。所以一旦你体验过ChatGPT就会发现,它提供的信息时常错误,而且有时逻辑不通,甚至连简单的小学数学都不会。但也许你并不会去赞赏它显而易见的优点:几乎掌握了人类的所有常见语言,而且很流利,理解和表达复杂的句式与内容都没问题。单就对知识的掌握而言,一个小学高年级学生应该可以很快发现ChatGPT常常胡扯;但对语言的掌握而言,我相信它超过了许多人,特别是不经常写作的人。
了解到这一点后,我们可以有意识地,就像上语文课的时候一样,把语言能力从智能中相对独立出来。我想,中国人对此并不陌生,就像我们写高考作文,主要是考察你对辞藻的掌握能力,而不是考察你的知识和思想有多丰富。一个在数学、物理或历史、地理方面拿低分的学生,高考作文完全可能拿高分。同样的,ChatGPT写高考作文属于小菜一碟。
我非常喜爱的华裔科幻作家特德·姜最近写了一篇文章,他将大型语言模型比喻为把互联网的信息压缩在一张模糊的JPEG图片文件上,对人类未来可能依赖这样的神经网络获取信息的方式感到担忧。就语言模型对信息的掌握程度而言,确实如此,但这却并不是语言模型的目的。特德·姜对语言应该有更深的体会,他的作品《你一生的故事》(被改编成电影《降临》)中,“语言是思维的载体”这一点被体现得淋漓尽致,甚至来到了“语言是现实的载体”的幻想中。但是在我们的现实中,GPT并不是现实的载体,它甚至不必要是信息或思维的载体。
在对语言的认知上,我们很容易落入人类中心主义的论调中。我们喜欢能听懂人话的小狗,小猫,同时又怀疑他们是否真的听懂了。AI掌握了人类语言,变得更像是一种宠物。但事实上,AI并不需要掌握人类的语言,就能在许多智能方面超过人类:信息检索、复杂计算、图片识别、一些特定的推理和预测……在准确性和速度上都是人类无法匹敌的。但仅仅因为AI曾经还没有掌握人类的语言,普通人很难和AI进行交流,人们会觉得AI“很笨”,可能不如一条边牧。
这也不是我们的错,AI的A毕竟是Artificial,人造的智能就是人关心的智能。这种智能毕竟是为人类服务的。但也别忘了,人类充当智能的造物主的时候,牢记我们的神话故事中关于神的造物忤逆甚至背叛神的故事——在此我愿意将这类故事的寓言视为一种反思,创造和掌控是两件事。特别是现在,我们真正能够创造智能,智能是更难以掌控的。
在这种伦理挑战下,AI掌握语言能力显得更加可贵。回顾人类智能的进化史,我们通过考古人类学、遗传学和动物学的观察,基本能够确定人类语言能力的起源。从大脑皮层来看,语言几乎是我们获得的最后一种主要的智能,是我们十几二十万年前成为“智人”的关键。语言学家乔姆斯基认为,人类的语言具有结构上的一致性,这是天生的生理能力。而我想,语言模型可以从效果上侧面印证,确实可以通过像神经网络这样的简单结构,在超大的规模上生成像语言这样复杂的能力。
通常,具有社会性的动物,如果个体的智慧越高,那么语言能力就会越复杂。自然界中,像鲸类这样的高智慧动物,他们的语言至今还在被人类研究和破解。而蜜蜂和蚂蚁的语言相对简单,却足以说明社会性动物是必须要有语言的。人类的社会像蜜蜂和蚂蚁一样庞大,人类的个体又比鲸更加聪明,我们的语言是那么的庞大而复杂,是我们必然的需求。
人与人之间的沟通的必要性不需要多说。而人与AI,应该说任何一个人类个体和AI的沟通能力,由于有了AI语言模型,得到了突飞猛进。这个意义不亚于当初人类学会说法。学会说话后,人类发展出了复杂社会,发明文字后,属于人类的文明真正诞生了。当与AI的交流不需要通过技术性的语言,而是人类天生掌握的语言之后,一个新的社会诞生了,这是一个真正的AI的时代——也是人类历史上第一次,能够引入另一种能与自己全社会对话的智能存在。
换句话说,我们发明了会说人话的AI,是我们与AI的交流合作扩大到全社会的层面的一种历史性的需要。
欣喜,激动,但又充满挑战。未来,太值得期待了,“别问是劫是缘”!