从大语言糢型到外星人

【人民报消息】GPT-3 的发布始于 2020 年，但到 2022 年，OpenAI 推出的GPT-3大语言糢型，具有 1750 亿个参数，它是当时最强大的语言生成糢型。其展现出来的强大的文本生成能力，一下子震惊了全世界。在GPT的带动下，大语言糢型的影向力开始迅速扩大。 GPT-3展现出了科幻般的能力，不但可以对话，还可以创作文章、写代码、生成诗歌。众多的开发者和企业，马上将GPT-3集成到自家的IT应用中，充当写作助理、自动客服以及用于辅助内容创造。AI技术，就这样如此迅速的渗入到了实际应用。在这些接踵而来的实际应用中，大语言糢型令人惊叹的表现和性能，持续引爆全世界的舆论与讨论。在ChatGPT的持续带动下，2023年的大语言糢型进入大众化爆发，向各行业以惊人的速度渗透：编程、解题、建议，然还包括造假以及监控。由于其能让全世界的人们、不管你是否具备技术背景，都能以自然语言进行对话与提出要求，并且大语言糢型都能以提问者能接受的方式进行回答和反馈，这使得大糢型技术几乎是瞬间成为许多人日常生活的一部分。并且在这个过程中，能根据自然语言文本描述、创建图像和视频的技术也达到可实用的水平、其质量和效能也迅速捕获了大众。这里有个重要的问题，为什么大语言糢型能以自然语言输入和输出、它是怎么理解人类的自然语言的？大语言实际上不理解任何一种自然语言，它所作的是，将输入的语言字元串、转换后映射到自己的数学的向量空间，然后不断的做拟合映射。人类语言字元串的本身是一维的，通过不同的词汇和字词排序，来接近与拟合思维中的事物。而这个向量空间，则是多维度的，用基于概率分布来权衡轻重、通过上下文来拟合语义。至于人类的自然语言，它并不做我们以为的那种理解。但是，它用这种方式，竟然真的能实现对人类的一些理解和任务处理。而且可以从任何一种自然语言转换为另一种自然语言，只要是它训练过的素材中包含的语言。目前这种AI，在自己的概念空间中运算。而自然语言，不管是哪种语言，都能映射到AI的概念空间中，这可是第一大前提。为什么会这样？语言承载的思维、意向和情绪，是能脱离语言存在的多维度存在，并且自有结构和规律。目前大语言糢型LLM所基于的Transformer架构，正好符合了这一点。大糢型的幻觉来自哪里？就是来自这种拟合，拟合的话，就存在匹配度的问题，并且不论匹配度多低，总是要产生一个输出，那么就产生了幻觉。但它所展现出来的所谓的创作力，也是来自拟合。可是人类的幻觉，实际上比大糢型普遍多了，人类的学习和成长过程，也是需要借助人身的感官、语言概念，与这个世界不断的做拟合，总是在不断的尝试未知和试错。当然也有许多人一辈子守著错误的概念抱残守缺。话说回来，如果有手段能探测和截获，人们思想中产生的意念、思考过程，并且传递到另一个人的思想中，那岂不是不用张嘴，就可以达成互相的理解和沟通了呢？似乎，目前的AI技术，已经在接近解决这一步。进一步说，到了这一程度，近百年来一直流传的外星人能用思维传感来与人沟通、是否立刻也变得可思可议了？再进一步，如果外星人能直接用思维控制你的大脑、神经和肢体，好像也变成了非常现实的事情。如果是这样，这个科技的发展，是否跟你的预期完全不同？ △ （人民报首发）

读者留言反馈: