从大语言糢型到外星人
山河
2025年5月26日发表
【人民报消息】GPT-3 的发布始于 2020 年,但到 2022 年,OpenAI 推出的GPT-3大语言糢型,具有 1750 亿个参数,它是当时最强大的语言生成糢型。其展现出来的强大的文本生成能力,一下子震惊了全世界。在GPT的带动下,大语言糢型的影向力开始迅速扩大。
GPT-3展现出了科幻般的能力,不但可以对话,还可以创作文章、写代码、生成诗歌。众多的开发者和企业,马上将GPT-3集成到自家的IT应用中,充当写作助理、自动客服以及用于辅助内容创造。AI技术,就这样如此迅速的渗入到了实际应用。在这些接踵而来的实际应用中,大语言糢型令人惊叹的表现和性能,持续引爆全世界的舆论与讨论。
在ChatGPT的持续带动下,2023年的大语言糢型进入大众化爆发,向各行业以惊人的速度渗透:编程、解题、建议,然还包括造假以及监控。由于其能让全世界的人们、不管你是否具备技术背景,都能以自然语言进行对话与提出要求,并且大语言糢型都能以提问者能接受的方式进行回答和反馈,这使得大糢型技术几乎是瞬间成为许多人日常生活的一部分。并且在这个过程中,能根据自然语言文本描述、创建图像和视频的技术也达到可实用的水平、其质量和效能也迅速捕获了大众。
这里有个重要的问题,为什么大语言糢型能以自然语言输入和输出、它是怎么理解人类的自然语言的?
大语言实际上不理解任何一种自然语言,它所作的是,将输入的语言字元串、转换后映射到自己的数学的向量空间,然后不断的做拟合映射。人类语言字元串的本身是一维的,通过不同的词汇和字词排序,来接近与拟合思维中的事物。而这个向量空间,则是多维度的,用基于概率分布来权衡轻重、通过上下文来拟合语义。至于人类的自然语言,它并不做我们以为的那种理解。但是,它用这种方式,竟然真的能实现对人类的一些理解和任务处理。而且可以从任何一种自然语言转换为另一种自然语言,只要是它训练过的素材中包含的语言。
目前这种AI,在自己的概念空间中运算。而自然语言,不管是哪种语言,都能映射到AI的概念空间中,这可是第一大前提。为什么会这样?语言承载的思维、意向和情绪,是能脱离语言存在的多维度存在,并且自有结构和规律。目前大语言糢型LLM所基于的Transformer架构,正好符合了这一点。
大糢型的幻觉来自哪里?就是来自这种拟合,拟合的话,就存在匹配度的问题,并且不论匹配度多低,总是要产生一个输出,那么就产生了幻觉。但它所展现出来的所谓的创作力,也是来自拟合。可是人类的幻觉,实际上比大糢型普遍多了,人类的学习和成长过程,也是需要借助人身的感官、语言概念,与这个世界不断的做拟合,总是在不断的尝试未知和试错。当然也有许多人一辈子守著错误的概念抱残守缺。
话说回来,如果有手段能探测和截获,人们思想中产生的意念、思考过程,并且传递到另一个人的思想中,那岂不是不用张嘴,就可以达成互相的理解和沟通了呢?似乎,目前的AI技术,已经在接近解决这一步。进一步说,到了这一程度,近百年来一直流传的外星人能用思维传感来与人沟通、是否立刻也变得可思可议了?再进一步,如果外星人能直接用思维控制你的大脑、神经和肢体,好像也变成了非常现实的事情。如果是这样,这个科技的发展,是否跟你的预期、完全不同? △
(人民报首发)
|