各位观众朋友,大家好!我是腾讯机器学习平台的工程师姚军。
大模型的兴起引发了广泛关注,让我们感受到人工智能正在变得越来越聪明。各类模型层出不穷,但机器的“智能”究竟是如何产生的呢?
智能的核心秘密是让基于神经网络的大模型学会思考。大模型的思考方式分为两种——快思考和慢思考,这一概念源自诺贝尔经济学奖得主丹尼尔·卡尼曼的《思考,快与慢》。
快思考模型模拟了人类的实时响应(系统1)的思维模式,而慢思考模型则模拟了人类的深度推理(系统2 )的思维模式,这两种模式恰恰是人类智能的核心特征。
快思考模型在在智能客服、知识问答、角色扮演等场景展现了快速、直觉化的信息处理能力,适用于实时决策和高效推理。
而慢思考模型则专注于复杂问题的深度分析和逻辑推理,在科学研究、战略规划、报告分析等场景展现了深度的推理能力。
然而,这样的成就并非一蹴而就。让我们一起回顾一下人工智能的来时路,看看这短短80年间,它是如何一步步走到今天的。
启蒙时代
这一切的起点,可以追溯到1943年,大洋彼岸的麦克卡洛克和皮茨提出最早的神经元数学模型,首次从数学上严格定义了神经元的计算规则,通俗来说,周围其他神经元给它发“电信号”(比如“看到一只猫”),这些信号会被神经元像“收快递”一样汇总,然后判断是否足够重要,如果信号够强,神经元就会“点火”(比如眼睛眨一下);这一模型描绘了让机器像人脑一样运行的原理,为后续神经网络研究提供了基础。这是神经网络的理论基石,也从此为人工智能的启蒙时代拉开了帷幕。
随后,一代代科学家为此不断努力。1950年,阿兰· 图灵提出了著名的“图灵测试”,探讨了“机器能否思考”的哲学问题,为AI的发展奠定了思想基础。1957年,罗森布拉特,受到大脑神经元研究成果的启发,发明了感知机,这是早期神经网络的雏形,开启了机器学习的实践探索。
这一阶段,人工智能从理论走向实践,但受限于计算能力和数据规模,成果更多停留在实验室中。正是这些早期的探索,为后来的技术突破铺平了道路。
总的来说,神经网络的原理很简单,就是通过模拟人脑神经元的工作方式, 分层处理数据,用大量简单单元的“集体智慧”,从数据中自动挖掘隐藏规律,来形成对事物的理解和认知,变得越来越聪明。
接下来,我们将看到人工智能如何突破算法瓶颈,迎来“觉醒时代”。
觉醒时代
在人工智能的“觉醒时代”,我们见证了从专家系统到深度学习的跨越。1970年代,专家系统在医疗、金融等领域表现出色,但它们依赖人工规则,难以泛化。1986年,Geoffery Hinton等人提出的反向传播算法和逐层预训练方法,解决了多层神经网络的训练难题,成为AI技术的重大突破。2012年,AlexNet在ImageNet竞赛中一鸣惊人,深度学习正式登上AI的舞台中央。2016年,AlphaGo战胜围棋世界冠军,展示了强化学习在复杂决策任务中的潜力。
在这一阶段,随着数据的爆发和用于处理数据的算力逐渐变强,算法瓶颈被逐步突破。机器的智能进一步增强,一个明显的标志是,深度学习和强化学习的崛起,这也为现代AI奠定了基础。
当时间来到2017年,神经网络为代表的人工智能迎来了它的“崛起时代”!
崛起时代
2017年,Google提出了Transformer架构。Transformer通过自注意力机制,实现了高效的并行计算,成为现代AI的核心技术。2021年,斯坦福大学提出了“基础模型”(Foundation Model)的概念,强调大规模预训练模型的通用性和潜力。这些模型不仅能够处理多种任务,还能通过微调适应特定领域,开启了AI的新范式。
这一阶段,模型结构创新和数据瓶颈的突破,推动了AI从专用模型向通用模型的转变。Transformer和基础模型的出现,为后续的AGI探索铺平了道路。
涌现时代
当时间来到2019年,我们不知不觉进入到了以神经网络为代表的人工智能的“涌现时代”,人工智能发展驶入的快车道,也就是从2019年开始到2023年,GPT系列模型从GPT-1到GPT-4的加速迭代,模型的规模和能力不断提升,展示了通用人工智能的潜力,GPT-4更以其严密的逻辑思辨能力和广泛适用性被认为是通用人工智能的早期版本。
随后的,2024也被称为大模型爆发的元年,这一年,包括腾讯混元在内的多个通用模型陆续面世,加快了中国公司的大模型探索之路。随着学习到到知识,也就是数据越来越多,计算能力越来越强,模型架构越来越先进,相比此前的模型,通用大模型更像一个“全能学霸”—— 提前读了所有书,考试时能快速套用知识答题,但它也需要老师(人类)指导具体怎么用(微调)。
也许AGI距离还很遥远,但是大模型也让我们看到了通用人工智能实现的希望,通用人工智能一直是几代人工智能科学家追逐的最终梦想,也一度被认为是可望而不可即的“珠穆朗玛峰”,这一波大模型,很可能成为了点亮了通用人工智能的火花。
回顾神经网络和智能诞生的历程,智能的产生并不神秘,而是一种系统的工程,核心三要素算法、数据和算力的不断进步带来了智能的进化。怎么让这三大要素产生“化学反应”,还离不开机器学习平台这个锻造大模型的超级工厂,我们也打造了一个这样一个超级工厂—— Angel机器学习平台,在这里,依托强大的算力支持,神经网络在算法的指导下,对大规模数据进行学习,最终训练出智能的模型能够胜任一系列通用任务。
本文为科普中国·创作培育计划扶持作品
作者:人民日报
审核:贾宁 大连东软信息学院 教授
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
来源: 科普中国创作培育计划
图文简介