首页  >  媒体动态  >  媒体动态详情

杨善林院士:AIGC科学基础与应用展望|数字经济50人论坛

2024-03-10   中国计算机学会   阅读量:42

    2024年1月,由中国计算机学会主办的 “第二届CCF中国数字经济50人论坛高端峰会”在杭州举行。中国工程院院士、合肥工业大学教授、50人论坛委员杨善林受邀出席,并在峰会上作了题为“AIGC科学基础与应用展望”的主题报告。为充分梳理和展现峰会成果,现将杨善林院士的主题报告内容做以下分享。

    深度学习问世以来,人工智能的发展突飞猛进,逐步从纯粹的学术研究向大规模应用迈进。特别是2022年之后,文本生成、图像生成、三维模型生成等一系列应用级人工智能内容生成(AIGC)算法问世,标志着人工智能具备了数字化内容生产的能力,并正在突破逻辑推理、常识认知等诸多门槛,逐步迈向通用人工智能。

    一、AIGC的科学基础

    自2016年AlphaGo战胜世界围棋冠军李世石以来,人工智能再次引起全社会的广泛关注,而且发展速度非常之快。2017年,Google在神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems,NIPS)上发表了名为《Attention is all you need》的论文,文中提出了基于注意力机制的Transformer结构,能够有效提取词语间的相关性,并且模型架构十分灵活。Transformer灵活的架构和优异的性能使得科学家们产生了探究其能力极限的想法,大模型的概念应运而生。仅仅以OpenAI为例,2018年是GPT1,2019年是GPT2,2020年是GPT3,2022年是ChatGPT,2023年3月是GPT4,还有GPT-4V。人工智能的发展进程超越大多数人的预期,想要理清这些重大突破到底是如何实现的,就需要从科学基础的视角进行分析,发现推动人工智能发展的关键要点。在梳理了AIGC发展过程中对其产生重要影响和重大推动作用的科学发现与技术发明,可以发现这些研究工作分布于多个领域,包括生物学、认知科学、数理计算科学、决策科学、复杂性科学等等。这些学科在AIGC发展的不同阶段起到了各种不同的作用。

图1 Open AI发展过程

    首先是生物学与AIGC,举两个简单的例子,一个是神经元和神经网络的发现,两位长期研究人脑的结构的科学家同时发现人脑由神经元和神经网络构成,但是观点有明显的差别。正是因为这样的发现,他们于1906年获得诺贝尔奖。

图2 神经元与神经网络的发现

    作为数理学家、计算学家考虑到既然人脑是神经元和神经网络构成的,就要想办法做一个人工的神经元和神经网络。马文·明斯基是世界上第一个做出人工神经网络模拟器的,正是因为这项发明,他获得1969年的图灵奖,这就是从科学发现到科学发明。

    另一个例子是猫的视觉系统的发现,大卫·休伯尔和托斯坦·维瑟尔长期研究猫的视觉神经网络,发现猫的视觉神经网络是很深层次的结构,而且不同层次的神经网络有不同的信息处理功能。正是因为这样的发现,这几位科学家在1981年获得诺贝尔奖。

    同样的道理,计算科学家、数理科学家在这些发现的基础上做人工的发明,很多科学家长期致力于做出一个人工决策的功能模型,最有代表性的是2018年因为深度学习成果获得图灵奖的三位科学家。

    认知科学与AIGC之间的联系是最直接的。所谓认知科学是研究人脑或心智工作机制的前沿性尖端学科,1975年由美国斯隆基金的投入,将六大学科整合到一起,六大学科又两两交叉形成十一个交叉学科,如图2,这些学科交叉在一起形成认知科学,在AIGC的过程中发挥着至关重要的作用。例如注意力机制是认知科学的研究成果,人人都有注意力机制,比如说今天早上我没吃饭,现在坐在下面就感到很饿,但是站在上面说话就没有饥饿感,因为注意力发生了转移,实际上这就是认知科学的模型。而计算学家就想办法将人的认知模型变成一个可计算的模型,如图3。这就是注意力机制,这就是从认知科学到计算科学,而今天的AIGC里面的核心机制就是注意力机制。

图3 认知科学的形成

图4 注意力机制

    计算科学、优化理论与机器学习,还有特征提取等方面都有很多例子。决策科学对AIGC的主要贡献就是价值观的对齐,即在安全问题上具有核心作用。复杂性科学主要是用来研究AIGC,对AIGC的研究已经成为当下发展AIGC重要的科学问题,例如为什么它具有这种涌现功能,这需要通过科学的研究,大模型的性能和发展就需要这样一些分析和研究,与AIGC创建和发展最为明显的诺贝尔奖,如图4是一些举例,图5是AIGC主要的图灵奖,1969年的神经网络一直到2018年的深度学习都是今天AIGC的重要技术基础。

图5与AIGC最为密切的诺贝尔奖举例

图6 与AIGC最为密切的图灵奖举例

    总体来说,生物学对AIGC的发展发挥了奠基性作用,认知科学、数理计算科学是AIGC发展最核心的理论与技术基础,而决策科学是解决AIGC安全伦理问题的重要理论与方法基础,复杂性科学是分析研究AIGC涌现机理的重要理论工具之一。从中长期看,应该加强生物学与AIGC的互动研究,这是很长期的事情;从近期看,特别要重视社会学、经济学、管理学、行为科学等人类认知规律的研究,并通过数理计算科学和决策科学的综合研究,推动AIGC的快速发展。

    二、AIGC的应用展望

    虽然AIGC还处在发展初期,但是AIGC在科技创新、产业发展、社会治理、智能代理等诸多领域都已经获得了初步的应用,科技创新、产业发展、社会治理、智能代理都是数字经济的广阔战场。随着AIGC的快速发展,其应用越来越广泛、越来越深入,且具有实验性。例如在科技创新方面,和生物学本身形成互动,进行生物学的研究方面。在结构预测和新材料结构合成等方面,人类几千年研究出来的新材料在AIGC的帮助下飞速发展。在考古学领域,AIGC可以帮助填补文物。此外,在数学领域、环境气候领域等科学研究上都有很多星星点点的历史。

图7 AIGC在考古学领域的应用

    在产业发展上也有很多例子,例如无人驾驶。现在的无人驾驶有很多雷达、摄像头,实际上它都没有实现智能,马斯克用AIGC的思路来实现无人驾驶,用每天实际开车的视频录像作为数据训练大模型,它不需要雷达,马斯克说:如果根据这样的方法,用100万个视频训练大模型,它就可以工作,200万个视频训练效果稍微好一些,300万个视频训练就会感觉它怎么开得这么好,1000万个视频训练之后就会感到难以置信为什么它比人类开得还好,现在特斯拉已经训练1000万个视频。

    在社会治理和医疗健康领域都有很多非常好的应用,比如让一个手机带着盲人随意上逛街,手机照着,它就会提示前面路有坑、左拐右拐、到商店看到商品是什么颜色、什么价格,他希望盲人用手机像正常人一样,这就是GPT-4的设计目标,叫“Be My Eyes”。智能代理是OpenAI上提出的,如果用核心的大模型来训练它,AIGC的代理很可能会产生比马云的电子商务更大的企业。

    总体上,我认为在现有机制中人工智能算法和算力的加持下,凡是规律隐藏在可获得数据中的各种工作都可能被人工智能、AIGC代替,而随着信息感知技术的快速发展,可获得的数据越来越多,比如脑电技术,也就是人工智能取代人类工作的范围正在逐步扩大,首先它是一个无限逼近人的过程,甚至可能超过人类的智能,这是当下AIGC要研究的安全问题的重要领域:如果AIGC超过人类怎么办?人类如何控制它也是个重要的安全问题。

    在当前的发展水平下,当决策任务与思维、场景等密切相关的时候,由于很难界定与决策任务相关的信息边界,或者难以获得相关的大量数据,人工智能还暂时难以替代人类的工作,但是要有一个思想准备,今天替代不了,明天可能被替代,后天可能又会产生新问题。所以我个人认为人永远是社会的主体,人本身是一种无边界信息的集合,想象是无边界的,所以人为核心要素的管理科学研究必须面对信息边界难以确定、规律模式不断深化的根本特性,所以这基本决定人工智能永远取代不智慧的人。

    总的来说,AIGC在科学发现、技术发明和工程创新中能够发挥越来越大的作用,对经济、社会乃至国家安全等方面带来前所未有的机遇和挑战,甚至对人类文明的发展产生颠覆性的影响,比第二次工业革命、第三次工业革命都来得大,但是它对科学技术、产业发展、社会治理、智能代理各方面的应用可能要经历点应用、线应用、面应用最后到全方位应用的发展,当前以点应用为主。

    人工智能的发展也存在着发展风险和发展中的风险,所谓发展风险,就是如果AIGC这个领域不发展或者发展得不好,我认为发展风险是最大的风险。而发展中的风险,大体上可以分为四类:一类是人类可以识别和管控的安全风险,比如隐私问题以及价值观对齐问题;第二类是人类难以预测和控制的安全风险,就是超过人类智能的问题;第三类是人类恶意制造的安全威胁风险;最后一类是软硬结合的破坏性安全风险,所以这个领域的研究还是要开展广泛国际交流与合作,按照科技战略供应链的发展规律努力攻关,争取在这个领域做出世界性的贡献。

杨善林
中国工程院院士
信息与电子工程管理专家