从智能家居到自动驾驶,从虚拟助手到医疗诊断,从艺术创作到地震监测,人工智能以“一日千里”的惊人速度演进,渗透日常生活的方方面面。而大模型作为人工智能领域的集大成者,通过其强大的数据处理能力和深度学习能力,更是展现出了无可比拟的优势。它们正在替代一部分脑力劳动,帮助人类释放更大的创新空间。
在近日召开的第五届中国人工智能大赛成果发布会现场,中国工程院院士、清华大学计算机系教授郑纬民接受《人民邮电》报记者专访时指出,当前我国完成备案并上线、能为公众提供服务的生成式人工智能服务大模型已经超过200个,但未来大模型将回归理性,在竞争中更加优化,数量将会大量减少。同时他表示,“大模型+X”,即大模型在千行百业的应用将是行业未来最主要的发展趋势。
人工智能大模型技术,简单来说,就是通过构建庞大的神经网络模型来处理海量数据,实现复杂的功能。大模型将自然语言、文字的识别和理解又推进了一步,是人工智能技术跃迁式变革的一种发展。今年以来,随着AI技术更深入发展,大模型已然成为当前全球人工智能竞争的正面战场。
郑纬民院士指出,当前我国人工智能大模型的发展有以下两方面特点。
一是基础大模型从单模态向多模态发展。从文本交互到图像创作、视频生成,这类模型将能够同时处理文本、图像、音频等多种模态的数据,实现跨模态的信息融合与交互,这将为人类提供更加自然、便捷的多模态交互体验,推动人工智能在各个领域的应用。
二是“行业+AI” 加速各行各业智能化升级,开始创造更大价值,例如“大模型+金融”“大模型+医疗”“大模型+汽车”“大模型+智能制造”“大模型+司法”等。中国信通院最新发布的《人工智能发展报告(2024年)》指出,当前人工智能应用持续走深向实,行业大模型已在金融、医疗、教育、零售、能源等多个行业领域实现了初步应用,并产生了明显的经济效益和社会效益。
然而,随着数据量的爆炸式增长,传统的大模型技术面临着计算资源紧张、训练时间长、模型泛化能力不足等挑战,和行业的结合也不够深入,应用经验不足。
“大模型要应用到各行各业,最重要就是要积累很多数据,没有数据什么也谈不上。因此现在有些行业数据少,或者没有数据,这个事情就比较费劲,我们要思考怎么把数据补齐,把数据拿过来。”在郑纬民院士看来,大模型时代有三类企业将会脱颖而出:研发大模型的企业、推动大模型应用落地的企业,以及支持大模型计算系统的企业。他表示,目前国内的“百模大战”,实际上也是一个大浪淘沙的过程,预计明年会逐步回归理性,避免太“烧钱”,在竞争中更加优化,因此大模型数量将会大量减少。
从百花齐放到场景落地,行业大模型正逐渐展现出其独特的技术优势和应用价值,“大模型+X”未来可期。郑纬民院士指出,这两年大模型的主要应用是语言类模型,比如ChatGPT、科大讯飞的“星火”、腾讯的“混元”、百度的“文心一言”等,但是如何将AI大模型更好地应用于和GDP直接相关的领域,如钢铁、汽车等制造业领域,赋能经济社会发展,这是我们需要努力的方向。因此郑纬民认为,明年“大模型+X”,即大模型在千行百业的应用将会是我国人工智能行业发展的主要趋势。
随着外部限制增强,AI要素全面进入本地化时代。郑纬民院士表示,我们的算力国产化势在必行。同时他指出,智能算力的软件生态是当前制约我国人工智能发展的关键因素,优秀的系统软件能够充分释放底层硬件算力的潜力。要改变国产大模型目前生态系统不好的局面,我们要重点做好10个软件,分别是并行系统、编程框架、通信库、AI编译器、算子库、编程语言、调度器、内存管理、容错系统和存储系统。
编辑:曹倩
监制:刘金良