本期专题邀请了在复杂智能软件领域开展相关研究与实践的学术界与工业界从业人员,从学术研究与企业实践结合的视角出发,探讨复杂智能软件构造与演化技术的相关议题。
软件开发技术总是伴随着计算技术的时代问题向前发展,随着智能计算时代的到来,软件界需要回应智能软件开发的问题。
大型机时代,软件开发的主要问题是软件开发的效率和质量问题,用机器指令或汇编语言编写软件,效率低、质量差。随着高级程序设计语言的出现及其自动编译技术的成熟,软件开发的效率和质量实现了质的跃升,助推了大型机应用领域的拓展和个人计算机的发明。伴随个人计算机时代的到来,越来越多的人涉足软件开发,软件开发的效率和质量保证问题更加凸显。随着集成化软件开发环境(IDE)的发展,软件开发技术得到普及,独立的软件产业形成,软件工程师成为一种职业。伴随互联网时代的到来,网络软件开发的效率和质量保证问题转化为软件生态的可持续成长演化问题。随着开源云原生技术的发展,开发运行一体化(DevOps)技术崛起,群智开发与快速迭代成为时尚,软件开发技术经历范式转变,“人”从软件系统外进入软件系统内,成为软件系统的组成部分,或者说软件系统有了“神启”,这个“神”就是软件系统中的“人”,这种发展态势孕育了基于网络大数据的人工智能的成功。伴随智能计算时代的到来,复杂智能软件系统开发问题值得我们高度关注。
目前,人工智能技术飞速发展,产生了智能交通、智慧金融、智能助理等复杂智能软件系统,深入到社会生产生活的各个方面,正在成为支撑未来超大规模智能化社会运转的新型基础设施,在经济发展和国家安全领域发挥越来越核心的支撑作用。复杂智能软件系统是指由大量软件系统要素(例如数据、模型、知识、代码及其服务)相互耦合关联并持续演化而形成的大规模复杂系统及其生态,具有人机协作、持续学习、成长演化的特点。例如,智能交通系统依赖传感器(包括行驶的车辆)获取环境数据,认知城市道路态势,做出判断和预测,影响车辆行驶。其中的车辆可以是有人驾驶,也可能是自动驾驶,或者是人车协同驾驶。道路态势判断与预测模型以及车辆自动驾驶模型可以在人机协同、人路协同中持续学习、成长演化。
复杂智能软件系统开发问题聚焦在“复杂性” 问题上,体现在两个方面 :一是个体复杂性(也是微观层面的复杂性),是指一个基于深度人工神经网络的智能模型(包括大语言模型,简称大模型)自身的复杂性 ;二是生态复杂性(也是宏观层面的复杂性),是指大量局部自治的智能软件系统(包括智能模型或智能代理)之间相互依赖所形成的开放生态的复杂性。前者是智能计算时代特有的复杂性,后者是网络计算时代软件生态的复杂性在智能计算时代的自然延伸。这两种复杂性都符合复杂系统科学关于复杂性的理解,我们无法用传统的确定性计算理论(包括经典计算复杂性理论)解释其行为。如何理解复杂智能软件系统的复杂性是当今复杂智能软件系统开发面临的科学问题。需要特别强调的是,复杂智能软件系统开发并非必须以回答该科学问题为前提。今天的复杂系统科学还没有为互联网、大模型的复杂性提供理论解释,但并不影响我们构造或培育有现实应用价值的互联网和大模型。实际上,互联网、大模型等人造复杂系统也为人类开展复杂系统的研究提供了可操控的实验平台,这正是今天我们研究复杂智能软件开发技术的理论意义,反映了科学与技术相互作用、共同发展的辩证关系。讨论复杂智能软件系统的开发问题,一方面服务于现实的复杂智能软件系统的开发,另一方面服务于包括复杂智能软件系统在内的复杂系统科学研究。
本期专题以国家科技创新—2030“新一代人工智能”重大项目中的“基于人机协作的复杂智能软件系统构造与演化技术”的研究为基础,聚焦“人机协作、持续学习、成长演化”,这三个关键词体现了我们对当前复杂智能软件系统开发的认知和追求。“人机协作”理念认为,今天的智能软件成长于网络计算时代的人类行为大数据之中,必然以人类助手的角色服务人类,复杂智能软件系统开发应该服务于人机协作的智能软件开发,其开发过程本身也必须是人机协作的活动 ;“持续学习”理念认为,今天的大模型在与人类协作和环境交互过程中应该具有持续学习的能力,形成人机协作共同持续学习进步的生态,复杂智能软件系统开发应该支持智能模型的持续学习能力的开发与认识 ;“成长演化”理念认为,今天复杂智能软件系统应该存在于开放的智能软件生态之中,不断成长演化,复杂智能软件系统开发应该支持智能软件生态的发育成长。
本期专题邀请了在复杂智能软件领域开展相关研究与实践的学术界与工业界从业人员,从学术研究与企业实践结合的视角出发,探讨复杂智能软件构造与演化技术的相关议题,包括以下七篇文章 :
国防科技大学冯大为的文章《复杂智能软件系统构造与演化支撑技术》阐述了复杂智能软件系统的构造与演化过程所面临的关键技术挑战,以及对应的支撑技术,介绍了复杂智能软件系统的一般工程化研发范式与流程。
北京航空航天大学罗杰等人的文章《面向大模型成长演化的数据工程》结合科大讯飞与鹏城实验室在大模型训练实践中涉及的数据工程相关创新理论、方法和工具,介绍了面向大模型成长演化的数据工程关键挑战与技术。
清华大学穆太江等人的文章《面向大模型训练的软件栈》分析并总结了大模型训练的软件栈,从软件的角度分析了实现大模型的高效训练所需要的软件工具,探讨了异构算力下的分布式算法框架。
科大讯飞AI工程院刘坤等人的文章《大模型推理云服务化与云际部署实践》以讯飞星火大模型的实践为例,围绕“智能软件部署与服务”这一主题,讨论了星火大模型在高效推理优化与快速部署服务化等方面的实践。
复旦大学陈碧欢等人的文章《基于大模型的智能软件应用构造》梳理了基于大模型的智能软件应用构造的现状与挑战,介绍了研究团队在此方向上的实践尝试。
南京大学冯洋的文章《面向智能软件的质量保障关键技术》介绍了智能软件的质量保障关键技术研究进展,包括多模态数据的自动生成和扩增、高价值数据筛选、深度学习框架测试技术等,并分析了其对构建高质量智能软件的关键作用。
国防科技大学余跃等人的文章《复杂智能软件系统生态持续演化支撑环境》围绕智能软件的复杂生态进行深入分析,结合国家新一代人工智能规划重点开源社区(OpenI启智社区)的建设经验,介绍当前我国复杂智能软件开源生态建设情况。
这七篇文章涵盖了复杂智能软件系统构造与演化涉及的研发范式、关键技术与应用案例等多个维度,不仅探讨了智能时代软件开发需要的方法、工具与平台,也考虑了面向具体应用场景的智能软件研发实践。这些内容将为读者提供关于复杂智能软件系统构造与演化的深刻见解。