首页  >  媒体动态  >  媒体动态详情

中国工程院院士刘合:大模型必将推动油气新质生产力发展

2024-08-07   中国化工报   阅读量:292

    中化新网讯 8月1日至3日,2024年第三届中国油气人工智能科技大会在北京召开。中国工程院院士、中国石油勘探开发研究院教授刘合出席大会并表示,大模型必将推动油气行业新质生产力发展。大模型应用需从数据、算力、算法三方面扎实开展工作,稳步实施。

    刘合指出,推动大模型行业应用的关键要素有三:数据、算力和算法。数据是大模型行业应用的基石。当前,数据已成为新生产要素,数据的数量和质量直接影响大模型的应用。针对不同场景的数据进行收集和标注,是确保大模型能够准确适应并服务具体场景的关键。算力是大模型行业应用的保障。大模型的训练过程需要处理海量的数据,并通过多次迭代优化模型参数。这一过程需要极高的计算资源,算力的强弱直接决定了模型训练的速度和效率,进而影响模型的开发周期和成本。算法是大模型行业应用的工具。不同的算法适用于不同的任务和数据类型,能够捕捉到数据中不同的特征和信息。算法的选择和优化直接影响到模型的性能上限。

    基于这三大要素,油气行业大模型应用还面临诸多挑战。一是数据之困。油气行业数据采集成本高昂,且数据采集、存储等标准不统一,系统技术架构不统一,数据权限管理不统一,跨企业、跨部门之间数据资源共享难以实现,数据价值挖掘困难。二是算力投资和安全难以平衡。自建算力的话,面临怎么建、谁来建、怎么用等问题,代价大、投入产出比高;而租赁算力的话,不能完全保证数据的安全和隐私。三是算法方面存在定制化与迭代双重考验。目前,人工智能、大模型主要解决的是单点突破,如何建立涵盖油气全盆地、全产业链的数智中心,推动形成智能决策分析、智能生产优化等科研生产新模式,是油气行业推动智能油田建设过程中需要解决的问题。四是“百模大战”带来跟风效应。国内需协同多方合作,打破“混战”僵局。五是版权问题。大模型的开源生态“百花齐放”,但开源的模型不等于可以商用。油气行业应用大模型要谨慎处理版权问题。六是大模型概念混淆。油气领域所说的勘探开发(大)模型大部分时候是指油气勘探和开发领域中应用的地质模型,“大”更多时候体现在地理空间上。而大模型是人工智能领域的深度学习模型,大模型的“大”,体现在模型、参数、数据等方面。七是大模型应用时应注重轻量化和端侧部署。

    刘合建议,油气行业可先行实施场景模型和数据质量好的L2行业基础模型(即油气领域大模型),解决业务需求。加强数据全生命周期管理,构建一批高质量开源数据集,推动油气行业大模型研发生态建设。统筹考虑通算、智算、超算设施建设规划,建设以智算为重点的融合算力设施。加强“AI+能源”复合团队建设,推动大模型技术自主可控。“大模型不是万能的,要逐步推进、有序实施油气行业大模型,切实解决油气业务痛点。”刘合强调。

刘合
中国工程院院士
能源与矿业工程管理专家