首页  >  媒体动态  >  媒体动态详情

如何缓解大模型训练算力不足问题?院士专家建议可以利用已有超算系统的空余算力

2024-05-19   央广网   阅读量:118

    央广网北京5月19日消息(记者吕红桥)据中央广播电视总台经济之声《天下财经》报道,当前,各行各业的人工智能大模型越来越多。在汽车领域,如何发挥大模型的作用?训练和应用汽车大模型有什么难点?2024新能源汽车智能网联创新大赛暨产业智库沙龙日前在安徽宿州举行,中国工程院院士和一些汽车业内专家就此发表了观点。

活动现场(记者吕红桥 摄)

    以前发生交通事故,当事人都是在现场等待交警和保险公司前来处理,这个过程耗时较长,而且容易造成交通拥堵或者二次事故。后来,轻微车损事故有了“快处快赔”,可以在线快速处理。不过,这种处理方式仍然是人工审核,有出错的可能,有的当事人并不认可。中国工程院院士郑纬民在赛前演讲中表示,大模型在汽车领域具有广泛的应用前景,除自动驾驶大模型外,还可以建立专门的汽车保险大模型,提高事故处理的精准度和效率。

    郑纬民介绍,将大量已有的汽车出事故的照片、录像、文字在基础大模型中再训练,就形成汽车保险大模型。有了汽车保险大模型,一旦有汽车现场出现碰撞,将照片放进大模型里做推理,就可以迅速找到责任人。

    汽车领域应用潜力最大的是自动驾驶。目前,不少汽车企业都在开展自动驾驶相关研发工作。其中车载算力芯片作为实现自动驾驶的核心硬件,备受汽车企业关注。自动驾驶由于需要实时处理大量多模态数据,所以对车载算力芯片的计算能力提出了很高要求。

    对此,清华大学计算机科学与技术系长聘教授李兆麟建议,发展中央计算平台式算力芯片,同时优先部署和推动存算一体、芯粒集成以及量子计算等前瞻性技术在自动驾驶领域的应用,构建开源开放的软件生态,推动国产算力芯片上车应用,解决汽车智能化对大算力、高并行的计算需求。

    无论训练汽车领域的哪类大模型,都需要规模庞大的智能计算中心来支撑。然而当前进口的训练用大算力芯片一芯难求,国产算力芯片短期内仍存在生态系统短板。如何在短期内解决大模型训练的算力不足问题?

    郑纬民院士建议,在推动智能计算中心建设的同时也可以利用已有超算系统的空余算力。现有的14个国家挂牌的超算系统,每台机器的建设成本都很高,成本在10亿元至20亿元,甚至更高。虽然这些系统已经为我国的国民经济发展、国防事业作出了巨大贡献,但有些系统还有空余算力。这些空余算力也可被用来做大模型训练,且经过优化甚至可降低大模型训练成本。

    专家认为,从长远来看,我国仍需大力发展面向汽车领域应用的智能算力中心。目前,国家新能源汽车技术创新中心已经在安徽宿州落地了国内领先的智能算力中心,积极推进产业创新落地。

    本届大赛上,智算中心二期也签约落地。国家新能源汽车技术创新中心主任、总经理原诚寅说:“现在汽车比的都是算力,在这个过程中,我们要把在芯片上扎下的底子,和现在正在做的国产工业软件数字化结合起来,形成一个立体化的解决方案,这就是为什么我们集中力量发力智算中心,而智算中心针对专业领域应用,我们对此做出了大量工业软件数字化的SAAS服务。”

编辑:嵇敬平