首页  >  院士动态  >  院士动态详情

中国工程院院士刘韵洁回应每经:实体经济需要行业大模型,但发展行业大模型要把行业大数据保护好、利用好、管理好

2023-08-20   每日经济新闻   阅读量:71

    刘韵洁:我个人判断中国的机会是在行业大模型。因为我们网络上的数据被美国爬取以后产生的ChatGPT3、ChatGPT4,他们又在爬取视频数据,据说可能不久会出ChatGPT5,下一步他们肯定要爬取行业的大数据,因此,我们怎么把行业的大数据保护好、利用好、管理好,这是很大的挑战。如果不把大数据利用好,行业大模型就出不来,就没有基础。

    每经记者 张蕊    每经编辑 廖丹    

    算力已成为数字经济时代的关键生产力。

    8月18日至19日,由工业和信息化部、宁夏回族自治区人民政府共同主办的2023中国算力大会在宁夏银川举行。

    要让算力充分转化为生产力,还面临哪些阻碍,又应当如何解决?怎么样能够让算力更便宜更好用?应该如何提升全国算力网络的协同发展水平?带着这些问题,《每日经济新闻》记者在大会期间采访了中国工程院院士刘韵洁。

    刘韵洁是通信与信息系统专家,负责主持建设我国通信与信息领域的首个国家重大科技基础设施——未来网络试验设施项目(CENI)。在采访中,刘韵洁也多次提到该项目的成果有助于解决算力产业发展中一些不足。

    记者注意到,就在一个多月前(7月6日),习近平总书记来到紫金山实验室,详细了解推进重大科技任务攻关等情况。刘韵洁向总书记汇报了实验室最新的研究进展。

刘韵洁在2023中国算力大会期间回答记者提问 图片来源:每经记者 张蕊 摄

    不能一窝蜂地去做算力,要具体问题具体分析

    NBD:在数字经济浪潮下,尤其是目前大模型涌现,算力已经成为继热力和电力之后的新型生产力,要让算力充分转化为生产力,您认为面临哪些阻碍,我们应当如何解决?

    刘韵洁:大模型出来后,通用大模型能解决的问题、它的智能化远远超出我们原来的水平,所以大家对它非常期盼。

    我国应该怎么搞,这方面我们应该冷静地分析我国在大模型方面、在算力方面、在数据领域、在网络方面等有什么问题,这些方面都应该从比较深入的、专家层面进行研究分析,通过这样的研究分析来制定出我国的应对措施和办法,而不是现在一看大模型这么火大家都去做大模型,或者是GPU价格涨的厉害大家都去搞GPU。

    当然,不是说这些东西不能搞,而是要根据我国的具体情况,具体需求情况、具体发展步骤等来做顶层设计,统一规划。

    大家都觉得我国在网络方面,在算力方面没有问题,5G网络规模我们是全球最大,算力总规模我们是全球第二大,但实际上,我们在很多领域、很多方面还有短板。比如,我国是全球第二大算力国家,但是在应用方面,这些算力资源还没有被充分发挥出来,还有富余,所以大家不能一窝蜂地去做算力,这要具体问题具体分析。

    尤其像“东数西算”方面,还有什么问题要解决,这些方面我认为都需要在顶层去思考,需要有数据、有调研、有专家分析,制定出相应的规划,而不是凭感觉,或者不同专家各执一词。

    尤其在目前状况下,国外ChatGPT不断迭代更新,很快ChatGPT5出来,最近还看到谷歌方面关于人工智能和基因结合的新进展,这些方面不断涌现,我国什么时候也能在这些应用领域不断涌现?这就需要我们冷静分析,不能只是在这方面单纯投资就可以。

    通过公用的专网可以让算力更便宜好用

    NBD:要让算力能够更好地赋能千行百业,您认为怎么样能够让算力更便宜更好用?

    刘韵洁:我国实施“东数西算”工程,这个政策很好,西部算力的电费比较低,差距很大,东部用户用到西部便宜绿色的能源,是很合理的。

    但是东部用户怎么使用西部的算力,一个办法是需要使用网络,尤其是训练大模型的工作。但网络的成本是多大?如果通过现在的互联网去做那是很便宜,但是效率很低,也不安全,传输的数据可能就被别人盗取了,这些问题需要解决。另一个办法就是专线,专线能够保证安全、保证质量,但专线又很贵,大家用不起。

    这就需要有一个新的技术解决方案,一个新型的网络来提供服务。我提出一个新的概念,就算力而言,不管是“东数西算”还是算力网络,需要一个公用专网的技术,也就是提供一种网络技术,像专网一样可以保证安全和质量,又像公网一样经济、方便灵活。

    我国确定了一个未来网络大科学装置,我们叫CENI,这个大科学装置就能提供既便宜又安全的上网服务能力,这方面今年年底准备验收,明年就能够提供服务。CENI就能够为我国的算力提供又安全又能保证质量又经济实惠的网络服务。

    为什么会比较便宜?是因为确定性的网络可以做到不丢包,在传输文件方面其传输效率比普通网络可以提高36倍,这么高的效率就可以把价格降下来。确定性网络技术我认为在全国40个城市已经可以提供这个服务,可以为我国的“东数西算”、算力网络的建设提供非常好的服务。

    今天我看到有的运营商也宣布建立自己的确定性网络,我认为这都是非常好的,将来会给大家提供更多的选择,更多的好的网络服务。

    NBD:您认为应该如何提升全国算力网络的协同发展水平?

    刘韵洁:我国的算力网要赶上美国做的这样一个大模型的需求,我认为是需要方方面面协同来发展的。比如,做大模型的或者做行业大模型的都需要数据,如果他没有这些数据,这个大模型的训练就会受到制约。

    据了解,美国大模型之所以做得比中国好,是因为全球的数据他都爬取了很多遍,他有这个优势,我们在数据方面就没有发挥这个作用。所以数据怎么利用好、管理好、保护好就是一个很大的挑战。

    这些大模型跟算力怎么结合?跟用户的数据怎么结合?就需要网络,如果没有安全、保证质量又便宜的网络,这个训练、使用也会有很多问题,这确实需要方方面面的协同合作,搞网络的、搞模型的、搞应用的、搞数据的,包括搞数据管理的、政府部门等等都要制定相应的政策,大家能够形成一盘棋,协同起来才能把这个工作做好。如果只靠某个单一的方面,就会制约我国的算力网络建设。

    发展行业大模型要把行业大数据保护好、利用好、管理好

    NBD:目前,我国算力总规模居全球第二,我国已经是算力大国,从算力大国到算力强国还存在哪些短板?相应地,您认为应该采取哪些措施来补足这些短板?

    刘韵洁:我个人认为,首先,大模型这方面短板比较明显,美国的ChatGPT3、ChatGPT4一个一个地出来,这个短板要跟上去,除了做大模型,我们在创新方面要提升。

    其次,在数据方面、应用方面,我认为是跟社会都有关系的,大家结合起来才能使得我国的大模型能够更快发展。我个人判断中国的机会是在行业大模型。因为我们网络上的数据被美国爬取以后产生的ChatGPT3、ChatGPT4,他们又在爬取视频数据,据说可能不久会出ChatGPT5,下一步他们肯定要爬取行业的大数据,因此,我们怎么把行业的大数据保护好、利用好、管理好,这是很大的挑战。如果不把大数据利用好,行业大模型就出不来,就没有基础。

    另外,在网络方面,我们也遇到一些困难和挑战。比如新的网络架构、新的网络服务效率很高,可以支持“东数西算”、支持算力网,但是它也面临一些政策方面的制约,比如网络的流量结算,因为这个新的网络本来是做科学实验的,是公益性、服务性的,按理来讲应该不结算。如果不制定相关的政策,大科学装置就没法发挥作用,要发挥作用就要把网络结算的费用转嫁到用户,但用户又会觉得贵,使不起网络,类似这样的困境,我认为政府部门和整个行业部门需要关注。

    NBD:刚刚您提到行业大模型会是中国的机会,您觉得这方面的突破会比较快吗?

    刘韵洁:我认为是有可能的。因为我国非常重视实体经济,实体经济需要这些行业的大模型,尽管跟通用大模型也有关系,它可能要借助通用大模型的一些能力,不一定完全从头开始做,因为行业大模型有自己的一些特点,我们如果集中精力把行业大模型做出来,对我们的实体经济非常有意义,非常有价值。

    但是要做好这一点,要把行业的数据保护好、利用好、管理好,这个很重要,否则这么宝贵的数据,如果都让国外爬取完了,美国或者别的国家会把一些大模型首先发布出来,中国的机会我认为就没有了。

    但怎么把这些数据管理好、保护好,我提出一个概念,就是叫“公用的专网”,就是这些数据不能跑在互联网上,因为我们的实体经济也跑在互联网上,全都被美国爬走,全都被国外爬走。这要怎么应对?通过一个公用的专网就可以解决相应的问题。

    我们去年2月份就宣布了在山东16市开通确定性网络,山东已经在做相关的规划布局,比如在能源方面怎么利用确定性网络。所以要使用确定性网络提供的服务,很快就可以用。