首页  >  媒体动态  >  媒体动态详情

张钹院士多维度探讨大模型时代的企业AI发展趋势

2024-08-15   光明网   阅读量:63

    在当今技术迅速发展的时代,生成式人工智能与大模型正成为推动产业变革的重要力量。随着AI技术的不断成熟与普及,它的应用已从个人领域扩展至企业层面,广泛覆盖各行各业。

    近日,在用友主办的“2024全球商业创新大会”上,中国科学院院士、清华大学人工智能研究院名誉院长张钹发表了主题为《生成式人工智能时代的产业》的演讲。

    会上,张钹院士从能力、应用、架构、趋势等几个维度,详尽阐述了学术界关于大模型的洞察与思考,全面剖析了大模型的演进路径,就该技术的应用前景、挑战及其在不同领域的实际应用展开了深入探讨。

    大语言模型“三大能力”与“一大缺陷”不容忽视

    张钹院士进一步探讨了生成式人工智能的核心优势及其可能带来的挑战。目前,在大模型发展的进程中,已呈现出“三大能力”和“一大缺陷”。

    其中,生成式人工智能具备的三大核心能力为:

    强大的语言生成能力,即在开放领域生成多样性的、语义连贯的、类似人类的文本,这是大语言模型区别于其他计算机生成语言的灵魂和优势所在;

    强大的自然语言对话能力,即在开放领域实现人机自然语言对话;

    强大的迁移能力,即在代理任务上训练一个模型,只需要少量数据和微调,就可以适配到下游任务中,从而凸显出大模型可举一反三的能力。

    除了上述优势外,大模型也呈现了一大缺陷,那就是大模型的幻觉。换句话说,在多样性输出的过程中,大模型也会犯错,这与它的创造性同时产生。

    这种幻觉是在外部信息驱动下产生的,因为大模型与人类生成的语言只是行为上相似,而内在机制完全不同。更深一步讲,这也揭示出了基础模型的局限性。一方面,它输出的结果不一定正确,且质量不可控;另一方面,大模型不可信任;还有一方面,大模型对提示词的依赖性强。

    “正因具备上述优势与缺陷,产业在落地大模型应用时必须格外重视这些因素。”

    基础模型的三种落地方向

    目前,在生成式AI的众多应用场景中,高阶应用如设计、规划,低阶应用如服务、营销是相对容易实现的。例如,券商可依托大模型打造新一代AI中台大脑,帮助企业实现智能化的开户、客服、AI选股等服务场景。

    与之相反,涉及企业关键业务领域的大模型应用场景则是较难实现的,如自动驾驶或制造行业的定制化生产、质量控制等。因为这些核心业务对于技术的容错率较低,而可靠性、准确性要求更高。

    为解决大模型的应用场景落地核心业务领域的问题,张钹院士提出了落地通用基础模型的三种方向:

    第一,面向各个行业的垂类大模型;第二,在大模型的基础上打造产业应用;第三,让大模型与其他技术、工具相结合,创造产业应用。

    大模型的六种架构模式

    让大模型真正落地,同时还能使其用起来安全、可信、可控,是产业和企业普遍关注的话题。为此,张钹院士提出了基于大模型的六种架构模式。

    第一,在很多大模型设计的过程中,都会增加提示工程这一至关重要的中间环节。它可以提高模型的理解和响应能力,从而输出更令人满意的结果。

    第二,检索增强生成(RAG)对于事实性的问题,为了提高生成内容的确定性,生成式人工智能需要结合检索功能,通过触发外部知识库检索机制,辅助大模型生成更加准确、详尽且具有针对性的答案。

    第三,加入领域知识和私有数,可以显著提高生成式人工智能的输出质量,使其更符合特定领域的需求。

    第四,知识图谱与向量数据库将知识图谱与向量数据库结合使用,能够帮助生成式人工智能更好地理解和处理文本中的语义信息,可解决模型缺乏事实知识、幻觉和可解释性等诸多问题。在企业部署大模型时,通过建立向量数据库,并让它与文档数据库协同工作,从而提高生成结果的准确性。

    第五,内部监测与控制在加以人类控制后,大模型可检测出数据偏差和漂移,也可处理异常情况。此外,引入智能体强化学习可以让大模型自我反应,帮助它完成感知、动作、学习的一体化,从而减少错误的发生。

    第六,安全与治理随着大模型的发展,安全、误用与滥用已经成为普遍问题,这里涉及政治标准、道德与伦理等问题。只有建立多层次的安全保障,推动治理体系落地,才能够确保大模型健康可持续性发展。目前,这是一个迫在眉睫的问题。

    坚持大模型自主发展之路,推动应用创新与产业化进程

    针对生成式人工智能未来前景的问题,张钹院士认为,生成式AI是人类发展史上的一次重大技术突破。为此,人类花费了几十年时间解决了人工智能领域中的三个关键技术问题——文本的语义向量表示、生成式预训练转换器、自监督学习。

    其中,最关键的技术创新就在于文本的语义向量表示,它实现了从信息形式的处理到信息内容处理的跨越。

    “这项技术真正意义在于它将语言问题转变为一个数学问题。原来,文本仅代表了一个个符号,符号是存在于离散空间的,这些很难用数学工具去解析。而现在,语言被翻译为向量,计算机根据向量就可以解析成语义,对信息的内容加以处理,从而帮助人类真正进入到人工智能时代!”

    张钹院士认为,就目前来看,问题的关键点仍在于如何让第三代人工智能技术落地。第三代人工智能的发展方向重点在于:第一,构建具备可解释与鲁棒(稳健)的AI理论与方法,消除人们心里产生的恐慌。其次,开发安全、可控、可信、可靠且可扩展的技术,从而驱动人工智能产业的繁荣发展。第三,推动AI的创新应用与产业化。这表明,AI技术的研究与开发不仅仅是学术上的突破,还需要与产业需求紧密结合,将技术创新转化为现实应用,从而带来经济效益和社会进步。

    同时,他还提出了“知识驱动+数据驱动”的理念,通过整合知识、数据、算法和算力这四大要素,确保AI技术不仅具备强大的智能能力,还能够在多样化的应用场景中发挥稳定且长效的作用。

    未来,企业不仅会关注技术本身的突破,更会思考如何将其与产业实际深度结合,让大模型为人类社会创造出更多的价值和机遇,迎接智能时代的全面到来。(李记)

张钹
中国科学院院士