首页  >  媒体动态  >  媒体动态详情

当AI“炼”成人形,能为人类做些什么?

2024-09-03   瞭望东方周刊   阅读量:758

    本文刊载于《瞭望东方周刊》(2024年第18期,总第915期),原题为《“炼”就人形》。

    文丨《瞭望东方周刊》记者万宏蕾?编辑顾佳贇

   完整、逼真的“人形”身体,因对人类有独特的亲和力、有望实现复杂功能等特性,被视为AI的一种理想载体,甚至“终极形态”。

    7月4日,在2024世界人工智能大会拍摄的“十八金刚 众创未来——人形机器人先锋阵列”( 王翔/摄)

    8月21-25日,在北京举行的2024世界机器人大会上,27款国产人形机器人引发广泛关注。“他们”在大会现场演奏扬琴、泼墨挥毫、比球赛、打辩论、跳“科目三”,赚足了流量。

    7月4日,在上海开幕的2024世界人工智能大会(WAIC)上,由15款、18台人形机器人组成的“十八金刚”阵列,向现场观众做出整齐的动作,分外吸睛。国家地方共建人形机器人创新中心的“青龙”、智元机器人的远征A2、宇树科技的Unitree H1、傅利叶的GR-1、达闼的双足XR4等国产具身机器人产品纷纷亮相。

    7月6日,在2024世界人工智能大会上,人们观看宇树科技通用人形机器人Unitree H1表演“科目三”舞蹈(王翔/摄)

    “具身智能是人工智能发展的下一个浪潮。”中国工程院院士、清华大学信息学院院长、北京信息科学与技术国家研究中心主任、中国人工智能学会理事长戴琼海说。

    所谓“具身智能”,就是给能理解、推理并与物理世界互动的AI“头脑”再加上一个“身体”,“身体”可以是手机、汽车、机床、机械臂等等,而完整、逼真的“人形”身体,因对人类有独特的亲和力、有望实现复杂功能等特性,被视为AI的一种理想载体,甚至“终极形态”。这两年,在大模型高速发展带动下,人形机器人产业迎来风口,成为全球科技业最热的赛道之一。

    2024年8月,美国具身智能公司Figure AI发布二代人形机器人Figure02。此前,Figure 01已进入宝马工厂工作。国内,优必选的人形机器人Walker S先后走进比亚迪、蔚来、东风柳汽、极氪等汽车工厂“打工”,智元机器人的人形机器人远征A1也在汽车工厂完成底盘装配和外观质检等任务……

    “AI大模型将赋能人形机器人走向主动交互,成为继计算机、智能手机、新能源汽车后的颠覆性产品。”8月13日,十四届全国政协常委、工业和信息化部原副部长、中国电子学会理事长徐晓兰在2024世界机器人大会新闻发布会上说。

    越来越“像”人

    在位于上海浦东张江科学城的国家地方共建人形机器人创新中心(以下简称“国地中心”)内,身高185厘米、体重80公斤,拥有多达43个主动自由度的人形机器人“青龙”双臂轻展,用五根钢铁手指,将面包轻轻捏起。

全球首款全尺寸通用人形机器人开源公版机——“青龙”机器人正在展示(万宏蕾/摄)

    “‘青龙’具有五感能力:能看,能闻,能听,有触觉,还有姿态传感器。它双手非常灵活,能精准抓取两厘米的小物件,能用工具在小米里挑出芝麻。”国地中心总经理许彬告诉《瞭望东方周刊》,“‘青龙’机器人平台的核心技术前期经过了十余年的沉淀。从国地中心成立到最近在世界人工智能大会上整机亮相,我们团队在短短半年时间内,厚积薄发,从无到有,实现了突破。”

    “端水、抓取,听起来简单,做起来复杂,涉及从感知、决策到控制的多项技术。”国地中心首席科学家江磊说,“‘青龙’一条手臂有7个自由度、末端手指有6个自由度,指尖有触觉传感器,因此可以完成对抓取的自主判断。”

    “对人形机器人来说,大脑对应智能系统,小脑对应控制系统,五官对应机器人的感知,执行则通过关节进行。”上海机器人产业技术研究院副院长周梅杰说。

    “‘青龙’之所以聪明,在于机器人和大模型的深度融合,负责人机交互和决策的‘大脑’(朱雀具身大脑大模型)、负责稳定行走的‘小脑’(玄武小脑模型),共同形成人形机器人的技术基座。”江磊介绍说,朱雀具身大脑如同一个智能化指挥调度中心,以多模态大模型为核心,能够接收文字信息、图像信息等多种输入,并输出精准的语音交互以及明智的任务决策信息;玄武小脑模型侧重于任务执行,其轨迹规划模块采用“端到端”模仿学习驱动的方式。

    “在大数据、大模型和大算力的支持下,人形机器人正在变得越来越聪慧,逐渐具备自主完成任务的能力。”徐晓兰说。

    机器人产业已发展多年,过去的机器人一般只侧重一个“技能点”,“写一段代码做一件事”。比如:一些工业机器人,主要比“肌肉”,侧重发展运动控制技术;扫地机器人是否好用,取决于能否规避障碍,把屋子打扫干净,主要侧重发展导航传感技术。而人形机器人,要和人一样有“知行合一”的综合能力,就要在芯片、传感器、软件、人工智能、通信、机械、材料等诸多前沿技术以及综合应用上实现突破。

    “在此轮发展大模型之前,在机器人‘大脑’层面,技术上几乎没有什么水花,各家推出的模型,基本都只能实现简单任务。这两年,相关技术迎来质变的拐点。”许彬说,“未来,随着人形机器人高速‘成长’,其心智或许很快会脱离稚嫩,迈向‘成年人’的赛道。”

    “深度学习让人工智能对世界有了感知,大模型则让人工智能有了自主生成的决策能力。”北京新鼎荣盛资本管理有限公司董事长、创始合伙人张弛说,“不远的未来,人形机器人将走向通用和商业化”。

    多城市布局

    “人形机器人正在成为科技竞争的新高地、未来产业的新赛道,蕴藏巨大的市场空间和发展机遇。”徐晓兰在2024世界机器人大会新闻发布会上表示。

    早在2021年,“十四五”规划纲要就将机器人产业提到了重要位置。由工业和信息化部、国家发展改革委等十五部门发布的《“十四五”机器人产业发展规划》提出,到2025年,中国要成为全球机器人技术创新策源地、高端制造集聚地和集成应用新高地。

    2023年,随着AI大模型技术加速迭代,“人形机器人”作为热词频繁出现在国家和相关部委文件中。当年10月,工业和信息化部印发的《人形机器人创新发展指导意见》提出,到2025年,我国人形机器人创新体系初步建立;到2027年,人形机器人技术创新能力显著提升,综合实力达到世界先进水平。

    以政策为牵引,各省市围绕着人形机器人产业的布局加速展开。

    2023年4月,杭州提出,力争到2026年实现智能机器人全产业链工业产值突破500亿元。

    2023年5月,上海印发《上海市推动制造业高质量发展三年行动计划(2023-2025年)》,特别提到加快人形机器人创新发展。同时,上海在全球投资促进大会现场发布2024“投资上海”政策包,其中最引人关注的就是千亿母基金。该母基金由上海市国资委推动设立,围绕集成电路、生物医药、人工智能三大先导产业,重点投向集成电路、创新药、智能机器人等领域。

    同期,深圳印发《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》,明确提出发展人形机器人。

    2023年6月,北京印发《北京市机器人产业创新发展行动方案(2023-2025年)》,针对人形机器人行业进行政策指导,提出加紧布局人形机器人。

    多地发展人形机器人的战略图景中出现了一个新角色——人形机器人创新中心。“创新中心本质上承担着调动当地资源,促进当地人形机器人产业发展的责任。”许彬说。

    2023年5月在上海揭牌的国地中心,是人形机器人领域首个国家级公共平台。“当时,为了国地中心选址,我们考察了好几个城市。”许彬回忆说,“人形机器人很多技术基础和工业机器人、新能源汽车的产业链是共通的,上海在这些领域产业基础雄厚。出于产业基础、政策环境等综合考虑,落户上海是优选。”

    “国地中心核心任务之一就是加速机器人通用场景的落地。”许彬办公桌对面的白板上,密密麻麻手写着其对创新中心组织架构的思考。“2024年,我们计划在上海打造能容纳 100台人形机器人的训练场。我们先选择相对简单的、方便实施的场景来落地,推动人形机器人产业技术创新,并带动通用场景的落地。”

    所谓“训练场”,就是数据生产和数据规模化场地。这里会建设实时标定系统、控制系统、数据采集系统和数据反馈系统,通过数字孪生来生成合成式数据,为人形机器人产业打造真实和生成式数据。

    作为技术领域广泛、生产工艺复杂的实体产业,人形机器人涉及数千乃至上万个零部件的细分产业。发展人形机器人,对直接创造产值、带动就业、引领产业链发展,都具有重要意义。“这也是多地积极筹建人形机器人创新中心,大力推动人形机器人产业发展的原因之一。”许彬说。

    目前,北京、上海、宁波、合肥、成都等城市均已建设人形机器人创新中心,在人形机器人赛道上抢先发力。

    产业化在即

    企查查数据显示,目前我国机器人相关企业主要集中在深圳、广州、上海和苏州,这四个城市分别拥有4.94万、4.41万、3.61万和3.52万家相关企业。人形机器人最关键的核心零部件头部供应商及供应链企业,主要分布在长三角和珠三角。

    产业发展离不开资本投入,伴随人形机器人迎着风口“起飞”,VC(风险投资)、PE(私募股权投资)前仆后继地涌入这条颇具科幻感的赛道。

    2024年8月18日,被誉为“天才少年”的智元机器人联合创始人彭志辉一口气发布五款商用人形机器人新品,分别为“远征”和“灵犀”系列。同时,彭志辉宣布智元机器人启动一系列开源计划:包括具身智能机器人训练所需的百万条真机数据集和千万条仿真数据集。

    “我们希望通过数据开源、提供零部件,让更多人利用智元的零部件,快速掌握人形机器人技术。”智元机器人合伙人兼营销服务副总裁姜青松说。

    一年前的2023年8月,智元机器人发布第一代通用型具身智能机器人——远征A1,并把2024年定义为智元机器人“商用元年”。该公司预测,2024年发货量为300台,其中双足机器人200台,轮式机器人100台,主要用于交付服务场景和工业场景。

    作为行业内的明星企业,智元机器人融资迅猛。目前,该公司已完成天使轮、A轮、A1轮、A1+轮、A2轮等多轮融资,A系列融资多达6轮。

    2024年2月,宇树科技宣布完成B++轮融资,投资方包括美团、金石投资、源码资本,老股东深创投、中网投、容亿、敦鸿和米达钧石跟投,融资近10亿元。

    把时间轴拉长,可以看到达闼机器人、傅利叶智能、乐森机器人等相关创业公司身后都挤满了投资机构。据统计,2024年上半年相关融资总额超过70亿元。

    市场前景方面,据国际投资银行高盛预测,到2035年,人形机器人市场规模有望达到1540亿美元(约合人民币11037亿元)。

    另据2024年4月首届中国人形机器人产业大会上发布的《人形机器人产业研究报告》预测,2024年中国人形机器人市场规模将达约27亿元,2026年达104亿元,2029年达750亿元,占彼时世界总量的32.7%,位居世界第一,到2035年有望达到3000亿元规模。通过在“智慧大脑”的深度学习、“敏捷小脑”的精准控制、“强健肢体”的创新设计上取得关键性突破,人形机器人产业将加速从“样机炫技”走向商业化应用的落地。

    “人形机器人是人工智能技术与制造业场景深度融合的载体,中国人形机器人产业正处于井喷前夜。”徐晓兰作出这样的判断。

    开源新生态

    2024世界人工智能大会上,国地中心正式发布“青龙”为全球首款全尺寸通用人形机器人开源公版机。

    “每年我们团队会更新一版公版机,大家拿到我们的设计参考,能有的放矢地进行很多人形机器人方面的创新。”许彬介绍,作为全球首款全尺寸通用人形机器人,“青龙”集成了43个主动自由度,实现了头部、手部、臂部、腿部、腰部、踝部的全尺寸设计。“借鉴科学界和技术界在技术分享与开源创新方面的经验和做法,经过评估,我们对‘青龙’设计图纸、软件代码和数据集进行开源,旨在吸引全球范围内的开发者、研究者和企业家共同参与人形机器人的研发和应用,加速人形机器人技术的普及和产业化进程。”

    “我们有一个共同想法,要打造中国人形机器人的底座技术。”江磊说,开源不仅能够汇聚全球智慧,加速技术创新,还能为中国科技在国际舞台上赢得更多话语权。

    “长期以来,全球科技领域的开源项目多由国外主导,我们在人形机器人领域亟待打破这一局面,建立属于自己的全尺寸开源社区。”江磊说,通过开源,把相关技术向全社会开放,降低进入门槛,这样就有更多资源、更多开发者涌入这个行业,有利于促进整个行业的发展。“3年至5年后,人形机器人基本上可以在物流分拣等一些简单生产线上使用,5年至10年后,基本上可以在家庭、服务等要求比较高、比较开放的环境下使用。”

    针对当前人工智能行业普遍困扰的“大模型缺乏高质量训练数据”等问题,国地中心将提供标准化的数据采集工具,以及基于数字孪生系统完成的快速数据二次评估。此外,国地中心还将构建开放、开源的标注工具,鼓励生态联盟单位一起加速数据集构建,通过开源数据场景和行业专用数据赋能应用。

    目前,在国地中心打造的OpenLoong开源社区网站上,已经开源了机器人硬件结构及参数,即将开源具身智能软件包。总体来看,人形机器人这个赛道目前规模还比较小,开源生态的建立有望吸引更多人才和企业加入,共同突破人形机器人的共性关键技术。

    除了“青龙”系列机器人项目,目前,国地中心还在加快推进训练中心建设,推动人形机器人在更多的真实场景中应用落地。根据规划,中心首期可容纳100个人形机器人训练,计划到2027年可容纳1000个人形机器人同时训练。

    作为2024世界人工智能大会入口处“十八金刚”之一,傅利叶通用人形机器人GR-1已于7月在建设银行上海浦东分行出任“大堂经理”。

    “在建行的银行大堂经理场景训练基地,GR-1承担的工作包括引导客户、分流叫号,还能对客户进行简单的反诈培训。”傅利叶智能CEO顾捷说,“目前,GR-1比较侧重与客户进行语言交互,我们希望下一步可以更多地开发身体功能,让机器人完成迎宾接待、巡逻、文本装订,甚至存取款的工作。”

    公众非常期待让人形机器人提供照顾老人孩子等家庭服务,客观看,距离人形机器人实现大规模商用,甚至以平价“飞入寻常百姓家”,到底还有多远?

    “未来可期,投资火热,但大热赛道更需要冷静攻坚。”许彬说。

    “目前的人形机器人,功能有限,价格昂贵。在ChatGPT出现之前,大家也觉得AI不够智能,这和人形机器人目前的状态有些类似。”宇树科技创始人、CEO王兴兴说。

    “场景丰富是我们的最大优势之一。有场景,就有望驱动技术的攻坚突破。说到底,目前人类科学仍在弱人工智能阶段,人形机器人离‘像人一样学习和理解’还差十万八千里。眼下最重要的是走出实验室,真正走向市场。”中国科学院院士丁汉说。

    《云端巨模 万象更新》专题系列稿件

    大浪淘沙

    “炼”就人形

    钉子之问

    城市“智”理

    大模型推动新一轮科技革命和产业变革

    集中力量,促进国产AI大模型发展

戴琼海
中国工程院院士
控制理论与技术专家
丁汉
中国科学院院士
  • 戴琼海
  • 丁汉