当前位置: 首页 > news >正文

[机器人] 产业研究之【人形机器人】

0 概述:产业研究之人形机器人

  • 任何一种新技术、新产品的诞生,其对社会生产方式、生产关系、生活方式都将产生方方面面的影响。

典型例子,如:蒸汽机、电(电子/电气)、计算机、AI;个人电脑、智能手机、智能汽车等。

前言

  • 人形机器人作为未来产业的重要赛道,是科技自立自强的标志型成果,是人工智能、机械工程、电子工程等领域融合创新的典范,也 是实现新质生产力的最佳手段之一。
  • 人形机器人凭借其类人感知交互能力肢体结构运动方式,能够快速融入为人类设计的各种环境,未来有望在简单重复劳动危险场景中【替代人类】,在复杂技能场景中辅助人类,在商业家庭场景中服务人类。

可以预见,未来人形机器人的广泛应用将深刻改变社会形态和人们的生产生活方式,已成为全球科技领域的发展热点。
业界普遍认为,人形机器人未来有望成为继个人电脑智能手机新能源汽车后的新终端,形成新的万亿级市场

  • 本文综合各产业研报,从人形机器人的内涵出发,深入分析人形机器人的核心技术重点产品的【发展现状】和【演进路径】、【产业布局】的【重点方向】、【应用需求】和【市场预期】等。同时,聚焦【生产制造】、【社会服务】、【特种作业】等方向,梳理【典型应用场景】,明确不同场景对人形机器人的【共性需求】和【差异化需求】。最后,研究提出了对未来人形机器人产业发展的【路径考虑】,助力推动我国人形机器人高质量发展。

背景

新质生产力背景下制造业智能变革

  • 2023年11月《人形机器人创新发展指导意见》发布,该政策推出的目的为推动人形机器人产业高质量发展,培育形成新质生产力。人形机器人作为集成人工智能、高端制造、新材料等先进技术的新质生产力载体,将对社会产业变革和全球竞争格局产生颠覆性影响。

image

资料来源:中国工信部 前瞻产业研究院整理

人形机器人是缓解制造业人力供需矛盾的关键一环

  • 当前中国低生育率化、高老龄化持续加速,人口红利效应逐渐减弱。在这样的背景下,人形机器人是缓解制造业人力供需矛盾的关键一环,人形机器人可以完成非结构化制造环境中组装、分拣、检测等任务。

image

资料来源:中国社科院人口与劳动经济研究所 优必选 前瞻产业研究院整理

目录

一、人形机器人的内涵和发展历程
(一)人形机器人的内涵
(二)人形机器人的分类
(三)人形机器人发展历程二、人形机器人的技术演进
(一)人形机器人技术高度集成,多角度实现对人模仿
(二)人形机器人整机加速发展,创新产品不断涌现
(三)“大脑”技术路线并行探索,具备初阶人类脑力
(四)“小脑”加载人工智能技术,运动方式更加拟人
(五)“肢体”多技术融合发展,技术路线逐步收敛三、人形机器人产业现状分析
(一)人形机器人处于发展初期,未来市场规模巨大
(二)人形机器人潜在应用丰富,全面覆盖生产生活
(三)人形机器人产业链初步形成,正在持续优化发展
(四)人形机器人是近年融资热点,受到各界资本青睐
(五)人形机器人外溢效益明显,与多产业相互促进
(六)人形机器人产业画像:目前人形机器人正在从L3向L4过渡
(七)全球产业现状:全球人形机器人市场规模持续增长
(八)全球区域现状:日本、欧美等地区早期出台相关产业政策较多
(九)全球区域现状:日本、欧美等地区机器人产业起步较早
(十)全球企业布局:全球人形机器人企业尚未正式实现量产产品
(十一)科研创新情况:中国人形机器人产业专利公开进入爆发阶段,广东人形机器人产业专利申请数量最多
(十二)安全伦理问题备受关注,需加强政策引导及规范预研四、人形机器人产业未来展望

1 人形机器人的内涵和发展历程

(一)人形机器人的内涵

  • 人形机器人一种利用人工智能和机器人技术制造的,模仿人类外观和行为,具备较高智能化水平的机器人

image

人形机器人需要保持相对平衡并适应不同行走环境,执行器(也称:执行机构)是实现其运动的关键部件,人形机器人线性执行器旋转执行器价值量占比较高。

  • 【传统工业机器人】【服务机器人】相比,最大的特点是:
  • 其与人类相似的“肢体”结构、运动方式和感知方式,
  • 并在【人工智能大模型】的赋能下,从【体能】、【技能】、【智能】三方面,实现对人的模仿
  • 人形机器人 vs 四足机器人 :

image

  • 人形机器人具有【拟人智能】、【类人形态】和【广泛适用】三个特点:
  • 一是拟人智能

一方面人形机器人可以通过人工智能大模型技术的赋能,实现拟人化的【感知】、【决策】、【控制】能力;
另一方面,人形机器人还可以选择通过【云“大脑”】和【智能联网】的方式,突破“一个躯体、一个大脑”的限制,实现算力和智能的飞跃

  • 二是类人形态

人的形态生物进化自然选择的结果,目前社会中的所有城市基础设施、生产生活用的工具产品均为人类形态设计
人形机器人通过对人类形态的高度模拟,能快速融入到为人类设计的各类环境中执行复杂任务,具有更强的通用性和适应性

  • 三是广泛适用。人形机器人具备比人类更强的耐受性和适应性,能够在非结构化环境中长期以低成本运行,有效解决未来劳动力短缺问题,将在工业生产民生服务特种作业等领域广泛应用,甚至在部分领域发挥更大优势。

image

图:人形机器人的特点

  • 对“人形”追求的【本质】是机器人通用性的问题,【核心点】是当前是否有必要通过外形的拟人设计赋予机器人等同人类的“通用能力”,是“一机多用”还是“专机专用”。

从【现阶段】的发展情况看,人形机器人主要在工业场景试水,相比后期服务应用场景中的复杂工作,工业场景任务相对重复和单一,人形需求并不强烈。
随着“大脑”的逐步完善,【通用人形机器人】将会是终极形态,但在此之前不同进化阶段及分支是必要条件,【主体人形】+【定制化组件】的【类人形】可能是商业化初步完成前的【最优解】。
所以,从【长远】看,“人形”是机器人的【理想形态】;从【现状】看,完全的“人形”【不是】现阶段的【唯一选择】。

(二)人形机器人的分类

  • 目前由于人形的【开发难度】大,企业为快速完成功能开发、实现应用落地,在人形机器人的研发过程中,采用了诸如反关节轮式轮腿结合式两指/三指灵巧手等方式代替完全拟人的结构,并实现部分拟人化功能

按【形态】划分

  • 按【形态】来划分,目前主流的人形机器人可以分成3个大类:
  • 轮式人形机器人,主要采用轮式驱动,强调触觉传感器和灵巧手的操作功能。
  • 半身足式人形机器人,强调机器人的腿部运动能力,手部基本只用作平衡。
  • 全能型人形机器人,具备双足、双臂、双手及各类感知和人工智能功能,适应开放环境中的多任务。

image

图:人形机器人的分类(按形态划分)

按【具体应用场景】和【主要功能】划分

  • 按【具体应用场景】和【主要功能】划分,可以分成以下几个类型:
  • 特种作业型人形机器人,用于执行巡逻巡检、灾害救援、危险作业等任务。
  • 工业型人形机器人,用于工业生产及物流领域,如货物搬运、生产制造等。
  • 医疗型人形机器人,协助医生进行手术、诊断、康复等任务。
  • 教育型人形机器人,作为教学辅助工具,提供互动式学习内容。
  • 娱乐型人形机器人,与人类互动,提供陪伴和娱乐功能。
  • 公共服务型人形机器人,在酒店、餐厅、商场等场所提供公共服务。
  • 家庭服务型人形机器人,用于家庭养老、育儿、家务等任务。
  • 通用型人形机器人,可用于工业、服务、教育、医疗等多个领域

image

图:人形机器人的分类(按功能划分)

(三)人形机器人发展历程

  • 目前,人形机器人的发展已经经历了萌芽探索阶段集成发展阶段高动态发展阶段智能化发展阶段四个阶段。

1.萌芽探索阶段(20 世纪 60 年代末至 90 年代)

  • 这一时期以实现基本的双足行走功能为【主要目标】。

  • 日本早稻田大学为代表,开发了一系列机器人,如WAP、WL、WABIAN和WABOT 等。

  • 这一阶段的【主要特点】是基本实现双足行走功能控制能力,初步具备了拟人化的结构,但整体上运动能力较弱

2.集成发展阶段(本世纪初至 2010 年)

  • 这一时期以感知智能控制整合为主要特点

本田公司的 ASIMO 系列人形机器人代表了这一阶段的重大进展,通过感知智能控制技术的整合,机器人具备了初步的感知系统,能够感知周围环境的基本信息,并根据感知输入做出简单判断并调整动作。
ASIMO2000 是其中的代表作,它不仅外观类人,还能预测未来动作并主动调整重心,实现转弯时的流畅行走。

3.高动态发展阶段(2010 年至 2022 年)

  • 控制理论和技术的进步提升了机器人的认知能力,使其能够独立、 稳定地执行复杂动作,且此阶段人形机器人已经具备了较强的运动能力

如本田的升级版 ASIMO 机器人采用电驱动的技术路线,并通过整合视觉和触觉物体识别技术,能够精确完成抓取物体和倒液体等精 细任务。
波士顿动力的 ATLAS 机器人采用液压驱动的技术路线,能够在具有挑战性的场景中保持平衡并实现高动态运动

4.智能化发展阶段(2022 年——)

  • 在人工智能技术的赋能下,机器人具有了更加智能化的感知、交互和决策能力。同时,电驱动成为【“肢体”】的主流技术路线,实现了更加精准的行走和操作,并提高了研发迭代速度。

如特斯拉公司的 Optimus 机器人,基于人工智能技术和自研的 FSD(Full Self-Driving,全自动 驾驶)芯片,通过端到端的神经网络模型实现任务级和动作级的决策, 以及复杂环境中物体、人脸和手势等的识别。

  • 同时,通过其全身压力计算实时反馈机制,使机器人的四肢运动更加灵敏,能够实现流畅和自然的动作。

  • 历经多年发展及技术迭代,在巨大的潜在市场需求牵引以及人工智能技术深度赋能的带动下,人形机器人已进入技术集中突破应用初步试水的关键发展阶段。

image

图:人形机器人发展阶段图

2 人形机器人的技术演进

(一)人形机器人技术高度集成,多角度实现对人模仿

  • 技术角度来看,人形机器人主要由【“大脑”】、【“小脑”】和【“肢体”】3个部分组成。

其中,【“大脑”】负责实现【环境感知】、【行为控制】、【人机交互】等任务级能力,目前主要是基于【人工智能大模型技术】,同时也可通过【云边协同】,提高机器人的智能水平。
【“小脑”】负责控制人形机器人的【运动】,目前主要基于【人工智能】、【自动控制】、【机器人操作系统】(ROS,Robot Operating System)等技术,实现复杂环境下的运动控制
【“肢体”】负责实现高动态高爆发高精度运动,集成了人体运动力学机械结构设计新材料传感器等诸多技术,包括仿人机械臂、灵巧手、腿足等关键结构,并通过集成传感器长续航动力单元,实现【能源-结构-感知一体化】。

image

图:人形机器人的组成

(二)人形机器人整机加速发展,创新产品不断涌现

  • 【全球方面】,目前美国特斯拉、Figure AI、波士顿动力已成为国外人形机器人整机产品第一梯队,其他 1X、Digit 等欧美产品为第二梯队
  • 【整体】上看,其产品智能化水平综合性能较高,特斯拉和亚马逊的产品已步入场景测试阶段

特斯拉 Optimus 系列机器人

  • 特斯拉公司于 2022 年 10 月正式发 布 Optimus 第一代(Gen 1),使用了与特斯拉电动车相同的 FSD 系 统,具备强大的计算机视觉处理能力。

Optimus Gen 1 身高约 173 厘 米,【重量】约 73 公斤,采用全电驱动,具有行走、挥手和跳舞等功能。
在结构方面,Optimus Gen 1 【身体】具有 28 个【自由度】,包括 14 个【旋转自由度】和 14 个【线性自由度】。
在此基础上,其【灵巧手】具有 6 个【主动自由度】和 5 个【被动自由度】。

  • 2023 年 12 月,特斯拉发布了 Optimus 第二代(Gen 2),【重量】减轻到 63 公斤,【颈部】增加了 2 个【自由度】,【步行速度】提升了 30%,【平衡感】和【身体控制能力】得到改善,能够完成【非平坦地形】下的行走,包括爬楼梯等复杂动作。

【精细操作】方面,Optimus Gen 2 的所有【手指】都配备了【触觉传感器】,能够轻松准确地抓取和放下鸡蛋, 展示出精巧的【双手操控能力】。

波士顿动力 Atlas 系列机器人

  • 波士顿动力公司于 2013 年发布 的第一代 Atlas 人形机器人由外置电驱动液压动力系统提供动力,高 183 厘米,全身 28 个【液压驱动关节】,能够实现碎石路面下的稳定行 走。

  • 2016 年发布的配备了【机载液压动力系统】的 Atlas 机器人,能够实 现雪地、山地行走,可在倒地后迅速起身,并具备双臂协同搬运重物 的能力。

  • 后续,该系列机器人完成了立定跳跃、跳高、跳转身、后空 翻、慢起手倒立、前滚翻、前空翻、原地 180°空中转体、分腿跳、360° 空中转体等一系列能力。
  • 2024 年 4 月,波士顿动力宣布液压版 Atlas 退役,并推出了纯电驱的新款 Atlas 机器人,能够完成稳定的行走、 起身和 180°头部、腰部旋转等动作。

Figure AI 公司系列人形机器人。

  • 2023 年 3 月 14 日,Figure AI 发 布的人形机器人 Figure 01,利用 OpenAI 的大型语言模型,可以与人类进行正常的完整对话,并具备分类识别物品的能力,被认为是世界上第一个具有商业可行性的自主型人形机器人

  • 2024 年 8 月 6 日 Figure AI 发布的新一代产品 Figure 02,与上一代相比,Figure AI 拥 有 16 个【自由度】的第四代机械手,【负载能力】与人类水平相当,可以抓 取 25 公斤的物体,比上一代增加 5 公斤。

同时,Figure 02 的【机载计算】和 【AI 推理能力】提高了 3 倍,能够完全自主地在现实世界中执行任务。

国内企业: 采用“整机集成、关键零部件自研”的路线

  • 相比之下,国内企业采用“整机集成、关键零部件自研”的路线, 快速推进整机产品迭代,产业迅速发展,产品不断涌现。

  • 目前,已发布数十款人形机器人产品,具备较为稳定的行走、跑跳、站起等基本功能,在技术方面已有一定积累,与国外无明显代际差异

  • 优必选Walker S1 在【环境感知】与【物品抓取方面】取得了一定进展,已进入比亚迪工厂实训,与 L4 级无人物流车、无人叉车、工业移动机器人和智能制造管理系统协同作业。

(三)“大脑”技术路线并行探索,具备初阶人类脑力

1.大模型是现阶段“大脑”的最佳解决方案

  • 目前人形机器人“大脑”技术以大模型为核心,为人形机器人提供任务级交互环境感知任务规划决策控制能力

  • 在【任务交互】方面,基于大模型的语言/视觉运行处理方式可为人形机器人提供【任务级交互入口】。

  • 在【环境感知】方面,大模型通过对多模态信息的统一处理与灵活转换,推动【多模态感知泛化】。

  • 在【任务规划】方面,大模型潜在的真实世界知识学习能力、强大的思考、推理和生成能力为“大脑”的任务规划提供基础。

  • 在【决策控制】方面,人形机器人基于大模型技术并优化奖励策略,通过整合环境、运动等多样化信息,实现决策控制功能

  • 从【功能需求】角度出发,人形机器人的“大脑”大模型需要具备以下能力:

  • *实时交互能力**。人形机器人需要具备与人类实时的任务级交互能力,快速理解人类通过语言、手势等方式给出的指令,并有效执行当出现指令理解不清或任务执行完毕后,可以与人类进行进一步的多轮交互。
  • 多模态感知能力。为了在复杂环境中做出正确决策,人形机器人需要能够通过视觉、听觉、触觉等多种感官获取信息。大模型需要整合这些多模态感知数据,以实现对环境的全面理解。
  • 自主可靠决策能力。人形机器人在执行任务时,需要能够理解任务的复杂性,并将其分解为一系列可执行的子任务。这要求大模型具备强大的语言理解能力和对物理世界的深刻理解。

例如,机器人可能需要理解“清理房间”这一任务,包括识别哪些物品需要移动,哪些需要丢弃。

  • 涌现和泛化能力。除了在训练数据上的表现,大模型还应具备超出训练范围的执行能力。具体表现为人形机器人能够在未见过的新环境中执行任务,适应新的、未知的情况。面对新挑战时,展现出创新性的解决方案。

2.人形机器人大模型多技术路线并行探索

  • 技术路线上看,目前基于大模型的“大脑”技术路线正处在并行探索阶段,并逐渐向端到端的大模型演进。现阶段主要是 4 条技术路线:
  • 一是 LLM(大语言模型)+VFM(视觉基础模型),实现人机语 言交互、任务理解、推理和规划,目前最为成熟。

主要代表是谷歌的 SayCan 模型,通过预训练技能的价值函数对齐(Grounds)大语言模 型或者通过价值函数的训练使大语言模型对用户指令进行推理分解 获得任务步骤。

  • 二是 VLM(视觉-语言模型),弥合语言与视觉理解间的差距,实现更准确的任务规划和决策。

主要代表是清华大学的 CoPa 模型,利用嵌入在基础模型(比如视觉语言模型的代表 GPT-4V)中 的常识知识为开放世界机器人操控生成一系列的自由度末端执行器 姿势,生成的操控任务分为任务导向抓取和感知运动规划。

  • 三是 VLA (视觉-语言-动作模型),在 VLM 基础上增加运动控制,解决机器人运动轨迹决策问题。

主要代表是谷歌的 RT-H 模型,学习语言和运动, 并使用视觉上下文,通过利用语言-视觉-动作结合的多任务数据集学习更强大和灵活的动作策略。

  • 四是多模态大模型,实现对物理世界环境的全面感知,是【未来的主要研究方向】。

主要代表是麻省理工、IBM 等共同研究的 MultiPLY 模型,将视觉、触觉、语音等 3D 环境的各类 特征作为输入,以形成场景外观的初步印象,并通过多视图关联将印 象中的输出融合到 3D,最终得到以对象为中心的场景特征。

  • 此外,类脑智能和脑机接口等创新技术也为人形机器人“大脑”的 解决方案带来无限可能。
  • 类脑智能是人工智能技术的进一步延伸,是 通过对人脑生物结构和思维方式进行直接模拟,使智能体能够像人脑一样精确高效处理多场景下的复杂任务,是未来有望代替大模型的新技术路线。
  • 脑机接口是在人脑与外部设备间建立连接通路的技术,实现人脑与外界设备的信息交换。未来有望基于脑机接口实现“大脑”的 “人+机”混合智能。

3.人形机器人“大脑”向更高级的智能化和自主化发展

  • 当前,人形机器人“大脑”刚刚具备【初阶人类脑力】,仅能完成人的部分工作,无法形成人类大脑全能力闭环。同时,其情感表现属于模拟层面,不具备情感理解能力
  • 基于大模型的“大脑”技术发展主要受限于数据和训练平台
  • 数据方面,由于真实数据采集难度大,仿真数据保真度规模有限,较难形成“数据飞轮”效应。
  • 平台方面,“大脑”的研究涉及数据采集、模型开发部署和仿真环境测试的整个流水线链路,需要强大的通用计算平台提供大规模计算支撑和通用服务能力。
  • 人形机器人作为人工智能的前沿应用领域,其发展速度令人瞩目。然而,要实现真正的智能化和自主化,现有的大模型仍需在多个方面重点发力。
  • 一是在感知模态维度方面形成突破。

当前的人形机器人大模型主要依赖于视觉语音感知,这种单一的感知模态在处理复杂环境时显得力不从心。
例如,在嘈杂的环境中,仅凭视觉信息,机器人可能难以准确识别和响应。
为了克服这一局限,未来的大模型需要整合视觉听觉触觉等【多种感知模态】。
【多模态感知】能够提供更丰富的环境信息,使机器人在复杂场景中做出更准确的决策。
例如,结合听觉和触觉信息,机器人可以更好地理解人类的指令和情感状态。

  • 二是在指令生成速度与复杂性方面形成突破。

现有的大模型在生成指令时的速度较慢,且生成的结果往往过于简单。
这在需要快速反应的场景如紧急救援或复杂操作任务中,可能导致机器人无法及时作出正确响应。
目前主流机器人大模型偏向于任务理解和拆分,对于机器人运动控制的涉及较少,只是用预设的端到端的训练方式生成了简单且离散分布的机械臂末端位置和底盘移动指令,未渗透到连续路径轨迹规划等更偏机器人领域的内容。

  • 三是在泛化能力提升与模型架构优化方面形成突破。
  • 泛化能力是大模型在新环境和新任务中表现的关键。

当前的模型在泛化能力上仍有待提高,尤其是在面对未知环境和任务时,模型的表现往往不尽人意。
为了提高泛化能力,未来的大模型需要在架构、训练方法和数据集方面进行创新。
例如,通过引入元学习迁移学习等技术,可以使模型更好地适应新任务。
同时,构建更多样化的数据集,也有助于模型学习到更广泛的知识。

(四)“小脑”加载人工智能技术,运动方式更加拟人

1. “小脑”运动控制包括基于模型的控制方法和基于学习的控制方式 2个大类

  • “小脑”的运动规划与控制是人形机器人实现自然和流畅动作的【关键】。
  • 传统的基于模型的控制方法通过建立机器人的运动学和动力学模型,进行运动轨迹规划和平衡控制,特点是身体控制稳健,步频较慢,代表算法有零力矩点(ZMP,Zero Moment Point)算法、线性倒 立摆(LIP,Linear Inverted Pendulum)算法、模型预测控制(MPC, Model Predictive Control)算法、中心引力优化(CFO,Central Force Optimization)算法等,但整体开发较为复杂,成本高,不利于产品快 速迭代。
  • 基于学习的控制方法则使用端到端的人工智能技术,代替复杂的运动学模型,大幅度降低了“小脑”开发难度、提升了迭代速度, 一般通过人类示教****或自主学习建立【运动执行策略】。其中通过【人类示教】的方式也称为【模仿学习】,指通过人或者其他专家提供【反馈示教】的方式, 使机器人以产生与示教相似的行动策略进行学习,效果依赖高质量示范数据。通过自主学习的方式也称为强化学习,指通过精心设计学习目标,机器人不断在环境中探索逐渐发现最大化奖励的方式学习到最优的执行策略,效果依赖于仿真环境。

目前主要的“小脑”技术路线包括以下几种。

基于模型的控制方法:

  • ZMP 判据及预观控制。基于简化的倒立摆模型/小车模型进行质心点运动规划和控制。该算法需要精确的动力学模型和复杂的在线控制策略,扰动适应性差。典型代表有日本本田、AIST 的相关产品。

  • 混杂零动态规划方法。通过在全身动力学模型上采用非线性控制,根据状态选择步态,进行轨迹跟踪控制。该算法需要精确的动力学模型和线性化反馈,实时求解慢,对复杂环境适应性差。典型代表有美国俄勒冈州立大学的相关产品。

  • 虚拟模型解耦控制。将控制解耦为速度、姿态、高度等,建立弹簧阻尼等虚拟模型进行力矩控制。该算法降低了对精确动力学模型的依赖,但融合复杂,对复杂环境的容错能力有限。典型代表为波士顿动力的相关产品。

  • 模型预测控制+全身控制。基于简单/复杂的动力学模型进行力的预测控制,进而全身优化,可实现臂足协同及物体接触。该算法依赖精确动力学模型和状态估计,线性模型仅适用于下肢单一步态的控制,而非线性模型求解速度慢。典型代表有美国麻省理工学院、瑞士苏黎世联邦理工大学和波士顿动力公司的相关产品。

基于学习的控制方法:

  • 强化学习。通过奖励设计和仿真环境设计,实现了受控步态、奔 跑、转弯、上下台阶等运动学习,提升运动的鲁棒性,并可以通过采 用因果 Transformer 模型,从观测和行动的历史中对未来行动进行自 回归预测来训练。典型代表如 Agility Robotics 的相关产品。

  • 模仿学习。采用非线性最优化求解的动作映射,以人机关节轨迹 相似为目标,以机器人可执行性、安全性、稳定性判据为约束,规划 运动方案。该算法计算耗时长,严重依赖初值,对碰撞检测难以解析 计算。典型代表有日本 AIST、北京理工大学的相关产品。

2.人形机器人“小脑”向基于学习的控制方法演进

  • 传统的机器人控制方法依赖于精确的动力学模型和专家知识,难以适应非结构化环境的不确定性和复杂性

  • 近年来,学习型控制的发展使得机器人能够从数据中学习控制策略,但其泛化能力鲁棒性仍难以满足复杂场景需求。

大模型为机器人控制引入了丰富的先验知识 和泛化能力,有望进一步突破传统控制方法的局限性。
整体上看,目前人形机器人的“小脑”核心技术正在从基于模型的控制方法基于学习的控制方法演进。

  • 强化学习领域,【大模型】为引入先验知识提高样本效率提供了新的思路。

LanguagePlan 为例,该模型利用 GPT-3 根据任务描述生成抽象的行动计划,如“先走到门口,然后打开门,再走出房间”。 然后,LanguagePlan 将该行动计划嵌入到状态空间中,作为额外的观 察信息,用于训练一个分层强化学习智能体
实验表明,LanguagePlan 能够显著提高样本效率泛化性能,加速复杂任务的学习。类似地LOFT、T-EBM 等模型也展示了利用语言模型引导策略学习的能力。

  • 模仿学习方面视觉-语言模型为机器人学习复杂技能提供了新的范式。

CLIP-ASAP 为例,该模型首先利用 CLIP视频帧编码为【语义特征】,然后通过【因果语言建模】学习动作与视觉变化之间的关系
控制阶段CLIP-ASAP 根据语言指令****和当前视觉观察,预测下一时刻的关键帧,并将其传递给低层控制器执行。
实验表明,CLIP-ASAP 能够学习复杂的长期技能,如烹饪、家政等,且具有很强的泛 化能力,能够根据不同的指令组合技能。
类似地,R3M、Pix2R 等模 型也展示了利用视觉-语言对齐进行模仿学习的能力。

  • 尽管大模型在机器人控制中展现出了广阔的应用前景,但如何进一步提高其实时性、鲁棒性和可解释性仍然是亟待解决的问题。

此外,如何将控制感知决策规划更紧密地结合,构建【端到端的自主系统】,也是未来的重要研究方向。

(五)“肢体”多技术融合发展,技术路线逐步收敛

  • “肢体”是人形机器人实现所有拟人功能的载体和基础,主要包括执行机构、芯片、传感器、电源、新材料方面的诸多先进技术。

1.执行机构

  • 目前,“肢体”执行机构的【核心驱动技术路线】已由传统的【液压驱动】方式全面转为【电驱动】。

液压驱动技术依赖于液体压缩泵产生高压液体,进而驱动输出机构。主要优点是力量输出大、易于扩展,但也存在控制技术复杂、能量效率相对较低、系统零件多、成本高、故障率高、维护维修繁琐、响应速度不够快等诸多问题。

液压驱动的代表产品主要是波士顿动力在 2024 年前的一系列人形机器人产品。
电驱动技术以各类【电机】作为动力输出机构
优点是成熟可靠、寿命长、鲁棒性 好、成本相对较低、易于控制、响应速度快、能量转化效率高等,主要缺点是本身扭矩密度较低,通常需要搭配减速器使用。
目前以特斯 拉 Optimus 为代表的新一代人形机器人均采用电驱动技术。
2024 年 4 月波士顿动力正式放弃传统的【液压驱动路线】并发布了该公司首款电驱动人形机器人,标志着驱动技术全面向电驱动路线收敛。

  • 人形机器人的执行机构主要包括旋转执行机构线性执行机构末端执行机构三类。

  • 【旋转执行机构】多用于人形机器人关节处,如手腕、膝关节,主要由【电机】和【减速器】组成,核心零部件是无框力矩电机、行星减速器和谐波减速器等。

目前主流的技术路线有两条:
一是高减速比(TSA&SEA, traditional stiffness actuator&series elastic actuator)方案,由高转速低 扭矩电机+谐波减速器组成,优点是输出扭矩大、精度高,可实现精 准的运动控制。目前,谐波减速器减速比为 50-300,并且体积紧凑, 在扭矩密度提升层面更具优势,“下肢”应用较多。缺点是减速器体积 和质量要求高,力控需要力矩传感器,成本高
二是准直驱(PA, proprioceptive actuator)方案,采用高扭矩电机+低减速比行星减速器, 优点是行星减速器刚性传动可反算力矩,不需要额外传感器,行星减 速器成本约为谐波减速器的 1/5,整体成本较低,在其负载范围内时, 是最经济的选择。缺点是扭矩电机成本高,体积大,且扭矩密度的进 一步提升只能通过增大尺寸,同时该方案对散热有较高要求

  • 【线性执行机构】多安装于机器人上臂、大腿及肘部,可理解为旋转 执行器的线性转换,通常实现伸展、推拉等直线运动,主要通过梯形 丝杠、滚珠丝杠或行星滚柱丝杠实现。

其中,行星滚柱丝杠具有更高 的承载力、更长的使用寿命及更小的体积,是线性执行器目前及未来 的主要技术趋势,但行星滚柱丝杠的成本远高于其他类型丝杠。
特斯 拉的 Optimus 的线性执行器即采用了反向行星滚柱丝杠技术,承载能 力强,寿命长,比常规滚珠丝杠提升一个数量级。Optimus 整机采用 了 14 个线性执行器,包含 4 根梯形丝杠(约 100 元/副)及 10 根行 星滚柱丝杠(约 10000 元/副),占总成本约 10%。

  • 【末端执行机构】可分为爪手类工具类,爪手类从各类夹持器已进化为多指灵巧手

目前全球灵巧手处于技术突破阶段,【研发重点】是系统简化和小型化、提高鲁棒性和自由度、多感知能力融合。
目前灵巧手的主流技术路线是使用电机驱动和连杆传动,结构形式上正逐步向驱动器混合置方向发展,空心杯电机是灵巧手的核心部件。

image

图:人形机器人三大执行机构

2.芯片

  • 人形机器人的芯片主要包括处理器芯片控制芯片总线管理芯片,其中处理器芯片是其功能实现的核心。

目前人形机器人处理器芯 片的【主流技术】是技术路线最成熟的 CPU + GPU 方案。特
斯拉人形机器 人搭载的FSD芯片即采用该路线,并与汽车自动驾驶共享底层技术。
单个芯片算力 72TOPS,是市场上唯一从底层出发为自动驾驶和深度 神经网络所设计的芯片,其中 CPU 做控制,GPU 做图像处理,NPU 为神经处理单元,并集成了大量的计算单元和专门的神经网络加速器, 能够高效地进行复杂的计算和推理任务,完全适用于人形机器人。
同时,人形机器人的处理器芯片还可通过 CPU+FPGACPU+ASIC 等 方案实现。
CPU+FPGA 方式,由于 FPGA 的开发流程简单,具有较 短的研究周期和较低的成本,但流片成本高昂。同时 FPGA 功耗较高, 不适用功耗敏感的应用。
CPU+ASIC 方式,通过数字“类存算一体”方 式实现 MAC 操作,在【电路级】实现“存算一体”,该路线运行稳定性较 高,但并行性和能效比要低;
同时也可以采用本身具有存储和计算功 能的固定存储器(NVM),实现【器件级】“存算一体”,单位器件可具有 多级状态,发展潜力巨大。

3.传感器

  • 大量传感单元是实现复杂感知功能、与环境交互的基础。人形机器人所需的传感器类型包括六维力传感器、关节扭矩传感器、拉压力传感器、指尖测力传感器、视觉传感器、触觉传感器、惯性测量单元、接近觉传感器、距离传感器等多种类型。

  • 六维力传感器可以测量力和力矩,对于实现人形机器人的运动控 制规划、姿态调整、力度感知和精确操作至关重要,通常安装在人形 机器人的手腕、脚踝、足底或手部,用来提升操作的灵活性和行走的 稳定性。

  • 关节扭矩传感器通常安装在人形机器人的上下肢关节处,用 于测量关节所受到的力,实现输出力的主动控制。

  • 拉压力传感器用于测量拉力和压力,一般安装在人形机器人小臂、腿部和灵巧手等位置 的线性执行器上。

  • 指尖测力传感器多应用于灵巧手上,实现加载力位 置的实时判定及反馈。

  • 视觉传感器可以获取周围环境的图像信息,实 现目标识别、位置定位等功能,一般采用 CCD 相机、CMOS 相机等。

  • 触觉传感器可以感知外部压力、温度和其他物理参数,可以形成类似 于人类皮肤的触觉感知层。

  • 惯性测量单元一般由加速度计、陀螺仪和 磁力计组成,可以实时测量物体的加速度、角度和磁场方向。

  • 接近觉传感器用于检测物体是否接近以及接近的距离,用于控制人形机器人 的位置、识别路径、障碍急停等。

  • 距离传感器则用于测量人形机器人 与物体之间的距离,实现避障、定位等功能,包括激光、超声波、红 外线等实现方式。

以特斯拉的人形机器人为例:

一台人形机器人需要 1 套视觉传感 器、1 套位置传感器、14 个一维力矩传感器、14 个一维压力传感器、 4个六维力矩传感器、10个MEMS(Micro-Electro-Mechanical System, 微机电系统)触觉传感器(手指部位)、1 套薄膜传感器。

  • 目前传感器方面的整体趋势是向多维度高精度高集成度高延展性方向发展, 【高维力矩传感器】和【高维触觉传感器】是传感器方面的当前研究重点。

4.电源

  • 人形机器人需要高性能的电源来提供持久的动力。

Figure AI 公司 发布的 Figure 02 人形机器人搭载 2.25 KWh 的电池组,一次充电可以 运行 5 小时。

我国目前大部分人形机器人的运行时间通常为 2-4 小时。

  • 电源包括电池电源管理系统两部分。

【电池】方面,目前锂离子电池是主流,但其在能量密度、循环寿命等方面仍无法满足未来人形机器人长时间、高负荷工作的要求。

国内企业如宁德时代等正在研发更高性能的电池技术。
【电源管理系统】方面,主要用于监控电池状态,优化能源使用,确保人形机器人在各种工况下都能稳定运行。
国内在电源管理系统的研发方面也在不断加强。

5.新材料

  • 人形机器人的新材料主要应用在骨骼、外壳等方面。该部分是支 撑人形机器人进行各种行动的基本框架,其应用场景包括外壳材料、 脊椎、大臂、小臂、大腿、小腿等结构件。

目前人形机器人“肢体”骨骼的常用材料包括钢材、铝合金、镁合金、碳纤维、工程塑料等。
在 保证机器人功能的先进性、稳定性、使用可靠性和服役安全性的前提下,采用轻量化材料,结合结构优化设计、先进制造工艺,可使机器 人构件轻量化,能够提高机器人的机动灵活性,保证机器与人类一起 协作工作时不会受到机器的伤害等问题。
目前,聚醚醚酮(PEEK) 在人形机器人“肢体”方面具有较大的应用潜力,可以满足人形机器人 本体轻量化的要求,大幅提高人形机器人灵活性和工作效率,减轻其 运动惯性,提高安全性。
采用了 PEEK 材料的特斯拉 Optimus Gen2 较上一代重量减轻 10kg,步行速度提升 30%。

3 人形机器人产业现状分析

(一)人形机器人处于发展初期,未来市场规模巨大

  • 功能实现上,人形机器人可分为 5 个能力等级。
  • 第一级(Lv1) 是基础能力实现,指人形机器人具备稳定的走、跑、跳功能和初步的 交互能力。
  • 第二级(Lv2)是初级智能实现,本阶段人形机器人可实 现特定场景下的特定功能,结构化任务,泛化能力较弱。
  • 第三级(Lv3) 是场景智能实现,本阶段人形机器人在特定场景下能够完成大部分非 结构化任务,具备一定泛化能力。
  • 第四级(Lv4)是多场景适配,本 阶段人形机器人能够在多个场景完成大部分非结构化的任务,且不少 于 3 个场景。
  • 第五级(Lv5)是全面智能实现,本阶段人形机器人能 够实现真正的具身智能,通过简单的学习即可完成各类任务。

image

图:人形机器人五个发展等级

  • 从目前产业技术现状上看,目前全球绝大多数全能型人形机器人产品处于 Lv1 等级,少部分头部企业最新产品和轮式机器人等其他形态的人形机器人正在逐步向 Lv2 等级探索,并从工业制造领域的 to B 端向服务领域的 to C 端拓展。

如 2024 年 5 月,特斯拉 Optimus 机器 人已经进入特斯拉工厂“实训”,实现对电池单元进行准确分装及纠错 能力。
2024 年 10 月,特斯拉 Optimus 机器人演示做饭、调酒、跳舞 等服务功能,并展现出更高水平的交互能力和更流畅的运动能力。

  • 需求侧分析,人形机器人的【核心】是代替或辅助人类完成各种任务,而根据相关统计分析数据,未来我国劳动人口将出现下滑,人形机器人可以有效填补我国未来短缺的劳动力。

  • 综合技术进展情况需求侧情况预计,从现在到 2028 年,全能型人形机器人将整体处于 Lv1 等级,以科学研究为主要落地场景,客 户主要是从事人形机器人相关软硬件研究的高校、企业等科研团队, 其他形态人形机器人则加速向 Lv2 等级演进。我国整机市场规模约在 20 至 50 亿元。

2028 年到 2035 年,人形机器人整体进入 Lv2 等级, 以特种场景应用为主,工业场景逐步落地,整机市场规模达到约 50 至 500 亿元。
2035 年到 2040 年,人形机器人整体进入 Lv3 等级,在工业场景形成规模,服务场景逐步落地,整机市场规模达到约 1 千至 3 千亿元。
2040 年到 2045 年,人形机器人整体进入 Lv4 等级,实现工业场景服务场景规模应用,整机市场规模达到约 5 千至 1 万亿 元。
2045 年后,人形机器人整体进入 Lv5 等级,在用人形机器人超 过 1 亿台,进入各行业领域,整机市场规模可达约 10 万亿元级别。

image

图:人形机器人各等级主要应用场景和规模预期

(二)人形机器人潜在应用丰富,全面覆盖生产生活

  • 人形机器人有着与人类相似的感知方式、“肢体”结构和运动方式, 是人工智能和机器人技术的创新高地,在各类应用场景中将发挥重要 作用。

  • 人形机器人的主要潜在应用场景包括生产制造社会服务特种作业三个大类。

  • 其中在生产制造领域,可以有效解决人口老龄化问 题,缓解未来的劳动力短缺,如农业采摘、汽车和 3C 领域制造业生 产等。
  • 社会服务领域,可以代替人类从事公共服务员、家政服务员、 物流配送员、安保巡逻员等岗位,为人类提供各方面的服务。
  • 特种作业场景主要是指在危险的作业环境中对人类进行替代,如在深海、民 爆、核电站等危险工作场景替代人类完成生产、巡检、探测、排爆等 工作;在航空航天领域代替人类长期驻守空间站,执行航空器维护和 空间科研任务,放大、延长外太空的工作时间,甚至直接登录地外行 星进行探索任务。

1.工业生产(自动化装配、质量检测等)

  • 目前,特斯拉、优必选、小米、小鹏、智元机器人等人形机器人厂商均已将目光聚集于工业生产领域,人形机器人将有望在汽车制造领域率先批量使用。
  • 人形机器人通过与传统自动化设备的协同,在汽车生产上,可用于装配底盘、打螺丝等,提升工厂智能化水平,实现 复杂工业场景的无人化生产

如特斯拉宣称其人形机器人 Optimus 将 率先应用于汽车制造领域,包括但不限于特斯拉的超级工厂内部,协助或替代人类完成重复性、危险性高的工作,未来有望全面接管特斯 拉汽车的生产。
优必选推出的工业版人形机器人 Walker S 系列,也将 率先适用于汽车领域工业场景,未来还将逐步拓展至汽车零部件、3C、 智慧物流等其他智能制造领域及应用场景
小鹏等则积极推进人形机器人在自有制造系统中的分阶段落地
智元机器人的远征 A1 将首先面向工业场景,规划在比亚迪工厂参与外观检测流程、进行底盘装配 等汽车装配线上作业。

工业生产制造领域,人形机器人重点应用场景包括以下方面:

  • 精密装配与操作

3C 电子产品如智能手机、笔记本电脑、智能 穿戴设备等,其内部结构复杂,包含大量微小精细的零部件。
人形机 器人通过高精度的机械臂和灵巧手,可以进行精准的抓取、放置、组 装等操作,完成电路板焊接、屏幕安装、电池固定等精密装配任务。

  • 柔性化生产线作业

由于人形机器人具备类似人类的移动能力和 关节灵活性,能够适应不同的生产线布局和工位需求,实现产线的快 速调整和重组,尤其适合多品种、小批量、快节奏的生产模式。

  • 厂内物料流转与管理

在仓库管理和生产线物料供应环节,人形机器人可以高效地进行物料搬运、库存盘点等工作,通过自动识别技术,准确无误地将物料送达指定工位,提高供应链效率。

  • 质量检测与维护

结合视觉识别、力感知等先进技术,人形机器人可以执行产品的外观检查、功能测试等质量控制任务,同时也能对生产设备进行预防性维护和故障排查,降低停机时间

2.物流(分拣、配送等)

  • 智慧物流领域,1XTechnologies、Agility Digit 和中国电科 21 所 等厂商在尝试利用人形机器人的优势来解决传统物流难题,推动行业 向更加智能化和自动化的方向发展。在物流领域,人形机器重点应用 场景包括以下方面:

  • 仓储管理与拣选

人形机器人可以灵活地在货架间移动,利用视觉识别和深度学习技术精准定位和抓取货物,实现智能拣选。
例如,在大型电商仓库中,人形机器人能根据订单信息高效完成商品的分拣、打包工作

  • 搬运与装卸

利用人形机器人的力量与灵活性,能够进行重物搬运以及复杂环境下的货物装卸作业,减轻工作人员的体力负担,并在高架库、窄巷道等特殊环境下替代人力操作。

  • 自主导航与调度

配备先进的传感器和自主导航系统的人形机器人可以在复杂的仓库环境中实现自主路径规划和避障行驶,同时通过中央管理系统实时调度,提高整体作业效率。

  • 最后一公里配送。在快递和外卖行业,人形机器人或类人形的递送机器人可以将包裹直接送达消费者手中,尤其适合于公寓楼、办公区等场所的室内递送服务,提供更便捷的终端交付体验。

3.家庭和商业服务(家庭服务、迎宾接待等)

  • 随着人工智能、机器学习和传感器技术的快速发展,以及人们对便捷生活需求的不断提高,人形机器人将在服务、娱乐、医疗、养老等领域发挥重要作用。

供给端角度来看,目前人形机器人在民生服务领域有落地计划的厂商包括达闼科技宇树科技傅利叶智能开普勒机器人优必选等。

  • 家庭服务与陪伴

作为陪伴型机器人,人形机器人能提供家政、 教育、娱乐等多种服务,如照顾老人与儿童、进行简单的家务劳动、 辅导孩子学习等。
随着老龄化社会问题日益凸显以及家庭结构的变化, 这类需求将会持续增长,进而提高人形机器人在家用市场的渗透率。
当前,人形机器人在家庭服务与陪伴领域的应用仍处于起步阶段,主 要集中在提供基本陪伴、娱乐互动和简单家务服务。
例如日本的 Softbank 公司推出的 Pepper 机器人和美国的 Jibo 机器人,这些机器 人能够进行语音交流、表情识别、情感分析等,为用户提供陪伴和简 单的家庭服务。
但目前市面上的人形机器人功能仍然相对有限,尚未 广泛应用于家庭环境。

  • 商业服务

在大模型技术持续提升人形机器人交互能力的背景下,业界正在从原有需求升级现有需求满足未来需求探索三个维度下,探究人形机器人在商业服务领域的逐步落地。
目前,商业服务人形机器人主要应用在封闭环境下的室内场景中,迎宾接待、导览讲解、需求解答、舞蹈表演等场景对机器人的运动性能要求不高,且部署周期短,将成为商业服务领域的最先落地场景。
当前,人形机器人产品(全能型人形机器人和轮式人形机器人)应用在展览展厅、商超酒店、网点大厅等场合。
优必选、达闼科技、傅利叶智能、星动纪元等公司在商业服务人形机器人领域均有布局。

  • 科研教育

人形机器人可作为教学助手进入课堂,实现科研助手、教学演示等功能。
通过生动有趣的方式传授知识,激发学生的学习兴趣,同时也能减轻教师的工作负担。
未来,随着教育信息化进程加快,人形机器人在教育领域的渗透率有望进一步提升。

4.医疗健康(辅助手术、康复护理等)

  • 随着人口老龄化、慢性病发病率上升以及新型疾病的出现,医疗系统面临着极大的压力,主要表现为不断增长的全球医疗和康复需求。
  • 当前,我国医疗行业面临长期护理工作人员短缺和人口老龄化日益严重的问题,主要的痛点包括医护人员短缺、医疗资源分布不均衡和医疗成本高昂等。
  • 人形机器人在医疗保健与健康领域的主要作用是辅助医护人员进行日常工作,降低其工作强度与工作负担。
  • 考虑到劳工成本不断上涨和长期护理工作人员的供应增长预期相对缓慢,作为更有效和高效的方式,智能康养人形机器人能够承担繁重和重复的康复任务,并确保训练动作的准确性和一致性,可以应对快速增加的养老需求,并填补长期的人工供需缺口。
  • 现阶段,人形机器人在医疗保健与康复领域的应用仍处于起步阶段。
  • 面临的难点主要包括技术成熟度、成本、医疗准确性和安全性等问题,人形机器人需要具备高度可靠的操作能力和判断力,以便在各种医疗场景中准确执行任务。
  • 此外,医疗行业对安全性和隐私性要求极高,人形机器人的生产和应用需要满足诸多严格的标准和认证要求。

5.安防巡逻

  • 在过去的几年里,非人形的机器人已经被用于安保任务,例如美国加利福尼亚州 Knightscope 开发的蛋形机器人 K5 和创业公司 Ascento 创建的两轮机器人,实现了在铁路车库的巡逻。
  • 从供给端来看,1X Technologies 的 EVE 人形机器人目前已成功应用于巡逻安保场景,区别于其他保安类机器人,EVE 人形机器人具有头、脸和两只 自主移动的手臂。随着技术的不断进步和成本的降低,未来人形机器 人在安保领域的应用将会越来越广泛。人形机器人可以在各种复杂的环境中执行安保任务,例如在园区、工厂、仓库等区域进行巡逻监控, 对机柜外观、开关、表计等进行巡查,排查是否存在安全隐患。

6.危险作业

  • (石油、核能、矿山、化工、消防)人形机器人可以替代人类在危险的环境中进行工作,提高工作效率和安全性。
  • 在石油和天然气行业中,人形机器人可以用于井下作业、油气管道巡检、危化品处理等危险作业。通过远程控制和智能化决策,人形机器人可以在高污染、高辐射等恶劣环境下进行工作,提高工作效率和安全性。
  • 在核能行业中,人形机器人可以在辐射环境下进行工作,用于核废料处理、核设施维护等危险作业,降低人员伤亡风险。此外,在矿山、化工、消防等领域,人形机器人也可以发挥重要作用。
  • 在矿山场景中,人形机器人可以用于矿井巡检、采矿等危险作业;
  • 在化工场景中,人形机器人可以用于化工厂巡检、危险品处理等危险作业;
  • 在消防场景中,人形机器人可以用于灭火、救援等危险作业。
  • 但目前需进一步提高人形机器人的技术能力、智能水平和可靠性,从而实现在危险作业中对人的代替。

7.灾害救援

  • 人形机器人在灾害救援领域具有广泛的应用前景。
  • 在地震、火灾、洪水等灾害发生后,人形机器人可以帮助救援人员快速定位受害者,提高救援效率,减少人员伤亡。
  • 首先,人形机器人可以进入人类无法到达或者难以进入的区域,如废墟、坍塌的建筑物等。

这些区域可能会存在危险,但是人形机器人可以替代救援人员进行搜索和救援工作,并通过配备各种传感器和设备检测生命迹象、搜寻被困人员、探测有害气体等,为救援人员提供重要的信息。

  • 其次,人形机器人可以帮助救援人员进行危险的操作。例如,在一些情况下,需要进入高温、有毒或放射性等对人类的生命健康有严重威胁的危险环境。通过远程控制人形机器人,救援人员可以在安全的环境下进行操作,避免暴露于危险之中。
  • 此外,人形机器人还可以协助救援人员进行物资运输后勤保障工作。

在灾区中,物资运输可能会受到限制,但是人形机器人可以在复杂的环境中自主导航,将物资送达救援人员手中。同时,人形机器人也可以提供如送餐、运送医疗用品等必要的生活支持。

总结

  • 总体来说,人形机器人可用于生产制造社会服务特种作业三大应用场景。各场景的共性需求包括人机交互能力、精准作业能力、自主决策能力、运动能力和安全伦理需求等,同时也各有侧重。

  • 特种作业类任务大部分属于标准化场景流程,对人机交互能力和精准度要 求一般(危险环境作业可能根据具体任务不同,对精准度有更高要求)。 而较为恶劣的场景环境对设备的环境适应要求较高。该场景通常需求 明确,供需对接相对容易,短期发展潜力较大。

  • 制造业场景主要是对工业制造场景中的工人进行替代,大部分工作为标准化流程,但总装 等环节对于细节的处理要求较高,对运动控制能力,手部精细化操作 能力要求较高。由于在生产过程中需要和人类工人或工作指令下达人 员进行频繁交流,需要有一定的人机交互能力。

该场景客户相对集中, 属于 to B 类型,且技术实现难度处于中等水平,预计中期的应用潜力 较大。

  • 服务业场景主要是提供综合家政服务、医疗、教育、商业、公 共服务等,一般均为非标准化场合,对于人形机器人的交互能力、智 能水平、灵活性、精准度等要求较高,同时还涉及诸多安全伦理问题。

该场景客户相对分散,主要为 to C 类型,并有部分 to B 的客户,预计落地应用将随着技术进步逐步释放,远期市场潜力巨大。

(三)人形机器人产业链初步形成,正在持续优化发展

  • 人形机器人产业链主要由上游零部件中游人形机器人【本体】以及下游终端应用等环节构成。

image

资料来源: Tesla AI Day 前瞻产业研究院整理

  • 目前,我国已基本形成了覆盖人形机器人全产业链的供给体系,但由于人形机器人尚未在下游终端应用领域实现规模化商业化落地,且随着人形机器人技术的不断成熟,其核心零部件的技术选型也在持续探索,我国人形机器人产业链仍在不断构建和优化中。

未来,在人形机器人创新体系加速完善,以及“大脑”、“小脑”、“肢体”等关键技术突破的牵引下,我国有望形成高效可靠的人形机器人产业链和供应链体系。

1.上游原材料与零部件

  • 人形机器人的产业链上游包括减速器、电机、丝杠、控制器和传感器等硬件组件,以及相关的软件系统

  • 长期角度来看,产业链中最具价值的部分在于【软件】。掌握或自主研发运动控制和人工智能算法等核心技术的企业,将在技术层面上主导人形机器人发展方向和节奏,成为此领域的“中枢”和“脑”,并且同时也成为中游机器人【本体制造】的主导企业。

  • 当前形势来看,传感器、减速器、电机和丝杠等核心零部件的价值占比较高,增量空间显著。

由于我国工业基础好、相关产业链齐全,人形机器人核心零部件的发展潜力巨大。
零部件的技术突破将有助于提升人形机器人的性能、降低成本、提高可靠性和安全性,并促进技术创新,从而推动人形机器人产业化的进程。

2.中游机器人本体研发设计与制造

  • 人形机器人本体的设计制造与集成是【产业链的关键环节】。
  • 目前,人形机器人本体制造业正处于产业化发展的初期阶段,行业内对人形机器人本体的价值已达成共识,但大规模商业化落地仍未真正实现。
  • 零部件选用软硬件整合本体设计以及应用场景的聚焦仍在探索之中,各类人形机器人总体解决方案正持续迭代与创新,人形机器人产业的“0-1”拐点有望提前到来。

  • 然而,人形机器人本体的发展面临多重挑战,包括技术基础亟待增强、制造成本需显著降低、算力需求高以及场景验证困难等问题。唯有解决上述发展困境,人形机器人行业才能成功从实验研究转向规模商业应用。

3.下游应用领域

  • 2023 年以来,众多人形机器人制造商在产品研发和市场策略上 积极瞄准各类下游应用领域。
  • 从各个厂商的应用规划来看,中短期内,人形机器人将主要应用于工业制造、仓储物流以及特种应用领域;而在中长期内,人形机器人的目标则是进入千家万户,为家庭养老育儿 等场景提供相关服务。
  • 随着应用的普及,面向各领域的专业运营企业 也将应运而生。
  • 此外,业界领军企业也在加速打造人形机器人“大脑” “小脑”“肢体”的开源软硬件平台、典型行业应用场景的数据采集 和训练场等,开源、协同、高效的产业链创新生态正在逐步形成。

(四)人形机器人是近年融资热点,受到各界资本青睐

  • 国家分布上来看,人形机器人产业投资最活跃的地区是中国和美国。

据不完全统计,2014 年到 2024 年第 3 季度,涉及我国人形机 器人企业投融资事件共 176 起,占全球 40%,投融资金额超 55 亿美 元,占全球 52%;
涉及美国人形机器人企业投融资事件共 106 起,占 全球 24%,投融资金额超 34 亿美元(其中有 20 笔投融资金额未披 露),占全球 33%。
国外企业融资单体金额平均高于我国,Figure AI 及波士顿动力均获 50 亿美元级投资。

  • 时间分布上来看,人形机器人产业投资最活跃的时间区间是 2023 年第 1 季度到 2024 年第 2 季度,行业内 86%的 TOP10 的风险投资事件集中在此时间内。

image

图:近 4 年全球人形机器人重点本体公司投融资情况

(五)人形机器人外溢效益明显,与多产业相互促进

  • 人形机器人涉及了人工智能、机械工程、电子工程等诸多学科领 域,是创新技术的集大成者,与目前许多创新方向形成了相互促进的产业外溢关系
  • 在人工智能方面,

一是人形机器人与多模态大模型协同发展,当前全球大模型市场规模约 200 到 300 亿美元,其中多模态 大模型占比约 10%,达 20 亿美元(来源:IDC)。
二是促进训练和仿真平台的开发,人形机器人训练平台是高效开发、训练、测试人形机 器人技术的孵化器,如美国的英伟达的 ISSAC 及北京人形机器人创 新中心的“开物”平台等。
三是与自动驾驶具有诸多相同的底层技术, 如智能化的感知、决策、控制等。

2023 年,我国自动驾驶市场规模达 到 1000 亿元。
预计到 2030 年,全球市场规模将达到 8349 亿元(来 源:Frost & Sullivan)。

  • 机械工程方面,人形机器人推动了无框力矩电机空心杯电机伺服系统的进一步升级。

  • 电子工程方面,推动电子皮肤的加速发展,以他山科技为代表的电子皮肤传感器已实现在 汽车、教育、安防、工程等行业的应用落地。

  • 仿生机械方面,促进了机械臂、机械手等产品创新,并与机械狗、机械鱼等其他产品融通 发展。

目前,全球机械臂市场规模已经突破数百亿美元,预计在未来 几年内将以约 12%的年均增长率持续扩张。
2021 年我国机械手市场 规模约为 1958 亿元,预计到 2029 年,市场规模将达到 3760 亿元(来 源:中研普华)。

(六)人形机器人产业画像:目前人形机器人正在从L3向L4过渡

  • 按照智能化程度,人形机器人可被分为L0至L5六个层级,目前人形机器人正在从L3向L4过渡。

image

资料来源:前瞻产业研究院整理

(七)全球产业现状:全球人形机器人市场规模持续增长

  • 全球人形机器人市场规模持续增长。

2023年全球人形机器人市场规模约21.6亿美元。
随着技术的进步,预计未来人形机器人将在更多场景中实现商业化应用,不仅提升生产效率,还将在教育和家庭生活中扮演更加积极的角色。
到2029年,全球人形机器人产业规模预期达324亿美元。

image

资料来源:中国人形机器人产业大会 前瞻产业研究院整理

  • 中国产业现状:中国市场展现出巨大的增长潜力

中国人形机器人市场展现出巨大的增长潜力。根据中国人形机器人产业大会披露的信息,2024年中国人形机器人市场规模约27.6亿元。对于整个人形机器人市场未来的发展,工信部2023年11月发布的《人形机器人创新发展指导意见》中明确,到2027年,产业加速实现规模化发展,应用场景更加丰富,相关产品深度融入实体经济,成为重要的经济增长新引擎。

image

资料来源:中国人形机器人产业大会 前瞻产业研究院整理

(八)全球区域现状:日本、欧美等地区早期出台相关产业政策较多

  • 整体来看,日本、欧美等发达国家早期出台机器人产业政策较多,中国则是近年来飞速发展,后期出台了一系列政策支持人形机器人产业的发展

image

资料来源:前瞻产业研究院整理

  • 中国政策现状:中国人形机器人政策重心由技术转向产业化

中国人形机器人政策重心技术开始转向产业化,2021年之后陆续发布《“十四五”机器人产业发展规划》、《“十四五”智能制造发展规划》、《“机器人+”应用行动实施方案》等政策。

image

资料来源:前瞻产业研究院整理

(九)全球区域现状:日本、欧美等地区机器人产业起步较早

  • 日本开创了人形机器人这一新兴赛道,而后欧美等企业积极开发相关产品。

image

资料来源:前瞻产业研究院整理

(十)全球企业布局:全球人形机器人企业尚未正式实现量产产品

  • 作为新兴科技产物,尽管全球机器人产业链齐全,但目前市场上诞生的人形机器人,技术层面上还停留在新产品对外发布、应用场景验证测试阶段,商业层面上还未实现大规模量产和商业落地。

image

资料来源:各公司官网 前瞻产业研究院整理

(十一)科研创新情况:中国人形机器人产业专利公开进入爆发阶段,广东人形机器人产业专利申请数量最多

  • 中国人形机器人产业专利公开进入爆发阶段
  • 根据incoPat数据,2015-2023年,中国人形机器人专利申请及公开数量呈波动上升趋势,2023年,中国人形机器人专利公开数量为2903项,中国人形机器人产业专利公开进入爆发阶段;申请机构方面,截至2024年11月,北京理工大学为人形机器人领域专利申请规模最大的机构,有181项。

image

资料来源:incopat 前瞻产业研究院整理

  • 广东人形机器人产业专利申请数量最多

从区域申请数量来看,截至2024年11月,广东人形机器人领域专利申请数量最多,达到1650项。从区域申请趋势来看,江苏后期在人形机器人领域专利申请数量较多,发展趋势较好,2023年江苏人形机器人专利申请数量280项,广东申请数量256项。

image

资料来源:incopat 前瞻产业研究院整理

(十二)安全伦理问题备受关注,需加强政策引导及规范预研

  • 人形机器人的安全伦理问题包括就业问题隐私问题操控问题等。

  • 人形机器人对就业的影响可以分为两个方面。

  • 一是替代效应。对于劳动力过剩的地区,人形机器人将造成一定程度的失业。但从另一方面看,能够大规模替代低技术劳动力,有效应对人口下行压力和老 龄化下未来的用工压力。
  • 二是创造效应。从直接影响看,人形机器人设计和维护需求催生新岗位,需要新的研发型和应用型人才,形成就业缺口。
  • 间接影响看,人形机器人应用将提升企业生产效率,增强 企业竞争力,进而在宏观上带动经济发展。

预计 2035 年人形机器人 达到 Lv3 后,可进入工业和服务业领域弥补短缺的劳动人口。
隐私风险则是由于人形机器人在提供服务的过程中,可能会收集和处理大量 个人信息和隐私数据,从而引发隐私泄露的风险。
操控风险则是人形 机器人可能会对人类进行有意的误导,在价值偏差下“操纵”人类,影 响人类的自由意志和决策。

  • 为有效解决上述问题,可以考虑重点加强以下几方面工作:
  • 一是加强政策引导。政府应出台相关政策,引导人形机器人产业健康发展,同时保护劳动者的合法权益。
  • 二是加强职业教育和技能培训。推动低技术工人向复合型和高技术型人才转变。
  • 三是完善相关规范。制定和完善相关法律法规及安全伦理规范,明确人形机器人的使用范围和权限,保障人类隐私和安全,分级分类推动人形机器人落地应用。

4 人形机器人产业未来展望

  • 迭代路径看,To B 市场是人形机器人发展的必经阶段To C 市 场将成为远期重点方向。

  • 技术领域看,“大脑”“小脑”属于ICT领域, “肢体”属于工业装备领域,两个领域应协同发力,融合发展。

  • 但不同 阶段的发力重点各有侧重。

  • 产业落地初期应用规模较小时,人形机器人能否落地的重要因素就是其智能化水平,应在 ICT 领域重点发 力,加快推进“大小脑”技术发展,同步补齐零部件的短板。
  • 大规模应用阶段,【成本问题】成为核心因素

工业场景使用人形机器人的最基 本要求是其购买、折旧、维护等的综合使用成本小于用工成本,服务 场景 to C 端的用户对价格更为敏感。
目前人形机器人的发布价格仍 在几十万至数百万,需在工业装备领域重点发力降低成本。

image

图:人形机器人商业化落地的三个阶段

基于上述考虑,并结合人形机器人发展的趋势,可考虑分三个阶段推动人形机器人商业化落地。

  • 第一阶段(2024—2030 年),通过政策牵引,深入挖掘危险作业、极端环境等高价值场景,遴选一批可落地可推广的典型需求。政府搭桥,推动特种应用场景供需双方对接,定向开发一批产品并落地应用。

  • 第二阶段(2030—2035 年),加快探索工业制造、物流等制造业相关的大规模应用场景,从“替代相对简单且重复性的劳动”开始,成熟一代应用一代,在迭代中加速技术成熟、降低单体本、提升整体性能,逐步提高对制造业场景的渗透率。

  • 第三阶段(2035年后),加强人工智能与人形机器人的融合创新,实现更高水平的具身智能,并推动人形机器人进入医院、学校、商场、餐厅等服务业场景,最终走入千家万户。

X 参考文献

  • 人形机器人产业发展研究报告(2024) - 中国信通院

  • 深度解读「高盛」人形机器人最新研报:核心供应链企业梳理和投资分析(附报告) - 知乎

  • 预见2025:《2025年中国工业机器人行业全景图谱》(附市场现状、竞争格局和发展趋势等) - 前瞻经济学人

  • 2025年人形机器人产业发展蓝皮书—人形机器人量产及商业化关键挑战 - 深圳前瞻产业研究院/廖子璇 2024.12.27

http://www.agseo.cn/news/676/

相关文章:

  • 因果图灵测试(Causal Turing Test, CTT),为判断AGI是否真正实现的唯一终极标准。
  • ECT-OS-JiuHuaShan在DeepSeek上的提示语
  • 强力漱囗液~西吡氯铵含漱液
  • 30条顶级APT与蓝队攻防单行命令:网络战场终极对决
  • github仓库推送拉取设置token
  • 你的部署流程已然落伍-热重启的失传艺术
  • 一次“连镜像都被 RST”的 GitHub push 填坑笔记
  • 分布式事务seata
  • 内容
  • 你的项目一团糟-不是你的错-是框架的锅
  • 【神器 Collection】mermaid:编程语言自动生成流程图
  • CF2138D
  • QBot - *--_
  • 222
  • 1111
  • Codeforces Round 1048 (Div. 2)
  • 为Unity开发者准备的虚幻引擎指南
  • mtgsig1.2 4.03 分析
  • 世界最顶级的游戏网络联机框架——NetCode for Entity
  • 《Python 操作 PDF 文件的常见方法-PDF转Word(附在线工具推荐)》
  • 理解Redis线程模型
  • 内核知识地图
  • Prometheus监控harbor仓库
  • kubernetes集群重置部署
  • 文件不只是数据-一份稳健的文件处理指南
  • 第一次作业
  • freeRTOS的信号量,是不是有点像中断
  • 【去日本玩了2】跟随空色轨迹一起去日本演出(2025年)
  • weston 桌面使用及工作架构
  • 滑动窗口