具身智能近日引发了学界和产业界的讨论。在2024中关村论坛年会“互联网3.0:未来互联网产业发展论坛”上,北航机器人研究所名誉所长、中关村智友研究院院长王田苗表示,具身智能时代来临,机器人从过去以“硬核”为主,正加速向大脑与小脑“智能软化”发展,期待通过机器人大模型研发,加快提高机器人智能化水平和对不同场景的适应性。 具身智能这一概念,最早是在1950年由图灵提出的,然而真正引起广泛重视却是由于近年来AI大模型的发展与应用。王田苗认为,具身智能就是实现思考、感知、行动三个空间有机智能融合的机器或系统,既具有人机交互与自然语言理解的能力,同时又可以通过感知、认知、决策与时变环境及对象进行实时校准互动,协助人完成相应的决策与行动任务。 王田苗说,最近五年发生了很多跟具身智能相关的重大科技事件。大模型实现了语义逻辑推理,使机器人执行复杂任务成为可能;人形机器人的结构、电机驱动、视觉感知有了重大的突破,使其有望在制造业、商业、危险作业、家庭养老等领域发挥作用;同时,脑机接口技术通过对脑电信号进行编解码,有望助力残疾人实现对外部设备的控制。 北航机器人研究所名誉所长、中关村智友研究院院长王田苗。主办方供图“这三件事都已经走到了具身智能的门口,正在敲击着具身智能的大门。”他说,在未来智能时代的十年间,三大革命性的智能终端将分别是AR/VR头显、无人驾驶汽车及通用机器人。 他认为,大模型不应该只停留在对话上,应该通过机器人或者具身智能与物理世界结合起来。如果机器人能够从语义和逻辑上深度理解搬运、传动带以及它们所运载的物品,就意味着机器人可能通过任务启发,自动编程并执行。 在接受新京报记者采访时,王田苗表示,在基础研究方面,具身智能发展期待出现机器人通用基础大模型。 新京报:2024年3月17日,OpenAI与人形机器人初创公司Figure合作推出了Figure 01机器人,其展示的理解、判断、行动和自我评估能力引发关注。目前,全球和我国具身智能研发处于什么阶段? 王田苗:我个人觉得正处于一个夯实基础和即将迎来落地爆发的时代,很多问题都在探索与突破之中。比如语言文本性模型中,随着参数的持续增加,其语义逻辑推理能力也将相应提高。但目前还没有出现这样的机器人通用基础大模型。另外,感知、决策、行动需要通过智能实体来实现,这也是目前全球正研究的问题。在应用场景上,具身智能将可能在物流分拣、医疗、农业、工业、养老等领域实现渐进式落地。 人们期待着利用大模型、脑机接口、通用机器人等加快具身智能在工业生产、危险作业和家庭中的应用。目前来看,我国的优势有望在这三方面特别突出。一方面,我国生产机器人核心部件的性能、质量和供应链规模在全球占有优势。另外,具身智能的训练需要大量的数据,我国有丰富且规模庞大的场景,有利于获得更优质、海量、丰富的数据。 具身智能有大模型和小模型,在小模型的控制、平衡和算法上,我国和国外处于同一水平。但我们在有些地方也存在一些差距,比如从0到1的原创性仍有待提升,另外我们的大模型数据质量尚未达到理想水平。 新京报:要实现成熟的应用,AI和机器人方面,分别还有哪些关键技术需要突破? 王田苗:一是要在基础研究方面,借助语言文本大模型探索和研究机器人的通用基础大模型,如果这个问题解决了,实际上就解决了机器人的大脑问题。 “一脑多机”是指一个有丰富知识的模型能够在若干个机器人身上应用,这不仅减少了工程师的工作量,而且提高了任务完成效率。还有一个词语叫“一脑多形”,即在不同环境下,一个特定的任务可以灵活地由不同类型的机器人执行,比如机械臂、轮式、足式、人形机器人都可以执行。未来随着一系列基础问题突破后,具身智能将有望在商务、工业和家庭的场景中得到广泛应用。 同时,具身智能的涵盖范围广泛,其中上游的核心部件尤为关键,高密度、高扭矩、高爆发力、高动态性的核心部件,如新材料、人造皮肤、人工肌肉等。 另外,具身智能的发展一定要和场景任务来结合。一个通用的具身智能体比如人形机器人,它的成熟还非常漫长。所以首先要把任务场景确定下来,再结合小脑或者与特定大模型结合起来,解决劳动能力问题。最后,具身智能还涉及安全、电源电池、数据训练等。 新京报:具身智能的发展未来是否会加速“机器人取代人类”? 王田苗:从我个人感觉可能会替代部分任务,但不会完全替代人类。首先会替代比较繁琐、重复、单调、危险的任务。因为从社会发展角度来理解,人是需要有工作的,所以具身智能应该作为人类的工具,去替代人类做不愿意干的工作,提高生产效率。 新京报:未来的应用前景如何?市场规模有多大? 王田苗:全球范围都掀起了具身智能特别是人形机器人关键技术研发的浪潮,我国也正在加速形成有竞争优势的供应链,未来随着其成本下降50%,国外人形机器人有望从25万美元/台下降到15万美元/台,中国人形机器人有望率先降到30万人民币/台。 2035年,全球人形机器人出货量有望达到70万-300万台套,并在救灾抢险、特殊传染病处置、汽车制造等场景下发挥重要作用。 新京报记者 张璐编辑 陈静 校对 李立军