大晓机器人王晓刚:现有技术路线存在缺陷,期待拥有更强的“大脑”去理解世界

近一年来,人形机器人持续火热。不过,当下人形机器人仍依赖人类遥控,普遍缺乏拥有自主决策能力的机器人“大脑”,因此也频遭外界质疑。

12月18日,大晓机器人召开发布会,推出开悟世界模型3.0(Kairos 3.0)。据悉,大晓机器人由商汤科技联合创始人、首席科学家王晓刚创立,由澳大利亚科学院院士陶大程担任首席科学家,该公司主要研究方向为机器人“大脑”及软硬件协同。

欲攻克机器人“大脑”难题

目前,国内人形机器人厂商大多聚焦于机器人本体及小脑,机器人大脑的研究相对匮乏。而大晓机器人主研方向正是机器人大脑。

王晓刚接受《每日经济新闻》记者采访时表示:“大晓机器人在产品化落地方面,输出的是软硬一体的方案,针对各个场景。”

从大晓机器人研发团队也可以看出,更加偏向“大脑”的研发,而并非机器人本体。

据悉,陶大程曾获IEEE计算机学会技术成就奖,也曾出任京东探索研究院创始院长、优必选人工智能首席科学家。此外,大晓机器人汇集来自南洋理工大学、香港大学和香港中文大学的全球稀缺的AI领域前沿科学家吕健勤、李鸿升、刘子纬、潘新钢、赵恒爽、刘希慧。


大晓机器人核心科学家团队 图片来源:大晓机器人供图

王晓刚表示:“我们团队强在‘大脑’和软件。同时,在过去两年时间,商汤也投资了一系列本体和零部件公司。然而,在实际场景中,现有的本体硬件与实际需求仍存在较大差距。因此,大晓会根据场景需求进行软硬件联合优化,协同供应链生态伙伴,重新设计硬件,使产品更符合客户需求。”

机器人“大脑”为何仍不尽人意?

王晓刚表示:“具身智能被期待拥有一个强大的大脑,这源于过去几年在大语言模型和多模态模型上取得的突破,大家期待将这种语言模型的能力赋予机器人,以实现通用化能力。”

那么,为何当下机器人“大脑”仍然不尽人意?

王晓刚认为:“现有技术路线有明显缺陷。VLA(视觉、语言、动作)模型是以机器为中心的,通过输入指令、图像和视频,直接输出动作,它不太需要去理解真实的物理世界和物理规律。我们期待将来有一个更强的‘大脑’能去理解世界,这就是我们提出的世界模型。与之伴随的是我们提出的ACE环境式采集范式。”

其具体解释称:“以前以机器为中心,基于不同物理结构的本体采集真机数据,很难综合得到一个比较通用化的‘大脑’。现在环境式采集是‘以人为中心’,通过第一视角、第三视角和多模态数据,更好地对人和物理世界的交互进行建模,并利用这些数据训练我们的世界模型。简单粗暴地使用端到端或VLA并不能解决具身智能对‘大脑’的期望。”

此前,有行业人士认为,汽车自动驾驶尚未完全实现,而具身智能更加复杂。对此,王晓刚告诉每经记者:“汽车自动驾驶与人形机器人应用场景不太一样,不能说汽车自动驾驶的场景更加简单。这是因为自动驾驶过程中,车速通常非常快,因而对乘客体验及安全性要求都非常高。”

其补充表示:“如果我们想象的场景是人形机器人在家庭中能够完全取代人、完成各种长程复杂的任务,并且保证安全性,这确实需要在未来的五年甚至更长的时间才能达到。但这并不妨碍机器人在各种场景中逐渐落地。”

Published by

风君子

独自遨游何稽首 揭天掀地慰生平