编者按:他们创办的公司或已是独角兽,或刚启动种子轮,或已家喻户晓,或长期身居幕后,或正起于微末,但他们都是中国新经济的微观脉搏,是这轮产业和技术升级的微观主导者和实践者,不同行业成千成万的他们的身影汇聚,投射变革的洪流。
由财联社和《科创板日报》联合发起的 “连线创始人/CEO”栏目,主要关注创新创业型企业,以企业创始人/CEO的访谈为一手信源,让成长中的创业公司走入公众和市场视野,并发掘最新技术和产业趋势。
《科创板日报》1月13日讯(记者 李明明) 具身智能的下半场,竞争焦点已聚焦具身数据。
2026年CES展上,黄仁勋抛出重磅论断:“机器人的ChatGPT时刻正在到来”,同时直言“脱离真实世界的数据,具身智能终将沦为幻觉”。这一观点迅速引爆全球科技产业,释放明确信号:机器人行业正告别单一任务编程、依赖真实场景数据却效率低下的旧阶段,全面迈入以物理AI为核心的通用化发展爆发期。
事实上,国内资本早已敏锐捕捉到这场产业变革浪潮。2025年下半年,行业完成范式升级,竞争维度从单一本体,升级为“本体+数据”双核驱动,更迈向“数据×模型×本体”协同发力的新阶段。
当前,具身智能领域在不同技术阶段与场景约束下,正并行推进四条核心数据路线,且每条路线均已形成清晰技术逻辑与产业落地方向:一是遥控真机路线,依托真实机器人执行任务获取数据,场景贴合度与数据真实性无可替代,但研发部署成本居高不下;二是仿真数据路线,凭借算力与仿真引擎生成海量合成数据,拓展性极强,却受限于仿真与现实的域差难题,难以完全适配真实应用;三是人类视频路线,通过采集大规模人类行为视频提取数据,成本与落地门槛最低,却易因场景还原度不足陷入应用误区;四是UMI数据路线,构建无本体依赖的通用化数据协议,打破硬件壁垒实现数据复用,通用性与适配性优势突出。
四条路线并行背后,国内具身智能赛道产业格局已初步清晰,智元机器人、银河通用、它石智航、鹿明机器人凭借各自主攻路线的深耕布局,成为业内公认的“具身数据四小龙”。其中,2024年9月成立的鹿明机器人,是国内布局UMI路线的先行者,率先推动通用化数据协议的场景落地。
海量、高质量的真机交互数据,是训练高性能机器人模型的核心基石,而行业长期受困于数据采集成本高、效率低,以及不同机器人本体数据无法互通的“数据孤岛”难题。鹿明机器人精准捕捉这一核心瓶颈,将突破方向锚定数据采集基础设施,其自主研发的FastUMI Pro无本体模仿学习数据采集系统,成为破局关键。
《科创板日报》记者近日对话鹿明机器人创始人、CEO喻超,及公司联席CTO丁琰。其中,喻超曾任追觅具身机器人(Magic Lab)业务负责人,并首创全球首个空翻电驱动人形机器人。而其联合创立的鹿明机器人,正通过提供从数据采集设备、高质量数据集、行业解决方案到联合模型训练的全栈服务,构建完善的UMI数据生态体系。
喻超表示,相较传统遥操作采集方式,鹿明FastUMI Pro通过创新硬件架构与软件算法,将单条数据采集时长从50秒压缩至10秒,效率提升5倍,综合成本降至传统方法的五分之一;更关键的是,该系统实现了数据与机器人本体的解耦,可快速适配市面数十种不同机械臂、,有效打破了行业数据孤岛困境。
“我相信2026年头部模型公司训练数据的规模一定是去年十倍以上的量级,整个具身数据市场相比去年一定是十倍以上的增长。”

UMI相比传统数据采集方案效率提升5倍,成本降至1/5
《科创板日报》:几年前UMI项目在学术界、产业界都相对冷门,当时为什么选择坚持做这个项目?
丁琰:2024年3月我们开始启动UMI项目时,全球范围内从事该领域的团队寥寥无几,由于技术难度较高,很多团队都中途放弃了,在推进过程中,我们越来越坚信这个项目的价值和前景,最终取得了一个又一个的阶段性成果。
首先就是FastUMI,我们从2024年3月左右开始做这个工作,中了当年的CoRL 2025,将学术界工作带入了工业界。
另外一个工作是FastUMI 100K。我们团队因此获得了大规模的数据治理经验。
UMI领域的真正门槛并非设备本身,而在于能否采集到“可训练”的高质量数据。市面上许多UMI设备采集的数据存在视觉与位姿未对齐、传感器不同步、轨迹不可复现(replay)等问题,实为无法用于有效训练模型的“废数据”。对此,鹿明首创了“为模型成功率负责”的系统工程范式,从硬件设计源头保障数据质量。
《科创板日报》:UMI在成本降低方面有哪些表现?其市场定位和市场份额变化趋势是怎样的?
丁琰:UMI在成本控制上优势明显,若不考虑机器人本体成本,其采集效率相比传统数据采集方案提升5倍,成本降低1/5;若计入本体成本,成本降低幅度更大,可达1/100甚至1/200。
从第一性原理来看,人手的采集效率最高,而UMI的采集效率已达90%,接近人手水平,因此被认为是数据采集的终极解决方案。
市场份额方面,过去几年遥操作的市场份额达95%以上;但从2025-2026年开始,UMI方案会迎来爆发式增长。
《科创板日报》:遥操作与UMI设备在数据维度上有什么差异?两者的适配算法有何不同?目前公司的客户合作情况如何?
丁琰:两者的数据维度差异不大,但适配的算法有所区别,遥操作的画面维度稍高,传感器数量与现行UMI设备不同,算法也从关节预测转向末端预测。UMI的适用场景范围较大,可广泛应用于各类具身智能公司。
我们跟三菱、中远海运、德马科技形成了比较深度的战略合作。在场景里面落地的过程中,数据规模化又能带来智能化的提升。
目前全球具身智能行业内有超过三分之二的团队,正在使用FastUMI Pro,2026年这一比例还会进一步提升。
《科创板日报》:UMI数据采集工厂的环境设计有什么要求?不同任务的采集环境是否存在差异?
丁琰:高质量的UMI数据采集依然需要严密的物理空间设计,甚至有着极其严苛的规则限制。如果无限制、无规则地自由发挥,产生的数据一致性将极差,最终导致模型无法收敛。这些关于空间设计的约束和技巧,是我们最核心的竞争力之一。
不同任务的数据采集环境存在明显差异,例如桌面级任务和移动操作任务,会采用不同的装置和采集规则。我们会制定一套复杂的空间引导规则,通过软硬件结合的方式,确保采集过程既具备现实世界的丰富度,又符合模型训练所需的逻辑一致性。
目前鹿明已有三个数据采集工厂,持续输出百万小时级的高质量具身数据。
《科创板日报》:UMI在产业内的角色定位是怎样的?对于不同规模的企业(中小企业、初创企业、大公司)分别有什么价值?
喻超:对于中小企业和初创企业而言,UMI因成本较低、数据质量高,是很好的选择;对于大公司来说,随着模型规模扩大,对数据量的需求达到海量级别,遥操作数据的成本过高,此时UMI大概率会成为更高效的解决方案,推动产业分工的升级。
计划在2026年实现100万小时的真机数据产能
《科创板日报》:公司在模型发展上有哪些策略?现阶段的模型规划是怎样的?
丁琰:我就是做模型出身的,我们在做的时候就发现——要想训一个非常好的模型,必须要有一个很好的数据管线,包括数据生产、数据评估、数据筛选,建立的过程本身就需要时间。
因此我们认为,不能上来就训模型,而是要把数据做到最极致。因为模型拼到最后,拼的不是模型架构,而是模型数据的质量,这是一个行业的共识。
目前我们的数据管线已搭建完成,可以源源不断地产生优质数据。
现阶段我们不会训练自有预训练模型,而是选择与产业方合作开发应用模型。

《科创板日报》:公司在数据量累积上有什么目标?目前的产能能否支撑该目标实现?
喻超:2026年头部模型公司训练数据的规模一定是去年十倍以上的量级,整个具身数据市场相比去年一定是十倍以上的增长。
为了应对市场需求的爆发,我们正在通过与政府/产业方合作建设数采工厂等方式,加速建设数据采集产能,预计2026年实现超过100万小时的UMI数据采集产能,目标是建成全球最大的具身真机数据集。
《科创板日报》:目前公司面临的数据质量评估标准有哪些?公司的数据质量处于什么水平?
丁琰:我们将“可复现”作为数据治理的第一性原理,首创8道工业级数据质量评估体系,只交付100%可复现数据。
我们陆续收到了很多不同类型客户的数据质量评估标准,我们在给客户交付的时候,数据质量不仅符合这些标准,还远超要求。
比如工信部规定画面分辨率需达到640×640以上、频率30赫兹,帧率稳定性2赫兹;而我们实际的指标分别为1280×1280、60赫兹,帧率稳定性更是达到1赫兹左右,在构建生态和市场推广过程中,这一优势为产品竞争提供了有力支持。
《科创板日报》:数据与模型的适配、模型与本体的泛化都十分重要,能否具体解释你们是如何开展这两项工作的?
丁琰:这其中的交互比想象中更为复杂,核心可分为数据、模型、硬件(本体,非数采硬件)三大板块,同时数采硬件也起到关键作用。
数采硬件直接决定数据质量,而数据质量又会影响模型的智能上限,若数据质量不佳,模型训练必然难以达到理想效果。当数据与模型完成适配后,还需部署到本体硬件上,若硬件本体性能不足,模型的实际效果也无法充分发挥。三者之间是相互影响、相互促进的关系。
这也是我们专门为UMI研发专属机械臂的原因。我们即将发布一款最适配UMI数据的轻量型机械臂,希望通过算法与硬件的深度耦合,
让数据、模型与硬件形成最佳配合,将整体性能与表现推向极致。
《科创板日报》:之前了解到你们的技术路径在本体泛化性上表现突出,具体是如何实现的?
丁琰:以夹爪采集设备为例,我们的采集设备分为手持设备和机载设备。像宣传片中展示的那样,手持设备的夹爪上配备了摄像头,会记录夹爪的外观画面,同时还可搭载其他传感器。
在实际部署时,只要机器人夹爪的外观与摄像头参数和手持设备一致,无论所搭配的机械臂类型如何,采集到的数据都可以相互共用,这就实现了物理层面的本体泛化。
