熊蓉：灵境启元：打造落地应用具身智能人形机器人-甬商发展大讲堂-天下甬商-甬商网

天下甬商

甬商动态

行业前沿

甬商代表

名人观点

云说甬商

甬商选树

联系我们

了解更多详细信息，请致电

0574-87189651

邮箱
ningbosr@163.com

微信号
yongshanglishihui

或给我们留言

在线留言

甬商发展大讲堂

您的位置：首页 > 天下甬商 > 甬商发展大讲堂

熊蓉：灵境启元：打造落地应用具身智能人形机器人

发布时间：2025-09-16　　点击量：121

目前，机器人在生产与生活场景中应用广泛，但随着社会高质量发展，各行各业对机器人智能化水平提出了更高要求。然而，当前机器人的智能程度仍显不足，严重依赖专业人员完成方案设计、算法选型、现场部署与调试，一旦物体、环境或任务发生变化，就需重新调整甚至开发系统，极大限制了机器人的规模化推广与应用。

针对这一核心痛点，我们以构建“通用易用系统”为目标，推动具身智能人形机器人的研发与体系化建设。具体来说，我们从本体设计上追求高精度类人形态，使机器人更好地适应人类环境，实现末端定位精度达到0.1毫米；同时打造具有自适应能力的“通用大小脑”，可应对任务、场景和物体的变化，并具备自动调优功能。以此为基础，我们开发了便捷的二次开发软件平台HOS STUDIO，进一步结合行业知识，形成高效应用解决方案。

在研发过程中，我们贯彻三大核心思路：

第一，推动虚实融合。通过Real2Sim2Real路径，将真实场景高保真重构到仿真环境中，利用AIGC和视觉语言模型（VLM）自动生成完整标签与精准分割，大幅提升数字资产的构建效率与真实性。这一方法在多项实际操作任务中表现出优越性，例如仅用1%的真实数据即可在仿真中训练出高成功率模型，在华为的实际应用中实现了99.99%的操作成功率，容差控制达到0.1毫米，部分场景甚至达到0.03毫米。

第二，实现人机融合。我们不仅利用人类的标注和先验知识训练语言与视觉大模型，更重点推进以任务为中心的语言—视觉—行为融合机制，显著提升机器人在开放环境及复杂堆叠物体中的操作成功率。系统还具备反思与重规划能力，进一步强化机器人的自主应对能力。

第三，融通已有知识体系，避免盲目数据驱动。我们将传统专家经验与数据学习方法结合，构建出通用视觉伺服基础模型，实现无需重新训练即可泛化到新场景，支持高精度操作，无论物体是否具备纹理，甚至可运用于工具操作场景，如打螺丝、插插头及汽车装配等。

这些方法在多个真实场景中验证有效。例如我们仅用半天完成新物件的建模和训练，实现瓶罐分液操作；在世界机器人大会场景中，两天内完成节拍优化与现场展示。在动态人流环境中，导航避障成功率提升至97%以上；拟人化运动控制则实现了包括60度斜坡、多级台阶在内的复杂地形稳定行走。

我们还推进机器人“开箱即用”，通过融合语言视觉大模型，使机器人能自主探索和理解环境，摆脱对预先构建地图的依赖，进一步减少人工干预。

真正的智能化突破需依靠技术生态的协同。我们正积极整合上下游技术资源与行业知识，构建更加通用、易用的人形机器人系统，推动智能技术在多行业、多场景中落地生根。

上一篇：李晓儿：AI赋能企业实践与分享

下一篇：褚健：数字化转型与工业AI实现路径

天下甬商

甬商文化

企业服务

政府服务

惠企政策

《甬商》杂志

平台活动

会员动态

甬商平台