0574-87189651
邮箱
ningbosr@163.com
微信号
yongshanglishihui
熊蓉:灵境启元:打造落地应用具身智能人形机器人
发布时间:2025-09-16 点击量:19
目前,机器人在生产与生活场景中应用广泛,但随着社会高质量发展,各行各业对机器人智能化水平提出了更高要求。然而,当前机器人的智能程度仍显不足,严重依赖专业人员完成方案设计、算法选型、现场部署与调试,一旦物体、环境或任务发生变化,就需重新调整甚至开发系统,极大限制了机器人的规模化推广与应用。
针对这一核心痛点,我们以构建“通用易用系统”为目标,推动具身智能人形机器人的研发与体系化建设。具体来说,我们从本体设计上追求高精度类人形态,使机器人更好地适应人类环境,实现末端定位精度达到0.1毫米;同时打造具有自适应能力的“通用大小脑”,可应对任务、场景和物体的变化,并具备自动调优功能。以此为基础,我们开发了便捷的二次开发软件平台HOS STUDIO,进一步结合行业知识,形成高效应用解决方案。
在研发过程中,我们贯彻三大核心思路:
第一,推动虚实融合。通过Real2Sim2Real路径,将真实场景高保真重构到仿真环境中,利用AIGC和视觉语言模型(VLM)自动生成完整标签与精准分割,大幅提升数字资产的构建效率与真实性。这一方法在多项实际操作任务中表现出优越性,例如仅用1%的真实数据即可在仿真中训练出高成功率模型,在华为的实际应用中实现了99.99%的操作成功率,容差控制达到0.1毫米,部分场景甚至达到0.03毫米。
第二,实现人机融合。我们不仅利用人类的标注和先验知识训练语言与视觉大模型,更重点推进以任务为中心的语言—视觉—行为融合机制,显著提升机器人在开放环境及复杂堆叠物体中的操作成功率。系统还具备反思与重规划能力,进一步强化机器人的自主应对能力。
第三,融通已有知识体系,避免盲目数据驱动。我们将传统专家经验与数据学习方法结合,构建出通用视觉伺服基础模型,实现无需重新训练即可泛化到新场景,支持高精度操作,无论物体是否具备纹理,甚至可运用于工具操作场景,如打螺丝、插插头及汽车装配等。
这些方法在多个真实场景中验证有效。例如我们仅用半天完成新物件的建模和训练,实现瓶罐分液操作;在世界机器人大会场景中,两天内完成节拍优化与现场展示。在动态人流环境中,导航避障成功率提升至97%以上;拟人化运动控制则实现了包括60度斜坡、多级台阶在内的复杂地形稳定行走。
我们还推进机器人“开箱即用”,通过融合语言视觉大模型,使机器人能自主探索和理解环境,摆脱对预先构建地图的依赖,进一步减少人工干预。
真正的智能化突破需依靠技术生态的协同。我们正积极整合上下游技术资源与行业知识,构建更加通用、易用的人形机器人系统,推动智能技术在多行业、多场景中落地生根。