近年来,具身智能备受瞩目,从春晚舞台上的机器人精彩演出,到被政府工作报告提及,再到英伟达CEO黄仁勋的多次推崇,它已成为人工智能领域的热点。具身智能的目标是让机器人在真实世界中如人类般精准感知并灵活反应。

清华大学联合蚂蚁数科的研究团队取得了重要进展,在ICLR2025上发表的论文中推出了BodyGen算法框架。该框架融合了强化学习与深度神经网络,使机器人能迅速演化出最适合环境的形态和控制策略,实际性能测试显示提升了60%,相关代码也已在GitHub上开源。


传统的机器人设计过程复杂,既依赖大量专家知识,又需要针对特定环境反复实验。同时,形态与控制的协同设计也面临形体搜索空间庞大、形态与控制策略深度绑定的问题。BodyGen框架通过形态设计和环境交互两个环节,有效解决了这些挑战。在形态设计阶段,它运用Transformer(GPT风格)自回归模型来构建和优化机器人的形体结构参数;在环境交互阶段,则通过Transformer(Bert风格)处理关节信息,实现机器人与环境的实时互动反馈。
BodyGen的核心技术有三项:形体结构位置编码器TopoPE,它像机器人的“身体感知”系统,助力AI迅速适应形态变化;基于Transformer的MoSAT作为“大脑中枢”,负责信息的处理与指令的发送;而独特的奖励分配机制则让AI能够合理评估其设计决策。
在包括爬行、游泳等在内的10种不同任务环境的测试中,BodyGen生成的机器人形态适应性评分比当前最佳方法提高了60.03%。此外,其参数量仅为1.43M,更加轻便,特别适合资源有限的环境。展望未来,研究团队计划推动其在现实场景中的应用,BodyGen有望成为推动通用具身智能发展的关键力量。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则