
来源:新华网
新华网北京4月11日电(记者张漫子)近日,一条短视频在社交媒体传播:广东省惠州市一个茶园里,一个名为“巡霄”的机器人化身采茶“小工”,与采茶工人们一起辛勤劳作。这一机器人由优艾智合-西安交大具身智能机器人研究院研发,基于VLM(多模态大模型)与MoE(混合专家)架构,依托于高质量的真实场景数据集,“巡霄”的左臂挎着竹篮,右手指尖掠过茶梢,精准将嫩绿的芽尖采下。

“巡霄”在广东省惠州市一个茶园里采茶。(此为视频截图)
“巡霄”不只会采茶,还能够应用于电力设备巡检、半导体精密操作、仓储智能分拣,完成清扫安防、故障排查、无尘搬运、物资调度等多样化任务。
它的灵巧作业,得益于两个方面。一方面是高质量真实数据集的积累,另一方面是“大模型+小模型”相结合的技术路线。“我们构建了‘一脑多态’的具身智能大模型,采用多模态通用基座大模型与‘一脑多态’端侧具身模型的混合架构,并完成场景应用初步验证。”优艾智合联合创始人边旭说。
边旭进一步解释,基座大模型采用VLM(多模态大模型)和MoE(混合专家)架构,基于多模态预训练数据集和“Data Ocean”海量专家级真实训练数据集,以完成对复杂任务的场景感知和通用语言理解,将复杂指令导入到端侧具身模型中完成高频的实时控制。
“一脑多态”框架下,通过强化学习、模仿学习等算法构建“具身大脑”MAIC,形成“视觉语义感知-行为决策-关节控制”的端到端执行链路,同时搭载多模态传感融合系统,实现立体环境感知、柔性操作及多形态移动能力。
“流程作业之外非结构化场景长任务链的复杂柔性作业,是传统工业机器人无法实现的。”边旭说。面对传统工业机器人难以应对的复杂动态任务,人形机器人能够以多模态交互、群体智能协同,突破工业场景自动化的“最后一公里”。
为满足不同场景的需要,优艾智合-西安交大具身智能机器人研究院规划了7个机器人组成的“人形机器人家族”,日前首次亮相于在京举办的第二届中国具身智能大会。这一“家族”涵盖双足、轮式、四足、履带式等形态。“例如,轮式人形机器人的下半身天然适合工厂洁净车间的需求,双足人形机器人更适合户外作业场景。”边旭接受记者采访时表示。
近来,机器人产业热度持续攀升,机器人从进厂拧螺丝到进茶园采茶,更逼近真实的工作场景。一名工作人员向记者举例,以一个机器人进驻的晶圆车间为例,1台机器人能完成4人的工作量,50台机器人每天能搬运近2万个晶圆盒,既能实现无损耗搬运,还能以7天24小时不间断生产的方式,帮助工厂生产提质增效。
业内认为,应用于泛工业场景的人形机器人市场巨大,大有可为。