星海图真机数据集突破40万下载量
10月28日消息,星海图(Galaxea)于2025年8月开源的星海图开放世界数据集(Galaxea Open-World Dataset),在发布后两个月内下载量突破40万次,成为全球具身智能领域关注度较高的真机数据集之一。据了解,该数据集旨在通过真实世界数据推动具身智能技术从实验室向产业化落地。
据介绍,该数据集覆盖住宅、餐饮、零售、办公室等50多个真实场景,累计时长500小时,规模超过10TB,包含10万条以上真实操作数据、150类任务类型、1600多种操作对象与58项操作技能,并提供多模态传感信息与自然语言标注。数据集通过细粒度注释和多模态对齐提升数据可用性,所有片段均经过质检剔除无效数据。
据悉,数据集的高质量得益于硬件、场景与工程化体系的支撑。硬件方面,采集设备采用自研机器人R1 Lite,具备23自由度,支持精细抓取与全身协调操作。场景方面,数据覆盖酒店、餐厅等动态真实环境,增强模型在复杂场景下的泛化能力。工程化方面,星海图构建了智能化数据管线(EDP),实现从采集、质检到标注审核的全流程管理。
数据集发布后,受到Physical Intelligence、Bitrobot、Hugging Face等国际团队的公开推荐,被称为“极具价值的社区资源”。目前,全球多地的研究者、实验室与企业正基于该数据集开展系统验证与模型训练等工作。
星海图表示,未来将持续扩展数据集场景与任务类型,并构建多维度评测体系,助力开发者高效推进具身智能研究。(崔玉贤)
来源: 网易科技报道
红包分享
钱包管理

