华为离职青年打造未来智能机器人基座-智元机器人震撼登场
3月10日消息,今日,“稚晖君”创业项目智元机器人推出了首款通用具身基座模型——智元启元大模型(GenieOperator-1)。
该大模型创新性地提出了Vision-Language-Latent-Action(ViLLA)架构,该架构结合了VLM(多模态大模型)和MoE(混合专家)技术,使其能够通过人类视频进行学习,实现小样本快速泛化,从而降低了具身智能的技术门槛,并已成功应用在智元多款机器人上。
通过ViLLA架构,智元机器人在五种不同复杂度的任务上测试GO-1时,相比现有的最佳模型,GO-1的成功率显著提高,平均成功率从46%提升至78%,增幅达32%。
其中 “Pour Water”(倒水)、“Table Bussing”(清理桌面) 和 “Restock Beverage”(补充饮料) 任务表现尤为突出。
此外,我们还单独验证了ViLLA架构中LatentPlanner的效果,结果显示添加LatentPlanner能够提高12%的成功率(从66%提升至78%)。
据介绍,GO-1大型模型通过整合人类与多种机器人数据,使机器人具备了突破性的学习能力,能够广泛应用于各种环境和物体中,迅速掌握新任务、学习新技能。
同时,它不仅能够适应多种机器人本体的部署需求,还能高效地实现技术落地,并在实际应用中不断进行快速迭代升级。 这样的设计使得该技术具备了极高的灵活性与适应性,能够迅速响应市场变化和技术进步。这不仅加速了科技成果向实用产品的转化过程,同时也为未来的持续创新提供了坚实的基础。这种快速迭代的能力,让技术始终保持前沿状态,为用户带来更加优质的服务体验。
这一系列的特点可以归纳为4个方面:
人类视频学习:GO-1大模型可以结合互联网视频和真实人类示范进行学习,增强模型对人类行为的理解,更好地为人类服务。
GO-1大模型展现出了卓越的泛化能力,即使在数据量极其有限甚至完全没有的情况下,也能迅速适应新的场景和任务。这一特性显著降低了具身模型的应用门槛,大幅减少了后续的训练成本。这不仅意味着开发者和研究者可以更加高效地利用现有资源进行创新,也为那些缺乏大规模数据集支持的研究团队提供了更多可能性。这无疑为人工智能技术的普及和应用开辟了新的道路。
一脑多形:GO-1大型模型是一种通用机器人策略模型,能够实现在多种机器人形态之间的迁移,迅速适应各种本体结构,从而实现群体智能的提升。
持续进化:GO-1大模型结合智元的数据回流系统,能够从实际应用中遇到的问题数据中不断优化和学习,从而变得更加智能。这一创新不仅展示了人工智能技术在自我完善方面的巨大潜力,也预示着未来AI系统将能够更快地适应复杂多变的实际应用场景,为各行各业提供更高效、更精准的服务。这种持续进化的能力,无疑将大大提升人工智能的应用价值,使其成为推动社会进步的重要力量。
据悉,2020年,彭志辉(稚晖君)凭借“华为天才少年计划”获得最高档年薪201万元,加入华为团队,负责昇腾AI芯片和AI算法的研究工作。2022年底,他从华为离职,并于2023年2月联合创立了智元机器人。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.010316秒