发布日期:2025-08-21 05:14 点击次数:93
最近,华为去职“天才少年”彭志辉的官宣在互联网刷屏。就在今天,智元启元大模子按期而至。
智元机器东谈主官微文告,发布首个通用具身基座大模子Genie Operator-1(GO-1),并配上视频,展示了GO-1通过学习东谈主类视频,助力机器东谈主骨子完成寄递水杯、制作餐点、迎接外宾等一系列任务。在视频结尾,还附有仿真数据收罗及大范畴真机数据收罗的历程画面。
从性能来看,GO-1比拟已有模子顺利率大幅超越,平均顺利率升迁了32%。经实验发现,GO-1在“倒水”“计帐桌面”“补充饮料”等任务中发扬相对隆起。
智元机器东谈主默示,为了灵验愚弄高质地的AgiBot World数据集以及互联网大范畴异构视频数据,增强战略的泛化智力,智元提倡了Vision-Language-Latent-Action(ViLLA)架构。
客岁底,智元机器东谈主纠合上海东谈主工智能实验室等单元文告开源百万真机数据集名堂AgiBot World,该数据集涵盖超100种真正场景,其中40%为家居场景,20%为工业场景。共收录80余种东谈主类生计必备手段。
不外,据智元机器东谈主方面默示,诸如AgiBot World的带作为标签的真机数据量仍然有限,远少于互联网范畴的数据集。而基于ViLLA架构,可汲取Latent Actions(隐式作为)来建模现时帧和历史帧之间的隐式变化,从而将外部作为常识诊治到通用操作任务中。
据悉,GO-1大模子借助东谈主类和多种机器东谈主数据,不祥快速安妥新任务。同期还营救部署到不同的机器东谈主骨子。智元机器东谈主将这一系列特色归纳为4个方面:
东谈主类视频学习:GO-1大模子不错联接互联网视频和真正东谈主类示范进行学习,增强模子对东谈主类行为的清爽。
小样本快速泛化:GO-1大模子具有遍及的泛化智力,不祥在一丝数据致使零样本下泛化到新场景、新任务。
一脑多形:GO-1大模子是通用机器东谈主战略模子,不祥在不同机器东谈主花样之间迁徙。
捏续进化:GO-1大模子搭配智元一整套数据回流系统,不错从实验奉行遭遇的问题数据中捏续进化学习。
智元机器东谈主默示,GO-1大模子将加快具身智能的普及,机器东谈主将从依赖特定任务的用具,向着具备通用智能的自主体发展。
当下,基础模子进展赶快。信达证券以为,AI的发展从根底上鼓动了东谈主形机器东谈主和自动驾驶等端侧的发展。Grok3/o3-mini等模子展示了对物理定律从容深化的清爽,而Deepseek关系模子则响应了推理老本的赶快裁减。受此激勉,端侧较高档别的智能落地可期,东谈主形机器东谈主或迎来赶快产业化。
Powered by kaiyun登录官网 @2013-2022 RSS地图 HTML地图