智元发布GO-1具身模型,ViLLA架构融合VLM与MoE。 开创性地提出了Vision-Language-Latent-Action(ViLLA)架构,该架构由VLM(多模态大模型) + MoE(混合专家)组成。 又一家具身智能公司,杀入“具身大脑 ...
快科技9月23日消息,据媒体报道,智元机器人今日宣布,通用具身基座大模型GO-1(Genie Operator-1)已在GitHub正式开源,成为全球首个采用Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型。 这一突破性架构通过引入隐式动作标记,有效弥合了图像-文本输入 ...