Emu3 原生多模态世界模型

授权协议:None操作系统:None 开发语言:None
Emu3 是一套全新的最先进的多模态模型。该模型只基于下一个token预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。 Emu3在生成和感知任务中的表现都优于几种...