wordpress小说网站模板下载,起点网站建设,昌平网站建设推广优化seo,外贸公司网站建设费会计科目Genmo 是一家专注于视频生成的人工智能公司#xff0c;该公司宣布发布 Mochi 1 的研究预览版。Mochi 1 是一种新的开源模型#xff0c;可根据文本提示生成高质量视频#xff0c;其性能可与 Runway 的 Gen-3 Alpha、Luma AI 的 Dream Machine、Kuaishou 的 Kling、Minimax 的…Genmo 是一家专注于视频生成的人工智能公司该公司宣布发布 Mochi 1 的研究预览版。Mochi 1 是一种新的开源模型可根据文本提示生成高质量视频其性能可与 Runway 的 Gen-3 Alpha、Luma AI 的 Dream Machine、Kuaishou 的 Kling、Minimax 的 Hailuo 等领先的闭源/专有竞争对手媲美甚至超过它们。
Mochi 1 采用 Apache 2.0 许可用户可免费使用尖端的视频生成功能而其他模型的价格从有限的免费层级开始最高可达每月 94.99 美元Hailuo 无限层级。用户可以在 Hugging Face 上免费下载完整的权重和模型代码不过需要 至少 4 个 Nvidia H100 GPU 才能在用户自己的机器上运行。
随着越来越多的公司发布自己的模型生成式人工智能大战正进入白热化阶段。生成视频似乎是当前最大的战场而 Genmo 则采取了不同的方法。
该公司将其 Mochi-1 模型作为 研究预览版 发布但新的视频生成模型属于 Apache 2.0 许可范围因此是开源的可以拆开再组装起来。
这也意味着Mochi-1可以免费使用你可以在Genmo的网站上亲身体验。Mochi-1开源的好处还在于它将来可以在所有常见的生成式人工智能平台上使用有朝一日还可以在优秀的游戏 PC 上运行。 Huggingface: genmo/mochi-1-preview GIthub: https://github.com/genmoai/models
推动最先进技术的发展
Mochi 1 为视频生成领域带来了多项重大进步包括高保真运动和强大的及时性。
根据 Genmo 的说法Mochi 1 擅长遵循详细的用户指令可以精确控制生成视频中的人物、设置和动作。
Genmo 将 Mochi 1 定位为缩小开放式和封闭式视频生成模式之间差距的解决方案。
我们距离生成视频的未来还有1%的距离。真正的挑战是创建长、高质量、流畅的视频。Genmo 首席执行官兼联合创始人 Paras Jain 在接受 VentureBeat 采访时说我们非常重视提高运动质量。
Jain 和他的联合创始人创办 Genmo 的使命是让每个人都能使用人工智能技术。贾因强调说视频是生成式人工智能的下一个前沿领域我们认为将其交到普通人手中非常重要。他补充说我们从根本上认为让这项技术平民化让尽可能多的人掌握它这一点非常重要。这也是我们将其开源的原因之一。
Genmo 声称在内部测试中Mochi 1 在及时性和运动质量方面优于大多数其他视频人工智能模型包括专利竞争产品 Runway 和 Luna。 开放合作–但培训数据仍处于保密状态
Mochi 1 采用 Genmo 创新的非对称扩散变压器 (AsymmDiT) 架构。
它拥有 100 亿个参数是有史以来最大的开源视频生成模型。该架构侧重于视觉推理用于处理视频数据的参数是处理文本数据的四倍。
效率是该模型设计的一个关键方面。Mochi 1 利用视频 VAE变异自动编码器将视频数据压缩到原始大小的一小部分从而降低了终端用户设备的内存需求。这使得开发人员社区更容易访问该模型他们可以从 HuggingFace 下载模型权重或通过 API 进行集成。
Jain 认为Mochi 1 的开源性质是推动创新的关键。开放模型就像原油。它们需要完善和微调。他说这正是我们希望为社区带来的这样他们就可以在此基础上构建令人难以置信的新事物。
然而当被问及该模型的训练数据集时–这是人工智能创意工具中最有争议的方面之一因为有证据表明许多人工智能创意工具都是在未经明确许可或补偿的情况下在网上对大量人类创意作品进行训练的其中一些还是受版权保护的作品。
他告诉 VentureBeat一般来说我们使用公开数据有时也会与各种数据合作伙伴合作。但出于竞争原因他拒绝透露具体细节。“拥有多样化的数据真的很重要这对我们来说至关重要。”
https://www.genmo.ai/
开发环境问题 https://github.com/kijai/ComfyUI-MochiWrapper 该框架允许低显存运行 mochi-1