OpenClaw—AI研究OpenClaw—AI研究
  • AI动态
  • OpenClaw教程
  • 技术解读
  • 用户故事

谷歌 Magenta RealTime 2:开源本地化实时音乐生成模型

谷歌 Magenta RealTime 2:开源本地化实时音乐生成模型

2026年6月5日 by WoodStone

谷歌 Magenta 团队 6 月 4 日发布 Magenta RealTime 2,这是首个能在普通笔记本上实时生成长达 10 分钟连续音乐的开源模型。相比前代只能在专业 GPU 上运行 30 秒片段,RealTime 2 在消费级硬件上将可用性提升了 100 倍。

模型核心突破在于”流式稀疏注意力”架构。RealTime 2 采用 8B 参数的稀疏 Transformer,每秒仅激活 1.2B 参数即可生成 44.1kHz 立体声音频。在 M4 Max 芯片上实时生成延迟低于 80 毫秒,达到专业 DAW 软件可接受的标准。

banner

开源策略上,谷歌这次选择了”完全开源”而非”开放权重”。模型权重、训练代码、推理代码、数据集预处理脚本全部以 Apache 2.0 协议发布在 GitHub,任何人都可以商用或二次开发。这与 Stability Audio 等仅开放权重的做法形成鲜明对比。

应用场景从专业音乐制作拓展到三大领域:游戏厂商可以用它实时生成环境音效,播客创作者能自动配 BGM,冥想/助眠 App 可以根据用户心率动态生成放松音乐。每个场景都对应一个开源参考实现。

middle

与商业竞品对比,RealTime 2 在 MIDI 控制精度、风格一致性、多轨分离度上明显领先 Suno v4 和 Udio v3。但生成音质仍略逊于商业模型——这是”本地化实时”与”云端高质量”之间的必然权衡。

谷歌 Magenta 团队负责人 Jesse Engel 表示:”音乐创作的民主化是 AI 最被低估的价值。RealTime 2 不是要取代音乐家,而是让每个有想法的人都能立即听到自己的创意。”

end

业内分析师认为,RealTime 2 的发布将触发音乐 AI 行业重新洗牌。Suno、Udio 等独角兽公司可能被迫在 6 个月内推出本地化版本,否则将面临来自”完全开源+硬件友好”路线的强力挑战。

商业模式上,谷歌明确表示 Magenta RealTime 2 不会直接商业化,而是通过 Google Cloud Vertex AI 提供”托管推理服务”。第三方若要本地部署则完全免费。这一定位延续了谷歌在 PyTorch、JAX 等基础框架上的”开源+云服务”双轨策略,对独立开发者极其友好,对云厂商则形成竞争压力。

开发者社区的初步反应热烈。GitHub 仓库上线 48 小时内即获得 3.2k stars,多个独立开发者基于 RealTime 2 发布了二次创作工具,包括实时电子鼓机、互动音乐游戏引擎、AI 配乐视频编辑器等。一个新兴的”开源音乐 AI 工具生态”正在快速形成。

← 返回文章列表
分类: AI动态 标记: Google, 大模型, 开源

© 2026 OpenClaw—AI研究 版权所有

沪ICP备2026010690号-1