ACE-Step 1.5XL发布:4B参数的音乐生成模型能否超越Suno?
ACE-Step 1.5XL模型已在HuggingFace上线,支持文本生成音乐、翻唱、重绘等多项功能,但用户对其实际效果持谨慎态度。

ACE-Step 1.5XL模型正式在HuggingFace平台发布,这是一个拥有约40亿参数的DiT解码器,号称能提供更高质量的音频生成。根据官方描述,该模型是基础模型,支持文本生成音乐、翻唱、重绘、提取、乐高式组合和补全等多种任务。
有网友在Reddit上分享了这个消息,并期待模型能尽快支持ComfyUI格式。但评论区出现了对模型功能的质疑声。
"上一个版本也说支持翻唱,但实际效果并不理想,"一位用户表示,"需要等实际测试后才能判断。"
关于ACE-Step与Suno的对比讨论也很热烈。有用户反映听过一些ACE生成的歌曲质量甚至超过了Suno,但这需要复杂的工作流程,属于罕见情况。大多数测试结果显示,ACE-Step在提示词理解、歌词处理、音质等方面仍存在挑战。
"我的测试结果都很平庸,相比Suno差很多,"一位测试者列举了几个问题,"提示词格式奇怪,AI随机性太明显,经常有金属音,最长只能生成3分钟,某些音乐类型处理不好。"
还有用户询问模型是否支持混音功能,希望ACE-Step能在这方面超越Suno的表现。
目前模型已在HuggingFace的ACE-Step合集页面提供下载,但实际效果仍需用户自行验证。有经验的使用者建议,这类音乐生成模型最好集成到独立程序中,才能充分发挥其功能。
发布时间: 2026-04-07 12:49