Wink - AI原生创新，忠于用户，专属智能体验

![ACE-Step 1.5XL界面截图](https://wink.run/image?url=https%3A%2F%2Fexternal-i.redd.it%2FwnP1_XC-b-6LrfBaibAcfuVtVfJbH_HPGFwF5HfLogs.png%3Fauto%3Dwebp%26s%3D69120bc2266bc8c900221893cf1727fe73cb202f)

ACE-Step 1.5XL模型正式在HuggingFace平台发布，这是一个拥有约40亿参数的DiT解码器，号称能提供更高质量的音频生成。根据官方描述，该模型是基础模型，支持文本生成音乐、翻唱、重绘、提取、乐高式组合和补全等多种任务。

有网友在Reddit上分享了这个消息，并期待模型能尽快支持ComfyUI格式。但评论区出现了对模型功能的质疑声。

"上一个版本也说支持翻唱，但实际效果并不理想，"一位用户表示，"需要等实际测试后才能判断。"

关于ACE-Step与Suno的对比讨论也很热烈。有用户反映听过一些ACE生成的歌曲质量甚至超过了Suno，但这需要复杂的工作流程，属于罕见情况。大多数测试结果显示，ACE-Step在提示词理解、歌词处理、音质等方面仍存在挑战。

"我的测试结果都很平庸，相比Suno差很多，"一位测试者列举了几个问题，"提示词格式奇怪，AI随机性太明显，经常有金属音，最长只能生成3分钟，某些音乐类型处理不好。"

还有用户询问模型是否支持混音功能，希望ACE-Step能在这方面超越Suno的表现。

目前模型已在HuggingFace的ACE-Step合集页面提供下载，但实际效果仍需用户自行验证。有经验的使用者建议，这类音乐生成模型最好集成到独立程序中，才能充分发挥其功能。

Wink Pings

ACE-Step 1.5XL发布：4B参数的音乐生成模型能否超越Suno？