
今天,我们正式发布最新一代音乐模型——MiniMax Music 2.0。这一版本中,模型对音乐的理解与表达实现了真正的跃升:无论是人声的细腻情绪,还是器乐的动态张力,都能被精准捕捉与还原。
它懂节奏,也懂情绪。在人声与器乐的交织中,它成为那个“会唱歌的制作人”。
从此,通过音乐表达自己,不再是少数人的专利,而是每一个人都能获得的快乐。
让灵感成为流动的乐句,Feel the rhythm, let the music belong to you.

1.人声灵动,驾驭不同唱法
你不必接受声乐训练,也能用自己喜欢的声音,运用技法与风格,唱出心里的旋律。
在人声质感方面,Music 2.0 音色无限接近真实人声。此外,模型像一位老练的「唱将」,可驾驭多种唱法和情感风格;对乐句、节奏、呼吸恰到好处的处理,俨然拥有媲美真人的「唱商」。
模型支持对人声音色的精准控制,可以通过Prompt,保持核心音色一致的基础上,让同一声音切换不同唱法,实现一声千变,AI也可化身「百变唱将」。
(同一个女声,能够自如在Jump Blues、Rock、Electronic不同的风格间切换)
除了能轻松驾驭流行、爵士、Blues、摇滚、民谣等常见唱法,模型还支持男女对唱、阿卡贝拉等风格。
男女声主唱不同的衔接效果,可以实现对话感、强弱变化的动态二重唱
无伴奏,也能呈现丰富旋律
2.旋律抓耳,乐器精准控制
你不必是编曲师,也能像编曲师那样,构建一首属于自己的完整乐章。
Music 2.0继承了上一代模型结构完整的优点,能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲。单首时长可达5min。此外新模型生成的旋律更容易记忆、能够迅速抓住耳朵。
Hook部分旋律容易记忆,更具备真人创作时的旋律习惯
在不同的风格表达中,模型可遵循精准的指令控制,对伴奏中的多种乐器进行独立控制与调整,实现层次丰富、律动自然的编曲。
萨克斯、长号、小号、爵士架子鼓、钢琴依次有序出现,宛如置身大师爵士现场
3.专业级音质体验
新模型也带来了全面的音质升级,无论是人声音轨质感,还是乐器空间感都更加增强,带给你沉浸式的听觉体验。
复古disco舞池,充满活力的人声演唱和80年代经典乐器表现,带你回到那个翩翩起舞的黄金年代。
One More Thing
我们在测试 Music 2.0 时惊喜地发现,也可以通过 Prompt 精准描述人声情绪、声音场景等因素,生成影视级配乐独白。层层递进的情感与音乐铺陈,让人仿佛「听」到了画面的色彩。
惊喜之余,我们意识到,这得益于模型对于语义的准确理解,以及对人声表现力的精准控制——这正是模型语义理解与声学表达力的完美结合,让声音拥有多变的情感轮廓。
Music 2.0已经全面上线,欢迎开始创作,听见属于自己的惊喜:
minimaxi.com/audio/music
Intelligence with Everyone.


 文本
文本 语音
语音 视频
视频 音乐
音乐 AI原生应用
AI原生应用 即刻接入AI能力
即刻接入AI能力 与所有人共创智能
与所有人共创智能
