2026.1.29

MiniMax Music 2.5：全维度突破，指挥细节，定义真实

即刻接入 API

立即体验

https://filecdn.minimax.chat/public/5b37b62c-57f5-4ea1-bef2-c8164659eac3.png

今天，我们正式发布 MiniMax Music 2.5：全维度突破，指挥细节，定义真实。

AI 音乐始终面对两个挑战：可控性与真实度。前者决定了创作者能否表达真实意图，后者决定了作品是否具备专业质感。

过去，从粗糙的 Demo 到具有明星质感的作品之间，隔着昂贵的录音棚、复杂的混音设备以及多年的专业训练。

相较于上一代模型，Music 2.5 在「段落级强控制」与「物理级高保真」两大技术难题上实现突破——让创作更准，让音乐更真。

Direct the Detail. Define the Real.

这道门槛，正在被打破。格莱美级的音乐创作，从此触手可及。

00:00 / 00:00

01. Direct the Detail：段落级精准控制

真正的创作自由，始于对每一段的精准掌控。

Music 2.5 开放全段落标签控制，精准支持包括 Intro（前奏）、Bridge（桥段）、Interlude（间奏）、Build-up（情绪铺垫）及 Hook（副歌）在内的 14 种结构变体，能够承载高复杂度音乐的创作表达。

这意味着，你可以像专业编曲人一样，在创作之初就设计好整首歌的情绪曲线、高潮位置、乐器配置，而不是生成后再碰运气。

City of stone_Hip-pop

在编写歌词时，加入具体的结构标签、乐器名称以及提示词，即可对每一部分的细节进行精准调控，触发特定的演唱状态。

00:00 / 00:00

Midnight Neon Heart

人声的情感张力可以随段落逐级递进，乐器的演奏技法与音色纹理也能根据结构需求实时变化。

00:00 / 00:00

02. Define the Real：人声、风格、混音的物理级保真

可控之外，是保真度的突破。Music 2.5 通过对人声生成、风格建模、混音处理的系统性优化，让 AI 音乐在听感上达到专业制作水准。

从 C-Pop 到 C-Rap，最懂华语的 AI 音乐

Music 2.5 针对华语流行音乐进行深度优化，覆盖从慢歌到说唱、从纯中文到中英文混搭的各类场景，在可听性与传播性上实现了系统级提升。

贴合流行趋势的旋律设计：我们优化了旋律走向与情绪推进的逻辑，使其深度贴合当下华语乐坛的流行趋势，节奏与情绪转换更自然，作品具备传播感染力。
清晰咬字与中英文无缝衔接： 极大程度减少了吞字、糊音或乱唱问题。无论是纯中文、纯英文，还是中英文混杂，Music 2.5 都能保持流畅切换。

东北最强音_福音版

旋律自带爆款基因，副歌部分更具记忆点，节奏情绪转换自然。

00:00 / 00:00

失真心跳

即便是在歌词密度极高且中英文混杂的快歌中，每一个字的发音依然清晰、精准，确保了歌词的传递与情感穿透力。

00:00 / 00:00

人声真实自然，具备生命力

通过优化人声合成，Music 2.5 实现了连续细腻的转音、自然起伏的颤音，以及胸腔与头腔共鸣的灵活切换，声音表现力显著增强。在男女对唱中，声线也不再是简单叠加，而是具备自然的协同感，问答交替、和声层次分明。

Weight of the Sky

不再是生硬的音高切换，而是具备细腻自然的转音和颤音，接近真人歌手的控制感。

00:00 / 00:00

Bittersweet_pop

可以听到胸腔的厚实，也可以感受到头腔的高亢。能够像真人一样切换发声位置，声音表现力显著增强。

00:00 / 00:00

刚好是你

男女对唱中，主副歌的问答交替与和声层次分明自然，具有专业歌手对唱质感。

00:00 / 00:00

风格化混音，自动适配音乐风格

针对不同音乐风格，Music 2.5 能够自动调整混音策略。摇滚的力量感和失真、80 年代的复古质感、经典爵士的低通温暖感，都能被准确还原。模型通过识别风格特征，在声音厚度、空间感、动态范围等维度实现差异化处理。

When It Rains Like This

80s 明尼阿波利斯之声：还原标志性的合成器与复古质感，配上节奏极强、干净利落的清脆鼓点律动。

00:00 / 00:00

Midnight Coffee Stains_Lofi Jazz

经典 Lofi Jazz：还原带有“颗粒感”的黑胶底噪与午后慵懒的温暖感，还原采样器特有的中频醇厚感，仿佛在耳边点燃了一支充满烟火气息的旧乐章。

00:00 / 00:00

100+ 种乐器，录音室级混音

Music 2.5 扩充音色库至 100+ 种乐器，并优化了混音处理，能够保持人声与伴奏的清晰分离，解决了 AI 音乐中常见的声音混叠问题，即使在乐器密集场景下也能保持各声部清晰。

Pulse of the Earth

细节自然、饱满、有清晰的层次感

00:00 / 00:00

此外，Music 2.5 深度适配专业工作流。在叙事感的影视配乐、沉浸式游戏动态声场、录音室级流行工业成品，以及为品牌设计的风格化声效等场景下，均能胜任专业交付标准。

过去需要录音棚、设备和训练才能做到的事，现在只需要你的想法。专业与业余的界限，正在被技术重新定义。

开始你的创作：

产品体验：https://www.minimax.io/audio/music
API 接口：https://platform.minimax.io/docs/api-reference/music-generation

One More! Encore!

00:00 / 00:00