
今天,我们正式发布 MiniMax Music 2.5:全维度突破,指挥细节,定义真实。
AI 音乐始终面对两个挑战:可控性与真实度。前者决定了创作者能否表达真实意图,后者决定了作品是否具备专业质感。
过去,从粗糙的 Demo 到具有明星质感的作品之间,隔着昂贵的录音棚、复杂的混音设备以及多年的专业训练。
相较于上一代模型,Music 2.5 在「段落级强控制」与「物理级高保真」两大技术难题上实现突破——让创作更准,让音乐更真。
Direct the Detail. Define the Real.
这道门槛,正在被打破。格莱美级的音乐创作,从此触手可及。
AI 音乐始终面对两个挑战:可控性与真实度。前者决定了创作者能否表达真实意图,后者决定了作品是否具备专业质感。
过去,从粗糙的 Demo 到具有明星质感的作品之间,隔着昂贵的录音棚、复杂的混音设备以及多年的专业训练。
相较于上一代模型,Music 2.5 在「段落级强控制」与「物理级高保真」两大技术难题上实现突破——让创作更准,让音乐更真。
Direct the Detail. Define the Real.
这道门槛,正在被打破。格莱美级的音乐创作,从此触手可及。
0:00 / 0:00
01. Direct the Detail:段落级精准控制
真正的创作自由,始于对每一段的精准掌控。
Music 2.5 开放全段落标签控制,精准支持包括 Intro(前奏)、Bridge(桥段)、Interlude(间奏)、Build-up(情绪铺垫)及 Hook(副歌)在内的 14 种结构变体,能够承载高复杂度音乐的创作表达。
这意味着,你可以像专业编曲人一样,在创作之初就设计好整首歌的情绪曲线、高潮位置、乐器配置,而不是生成后再碰运气。
City of stone_Hip-pop
在编写歌词时,加入具体的结构标签、乐器名称以及提示词,即可对每一部分的细节进行精准调控,触发特定的演唱状态。
0:00 / 0:00
Midnight Neon Heart
人声的情感张力可以随段落逐级递进,乐器的演奏技法与音色纹理也能根据结构需求实时变化。
0:00 / 0:00
02. Define the Real:人声、风格、混音的物理级保真
可控之外,是保真度的突破。Music 2.5 通过对人声生成、风格建模、混音处理的系统性优化,让 AI 音乐在听感上达到专业制作水准。
从 C-Pop 到 C-Rap,最懂华语的 AI 音乐
Music 2.5 针对华语流行音乐进行深度优化,覆盖从慢歌到说唱、从纯中文到中英文混搭的各类场景,在可听性与传播性上实现了系统级提升。
- 贴合流行趋势的旋律设计:我们优化了旋律走向与情绪推进的逻辑,使其深度贴合当下华语乐坛的流行趋势,节奏与情绪转换更自然,作品具备传播感染力。
- 清晰咬字与中英文无缝衔接: 极大程度减少了吞字、糊音或乱唱问题。无论是纯中文、纯英文,还是中英文混杂,Music 2.5 都能保持流畅切换。
东北最强音_福音版
旋律自带爆款基因,副歌部分更具记忆点,节奏情绪转换自然。
0:00 / 0:00
失真心跳
即便是在歌词密度极高且中英文混杂的快歌中,每一个字的发音依然清晰、精准,确保了歌词的传递与情感穿透力。
0:00 / 0:00
人声真实自然,具备生命力
通过优化人声合成,Music 2.5 实现了连续细腻的转音、自然起伏的颤音,以及胸腔与头腔共鸣的灵活切换,声音表现力显著增强。在男女对唱中,声线也不再是简单叠加,而是具备自然的协同感,问答交替、和声层次分明。
Weight of the Sky
不再是生硬的音高切换,而是具备细腻自然的转音和颤音,接近真人歌手的控制感。
0:00 / 0:00
Bittersweet_pop
可以听到胸腔的厚实,也可以感受到头腔的高亢。能够像真人一样切换发声位置,声音表现力显著增强。
0:00 / 0:00
刚好是你
男女对唱中,主副歌的问答交替与和声层次分明自然,具有专业歌手对唱质感。
0:00 / 0:00
风格化混音,自动适配音乐风格
针对不同音乐风格,Music 2.5 能够自动调整混音策略。摇滚的力量感和失真、80 年代的复古质感、经典爵士的低通温暖感,都能被准确还原。模型通过识别风格特征,在声音厚度、空间感、动态范围等维度实现差异化处理。
When It Rains Like This
80s 明尼阿波利斯之声:还原标志性的合成器与复古质感,配上节奏极强、干净利落的清脆鼓点律动。
0:00 / 0:00
Midnight Coffee Stains_Lofi Jazz
经典 Lofi Jazz:还原带有“颗粒感”的黑胶底噪与午后慵懒的温暖感,还原采样器特有的中频醇厚感,仿佛在耳边点燃了一支充满烟火气息的旧乐章。
0:00 / 0:00
100+ 种乐器,录音室级混音
Music 2.5 扩充音色库至 100+ 种乐器,并优化了混音处理,能够保持人声与伴奏的清晰分离,解决了 AI 音乐中常见的声音混叠问题,即使在乐器密集场景下也能保持各声部清晰。
Pulse of the Earth
细节自然、饱满、有清晰的层次感
0:00 / 0:00
此外,Music 2.5 深度适配专业工作流。在叙事感的影视配乐、沉浸式游戏动态声场、录音室级流行工业成品,以及为品牌设计的风格化声效等场景下,均能胜任专业交付标准。
过去需要录音棚、设备和训练才能做到的事,现在只需要你的想法。专业与业余的界限,正在被技术重新定义。
开始你的创作:
过去需要录音棚、设备和训练才能做到的事,现在只需要你的想法。专业与业余的界限,正在被技术重新定义。
开始你的创作:
产品体验:https://www.minimax.io/audio/music
API 接口:https://platform.minimax.io/docs/api-reference/music-generation
API 接口:https://platform.minimax.io/docs/api-reference/music-generation
One More! Encore!
0:00 / 0:00
