MiniMax M2.1: 大幅提升多语言编程,为真实世界复杂任务而生

AICoding

MiniMax一直在用更AI原生的方式改造自己。这个过程的核心驱动力是模型、Agent脚手架和组织。在探索过程中,我们对上述三点也有了越来越深刻的认知。今天我们开放模型部分的更新,也就是MiniMax M2.1,希望有机会能帮助到更多的企业和个人早日找到更AI原生的工作方式。

在10月底的M2中,我们主要解决模型成本和模型开放性的问题。在M2.1中,我们致力于提升真实世界复杂任务中的表现:重点聚焦于更多编程语言和办公场景的可用性,并在这个领域做到最好的水平

MiniMax M2.1 具体模型亮点如下:

基准测试概览

在软件工程相关场景的核心榜单上,MiniMax-M2.1 相比于 M2 有了显著的提升,尤其是在多语言场景上,超过 Claude Sonnet 4.5 和 Gemini 3 Pro,并接近 Claude Opus 4.5。

我们在不同 coding agent 框架上测试了 SWE-bench Verified,结果表明 MiniMax-M2.1 具有良好的框架泛化性和稳定的表现。

为了衡量模型从零到一构建完整应用程序的全栈能力,我们构建并开源了全新基准 VIBE 测试集。MiniMax-M2.1 以平均 88.6 分展现了接近 Claude Opus 4.5 的全栈构建能力。

使用者评价

Eno Reyes (Factory), Benny Chen (Fireworks), Saoud Rizwan (Cline), Scott Breitenother (Kilo), Matt Rubens (RooCode), Robert Rizk (BlackBox AI) 等国际头部 AI 平台合作方一致认可 M2.1 在多语言编程、框架泛化性和生产级工程质量方面的突破性表现。

Showcases

物理世界 Agent

M2.1 驱动维他动力的机器狗,展示了从虚拟世界到物理世界的泛化能力。

多语言 Coding

3D 交互式动画

基于 React Three Fiber 与 InstancedMesh 构建 3D 梦幻圣诞树,渲染 7000+ 实例,支持手势交互与复杂粒子动画。

Web UI 前卫设计

原生 App - Android

原生 App - iOS

Web 音频模拟

Rust 安全审计 TUI

Python 数据监控看板

C++ 图像渲染

Java 实时弹幕

Agentic Tool Use

数字员工

M2.1 能够在日常办公场景下完成行政、数据科学、财务、人力资源、软件开发类的端到端任务。

如何使用

提供 M2.1 和 M2.1-lightning 两个版本 API,全面支持自动 Cache。

联系我们

算法和模型:model@minimax.io | 商务合作:api@minimax.io