2025.11.07

Mini Price,Max Performance,关于API、编程套餐和Agent

在过去10天时间里面, M2的在线服务使用量激增。在这个过程中, 公司的的小伙伴通过疯狂优化和增加资源来缓解线上的压力。最近两天, 我们基本实现了在线服务成功率大于99%的目标。除了我们官方的服务外, M2的开源权重也是过去一周Hugging Face上下载量最大的模型, 有不少开源社区的朋友自己部署了 M2。据我们所知, 有至少二十家平台对外提供了 M2 的 API 服务。

在此期间, 有不少企业的朋友问我们能不能提供更大的并发, 也有不少开发者朋友问我们能不能提供可以长期使用的编程套餐, 还有一些用 MiniMax Agent 的朋友问我们产品后面会不会很贵。

我们做 M2 的初心就是把最优秀的 Agent 能力变得普惠, 这也会是我们一直坚守的目标。基于这个原则, 我们统一回答下上述的问题。简单的总结是:

  • API 会保持 Claude Sonnet 8% 的价格;
  • 对于大家呼吁的编程套餐, 我们对国内用户提供单月29、49、119 人民币三档套餐, 分别对应 Claude Code 的20、100、200 美金三档套餐的使用容量。
  • MiniMax Agent 提供免费的高效模式和39、119 两档价格的专业模式, 把完成单个复杂任务的成本从行业内约10块钱变成了约1块钱。

一些具体的细节和生效的具体时间如下:

API:

按照2.1元/百万Token输入, 8.4元/百万Token输出, 0.21元/百万Token缓存读取的国内Agent模型最实惠的价格。对大批量使用用户从北京时间11月8号下午2点开始正式计费, 对付费用户默认提供 500 的RPM和两千万的TPM, 使用时请选择MiniMax-M2-Stable。若有需要更高并发的付费用户可以直接联系我们进行RPM的增加。对于开发者朋友提到的Cache问题, 我们的API接口已经支持, 并在接下来几天会逐步推全。

编程套餐:

受限于一些外部的对接流程, 我们预计在11月14号给开发者朋友提供收费的编程套餐。为了方便个人开发者朋友使用, 在编程套餐正式推出前, 我们依然为个人开发者提供足够同时进行两个Vibe Coding项目的免费服务。使用时, 请选择MiniMax-M2。

MiniMax Agent:

相比于对话类产品, Agent产品能自动使用多轮搜索、编程、Office等工具, 从而可以完成从而可以完成专业的深度研究、PPT和网页制作、文档处理等对话类产品完成不了的复杂任务,适合工作中使用。专业模式的价格今天开始生效。

目前我们基本提供远快于国内同行的推理速度, 使得我们编程和Agent中使用尽可能流畅, 团队的小伙伴还在努力优化, 在接下来一两周, 大家还能看到推理速度的持续提升。目前我们提供超过70 TPS的服务, 显著快于同水平模型。

API和待推出的编程套餐, 可以在我们的开放平台、认证和充值: platform.minimaxi.com

MiniMax Agent 可以在 agent.minimaxi.com 中使用, 也可以通过手机应用商店搜索“MiniMax”下载。

联系我们的方式:

邮箱: api@minimaxi.com

企业二维码:

除了我们的文本API和编程套餐, 也欢迎使用我们行业领先的语音和视频模型服务。




Intelligence with everyone
logo
©上海稀宇科技有限公司 2025 版权所有隐私条款用户协议