Litecoin

小米和MiniMax同时放大招,Agent定价战正式开打

2026/03/20 13:31
🌐zh-Hans

不靠品牌,不靠宣传,8天时间让开发者用脚投票

小米和MiniMax同时放大招,Agent定价战正式开打

3 月 18 日和 19 日,两家中国公司先后发布了各自的 Agent 方向大模型。国内 AI 初创公司 MiniMax 推出 M2.7,小米旗下大模型团队 MiMo 推出 V2-Pro。两款模型在 Agent benchmark 上均进入全球第一梯队,但它们的 API 输出定价分别是 Claude Opus 4.6 的 1/21 和 1/8。

两家同一周出牌,但手里的牌完全不同。它们代表了两条截然不同的技术路线,赌的是 Agent 时代的两种未来。

同一场考试,1/17 的学费

先看最直观的对比。

据 OpenRouter 和各公司官方定价页数据,以 API 输出价格(每百万 tokens)计,MiniMax M2.7 是 1.2 美元,MiMo-V2-Pro 是 3 美元。作为参照,Claude Opus 4.6 的输出价是 25 美元,GPT-5.2 是 14 美元,Claude Sonnet 4.6 是 15 美元。

价格差距是数量级的,但能力差距不是。在 SWE-bench Verified(当前衡量代码工程能力最主流的 benchmark)上,MiMo-V2-Pro 拿到 78%,Sonnet 4.6 是 79.6%,差距不到两个百分点。M2.7 的 SWE-Pro 成绩为 56.22%,与 GPT-5.3-Codex 持平。在 VIBE-Pro(端到端项目交付能力)上,M2.7 拿到 55.6%,接近 Opus 4.6 的水平。

这张图的重点不在于谁高谁低——各家的 benchmark 体系不完全对齐,直接比较要谨慎。重点在于那个「价格-性能剪刀差」:国产 Agent 模型已经挤进了同一个能力带,但站在完全不同的价格区间里。

万亿参数 vs 自我进化

价格只是表象。两家公司拿出了两套完全不同的底牌。

MiMo-V2-Pro 走的是「大力出奇迹」路线。据小米官方公告,V2-Pro 拥有超过 1 万亿总参数,激活参数 42B,支持 100 万 tokens 的超长上下文。它的核心创新是 Hybrid Attention 混合注意力机制,将滑动窗口注意力(SWA)与全局注意力(GA)的比例调至 7:1——前代 V2-Flash 是 5:1。这套架构让模型在处理长文档、多工具并行调用的 Agent 场景时更稳定。在 PinchBench(Agent 工具调用能力评测)上,MiMo-V2-Pro 拿到 84%。

M2.7 走了一条完全不同的路。据 MiniMax 3 月 18 日发布的官方技术博客,M2.7 的参数量未公开,但它展示了一种「自迭代进化」机制:模型自主运行 100 轮以上的优化循环,包括分析失败轨迹、规划修改、修改自身代码架构、跑评估、再循环,最终在内部评估集上实现了 30% 的性能提升。在 MLE Bench Lite(机器学习竞赛难度评测)的 22 道高难度题中,M2.7 拿下 9 金 5 银 1 铜,平均奖牌率 66.6%。

从五个维度看,两条路线的锋芒朝向完全不同:MiMo-V2-Pro 在上下文长度和代码工程维度上明显占优,M2.7 则在办公自动化和自迭代能力上拉开距离。据 MiniMax 同篇技术博客,M2.7 在 GDPval-AA(办公文档处理评测)上拿到 ELO 1495,居开源模型首位,在覆盖 40 多个复杂技能的 MM-Claw 测试中保持了 97% 的技能遵循率。

五个月四版本

两家公司不只技术路线不同,迭代节奏也完全不一样。

据公开发布记录,MiniMax 从 2025 年 10 月发布 M2 到 2026 年 3 月发布 M2.7,五个月内迭代了四个版本,平均每 49 天一个大版本。其中 M2.5 到 M2.7 的间隔只有约 30 天。

小米 MiMo 的节奏不同:2025 年 4 月发布 MiMo-7B(7B 参数的开源推理模型),同年 12 月发布 V2-Flash(309B 总参数),2026 年 3 月发布 V2-Pro(1T 总参数)。每一代之间的参数规模跨越更大,但版本间隔也更长。

MiniMax 选择了小步快跑,每次迭代幅度不大但频率极高,M2.7 的自迭代机制本身就是为「持续进化」设计的。小米选择了蓄力一击,每个版本都是参数规模和架构的大幅跃迁。

匿名 8 天,登顶 OpenRouter

除了技术路线,小米的发布策略也打破了行业惯例。

据 Reuters 报道,3 月 11 日,一个名为 Hunter Alpha 的匿名模型出现在全球最大 API 聚合平台 OpenRouter 上。没有品牌背书,没有发布会,没有技术博客。它的 API 定价极低,性能却出人意料地强。

社区开始猜测它的来历。据 Republic World 和多家科技媒体报道,最主流的猜测是 DeepSeek V4,因为 MiMo 团队负责人罗福莉此前曾在 DeepSeek 从事研究工作。调用量迅速攀升,匿名期内总调用量突破 1 万亿 tokens,登顶 OpenRouter 周榜第一。

3 月 19 日凌晨,小米揭榜:Hunter Alpha 就是 MiMo-V2-Pro。据 Reuters 同篇报道,揭榜后小米港股一度涨幅达 5.8%。

这是国产大模型第一次在全球平台上以纯盲测的方式证明自己。不靠品牌,不靠宣传,用 8 天时间让开发者用脚投票。

QQlink

Không có cửa hậu mã hóa, không thỏa hiệp. Một nền tảng xã hội và tài chính phi tập trung dựa trên công nghệ blockchain, trả lại quyền riêng tư và tự do cho người dùng.

© 2024 Đội ngũ R&D QQlink. Đã đăng ký Bản quyền.