小米MiMo-V2.5开源模型深度解读：Token效率暴涨60%，这款国产AI凭什么登顶全球榜首

2026年5月，国产AI领域传来重磅消息：小米正式开源MiMo-V2.5系列模型，凭借稀疏混合专家架构实现Token消耗降低60%的突破性进展，成为全球开源智能体框架Hermes Agent的首选推理引擎。在权威测试中，MiMo-V2.5-Pro的ClawEval基准Pass³得分达到64%，每条轨迹仅消耗约7万Token，在同等能力水平下相比Claude Opus 4.6、Gemini 3.1 Pro和GPT-5.4，Token消耗减少了惊人的40%至60%。这一成绩不仅让小米从众多国产AI厂商中脱颖而出，更在全球AI竞争中树立了新的效率标杆。

从追赶到领跑：小米AI的一年狂奔

回顾小米在AI领域的发展历程，2025年可以看作是MiMo系列模型的亮相元年。那时的小米从MiMo-7B起步，陆续推出多模态、语音方向的基座模型，并在年末发布了混合专家模型MiMo-V2-Flash，构建起覆盖语言、多模态、语音的完整模型矩阵。

进入2026年，小米的节奏明显加快。2月开源首代机器人VLA大模型；3月集中发布MiMo-V2-Pro、V2-Omni、V2-TTS三款自研基座大模型；4月发布MiMo Token扶持计划，miclaw通过首批可信AI评测；5月初开源覆盖超600种语言的多语言语音克隆模型，近期又全面开源OneVL自动驾驶模型。各模型分别适配移动终端、全屋智能、自动驾驶等场景，形成了被AI串联的”人车家全生态”雏形。

2025年11月，被业界称为”AI天才少女”的罗福莉宣布加入小米MiMo团队。罗福莉此前拥有阿里达摩院与DeepSeek的研发经历，她的加入为小米AI团队注入了新的活力。同年12月，罗福莉在小米人车家全生态合作伙伴大会上完成首秀，提出了智能体系统应从”回答问题”转向”完成任务”的核心理念，强调大模型护城河在于科学研究文化与转化能力。

稀疏混合专家架构：效率革命的底层密码

MiMo-V2.5系列模型的核心突破，在于其采用的稀疏混合专家架构（Sparse Mixture of Experts）。技术团队透露，MiMo-V2.5-Pro拥有1.02万亿参数，但在每次请求时仅激活420亿参数。这种”按需激活”的设计理念，是实现高效推理的关键所在。

传统的密集模型在处理任何请求时，都需要调动全部参数参与计算，这就好比用一把大锤去敲开一颗钉子——力量有余而效率不足。而稀疏混合专家架构则像是组建了一支专业团队，每个专家只负责自己擅长的领域。当用户提出编程问题时，系统会自动调用擅长代码生成的专家；当用户需要文案创作时，另一批专家则会接管任务。这种精细化的分工协作，使得模型在保持高质量输出的同时，大幅降低了计算资源的消耗。

更值得关注的是MiMo-V2.5的混合注意力设计。团队创新性地引入了KV缓存压缩技术，将Key-Value缓存的存储量缩减近7倍。这对于需要处理长文本、长对话的企业用户来说尤为重要。在实际测试中，MiMo-V2.5-Pro在4.3小时内通过672次工具调用完成了一个Rust语言编写的SysY编译器，全部通过233个隐藏测试；并在11.5小时自主工作中，历经1868次工具调用，生成了一个8192行代码的桌面视频编辑器。这种长时间、高复杂度任务的稳定执行能力，充分验证了其在真实场景中的实用性。

百万Token上下文：长任务处理的硬实力

除了Token效率的优化，MiMo-V2.5系列还支持100万Token的超长上下文窗口。这一能力对于需要处理长文档、进行复杂分析的用户来说，是实打实的刚需。

想象一下这样的场景：你需要让AI分析一份300页的技术文档，或者让它帮助审阅一个包含数十个文件的代码仓库。如果模型的上下文窗口不够大，就不得不将内容分批处理，这不仅容易导致信息的丢失，还会影响输出的连贯性和准确性。而100万Token的上下文窗口，意味着AI可以一次性”消化”整部《战争与和平》的原文还有富余，这为复杂任务的处理提供了充足的”记忆空间”。

在实际应用层面，这一能力对于法律文档审查、财务报告分析、代码仓库理解等长文本任务有着显著的价值。企业用户不再需要花费时间将长文档拆分成多个片段，也不用担心跨片段的信息关联问题，AI可以像人类专家一样，从头到尾保持对整体内容的连贯理解。

开源生态：从技术突破到产业落地

小米在开源策略上展现出了十足的诚意。MiMo-V2.5系列模型采用MIT许可协议开源，这意味着开发者可以免费商用、微调及二次训练，几乎没有任何使用限制。这种完全开放的姿态，与某些厂商”开源但附带诸多条件”的做法形成了鲜明对比。

为了加速开发者采用，小米还启动了”MiMo Orbit 100T Token计划”，计划在30天内面向全球AI用户免费发放100万亿Token权益。截至5月12日上午，该计划已累计送出近80万亿Token。这种大规模的Token赠送，类似于SaaS产品的免费试用期，让开发者有机会亲身体验MiMo模型的性能，从而做出更明智的选择。

在生态合作方面，MiMo已与OpenCode、Hermes Agent、Kilo Code等主流框架厂商展开深度合作。以Hermes Agent为例，这款开源AI智能体框架凭借持久记忆和自主学习特性，在全球开发者社区获得了广泛认可。其GitHub星标已超过14万，成为全球增长最快的开源智能体框架之一。MiMo作为Hermes Agent的首选推理引擎，双方的深度绑定为开发者提供了从底层模型到上层应用的完整解决方案。

全球竞争格局：中国力量正在改写规则

OpenRouter平台的最新数据显示，近一个月全球AI大模型周调用量前20名中，半数来自中国，且包揽前三名。在Kilo Code等智能体的调用榜上，上海基座模型如阶跃星辰Step 3.5 Flash、MiniMax M2.5等也占据前列位置。

这一现象背后，是中国AI企业在技术创新和成本控制上的双重突破。以MiMo为例，其Token效率的优化不仅降低了用户的使用成本，更为构建大规模、高并发的AI应用提供了可能。对于需要同时处理成千上万用户请求的商业场景，60%的Token节省意味着运营成本的等比例下降，这在商业竞争中是不可忽视的优势。

从更宏观的视角来看，中国AI企业正在从”技术追随者”向”规则塑造者”转型。过去，全球AI领域的话语权主要掌握在OpenAI、Google等美国企业手中，开源模型的玩法也基本沿用硅谷制定的规则。而现在，以小米、DeepSeek、字节跳动为代表的中国企业，正通过技术创新和开源生态建设，逐步建立起自己的影响力。

使用指南：如何快速上手MiMo-V2.5

对于希望尝试MiMo-V2.5的开发者，小米的官方文档提供了清晰的接入指引。模型已上架Hugging Face和GitHub，开发者可以通过pip安装对应的SDK包，快速开始调用。

具体而言，如果你在本地运行，推荐配置为16核CPU、32G内存、16G以上显存，硬盘预留100G空间。当然，如果只是想体验一下基础功能，也可以通过小米的云端API接口进行调用，每月有免费Token额度可用。

对于已经在使用Hermes Agent的用户，只需在配置文件中将默认模型切换为MiMo-V2.5-Pro，即可体验Token效率提升带来的成本优化。小米官方也提供了详细的迁移文档，帮助用户平滑过渡。

未来展望：效率优化永无止境

小米MiMo团队表示，Token效率的优化是一个持续迭代的过程。下一阶段的研发方向将聚焦于进一步压缩推理成本、提升多模态融合能力，以及针对特定垂直场景的专项优化。

与此同时，MiMo与小米生态的深度整合也值得期待。从手机到汽车，从智能家居到机器人，MiMo正成为连接各种智能设备的”神经网络”。随着OneVL自动驾驶模型等垂直领域产品的推出，一个以MiMo为核心的AI生态正在逐步成型。

对于普通用户而言，MiMo带来的最直接影响是AI应用成本的持续下降。当模型的Token消耗更低、响应速度更快、服务价格更亲民，AI从小众极客的玩具变成普罗大众的日常工具，这一天或许已经不远了。

常见问题

Q：MiMo-V2.5和之前的版本有什么主要区别？

A：MiMo-V2.5相比V2版本，主要在三个维度进行了升级：一是Token效率提升40%至60%，同等能力下消耗更少的Token；二是上下文窗口扩展至100万Token，支持更长文本的处理；三是稀疏混合专家架构优化，1.02万亿参数仅激活420亿，推理成本大幅降低。

Q：普通用户如何使用MiMo模型？

A：普通用户可以通过两种方式体验MiMo：一是使用集成了MiMo的第三方应用，如Hermes Agent、Kilo Code等智能体框架；二是通过小米的云端API接口调用，官方提供免费Token额度供试用。

Q：MiMo开源后可以商用吗？有什么限制？

A：MiMo-V2.5系列采用MIT许可证，完全开源可商用，允许免费商用、微调及二次训练，几乎没有使用限制，是目前限制最宽松的开源大模型许可证之一。

Q：和其他主流模型相比，MiMo的性能如何？

A：在ClawEval基准测试中，MiMo-V2.5-Pro的Pass³得分达到64%，与Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.4等顶级模型处于同一能力水平，但Token消耗减少了40%至60%，性价比优势明显。

延伸阅读：深度解读：开源AI如何重塑智能体生态格局

从追赶到领跑：小米AI的一年狂奔

稀疏混合专家架构：效率革命的底层密码

百万Token上下文：长任务处理的硬实力

开源生态：从技术突破到产业落地

全球竞争格局：中国力量正在改写规则

使用指南：如何快速上手MiMo-V2.5

未来展望：效率优化永无止境

常见问题

评论

发表回复 取消回复

更多文章

稳定币市场格局正在发生哪些新变化

Anthropic Claude for Small Business深度解读：15个智能体工作流让中小企业AI落地不再难

DePIN赛道爆发后哪些项目最值得关注

币安储备金机制如何提升用户信任

发表回复取消回复