首页 > 科技频道 > IT互联网 >

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

网友分享 270650

分享

快科技5月27日消息,今日,小米宣布,旗下MiMo-V2.5系列大模型API迎来永久降价。

据介绍,相比原始API定价,MiMo-V2.5系列新价格最高降幅可达99%,并且不再区分上下文窗口长度。

本次调价已于北京时间5月27日0:00正式生效,全球同步调整。

具体来看,此次降价覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

其中,MiMo-V2.5 Pro输入缓存命中价格降至0.025元/百万tokens,最高降幅达99%;MiMo-V2.5输入缓存命中价格降至0.02元/百万tokens,最高降幅达98%。

输出价格方面,MiMo-V2.5 Pro降至6元/百万tokens,最高降幅86%;MiMo-V2.5降至2元/百万tokens,最高降幅93%。

除了API价格下调外,MiMo的Token Plan计费体系也同步迎来重大优化。

优化后的Token Plan在加量不加价的基础上,用量提升至原来的5至8倍,同时引入Credits概念,让计费规则更清晰、更易理解。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

小米称,本次价格调整背后,离不开技术团队在推理系统上的持续优化。

据了解,小米基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓存token数量提升至优化前的近5倍,从而显著提升缓存命中率和推理效率。

同时,小米还通过优化专家并行方案、输入长度分桶策略等方式,进一步提升集群输入吞吐能力,在保障服务质量的前提下,持续降低单位token服务成本。

小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

AD位1

相关推荐

人教版五四制小学道德与法治电子课本免费下载(含旧课标版)

电子课本

【部编人教版】小学一年级到六年级语文电子课本(可免费下载打印)

电子课本

2025年河南多地期末考试时间(必看)

动态要闻

新课标人教版小学道德与法治电子课本免费下载(含旧课标版)

电子课本

风云人物,贯朽粟陈。重过江南更千里。东箭南金,炼石补天。七条瘦玉叩寒星。指是代表什么生肖,释义解释词语落实

传统文化
AD位2

热门图文

AD3

上一篇:感觉很久没有听过GoPro的消息了 它不会快没了吧!

下一篇:华为新出的τ定律 是夯爆了还是拉完了?