+1

收藏
0

评论
+1

点赞

分享

罗福莉首次公开亮相：讲解小米开源模型MiMo-V2-Flash

PChome
PChome官方账号

1小时前

2025年12月17日，小米人车家全生态合作伙伴大会上罗福莉首次公开亮相，并揭开了开源模型MiMo-V2-Flash实现极致推理速度的核心技术奥秘。

500

据了解，MiMo-V2-Flash 实现高速推理的核心技术包括了混合滑动窗口注意力机制和轻量级多Token预测。

混合滑动窗口注意力机制采用了5层滑动窗口与1层全局注意力交替的结构，大幅降低KV缓存占用，支持最长256K上下文，同时保持长文本处理能力。而轻量级多Token预测则通过3层MTP模块实现并行token预测，平均可接受2.8–3.6个token，推理速度提升2.0–2.6倍。

500

该技术不仅加速推理，还优化训练阶段采样效率，缓解小批量强化学习中的GPU空转问题。

科技生活财经举报

PChome

2301篇文章 | 35人关注

+关注

观察者网用户社区

作者文章查看全部>>

如何看待新华社观点：“打扮”历史附会现实的“流量生意”当止？

最新提问

等27人已参与问答

媒体称收入分配制度或迎重大改革，大家怎么看？这是什么信号？

最新提问

等8人已参与问答

蜜雪冰城进军美国，可选 200%糖度，为什么美国人这么能吃糖？

最新提问

等32人已参与问答

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

岁月匆匆，又是一年。这一年，我们看到过巴以战场上无家可归的孩子，见证过巴黎奥运会赛场上的拼搏，也迎来了新中国的第75个生日……这一年，我们讨论经济、讨论房价股市，在现实的磨......
- 评论 83
- 赞 19
风闻社区小助手_小风

风闻 “避坑” 版块上线！你的消费避雷指南、好物种草清单，从此常驻不离🎉

还记得“三月风闻社区消费者权益月”“智能车轮上的权益保卫战”活动里，大家分享的那些消费“踩坑”吐槽、维权妙招和宝藏好物吗？很多观友都说，希望这样的交流平台能一直存在！现在，......
- 评论 22
- 赞 12

最近更新的专栏

上海全知道

自媒体人脊梁in上海
- 好精彩的瓜！前经纪公司称已支付鞠婧祎超1.39亿元！网友：1个月比我1年都多
知危
- 第一批开在商场里的汽车门店，已经撑不下去要撤了
柳飘飘了吗
- F4变F5，他被踢出局0人关心
独角兽早知道

提供IPO最新消息，及时更新市场动态
- 传Minimax、智谱AI已完成港股上市备案且通过港交所聆讯，争夺大模型第一股
电影杂志

电影杂志——为你发现好片
- 9.6分神作，在国内上映了
侠客岛
- 这份承诺，几斤几两？
PChome
- 豆包AI手机恢复销售，仅有少量名额且无扩大生产计划
新潮沉思录
- 法学界的问题比毒品问题更让人担心
民声面对面

心贴心听民声，面对面解民忧。
- 潍坊临朐：开展消防产品专项检查行动筑牢消防产品安全"防火墙"
子弹财经

子弹财经（zidancaijing）
- 总资产突破6000亿，高层变动频繁，桂林银行距上市还有多远？

风闻最热

全部专栏