2025 年 11 月,95 后 AI 研究员罗福莉通过朋友圈发声“我正在 Xiaomi MiMo”,正式确认加盟小米大模型团队。这一官宣为持续近一年的“雷军千万年薪挖角”传闻画上句号。
事实上,双方合作早有伏笔。2025 年 10 月,小米与北京大学联合发表的 MoE(混合专家)与强化学习领域论文中,罗福莉已位列通讯作者,其研究方向与 Xiaomi MiMo 的核心技术路径高度契合。而她在 9 月点赞小米语音大模型 Xiaomi-MiMo-Audio 开源动态的行为,也被外界解读为加盟前的信号。
此前 2 月,罗福莉亲属曾证实其入职新单位,但未披露具体去向,小米内部系统当时也未显示其信息,直至此次官宣终告落地。
从顶会新星到开源先锋
罗福莉本科就读于北京师范大学计算机专业,保研至北京大学计算语言学研究所后,于 AI 领域顶级国际会议 ACL 发表 8 篇论文(含 2 篇一作),两年内累计发表顶会论文超 20 篇。
职业生涯中,她先后任职于阿里达摩院、幻方量化 DeepSeek 等机构。在阿里达摩院期间,她主导开发多语言预训练模型 VECO,成为开源项目 AliceMind 核心组件,奠定跨语言大模型研发经验。加盟 DeepSeek 后,作为关键开发者参与 MoE 架构大模型 DeepSeek-V2 研发,该模型以 1 元/百万 Tokens 的性价比(GPT-4 的 1%)和顶尖中文处理能力,被业界评为“闭源模型第一梯队”。
值得注意的是,罗福莉本人始终淡化“天才少女”标签,2025 年 2 月曾发文称“只想安安静静做难而正确的事情”,但其技术成果已获得行业广泛认可。
技术互补加速小米 AI 生态落地
罗福莉加盟的核心载体——Xiaomi MiMo 大模型,是小米于 2025 年 4 月 30 日开源的首个推理专用大模型,其最大突破在于打破“参数规模决定性能”的行业铁律,以 7B 轻量化参数实现超越 32B 模型的性能表现。
小米官方披露,MiMo 的性能突破源于全链路技术革新:
三阶段预训练:基于 200B tokens 专项推理语料库,通过“基础能力→STEM 强化→长文本突破”阶梯训练,累计训练量达 25T tokens;
强化学习革新:独创 TDDR(Test Difficulty Driven Reward)机制,解决“难题摆烂”问题,搭配 Easy Data Re-Sampling 策略,训练稳定性提升 40%;
工程效率突破:自研 Seamless Rollout 系统实现异步奖励计算,训练速度提升 2.29 倍,验证效率翻倍。
目前 MiMo 已开源 4 个版本(基础预训练、监督微调及两个强化学习版本),教育机构已基于其开发 AI 解题助手等应用。
罗福莉的加盟被业界视为“强强联合”。其在 MoE 架构、强化学习、开源生态运营等领域的经验,与 Xiaomi MiMo 的技术路线高度契合——MiMo 采用的混合专家模型架构,正是罗福莉在 DeepSeek-V2 研发中的核心擅长领域。
从行业格局看,当前手机厂商正加速大模型端侧落地,MiMo 以“轻量化、高性能”为差异化优势,而罗福莉主导的跨语言模型研发经验,或将助力 MiMo 拓展多语种推理能力,进一步适配小米全球智能设备生态。雷军此前曾公开表示,小米大模型研发的核心目标是“让 AI 技术惠及每一个用户”,而罗福莉在开源社区的深厚积累,将为 MiMo 生态的开发者共建提供关键支撑。
轻量化大模型成终端 AI 竞争焦点
罗福莉加盟小米的背后,是终端厂商大模型竞争的升级。数据显示,2025 年以来,7B-13B 参数的轻量化模型成为行业布局热点,其在推理速度、硬件适配性上的优势,更符合手机、智能家居等终端设备的应用场景。MiMo 的开源策略已吸引超万名开发者参与调优,而罗福莉的加入有望进一步提升其技术迭代速度,与华为盘古、OPPO AndesGPT 等形成差异化竞争。
对于罗福莉个人而言,从阿里达摩院的预训练模型研发,到 DeepSeek 的开源大模型实践,再到 MiMo 的端侧推理突破,其职业路径始终聚焦“技术落地”核心。此次加盟小米,或将成为其实现“难而正确的事情”的新起点。