小米开源 MiMo-V2.5 系列
小米 MiMo 团队正式开放 MiMo-V2.5 系列权重,覆盖 MiMo-V2.5-Pro 与 MiMo-V2.5 两个主模型。
MiMo-V2.5-Pro 采用 1.02T 参数 MoE 架构,激活参数 42B,支持 1M token 上下文,面向复杂 Agent、软件工程和长周期任务;权重、分词器和模型卡已在 Hugging Face 提供。
MiMo-V2.5 则定位为原生全模态模型,支持文本、图像、视频和音频理解。官方模型卡显示,该模型为 310B 参数 Sparse MoE,激活参数 15B,同样支持 1M token 上下文,训练规模约 48T tokens。
两个模型的 Hugging Face 页面均标注为 MIT License。
v2.5
v2.5pro
小米 MiMo 团队正式开放 MiMo-V2.5 系列权重,覆盖 MiMo-V2.5-Pro 与 MiMo-V2.5 两个主模型。
MiMo-V2.5-Pro 采用 1.02T 参数 MoE 架构,激活参数 42B,支持 1M token 上下文,面向复杂 Agent、软件工程和长周期任务;权重、分词器和模型卡已在 Hugging Face 提供。
MiMo-V2.5 则定位为原生全模态模型,支持文本、图像、视频和音频理解。官方模型卡显示,该模型为 310B 参数 Sparse MoE,激活参数 15B,同样支持 1M token 上下文,训练规模约 48T tokens。
两个模型的 Hugging Face 页面均标注为 MIT License。
v2.5
v2.5pro