
【大河财立方消息】9月19日正规杠杆炒股官网,小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio。
该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并在预训练观察到明显的“涌现”行为。
据介绍,在通用语音理解及对话等多项标准评测基准中,MiMo-Audio大幅超越了同参数量的开源模型,取得7B最佳性能;在音频理解基准MMAU的标准测试集上,MiMo-Audio超过Google闭源语音模型Gemini-2.5-Flash;在面向音频复杂推理的基准Big Bench Audio S2T任务中,MiMo-Audio同样超越了OpenAI闭源的语音模型GPT-4o-Audio-Preview。
下一步,MiMo-Audio 的开源将显著加速语音大模型研究对齐到语言大模型,为语音 AGI 的发展提供重要基础。

实习编辑:金怡杉 | 审核:李震 | 监审:古筝正规杠杆炒股官网
信钰证券提示:文章来自网络,不代表本站观点。