小米开源首个原生端到端语音大模型

2025-12-17 17:39:35

阅读

XM外汇官网讯——

【小米开源首个原生端到端语音模型】

9月19日，小米小米推出了其首个原生端到端语音模型——Xiaomi-MiMo-Audio。开源该模型基于创新的原生音预训练架构和超过亿小时的训练数据，实现了在语音领域的端到端语少样本泛化，并展现出显著的模型“涌现”行为。根据介绍，小米MiMo-Audio在通用语音理解和对话等多个标准评测基准上表现出色，开源性能远超同等参数的原生音开源模型，达到了7B的端到端语最佳表现；在音频理解基准MMAU的标准测试集上，其表现超过了Google的模型闭源模型Gemini-2.5-Flash；在面向复杂音频推理的基准Big Bench Audio S2T任务中，MiMo-Audio同样优于OpenAI的小米闭源语音模型GPT-4o-Audio-Preview。

开源

风险披露

差价合约(CFDs)和杠杆产品交易具有高风险性，可能不适合所有投资者。您的损失可能超过您的初始投资。在决定交易之前，请确保您完全理解所涉及的风险，并根据您的投资目标、经验水平和风险承受能力进行评估。如有必要，请寻求独立的财务建议。

准备好开始交易了吗？

在ICMarkets集团官网开设账户，体验专业的交易服务

立即开户使用杠杆模拟器

小米开源首个原生端到端语音大模型

风险披露

准备好开始交易了吗？

相关文章