小米AI算法能力登顶声音识别领域高峰，AI全面赋能业务再进一步

　　近日，小米自研声音识别算法取得最新进展，算法模型领先其他机构，性能国际排名第一。小米是在 Google 发布的 AudioSet 音频标记任务中获得的这一突破。

　　它是音频标记任务影响力最大的数据集，被认为是声音领域的 ImageNet (注：计算机视觉领域最著名的数据集，由著名学者李飞飞等主持发布)，权威性颇高。

　　Google 将 AudioSet 数据集分为三个子集，前两个子集用于训练，被合并称为 “AudioSet-2M”。正是在这个合并后的训练集中，小米的声音识别算法模型首次在业界突破了50 mAP，刷新了音频标记技术指标，成为截至目前性能最好的模型。

　　此外，小米还发布了一个 Mini 版模型，适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一，远小于其他机构的模型，但性能却优于其他所有机构。

　　这项技术的突破意味着小米的声音识别算法能力再次精进，小米的众多智能硬件设备应用此项技术后，可以更敏锐地捕捉和识别环境声音，大幅提升硬件的智能化程度，从而为用户创造更加便捷的智能生活体验。