科技魔方

Nexa AI发布OmniAudio-2.6B:用于边缘部署的快速音频语言模型

更多场景

2024年12月16日

  Nexa AI最近推出的OmniAudio-2.6B音频语言模型,专为边缘设备的高效部署而设计。

  该模型通过将多个组件整合到一个统一框架中,显著提升了处理速度和资源效率,适应了计算资源有限的环境。

  其在准确性和灵活性方面也表现出色,能够满足转录、翻译等多种任务的需求。

  处理速度卓越:在2024Mac Mini M4Pro上,模型实现每秒35.23个令牌的处理速度,展现出显著的速度优势。

  资源效率高:紧凑设计减少了对云资源的依赖,适合功率和带宽受限的设备,如可穿戴设备和汽车系统。

  高准确性与灵活性:适用于转录、翻译等多种任务,能够提供精准的实时语音处理结果。

+1

来源:科技魔方

延展资讯