根据美国商标和专利局(USPTO)近日公示的清单,微软携手 OpenAI 构想了一个声音识别 AI 技术专利,不仅能够识别门铃、狗叫或婴儿啼哭等日常声音,还能检测地震和风暴等自然灾害的迹象。
微软构想的该系统通过处理环境声音,可以提醒用户注意潜在的危险,可以在公共安全、备灾工作发挥重要作用。
微软这项声音 AI 专利的核心在于对音频信号的复杂处理。
系统首先将声音信号分解成较小的片段,在经过独立处理之后创建声音在时域中的规范化表示,本质上是声音在时间轴上的映射。
然后该系统映射数据输入神经网络,进一步匹配和评估声音片段,识别出的每一类声音事件的分配得分(assigning scores)和发生概率。
系统再调用算法进行后期处理之后,完善这些分数和概率,为每种声音类型生成置信度值(confidence values)。这一细致的过程使人工智能能够准确识别从普通到潜在危险的各种声音。