【CNMO新闻】音频水印是为PC添加可识别的独特声音模式的过程,它是网络视频主机、机顶盒和媒体播放器发布受版权保护的曲目的主要方式。但是水印方案在嘈杂的环境中并不是特别可靠,例如通过音箱播放音频时,由此产生的噪声和干扰严重扭曲了水印,并引入了探测器经常难以处理的延迟。 不过,亚马逊的研究人员已经找到了一种新的解决方法,他们在相关论文中进行了描述,该团队声称他们的方法可以以“几乎完美的准确度”检测到水印,只增加大约两秒的时间,即使音箱和探测器之间的距离大于20英尺也毫无问题。
传统的声学指纹识别方法需要为每个实例存储单独的指纹,并且计算的复杂程度会随着指纹库规模而变大,而研究人员找到的这种新方法的复杂程度是恒定的,他们认为这使得这种技术非常适合蓝牙耳机等低功耗设备。
亚马逊Alexa Speech小组的研究科学家写道:“我们的算法可以对声学指纹识别技术形成补充,这种技术目前可以防止Alexa在听到媒体提到她的名字时错误地被唤醒。我们还设想音频水印可以提高Alexa自动语音识别系统的性能。Alexa播放的音频内容,如音乐、有声读物、播客、无线电广播、电影等都可以动态加水印,因此支持Alexa的设备可以更好地衡量房间混响并滤除回声。”
研究小组成员解释说,该模型使用了“扩频”技术,水印能量可以在时间和频率上传播,让人耳听不到它,同时使其不受后处理的影响,并且它从固定持续时间的噪声块产生水印,每个噪声块都将自己独特的模式引入主机音频信号中的所选频率分量。
这不是一个完美的解决方案,它需要更短的噪声模式,这与较低的检测精度相关,并且当目标音频包括音乐时,节奏有时与噪声过于相似。但该团队表示,这些都可以通过重复噪声阻挡模式得到一定程度的缓解。