能够收集用户声音的强大个人设备的广泛开设了建立语音识别系统(ASR)的扬声器或参与ASR的协作学习的机会。在这两种情况下,可以构建个性化的声学模型(AM),即微调AM与特定扬声器数据。自然出现的问题是,个性化声学模型的传播是否可以泄漏个人信息。在本文中,我们表明可以通过仅利用本地适应该扬声器的神经声学模型的重量矩阵变化来检索扬声器的性别,而且还可以检索扬声器的性别,而且还可以检索他的身份。顺便提及,我们观察到在语音处理的背景下可以有助于解释深度神经网络的现象。在使用中间层时,只能使用第一层和扬声器验证几乎肯定地识别性别。我们对具有HMM / TDNN模型的TED-Lium 3数据集的实验研究显示了性别检测的95%,并且通过仅利用可以交换的个性化模型的权重,扬声器验证任务的相同错误率为9.07%而不是用户数据。
translated by 谷歌翻译