减少潜伏期和模型大小一直是实时自动语音识别(ASR)应用程序方案的重要研究问题。沿着这个方向,模型量化已成为压缩神经网络并降低计算成本的越来越流行的方法。大多数现有的实用ASR系统都采用训练后8位量化。为了在不引入额外的性能回归的情况下达到更高的压缩率,在这项研究中,我们建议开发具有本机量化培训的4位ASR模型,该模型利用天然整数操作有效地优化培训和推理。我们对基于最新构象体的ASR模型进行了两个实验,以评估我们提出的量化技术。首先,我们探讨了不同精度对重量和激活量化对LibrisPeech数据集的影响,并获得了与Float32模型相比,获得了7.7倍尺寸的无损4位构象异构体模型。此后,我们首次研究并揭示了在使用大型数据集训练的实用ASR系统上的4位量化的可行性,并产生了具有4位混合重量和8位权重的无损构象体ASR模型与FLOAT32模型相比,尺寸减小了5倍。
translated by 谷歌翻译