智能论文笔记

4-bit Conformer with Native Quantization Aware Training for Speech Recognition

Shaojin Ding , Phoenix Meadowlark , Yanzhang He , Lukasz Lew , Shivani Agrawal , Oleg Rybakov

分类：机器学习

2022-03-29

减少潜伏期和模型大小一直是实时自动语音识别（ASR）应用程序方案的重要研究问题。沿着这个方向，模型量化已成为压缩神经网络并降低计算成本的越来越流行的方法。大多数现有的实用ASR系统都采用训练后8位量化。为了在不引入额外的性能回归的情况下达到更高的压缩率，在这项研究中，我们建议开发具有本机量化培训的4位ASR模型，该模型利用天然整数操作有效地优化培训和推理。我们对基于最新构象体的ASR模型进行了两个实验，以评估我们提出的量化技术。首先，我们探讨了不同精度对重量和激活量化对LibrisPeech数据集的影响，并获得了与Float32模型相比，获得了7.7倍尺寸的无损4位构象异构体模型。此后，我们首次研究并揭示了在使用大型数据集训练的实用ASR系统上的4位量化的可行性，并产生了具有4位混合重量和8位权重的无损构象体ASR模型与FLOAT32模型相比，尺寸减小了5倍。

translated by 谷歌翻译

本文介绍了一种开源平台，可快速发展计算机视觉应用。该平台在机器学习开发过程的中心进行了高效的数据开发，集成了主动学习方法，数据和型号版本控制，并使用项目等概念，以便并行启用多个任务特定数据集的快速迭代。我们通过将开发过程抽象到核心状态和操作中，设计开放式平台，并设计开放API，将第三方工具集成为操作的实现。这种开放式设计降低了ML与现有工具的ML团队的开发成本和采用费用。与此同时，该平台支持录制项目开发历史记录，可以共享成功的项目，以进一步提高类似任务的模型生产效率。该平台是开源的，已经在内部使用，以满足自定义现实世界计算机视觉应用程序的日益增长的需求。

translated by 谷歌翻译