减少潜伏期和模型大小一直是实时自动语音识别(ASR)应用程序方案的重要研究问题。沿着这个方向,模型量化已成为压缩神经网络并降低计算成本的越来越流行的方法。大多数现有的实用ASR系统都采用训练后8位量化。为了在不引入额外的性能回归的情况下达到更高的压缩率,在这项研究中,我们建议开发具有本机量化培训的4位ASR模型,该模型利用天然整数操作有效地优化培训和推理。我们对基于最新构象体的ASR模型进行了两个实验,以评估我们提出的量化技术。首先,我们探讨了不同精度对重量和激活量化对LibrisPeech数据集的影响,并获得了与Float32模型相比,获得了7.7倍尺寸的无损4位构象异构体模型。此后,我们首次研究并揭示了在使用大型数据集训练的实用ASR系统上的4位量化的可行性,并产生了具有4位混合重量和8位权重的无损构象体ASR模型与FLOAT32模型相比,尺寸减小了5倍。
translated by 谷歌翻译
本文介绍了一种开源平台,可快速发展计算机视觉应用。该平台在机器学习开发过程的中心进行了高效的数据开发,集成了主动学习方法,数据和型号版本控制,并使用项目等概念,以便并行启用多个任务特定数据集的快速迭代。我们通过将开发过程抽象到核心状态和操作中,设计开放式平台,并设计开放API,将第三方工具集成为操作的实现。这种开放式设计降低了ML与现有工具的ML团队的开发成本和采用费用。与此同时,该平台支持录制项目开发历史记录,可以共享成功的项目,以进一步提高类似任务的模型生产效率。该平台是开源的,已经在内部使用,以满足自定义现实世界计算机视觉应用程序的日益增长的需求。
translated by 谷歌翻译