传统的图像/视频压缩旨在以尽可能高的信号保真度降低传输/存储成本。但是,随着近年来对机器分析和语义监测的需求不断增长,语义保真度而不是信号忠诚度正在成为图像/视频压缩中的另一个新兴关注点。随着交叉模态翻译和生成的最新进展,在本文中,我们提出了交叉模态压缩〜(CMC),即视觉数据的语义压缩框架,以转换高冗余的视觉数据〜(例如图像,视频等) 。具体而言,我们首先将CMC问题作为率延伸优化问题。其次,我们研究了与传统图像/视频压缩和最新特征压缩框架的关系,显示了我们的CMC和这些先前的框架之间的差异。然后,我们为CMC提出了一种新颖的范式,以证明其有效性。定性和定量结果表明,我们提出的CMC可以通过超高压缩比实现令人鼓舞的重建结果,比广泛使用的JPEG基线显示出更好的压缩性能。
translated by 谷歌翻译