语义场景完成(SSC)是一个具有挑战性的计算机视觉任务,具有许多实际应用,从机器人到辅助计算。其目标是在场景的视野中推断3D几何图形和体素的语义标记,包括遮挡区域。在这项工作中,我们呈现出来,一种新型轻质多模式3D深CNN,其与来自BiMoDal 2D分段网络的语义前沿的RGB-D图像的深度分量无缝地熔化结构数据。这一领域的一个至关重要的困难是缺乏完全标记的现实世界3D数据集,足以训练当前的数据饥饿的深3d CNN。在2D计算机愿景任务中,已提出许多数据增强策略来改善CNN的泛化能力。但是,这些方法不能直接应用于RGB-D输入和SSC解决方案的输出量。在本文中,我们介绍了可以应用于多模式SSC网络的3D数据增强策略的使用。我们通过全面和可重复的消融研究验证我们的贡献。我们的解决方案始终如一地超越了以前的作品,具有类似的复杂程度。
translated by 谷歌翻译