作为一项结构化的预测任务,场景图生成给定输入图像,旨在通过构造视觉上的场景图来明确建模对象及其关系。在当前的文献中,这种任务是通过传递基于神经网络的均值差异贝叶斯方法的消息普遍解决的。经典的宽松证据下结合通常被选择为变异推理目标,这可能会诱导过分简化的变分近似,从而低估了下面的复合物后部。在本文中,我们提出了一种新颖的双重重视重要的加权结构学习方法,该方法采用更严重的加权下限作为变异推理目标。它是从从可重新聚集的gumbel-softmax采样器中绘制的多个样品中计算得出的,所得约束的变异推理任务由通用的熵镜下降算法求解。由此产生的双重重聚梯度估计器可降低相应的衍生物的方差,对学习产生有益的影响。所提出的方法在各种流行场景图生成基准测试中实现了最先进的性能。
translated by 谷歌翻译