智能论文笔记

Exploring Depth Information for Face Manipulation Detection

Haoyue Wang , Meiling Li , Sheng Li , Zhenxing Qian , Xinpeng Zhang

分类：计算机视觉

2022-12-29

Face manipulation detection has been receiving a lot of attention for the reliability and security of the face images. Recent studies focus on using auxiliary information or prior knowledge to capture robust manipulation traces, which are shown to be promising. As one of the important face features, the face depth map, which has shown to be effective in other areas such as the face recognition or face detection, is unfortunately paid little attention to in literature for detecting the manipulated face images. In this paper, we explore the possibility of incorporating the face depth map as auxiliary information to tackle the problem of face manipulation detection in real world applications. To this end, we first propose a Face Depth Map Transformer (FDMT) to estimate the face depth map patch by patch from a RGB face image, which is able to capture the local depth anomaly created due to manipulation. The estimated face depth map is then considered as auxiliary information to be integrated with the backbone features using a Multi-head Depth Attention (MDA) mechanism that is newly designed. Various experiments demonstrate the advantage of our proposed method for face manipulation detection.

translated by 谷歌翻译

Generative Steganography Network

Ping Wei , Sheng Li , Xinpeng Zhang , Ge Luo , Zhenxing Qian , Qing Zhou

分类：计算机视觉

2022-07-28

隐肌通常会将覆盖媒体修改为嵌入秘密数据。最近出现了一种称为生成隐志（GS）的新型隐志方法，其中直接从秘密数据中生成了Stego图像（包含秘密数据的图像），而无需覆盖媒体。但是，现有的GS方案经常因其表现不佳而受到批评。在本文中，我们提出了一个先进的生成隐志网络（GSN），该网络可以在不使用封面图像的情况下生成逼真的Stego图像，其中首先在Stego Image生成中引入了相互信息。我们的模型包含四个子网络，即图像生成器（$ g $），一个歧视器（$ d $），steganalyzer（$ s $）和数据提取器（$ e $）。 $ d $和$ s $充当两个对抗歧视器，以确保生成的Stego图像的视觉和统计不可识别。 $ e $是从生成的Stego图像中提取隐藏的秘密。发电机$ g $灵活地构建以合成具有不同输入的封面或seego图像。它通过隐藏在普通图像发生器中生成seego图像的功能来促进秘密通信。一个名为Secret Block的模块设计用于在图像生成过程中掩盖特征地图中的秘密数据，并实现了高隐藏容量和图像保真度。此外，开发了一种新型的层次梯度衰减技能来抵抗切割分析的检测。实验证明了我们工作比现有方法的优越性。

translated by 谷歌翻译

Image Generation Network for Covert Transmission in Online Social Network

Zhengxin You , Qichao Ying , Sheng Li , Zhenxing Qian , Xinpeng Zhang

分类：计算机视觉

2022-07-21

在线社交网络比以往任何时候都更加激发了互联网的通信，这使得在此类嘈杂渠道上传输秘密消息是可能的。在本文中，我们提出了一个名为CIS-NET的无封面图像隐志网络，该网络合成了直接在秘密消息上传输的高质量图像。 CIS-NET由四个模块组成，即生成，对抗，提取和噪声模块。接收器可以提取隐藏的消息而不会损失任何损失，即使图像已被JPEG压缩攻击扭曲。为了掩盖隐肌的行为，我们在个人资料照片和贴纸的背景下收集了图像，并相应地训练了我们的网络。因此，生成的图像更倾向于摆脱恶意检测和攻击。与先前的图像隐志方法相比，区分主要是针对各种攻击的鲁棒性和无损性。各种公共数据集的实验已经表现出抗坚果分析的卓越能力。

translated by 谷歌翻译

Robust Watermarking for Video Forgery Detection with Improved Imperceptibility and Robustness

Yangming Zhou , Qichao Ying , Xiangyu Zhang , Zhenxing Qian , Sheng Li , Xinpeng Zhang

分类：计算机视觉

2022-07-07

视频容易篡改攻击，从而改变含义并欺骗观众。以前的视频伪造检测方案找到了微小的线索来定位篡改区域。但是，攻击者可以通过使用视频压缩或模糊破坏此类线索来成功逃避监督。本文提出了一个视频水印网络，用于篡改本地化。我们共同训练一个基于3D-UNET的水印嵌入网络和一个预测篡改面罩的解码器。水印嵌入产生的扰动几乎是无法察觉的。考虑到没有现成的可区分的视频编解码器模拟器，我们建议通过结合其他典型攻击的模拟结果来模仿视频压缩，例如JPEG压缩和模糊，作为近似值。实验结果表明，我们的方法生成具有良好不可识别的水印视频，并且在攻击版本中可以稳健，准确地定位篡改区域。

translated by 谷歌翻译

Robust Image Protection Countering Cropping Manipulation

Qichao Ying , Hang Zhou , Zhenxing Qian , Sheng Li , Xinpeng Zhang

分类：计算机视觉

2022-06-06

图像裁剪是一种廉价而有效的恶意改变图像内容的操作。现有的裁剪检测机制分析了图像裁剪的基本痕迹，例如色差和渐晕，以发现种植攻击。但是，它们在常见的后处理攻击方面脆弱，通过删除此类提示，欺骗取证。此外，他们忽略了这样一个事实，即恢复裁剪的内容可以揭示出行为造成攻击的目的。本文提出了一种新型的强大水印方案，用于图像裁剪定位和恢复（CLR-NET）。我们首先通过引入不可察觉的扰动来保护原始图像。然后，模拟典型的图像后处理攻击以侵蚀受保护的图像。在收件人方面，我们预测裁剪面膜并恢复原始图像。我们提出了两个即插即用网络，以改善CLR-NET的现实鲁棒性，即细粒生成性JPEG模拟器（FG-JPEG）和Siamese图像预处理网络。据我们所知，我们是第一个解决图像裁剪本地化和整个图像从片段中恢复的综合挑战的人。实验表明，尽管存在各种类型的图像处理攻击，但CLR-NET可以准确地定位裁剪，并以高质量和忠诚度恢复裁剪区域的细节。

translated by 谷歌翻译

Invertible Image Dataset Protection

Kejiang Chen , Xianhan Zeng , Qichao Ying , Sheng Li , Zhenxing Qian , Xinpeng Zhang

分类：计算机视觉

2021-12-29

深度学习在各种工业应用中取得了巨大成功。公司不希望他们的宝贵数据被恶意员工偷来培训盗版模式。他们也不希望竞争对手在线使用后分析的数据。我们提出了一种新的解决方案，在这种情况下，通过稳健地并可逆地将图像转换为对手图像。我们开发一个可逆的对抗性示例生成器（Raeg），对图像引入略微变化以欺骗传统的分类模型。尽管恶意攻击培训基于Deacened版本的受保护图像的盗版模型，但Raeg可以显着削弱这些模型的功能。同时，Raeg的可逆性确保了授权模型的表现。广泛的实验表明，Raeg可以通过比以前的方法更好地防止对抗对抗防御的轻微扭曲。

translated by 谷歌翻译

DiverGAN: An Efficient and Effective Single-Stage Framework for Diverse Text-to-Image Generation

Zhenxing Zhang , Lambert Schomaker

分类：计算机视觉 | 人工智能

2021-11-17

在本文中，我们提出了一种有效且有效的单级框架（Divergan），根据自然语言描述产生多样化，可粘性和语义一致的图像。 Divergan采用两种新颖的单词级注意模块，即通道关注模块（CAM）和像素 - 注意模块（PAM），这在允许网络允许将较大的权重分配给定句子中的每个单词的重要性与突出字，语义对齐的重要通道和像素。之后，引入了条件自适应实例层归一化（CADailn）以使语言提示嵌入的句子中的语言线索灵活地操纵形状和纹理的变化量，进一步改善视觉语义表示和帮助稳定训练。此外，开发了双剩余结构以保持更多原始的视觉功能，同时允许更深的网络，从而产生更快的收敛速度和更生动的细节。此外，我们建议将完全连接的层插入管道以解决缺乏多样性问题，因为我们观察到致密层会显着提高网络的生成能力，平衡低于之间的权衡尺寸随机潜代码有助于使用高维和文本上下文来强度特征映射的变体和调制模块。在第二个残差块之后插入线性层，实现最佳品种和质量。基准数据集的定性和定量结果都展示了我们的潜水员实现多样性的优越性，而不会损害质量和语义一致性。

translated by 谷歌翻译

Multimodal Fake News Detection with Adaptive Unimodal Representation Aggregation

Qichao Ying , Yangming Zhou , Zhenxing Qian , Dan Zeng , Shiming Ge

分类：计算机视觉

2022-06-12

互联网技术的发展不断增强谣言和虚假新闻的传播和破坏力。先前关于多媒体假新闻检测的研究包括一系列复杂的功能提取和融合网络，以实现图像和文本之间的特征对齐。但是，多模式功能由什么组成，以及来自不同模式的特征如何影响决策过程仍然是开放的问题。我们介绍了Aura，这是一个具有自适应单峰表示聚合的多模式假新闻检测网络。我们首先从图像模式，图像语义和文本中分别提取表示形式，并通过将语义和语言表示形式发送到专家网络来生成多模式表示。然后，我们根据单峰和多模式表示，进行粗级的虚假新闻检测和跨模式宇宙性学习。分类和一致性得分被映射到模态感知的注意分数，以重新调整功能。最后，我们汇总并将加权功能分类用于精制的假新闻检测。关于微博和八卦的综合实验证明，Aura可以成功击败几个最先进的FND方案，在该方案中，整体预测准确性和对假新闻的回忆得到稳步改善。

translated by 谷歌翻译

Adversarial Fine-tuning for Backdoor Defense: Connecting Backdoor Attacks to Adversarial Attacks

Bingxu Mu , Zhenxing Niu , Le Wang , Xue Wang , Rong Jin , Gang Hua

分类：计算机视觉

2022-02-13

已知深层神经网络（DNN）容易受到后门攻击和对抗攻击的影响。在文献中，这两种攻击通常被视为明显的问题并分别解决，因为它们分别属于训练时间和推理时间攻击。但是，在本文中，我们发现它们之间有一个有趣的联系：对于具有后门种植的模型，我们观察到其对抗性示例具有与触发样品相似的行为，即都激活了同一DNN神经元的子集。这表明将后门种植到模型中会严重影响模型的对抗性例子。基于这一观察结果，我们设计了一种新的对抗性微调（AFT）算法，以防止后门攻击。我们从经验上表明，在5次最先进的后门攻击中，我们的船尾可以有效地擦除后门触发器，而无需在干净的样品上明显的性能降解，并显着优于现有的防御方法。

translated by 谷歌翻译

Generalized Binary Search Network for Highly-Efficient Multi-View Stereo

Zhenxing Mi , Di Chang , Dan Xu

分类：计算机视觉

2021-12-04

具有已知相机参数的多视图立体声（MVS）基本上是有效深度范围内的1D搜索问题。最近的基于深度学习的MVS方法通常在深度范围内密集地样本深度假设，然后构造对深度预测的预测存储器消耗的3D成本卷。虽然粗细的抽样策略在一定程度上缓解了这个开销问题，但MVS的效率仍然是一个开放的挑战。在这项工作中，我们提出了一种用于高效MV的新方法，其显着降低了内存足迹，同时明显推进最先进的深度预测性能。考虑到效率和有效性，我们调查搜索策略可以合理地最佳地最佳。我们首先将MVS制定为二进制搜索问题，因此提出了用于MV的广义二进制搜索网络。具体地，在每个步骤中，深度范围被分成2个箱，两侧具有额外的1个误差容差箱。执行分类以确定哪个箱包含真实深度。我们还将三种机制分别设计为分别处理分类错误，处理超出范围的样本并降低培训记忆。新配方使我们的方法仅在每个步骤中示出非常少量的深度假设，这是高度记忆效率，并且还极大地促进了快速训练收敛。竞争力基准的实验表明，我们的方法达到了最先进的准确性，内存要少得多。特别是，我们的方法在DTU数据集中获得0.289的总分，并在所有基于学习的方法中排列在具有挑战性的坦克和寺庙高级数据集上的第一名。训练有素的型号和代码将在https://github.com/mizhenxing/gbi-net发布。

translated by 谷歌翻译