智能论文笔记

MC-Nonlocal-PINNs: handling nonlocal operators in PINNs via Monte Carlo sampling

Xiaodong Feng , Yue Qian , Wanfang Shen

分类：机器学习

2022-12-26

We propose, Monte Carlo Nonlocal physics-informed neural networks (MC-Nonlocal-PINNs), which is a generalization of MC-fPINNs in \cite{guo2022monte}, for solving general nonlocal models such as integral equations and nonlocal PDEs. Similar as in MC-fPINNs, our MC-Nonlocal-PINNs handle the nonlocal operators in a Monte Carlo way, resulting in a very stable approach for high dimensional problems. We present a variety of test problems, including high dimensional Volterra type integral equations, hypersingular integral equations and nonlocal PDEs, to demonstrate the effectiveness of our approach.

translated by 谷歌翻译

Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud Analysis

Qijian Zhang , Junhui Hou , Yue Qian , Yiming Zeng , Juyong Zhang , Ying He

分类：计算机视觉

2022-12-17

Point clouds are characterized by irregularity and unstructuredness, which pose challenges in efficient data exploitation and discriminative feature extraction. In this paper, we present an unsupervised deep neural architecture called Flattening-Net to represent irregular 3D point clouds of arbitrary geometry and topology as a completely regular 2D point geometry image (PGI) structure, in which coordinates of spatial points are captured in colors of image pixels. \mr{Intuitively, Flattening-Net implicitly approximates a locally smooth 3D-to-2D surface flattening process while effectively preserving neighborhood consistency.} \mr{As a generic representation modality, PGI inherently encodes the intrinsic property of the underlying manifold structure and facilitates surface-style point feature aggregation.} To demonstrate its potential, we construct a unified learning framework directly operating on PGIs to achieve \mr{diverse types of high-level and low-level} downstream applications driven by specific task networks, including classification, segmentation, reconstruction, and upsampling. Extensive experiments demonstrate that our methods perform favorably against the current state-of-the-art competitors. We will make the code and data publicly available at https://github.com/keeganhk/Flattening-Net.

translated by 谷歌翻译

HEAD: HEtero-Assists Distillation for Heterogeneous Object Detectors

Luting Wang , Xiaojie Li , Yue Liao , Zeren Jiang , Jianlong Wu , Fei Wang , Chen Qian , Si Liu

分类：计算机视觉

2022-07-12

用于对象检测的常规知识蒸馏（KD）方法主要集中于同质的教师学生探测器。但是，用于部署的轻质检测器的设计通常与高容量探测器显着不同。因此，我们研究了异构教师对之间的KD，以进行广泛的应用。我们观察到，异质KD（异核KD）的核心难度是由于不同优化的方式而导致异质探测器的主链特征之间的显着语义差距。常规的同质KD（HOMO-KD）方法遭受了这种差距的影响，并且很难直接获得异性KD的令人满意的性能。在本文中，我们提出了异助剂蒸馏（Head）框架，利用异质检测头作为助手来指导学生探测器的优化以减少此间隙。在头上，助手是一个额外的探测头，其建筑与学生骨干的老师负责人同质。因此，将异源KD转变为同性恋，从而可以从老师到学生的有效知识转移。此外，当训练有素的教师探测器不可用时，我们将头部扩展到一个无教师的头（TF-Head）框架。与当前检测KD方法相比，我们的方法已取得了显着改善。例如，在MS-COCO数据集上，TF-Head帮助R18视网膜实现33.9 MAP（+2.2），而Head将极限进一步推到36.2 MAP（+4.5）。

translated by 谷歌翻译

Multi-View Vision-to-Geometry Knowledge Transfer for 3D Point Cloud Shape Analysis

Qijian Zhang , Junhui Hou , Yue Qian

分类：计算机视觉

2022-07-07

作为3D对象的两个基本表示方式，2D多视图图像和3D点云反映了来自视觉外观和几何结构各个方面的形状信息。与基于深度学习的2D多视图图像建模不同，该模型在各种3D形状分析任务中展示了领先的性能，基于3D点云的几何建模仍然遭受学习能力不足。在本文中，我们创新地构建了一个统一的跨模式知识转移框架，该框架将2D图像的歧视性视觉描述器提炼成3D点云的几何描述符。从技术上讲，在经典的教师学习范式下，我们提出了多视觉愿景到几何的蒸馏，由深入的2D图像编码器作为老师和深层的3D点云编码器组成。为了实现异质特征对齐，我们进一步提出了可见性感知的特征投影，通过该投影可以通过该投影将每个点嵌入可以汇总到多视图几何描述符中。对3D形状分类，部分分割和无监督学习的广泛实验验证了我们方法的优势。我们将公开提供代码和数据。

translated by 谷歌翻译

Intelligent Request Strategy Design in Recommender System

Xufeng Qian , Yue Xu , Fuyu Lv , Shengyu Zhang , Ziwen Jiang , Qingwen Liu , Xiaoyi Zeng , Tat-Seng Chua , Fei Wu

分类：人工智能

2022-06-23

瀑布推荐系统（RS）是移动应用程序中RS的流行形式，是推荐的项目流，这些项目由连续页面组成，可以通过滚动浏览。在Waterfall RS中，当用户完成浏览页面时，Edge（例如，手机）将向Cloud Server发送请求，以获取新的建议页面，称为分页请求机制。 RSS通常将大量项目放入一页中，以减少众多分页请求中的过度资源消耗，但是，这将降低RSS根据用户的实时兴趣及时续订建议的能力，并导致贫穷的用户。经验。直观地，在页面内插入其他请求以更新频率的建议可以减轻问题。但是，以前的尝试，包括非自适应策略（例如，统一插入请求）最终会导致资源过度消费。为此，我们设想了一项名为智能请求策略设计（IRSD）的Edge Intelligence的新学习任务。它旨在通过根据用户的实时意图确定请求插入的适当情况来提高瀑布RSS的有效性。此外，我们提出了一种新的自适应请求插入策略的范式，名为基于Uplift的On-Ending Smart请求框架（AdareQuest）。 AdareQuest 1）通过将实时行为与基于基于注意力的神经网络相匹配的历史兴趣来捕获用户意图的动态变化。 2）估计根据因果推理插入的请求带来的用户购买的反事实提升。 3）通过在在线资源约束下最大化效用功能来确定最终请求插入策略。我们在离线数据集和在线A/B测试上进行了广泛的实验，以验证AdareQuest的有效性。

translated by 谷歌翻译

Semi-signed neural fitting for surface reconstruction from unoriented point clouds

Runsong Zhu , Di Kang , Ka-Hei Hui , Yue Qian , Xuefei Zhe , Zhen Dong , Linchao Bao , Chi-Wing Fu

分类：计算机视觉

2022-06-14

从\ emph {nocedended}点云中重建3D几何形状可以使许多下游任务受益。最近的方法主要采用神经网络的神经形状表示，以代表签名的距离字段，并通过无签名的监督适应点云。但是，我们观察到，使用未签名的监督可能会导致严重的歧义，并且通常会导致\ emph {意外}故障，例如在重建复杂的结构并与重建准确的表面斗争时，在自由空间中产生不希望的表面。为了重建一个更好的距离距离场，我们提出了半签名的神经拟合（SSN拟合），该神经拟合（SSN拟合）由半签名的监督和基于损失的区域采样策略组成。我们的关键见解是，签名的监督更具信息性，显然可以轻松确定对象之外的区域。同时，提出了一种新颖的重要性抽样，以加速优化并更好地重建细节。具体而言，我们将对象空间弹并分配到\ emph {sign-newand}和\ emph {sign-unawern}区域，其中应用了不同的监督。此外，我们根据跟踪的重建损失自适应地调整每个体素的采样率，以便网络可以更多地关注复杂的拟合不足区域。我们进行了广泛的实验，以证明SSN拟合在多个数据集的不同设置下实现最新性能，包括清洁，密度变化和嘈杂的数据。

translated by 谷歌翻译

Smart Director: An Event-Driven Directing System for Live Broadcasting

Yingwei Pan , Yue Chen , Qian Bao , Ning Zhang , Ting Yao , Jingen Liu , Tao Mei

分类：计算机视觉

2022-01-11

实时视频广播通常需要具有域知识的多种技能和专业知识，以实现多摄像头制作。随着摄像机的数量不断增加，指导现场运动广播现在比以往任何时候都变得更加复杂和挑战。在生产过程中，广播董事需要更加集中，响应，令人满意的知识。为了使董事免于其密集努力，我们开发了一个叫做智能总监的创新自动化体育广播指示系统，旨在模仿典型的人类循环广播过程，以实时自动创建近专业广播节目通过使用一组高级多视图视频分析算法。灵感来自于所谓的“三事”的体育广播建设，我们用一个由三个连续新型组件组成的事件驱动管道构建我们的系统：1）通过建模多视图相关性来检测事件的多视图事件定位2）多视图突出显示检测通过视图选择的视觉重视等级相机视图，3）自动广播调度程序来控制广播视频的生产。为了我们的最佳知识，我们的系统是用于多摄像机运动广播的第一个端到端的自动化指导系统，完全受到体育赛事的语义理解。它还是通过跨视网膜关系建模解决多视图联合事件检测的新问题的第一系统。我们对现实世界的多相机足球数据集进行客观和主观评估，这证明了我们的自动生成视频的质量与人类导向的质量相当。由于其更快的回应，我们的系统能够捕获更快速的快速和短期持续时间，通常由人道持有。

translated by 谷歌翻译

Blind Image Super-resolution with Elaborate Degradation Modeling on Noise and Kernel

Zongsheng Yue , Qian Zhao , Jianwen Xie , Lei Zhang , Deyu Meng , Kwan-Yee K. Wong

分类：计算机视觉

2021-07-02

虽然最近基于模型的盲目单图像超分辨率（SISR）的研究已经取得了巨大的成功，但大多数人都不认为图像劣化。首先，它们总是假设图像噪声obeys独立和相同分布的（i.i.d.）高斯或拉普拉斯分布，这在很大程度上低估了真实噪音的复杂性。其次，以前的常用核前沿（例如，归一化，稀疏性）不足以保证理性内核解决方案，从而退化后续SISR任务的性能。为了解决上述问题，本文提出了一种基于模型的盲人SISR方法，该方法在概率框架下，从噪声和模糊内核的角度精心模仿图像劣化。具体而言，而不是传统的i.i.d.噪声假设，基于补丁的非i.i.d。提出噪声模型来解决复杂的真实噪声，期望增加噪声表示模型的自由度。至于模糊内核，我们新建构建一个简洁但有效的内核生成器，并将其插入所提出的盲人SISR方法作为明确的内核（EKP）。为了解决所提出的模型，专门设计了理论上接地的蒙特卡罗EM算法。综合实验证明了我们对综合性和实时数据集的最新技术的方法的优越性。

translated by 谷歌翻译

Deep Magnification-Flexible Upsampling over 3D Point Clouds

Yue Qian , Junhui Hou , Sam Kwong , Ying He

分类：计算机视觉

2020-11-25

本文解决了从给定稀疏点云生成密集点云的问题，以模拟物体/场景的底层几何结构。为了解决这一具有挑战性的问题，我们提出了一种新的基于端到端学习的框架。具体地，通过利用线性近似定理，我们首先明确地制定问题，这逐到确定内插权和高阶近似误差。然后，我们设计轻量级神经网络，通过分析输入点云的局部几何体，自适应地学习统一和分类的插值权重以及高阶改进。所提出的方法可以通过显式制定来解释，因此比现有的更高的内存效率。与仅用于预定义和固定的上采样因子的现有方法的鲜明对比，所提出的框架仅需要一个单一的神经网络，一次性训练可以在典型范围内处理各种上采样因子，这是真实的-world应用程序。此外，我们提出了一种简单但有效的培训策略来推动这种灵活的能力。此外，我们的方法可以很好地处理非均匀分布和嘈杂的数据。合成和现实世界数据的广泛实验证明了所提出的方法在定量和定性的最先进方法上的优越性。

translated by 谷歌翻译

Deep Variational Network Toward Blind Image Restoration

Zongsheng Yue , Hongwei Yong , Qian Zhao , Lei Zhang , Deyu Meng , Kwan-Yen K. Wong

分类：计算机视觉

2020-08-25

盲图修复（IR）是计算机视觉中常见但充满挑战的问题。基于经典模型的方法和最新的深度学习（DL）方法代表了有关此问题的两种不同方法，每种方法都有自己的优点和缺点。在本文中，我们提出了一种新颖的盲图恢复方法，旨在整合它们的两种优势。具体而言，我们为盲IR构建了一个普通的贝叶斯生成模型，该模型明确描绘了降解过程。在此提出的模型中，PICEL的非I.I.D。高斯分布用于适合图像噪声。它的灵活性比简单的I.I.D。在大多数常规方法中采用的高斯或拉普拉斯分布，以处理图像降解中包含的更复杂的噪声类型。为了解决该模型，我们设计了一个变异推理算法，其中所有预期的后验分布都被参数化为深神经网络，以提高其模型能力。值得注意的是，这种推论算法诱导统一的框架共同处理退化估计和图像恢复的任务。此外，利用了前一种任务中估计的降解信息来指导后一种红外过程。对两项典型的盲型IR任务进行实验，即图像降解和超分辨率，表明所提出的方法比当前最新的方法实现了卓越的性能。

translated by 谷歌翻译