智能论文笔记

Advertising Media and Target Audience Optimization via High-dimensional Bandits

Wenjia Ba , J. Michael Harrison , Harikesh S. Nair

分类：机器学习

2022-09-17

我们提出了一种数据驱动的算法，广告商可以用来自动在线出版商的数字广告广告。该算法使广告客户能够跨越可用的目标受众和AD-Media搜索通过在线实验找到其广告系列的最佳组合。找到最佳受众ad AD组合的问题使许多独特的挑战变得复杂，包括（a）需要积极探索以解决先前的不确定性并加快搜索有利可图的组合，（b）许多组合可供选择，产生高维搜索公式，以及（c）成功概率非常低，通常只有百分之一。我们的算法（指定的LRDL，logistic回归与Debiased Lasso的首字母缩写）通过结合四个元素来解决这些挑战：一个用于主动探索的多层匪徒框架；套索惩罚功能以处理高维度；一个内置的偏见核，可处理套索引起的正则化偏差；以及一个半参数回归模型，用于促进跨武器交叉学习的结果。该算法是作为汤普森采样器实施的，据我们所知，这是第一个实际上可以解决以上所有挑战的方法。具有真实和合成数据的模拟表明该方法是有效的，并记录了其在最近的高维匪徒文献中的几个基准测试中的出色性能。

translated by 谷歌翻译

Optimal No-Regret Learning in Strongly Monotone Games with Bandit Feedback

Tianyi Lin , Zhengyuan Zhou , Wenjia Ba , Jiawei Zhang

分类：机器学习

2021-12-06

我们考虑在具有强盗反馈的未知游戏中的在线无遗憾的学习，其中每个代理只在每次都观察到其奖励 - 所有参与者当前的联合行动 - 而不是其渐变。我们专注于平稳且强烈单调的游戏类，并在其中研究最佳的无遗憾。利用自我协调的障碍功能，我们首先构建在线强盗凸优化算法，并表明它实现了平滑且强烈 - 凹陷的支付下$ \ tilde {\ theta}（\ sqrt {t}）$的单代理最佳遗憾职能。然后，如果每个代理在强烈单调的游戏中应用这种无悔的学习算法，则以$ \ tilde {\ theta}的速率，联合动作会收敛于\ texit {last erate}到唯一的纳什均衡（1 / \ sqrt {t}）$。在我们的工作之前，同一类游戏中的最熟悉的融合率是$ O（1 / T ^ {1/3}）$（通过不同的算法实现），从而留下了最佳无悔的问题学习算法（因为已知的下限为$ \ omega（1 / \ sqrt {t}）$）。我们的结果因此通过识别第一双重最佳强盗学习算法来解决这个公开问题并促进强盗游戏 - 理论学习的广泛景观，因为它达到了（达到了日志因子）单王子学习和最佳的最佳遗憾多代理学习中的最后迭代收敛速度。我们还展示了几项模拟研究的结果 - Cournot竞争，凯利拍卖和分布式正则化物流回归 - 以证明我们算法的功效。

translated by 谷歌翻译

Mesh-based 3D Motion Tracking in Cardiac MRI using Deep Learning

Qingjie Meng , Wenjia Bai , Tianrui Liu , Declan P O'Regan , Daniel Rueckert

分类：计算机视觉 | 机器学习

2022-09-05

来自类似的心脏磁共振（CMR）图像的3D运动估计对于评估心脏功能和心血管疾病的诊断很重要。以前的大多数方法都侧重于估计完整图像空间中的像素 - /体素运动场，这忽略了运动估计主要是相关且在感兴趣的对象中有用的事实，例如心脏。在这项工作中，我们将心脏建模为3D几何网格，并提出了一种新型的基于深度学习的方法，该方法可以从2D短轴和长轴CMR图像中估算心脏网格的3D运动。通过开发可区分的网格到图像射击器，该方法能够利用2D多视图CMR图像的解剖形状信息进行3D运动估计。 Rasterizer的不同性使我们能够训练该方法最终到端。提出方法的一个优点是，通过跟踪每个顶点的运动，它可以保持时间帧之间3D网格的顶点对应关系，这对于对网格上心脏功能的定量评估很重要。我们评估了从英国生物银行研究获得的CMR图像的建议方法。实验结果表明，所提出的方法在定量和定性上都优于常规和基于学习的心脏运动跟踪方法。

translated by 谷歌翻译

Generative Modelling of the Ageing Heart with Cross-Sectional Imaging and Clinical Data

Mengyun Qiao , Berke Doga Basaran , Huaqi Qiu , Shuo Wang , Yi Guo , Yuanyuan Wang , Paul M. Matthews , Daniel Rueckert , Wenjia Bai

分类：计算机视觉 | 机器学习

2022-08-28

心血管疾病是全球死亡的主要原因，是一种与年龄有关的疾病。了解衰老期间心脏的形态和功能变化是一个关键的科学问题，其答案将有助于我们定义心血管疾病的重要危险因素并监测疾病进展。在这项工作中，我们提出了一种新型的条件生成模型，以描述衰老过程中心脏3D解剖学的变化。提出的模型是灵活的，可以将多个临床因素（例如年龄，性别）整合到生成过程中。我们在心脏解剖学的大规模横截面数据集上训练该模型，并在横截面和纵向数据集上进行评估。该模型在预测衰老心脏的纵向演化和对其数据分布进行建模方面表现出了出色的表现。

translated by 谷歌翻译

HTML版本

Distincive Image Captioning via CLIP Guided Group Optimization

Youyuan Zhang , Jiuniu Wang , Hao Wu , Wenjia Xu

分类：计算机视觉

2022-08-08

图像字幕模型通常是根据人体注释的地面真实字幕训练的，该字幕可能会产生准确但通用的字幕。为了提高字幕模型的独特性，我们首先提出了一系列使用大规模视觉语言预训练模型剪辑来评估标题的独特性。然后，我们提出了一种简单有效的训练策略，该策略通过在相似图像组中进行比较来训练模型。我们对各种现有模型进行了广泛的实验，以证明我们的策略的广泛适用性以及基于公制的结果与人类评估的一致性。通过将最佳模型的性能与现有的最新模型进行比较，我们声称我们的模型实现了针对独特性目标的新最先进的。

translated by 谷歌翻译

Improved post-hoc probability calibration for out-of-domain MRI segmentation

Cheng Ouyang , Shuo Wang , Chen Chen , Zeju Li , Wenjia Bai , Bernhard Kainz , Daniel Rueckert

分类：计算机视觉

2022-08-04

深层模型的概率校准是在安全至关重要的应用（例如医学成像）中非常可取的。它通过将预测概率与测试数据中的实际准确性对齐，使深网的输出概率可解释。在图像分割中，精心校准的概率使放射科医生可以识别模型预测的分割不可靠的区域。这些不可靠的预测通常是由成像伪影或看不见的成像协议引起的室外（OOD）图像。不幸的是，大多数用于图像分割的先前校准方法在OOD图像上表现出色。为了减少面对OOD图像的校准误差，我们提出了一个新型的事后校准模型。我们的模型利用当地级别的扰动的像素敏感性以及在全球层面的形状先验信息。该模型在心脏MRI分割数据集上进行了测试，这些数据集包含来自看不见的成像协议中看不见的成像伪像和图像。与最新的校准算法相比，我们证明了校准误差减少。

translated by 谷歌翻译

Subject-Specific Lesion Generation and Pseudo-Healthy Synthesis for Multiple Sclerosis Brain Images

Berke Doga Basaran , Mengyun Qiao , Paul M. Matthews , Wenjia Bai

分类：计算机视觉 | 机器学习

2022-08-03

了解脑损伤的强度特征是定义神经系统研究和预测疾病负担和结局的基于图像的生物标志物的关键。在这项工作中，我们提出了一种基于前景的新型生成方法，用于对局部病变特征进行建模，该方法既可以在健康图像上产生合成病变，又可以从病理图像中综合受试者特异性的伪健康图像。此外，该方法可以用作数据增强模块，以生成用于训练大脑图像分割网络的合成图像。在磁共振成像（MRI）上获得的多发性硬化症（MS）脑图像的实验表明，所提出的方法可以生成高度逼真的伪健康和伪病理学脑图像。与传统的数据增强方法以及最近的病变感知数据增强技术Carvemix相比，使用合成图像进行数据扩展可改善大脑图像分割的性能。该代码将在https://github.com/dogabasaran/lesion-synthesis中发布。

translated by 谷歌翻译

MulViMotion: Shape-aware 3D Myocardial Motion Tracking from Multi-View Cardiac MRI

Qingjie Meng , Chen Qin , Wenjia Bai , Tianrui Liu , Antonio de Marvao , Declan P O'Regan , Daniel Rueckert

分类：计算机视觉 | 机器学习

2022-07-29

从电影心脏磁共振（CMR）成像中恢复心脏的3D运动可以评估区域心肌功能，对于理解和分析心血管疾病很重要。但是，3D心脏运动估计是具有挑战性的，因为获得的Cine CMR图像通常是2D切片，它限制了对整个平面运动的准确估计。为了解决这个问题，我们提出了一个新颖的多视图运动估计网络（Mulvimotion），该网络集成了以短轴和长轴平面获取的2D Cine CMR图像，以学习心脏的一致性3D运动场。在提出的方法中，构建了一个混合2D/3D网络，以通过从多视图图像中学习融合表示形式来生成密集的3D运动场。为了确保运动估计在3D中保持一致，在训练过程中引入了形状正则化模块，其中利用了来自多视图图像的形状信息，以提供3D运动估计的弱监督。我们对来自英国生物银行研究的580名受试者的2D Cine CMR图像进行了广泛评估，用于左心室心肌的3D运动跟踪。实验结果表明，该方法在定量和定性上优于竞争方法。

translated by 谷歌翻译

Learning Prototype via Placeholder for Zero-shot Recognition

Zaiquan Yang , Yang Liu , Wenjia Xu , Chong Huang , Lei Zhou , Chao Tong

分类：计算机视觉

2022-07-29

零拍学习（ZSL）旨在通过利用所见类和看不见的类之间共享的语义描述来识别看不见的类。当前的方法表明，通过将语义嵌入将视觉空间投射到视觉空间中是类原型，从而有效地学习视觉语义对齐是有效的。但是，这样的投影函数仅与可见的类有关。当应用于看不见的类时，原型通常由于域移位而次优。在本文中，我们建议通过称为LPL的占位符学习原型，以消除看到和看不见的阶级之间的域转移。具体来说，我们将看到的课程结合在一起，以使新课程成为视觉和语义空间中看不见的班级的占位符。占位持有人放置在看到的班级之间，鼓励人们高度分散所见类的原型。插入良好的看不见的空间也可以保留更多的空间。从经验上讲，分离良好的原型有助于抵消由域转移引起的视觉声音错位。此外，我们利用一种新颖的面向语义的微调来保证占位符的语义可靠性。在五个基准数据集上进行的广泛实验证明了LPL在最新方法上的显着性能提高。代码可在https://github.com/zaiquanyang/lpl上找到。

translated by 谷歌翻译

Multi-dimension Geospatial feature learning for urban region function recognition

Wenjia Xu , Jiuniu Wang , Yirong Wu

分类：计算机视觉

2022-07-18

城市地区功能识别在监测和管理有限的城市地区时起着至关重要的特征。由于城市功能很复杂，并且充满了社会经济属性，因此只需使用配备物理和光学信息的遥感图像（RS）图像就无法完全解决分类任务。另一方面，随着移动通信和互联网的发展，对地理空间大数据（GBD）的获取变得可能是可能的。在本文中，我们建议使用高维GBD数据与RS图像结合使用以用于城市区域功能识别的RS图像，提出了多维特征学习模型〜（MDFL）。当提取多差异功能时，我们的模型考虑了由其活动建模的用户相关信息以及从区域图中抽象的基于区域的信息。此外，我们提出了一个决策融合网络，该网络集成了来自多个神经网络和机器学习分类器的决策，并且最终决定是考虑RS图像中的视觉提示以及GBD数据中的社交信息。通过定量评估，我们证明我们的模型达到92.75的总体准确性，表现优于最先进的时间10％。

translated by 谷歌翻译