智能论文笔记

Coevolutionary Framework for Generalized Multimodal Multi-objective Optimization

Wenhua Li , Xingyi Yao , Kaiwen Li , Rui Wang , Tao Zhang

分类：神经与进化计算

2022-12-02

Most multimodal multi-objective evolutionary algorithms (MMEAs) aim to find all global Pareto optimal sets (PSs) for a multimodal multi-objective optimization problem (MMOP). However, in real-world problems, decision makers (DMs) may be also interested in local PSs. Also, searching for both global and local PSs is more general in view of dealing with MMOPs, which can be seen as a generalized MMOP. In addition, the state-of-the-art MMEAs exhibit poor convergence on high-dimension MMOPs. To address the above two issues, in this study, a novel coevolutionary framework termed CoMMEA for multimodal multi-objective optimization is proposed to better obtain both global and local PSs, and simultaneously, to improve the convergence performance in dealing with high-dimension MMOPs. Specifically, the CoMMEA introduces two archives to the search process, and coevolves them simultaneously through effective knowledge transfer. The convergence archive assists the CoMMEA to quickly approaching the Pareto optimal front (PF). The knowledge of the converged solutions is then transferred to the diversity archive which utilizes the local convergence indicator and the $\epsilon$-dominance-based method to obtain global and local PSs effectively. Experimental results show that CoMMEA is competitive compared to seven state-of-the-art MMEAs on fifty-four complex MMOPs.

translated by 谷歌翻译

Time-distance vision transformers in lung cancer diagnosis from longitudinal computed tomography

Thomas Z. Li , Kaiwen Xu , Riqiang Gao , Yucheng Tang , Thomas A. Lasko , Fabien Maldonado , Kim Sandler , Bennett A. Landman

分类：计算机视觉

2022-09-04

从单个放射学图像中学到的功能无法提供有关随着时间的流逝可能发生的病变以及多少变化的信息。从重复图像计算出的时间相关特征可以捕获这些变化，并通过其时间行为来识别恶性病变。但是，纵向医学成像提出了数据获取的稀疏，不规则时间间隔的独特挑战。虽然自我注意事项已被证明是时间序列和自然图像的一种多功能，有效的学习机制，但尚未探索其在稀疏，不规则采样的空间特征之间解释时间距离的潜力。在这项工作中，我们通过使用（1）连续时间的矢量嵌入和（2）时间强调自我注意力的权重来提出两种解释时间距离视觉变压器（VIT）。这两种算法是根据合成肺结节的良性与恶性肺癌区分和肺筛查计算机断层扫描研究（NLST）评估的。与标准VIT相比，评估合成结节的时间段VIT的实验表明，在对不规则采样的纵向图像进行分类方面有了基本改进。在从NLST筛选胸部CTS的交叉验证中，我们的方法（分别为0.785和0.786 AUC）显着超过了横截面方法（0.734 AUC）（0.734 AUC），并匹配领先的纵向医学成像算法（0.779 AUC）在良好的良性上的判别性能与恶性分类。这项工作代表了第一个基于自我注意的框架，用于对纵向医学图像进行分类。我们的代码可从https://github.com/tom1193/time-distance-transformer获得。

translated by 谷歌翻译

Let Me Check the Examples: Enhancing Demonstration Learning via Explicit Imitation

Sirui Wang , Kaiwen Wei , Hongzhi Zhang , Yuntao Li , Wei Wu

分类：机器学习 | 人工智能

2022-08-31

示范学习旨在通过在少数射击设置中提供回答的演示来指导及时的预测。尽管取得了令人鼓舞的结果，但现有工作仅将回答的示例与及时模板（包括原始上下文）相连，而无需任何其他操作，从而忽略了迅速示意的依赖性。此外，先前的研究发现，随机替换示威的标签极小地损害了性能，这表明该模型无法正确地了解示威活动所带来的知识。受到人类学习过程的启发，在本文中，我们引入了模仿演示学习（模仿），以通过明确模仿人类审查行为来加强演示学习，其中包括：（1）对比度学习机制，以专注于类似的演示。（2）证明标签重新预测方法以合并已知知识。实验结果表明，我们提出的方法在14个分类中心中有11个实现了最先进的性能。进一步的研究还证明，模仿 - demo加强了迅速与示威之间的关联，这可以为探索示范学习的工作方式提供基础。

translated by 谷歌翻译

JARVIS: A Neuro-Symbolic Commonsense Reasoning Framework for Conversational Embodied Agents

Kaizhi Zheng , Kaiwen Zhou , Jing Gu , Yue Fan , Jialu Wang , Zonglin Li , Xuehai He , Xin Eric Wang

分类：人工智能 | 自然语言处理 | 计算机视觉 | 机器人

2022-08-28

建立一个对话体现的代理执行现实生活任务一直是一个长期而又具有挑战性的研究目标，因为它需要有效的人类代理沟通，多模式理解，远程顺序决策等。传统的符号方法具有扩展和概括问题，而端到端的深度学习模型则遭受数据稀缺和高任务复杂性的影响，并且通常很难解释。为了从两全其美的世界中受益，我们提出了一个神经符号常识性推理（JARVIS）框架，用于模块化，可推广和可解释的对话体现的药物。首先，它通过提示大型语言模型（LLM）来获得符号表示，以了解语言理解和次目标计划，并通过从视觉观察中构建语义图。然后，基于任务和动作级别的常识，次目标计划和行动生成的符号模块。在Teach数据集上进行的大量实验验证了我们的JARVIS框架的功效和效率，该框架在所有三个基于对话框的具体任务上实现了最新的（SOTA）结果，包括对话记录（EDH）的执行，对话框的轨迹，（TFD）和两个代理任务完成（TATC）（例如，我们的方法将EDH看不见的成功率从6.1 \％\％提高到15.8 \％）。此外，我们系统地分析了影响任务绩效的基本因素，并在几个射击设置中证明了我们方法的优越性。我们的Jarvis模型在Alexa奖Simbot公共基准挑战赛中排名第一。

translated by 谷歌翻译

Body Composition Assessment with Limited Field-of-view Computed Tomography: A Semantic Image Extension Perspective

Kaiwen Xu , Thomas Li , Mirza S. Khan , Riqiang Gao , Sanja L. Antic , Yuankai Huo , Kim L. Sandler , Fabien Maldonado , Bennett A. Landman

分类：计算机视觉

2022-07-13

肺部以外的视野（FOV）组织截断在常规的肺筛查计算机断层扫描（CT）中很常见。这对机会性CT的身体组成（BC）评估构成了局限性，因为缺少关键的解剖结构。传统上，扩展CT的FOV被认为是使用有限数据的CT重建问题。但是，这种方法依赖于应用程序中可能无法使用的投影域数据。在这项工作中，我们从语义图像扩展角度提出问题，该角度仅需要图像数据作为输入。提出的两阶段方法根据完整体的估计范围识别新的FOV边框，并在截短区域中渗出了缺失的组织。使用在FOV中具有完整主体的CT切片对训练样品进行模拟，从而使模型开发自制。我们使用有限FOV的肺筛选CT评估了所提出的方法在自动BC评估中的有效性。提出的方法有效地恢复了缺失的组织并减少了FOV组织截断引入的BC评估误差。在大规模肺部筛查CT数据集的BC评估中，这种校正既可以提高受试者内的一致性和与人体测量近似值的相关性。已开发的方法可在https://github.com/masilab/s-efov上获得。

translated by 谷歌翻译

Hybridization of evolutionary algorithm and deep reinforcement learning for multi-objective orienteering optimization

Wei Liu , Rui Wang , Tao Zhang , Kaiwen Li , Wenhua Li , Hisao Ishibuchi

分类：神经与进化计算

2022-06-21

多目标定向运动问题（MO-OPS）是经典的多目标路由问题，在过去几十年中，人们一直受到很多关注。这项研究旨在通过问题分解框架解决MO-OPS，即MO-OP分解为多目标背包问题（MOKP）和旅行推销员问题（TSP）。然后，MOKP和TSP分别通过多目标进化算法（MOEA）和深钢筋学习（DRL）方法来解决。虽然MOEA模块用于选择城市，但DRL模块用于计划这些城市的哈密顿路径。这两个模块的迭代使用将人口驱动到Mo-ops的帕累托前沿。在各种类型的MO-OP实例上，将提出方法的有效性与NSGA-II和NSGA-III进行了比较。实验结果表明，我们的方法几乎在所有测试实例上表现出最佳性能，并且表现出强大的概括能力。

translated by 谷歌翻译

Maximum Likelihood Training for Score-Based Diffusion ODEs by High-Order Denoising Score Matching

Cheng Lu , Kaiwen Zheng , Fan Bao , Jianfei Chen , Chongxuan Li , Jun Zhu

分类： (统计)机器学习 | 机器学习

2022-06-16

基于分数的生成模型在发电质量和可能性方面具有出色的性能。他们通过将参数化的分数网络与一阶数据得分功能匹配来建模数据分布。分数网络可用于定义ODE（“基于得分的扩散ode”），以进行精确的似然评估。但是，颂歌的可能性与得分匹配目标之间的关系尚不清楚。在这项工作中，我们证明，匹配一阶得分不足以通过在最大可能性和分数匹配目标之间显示差距来最大化ode的可能性。为了填补这一空白，我们表明，可以通过控制第一，第二和三阶得分匹配错误来界定颂歌的负可能性；我们进一步提出了一种新型的高阶denoising评分匹配方法，以实现基于得分的扩散ODE的最大似然训练。我们的算法确保高阶匹配误差受训练错误和较低级错误的限制。我们从经验上观察到，通过高阶匹配，基于得分的扩散频率在合成数据和CIFAR-10上都具有更好的可能性，同时保留了高生成质量。

translated by 谷歌翻译

OdomBeyondVision: An Indoor Multi-modal Multi-platform Odometry Dataset Beyond the Visible Spectrum

Peize Li , Kaiwen Cai , Muhamad Risqi U. Saputra , Zhuangzhuang Dai , Chris Xiaoxuan Lu

分类：机器人

2022-06-03

本文介绍了一个多模式的室内轨道图数据集，Odombeyondvision，具有不同频谱的多个传感器，并使用不同的移动平台收集。Odombeyondvision不仅包含传统的导航传感器，例如IMUS，机械激光镜，RGBD摄像头，还包括几个新兴传感器，例如单芯片MMWave Radar，LWIR热相机和固态激光雷达。在无人机，UGV和手持式平台上的上述传感器中，我们分别记录了各种室内场景和不同照明条件的多模式探光数据及其运动轨迹。我们释放了示例雷达，雷达惯性和热惯性循环仪的实现，以证明其未来工作的结果，以对其进行比较和改进。包括工具包和文档在内的完整数据集可公开可用：https：//github.com/maps-lab/odombeyondvision。

translated by 谷歌翻译

Deep Multi-Modal Structural Equations For Causal Effect Estimation With Unstructured Proxies

Shachi Deshpande , Kaiwen Wang , Dhruv Sreenivas , Zheng Li , Volodymyr Kuleshov

分类：机器学习

2022-03-18

在考虑混杂变量时估计干预措施的效果是因果推断的关键任务。通常，混杂因素没有观察到，但是我们可以访问大量的非结构化数据（图像，文本），这些数据包含有关缺失混杂因素的有价值的代理信号。本文表明，利用通常被现有算法未使用的非结构化数据提高了因果效应估计的准确性。具体而言，我们引入了深层多模式结构方程，这是一个生成模型，其中混杂因素是潜在变量，非结构化数据是代理变量。该模型支持多个多模式代理（图像，文本）以及缺少数据。我们从经验上证明了基因组学和医疗保健的任务，我们的方法纠正了使用非结构化输入混淆，从而有可能使用以前在因果推理中不使用的大量数据。

translated by 谷歌翻译

Interaction-Aware Trajectory Prediction and Planning for Autonomous Vehicles in Forced Merge Scenarios

Kaiwen Liu , Nan Li , H. Eric Tseng , Ilya Kolmanovsky , Anouck Girard

分类：机器人

2021-12-14

一般而言，融合是人类驱动因素和自治车辆的具有挑战性的任务，特别是在密集的交通中，因为合并的车辆通常需要与其他车辆互动以识别或创造间隙并安全合并。在本文中，我们考虑了强制合并方案的自主车辆控制问题。我们提出了一种新的游戏 - 理论控制器，称为领导者跟随者游戏控制器（LFGC），其中自主EGO车辆和其他具有先验不确定驾驶意图的车辆之间的相互作用被建模为部分可观察到的领导者 - 跟随游戏。 LFGC估计基于观察到的轨迹的其他车辆在线在线，然后预测其未来的轨迹，并计划使用模型预测控制（MPC）来同时实现概率保证安全性和合并目标的自我车辆自己的轨迹。为了验证LFGC的性能，我们在模拟和NGSIM数据中测试它，其中LFGC在合并中展示了97.5％的高成功率。

translated by 谷歌翻译