智能论文笔记

聚类是一个流行的无监督学习工具，通常用于发现较大的人口中的群体，例如客户段或患者亚型。但是，尽管它用作子组发现的工具和描述 - 很少有最先进的算法提供了发现的群集后面的任何理由或描述。我们提出了一种用于可解释聚类的新方法，即群集数据点和构建在被发现的集群周围的多个群体来解释它们。我们的框架允许在多台上进行额外的约束 - 包括确保构建多托的超平面是轴平行的或稀疏，具有整数系数。我们制定通过多拓构造群集作为混合整数非线性程序（MINLP）的问题。要解决我们的配方，我们提出了一种两相方法，我们首先使用交替的最小化初始化群集和多核酸，然后使用坐标下降来提升聚类性能。我们在一套综合和真实的世界聚类问题上基准测试方法，其中我们的算法优于艺术可解释和不可解释的聚类算法的状态。

translated by 谷歌翻译

Math Programming based Reinforcement Learning for Multi-Echelon Inventory Management

Pavithra Harsha , Ashish Jagmohan , Jayant R. Kalagnanam , Brian Quanz , Divya Singhvi

分类：机器学习 | 人工智能

2021-12-04

在机器人，游戏和许多其他地区，加固学习导致各种区域导致相当大的突破。但是在复杂的真实决策中申请RL仍然有限。运营管理中的许多问题（例如，库存和收入管理）的特点是大动作空间和随机系统动态。这些特征使得解决问题的问题很难解决依赖于每步行动问题解决枚举技术的现有RL方法。要解决这些问题，我们开发可编程演员强化学习（PARL），一种策略迭代方法，该方法使用整数编程和示例平均近似的技术。在分析上，我们表明，对于给定的批评者，每个迭代的学习政策会聚到最佳政策，因为不确定性的底层样本转到无穷大。实际上，我们表明，即使来自潜在的不确定性的样本很少，潜在的不确定分布的正确选择的不确定分布可以在最佳的演员政策附近产生。然后，我们将算法应用于具有复杂的供应链结构的现实库存管理问题，并显示Parl优于这些设置中的最先进的RL和库存优化方法。我们发现Parl优于常用的基础股票启发式44.7％，并且在不同供应链环境中平均最高可达的RL方法高达12.1％。

translated by 谷歌翻译

在现实世界中的对话系统中，生成的响应必须满足几个互锁的限制：内容丰富，真实且易于控制。语言生成中的两个主要范式 - 神经语言建模和基于规则的一代 - 都难以满足这些约束。即使是最好的神经模型，也容易出现信息的幻觉和省略，而现有的基于规则的形式的形式使得很难编写既灵活又流利的语法。我们描述了对话响应产生的混合体系结构，结合了两种方法的优势。该体系结构有两个组件。首先，使用新的正式框架定义的基于规则的内容选择模型，称为数据流转导，该模型使用声明性规则将对话代理的计算（表示为数据流图）转换为代表上下文可接受响应空间的无上下文语法。其次，使用这些语法来限制神经语言模型的输出的受约束解码过程，该过程选择流利的话语。最终的系统在人类对流利，相关性和真实性的评估中的表现都优于基于规则的方法和学识渊博的方法。

translated by 谷歌翻译

该行业许多领域的自动化越来越多地要求为检测异常事件设计有效的机器学习解决方案。随着传感器的普遍存在传感器监测几乎连续地区的复杂基础设施的健康，异常检测现在可以依赖于以非常高的频率进行采样的测量，从而提供了在监视下的现象的非常丰富的代表性。为了充分利用如此收集的信息，观察不能再被视为多变量数据，并且需要一个功能分析方法。本文的目的是探讨近期对实际数据集的功能设置中异常检测技术的性能。在概述最先进的和视觉描述性研究之后，比较各种异常检测方法。虽然功能设置中的异常分类（例如，形状，位置）在文献中记录，但为所识别的异常分配特定类型似乎是一个具有挑战性的任务。因此，鉴于模拟研究中的这些突出显示类型，现有方法的强度和弱点是基准测试。接下来在两个数据集上评估异常检测方法，与飞行中的直升机监测和建筑材料的光谱相同有关。基准分析由从业者的建议指导结束。

translated by 谷歌翻译