智能论文笔记

Retrieving Black-box Optimal Images from External Databases

Ryoma Sato

分类：人工智能 | 计算机视觉 | 机器学习

2021-12-30

假设我们有一个黑盒功能（例如，深神经网络），将图像作为输入拍摄并输出指示偏好的值。我们如何在Internet上的外部数据库中获取最佳图像？文献中的标准检索问题（例如，项目建议）假设算法可以完全访问该组项目。换句话说，这种算法是为服务提供商设计的。在本文中，我们考虑了不同假设下的检索问题。具体而言，我们考虑如何使用有限的用户访问图像数据库，可以使用自己的黑盒功能检索图像。该配方使每个用户定义的灵活和更精细的图像搜索。我们假设用户可以通过具有紧密API限制的搜索查询访问数据库。因此，用户需要以查询的数量有效地检索最佳图像。我们提出了一个有效的检索算法Tiara为此问题。在实验中，我们确认我们的建议方法在各种设置下比几个基线更好地执行。

translated by 谷歌翻译

On component interactions in two-stage recommender systems

Jiri Hron , Karl Krauth , Michael I. Jordan , Niki Kilbertus

分类：机器学习 | (统计)机器学习

2021-06-28

由于其可扩展性，两阶段推荐人被今天的许多最大的在线平台使用，包括YouTube，Linkedin和Pinterest。这些系统以两个步骤产生建议：（i）多个提名者调整为低预测延迟，从整个项目池中预先选择一个小候选者的小组; （ii）较慢但更准确的排名进一步缩小指定项目，并为用户服务。尽管他们受欢迎，但两级推荐人的文献相对稀缺，算法经常被视为他们的部分的总和。这种治疗假定了通过单独组分的行为解释了两级性能。事实并非如此：使用综合性和现实世界数据，我们证明了排名人员和提名人之间的互动大大影响了整体性能。通过这些调查结果，我们推出了概括下限，表明独立提名培训可能导致均匀随机建议的表现。我们发现，仔细设计项目池，每个项目池分配给不同的提名人，减轻了这些问题。随着手动搜索良好的池分配很难，我们建议使用基于专家的混合方法来学习一个。这显着改善了K的精度和召回。

translated by 谷歌翻译

EDAssistant: Supporting Exploratory Data Analysis in Computational Notebooks with In-Situ Code Search and Recommendation

Xingjun Li , Yizhi Zhang , Justin Leung , Chengnian Sun , Jian Zhao

分类：机器学习

2021-12-15

使用计算笔记本（例如，Jupyter Notebook），数据科学家根据他们的先前经验和外部知识（如在线示例）合理化他们的探索性数据分析（EDA）。对于缺乏关于数据集或问题的具体了解的新手或数据科学家，有效地获得和理解外部信息对于执行EDA至关重要。本文介绍了eDassistant，一个jupyterlab扩展，支持EDA的原位搜索示例笔记本电脑和有用的API的推荐，由搜索结果的新颖交互式可视化供电。代码搜索和推荐是由最先进的机器学习模型启用的，培训在线收集的EDA笔记本电脑的大型语料库。进行用户学习，以调查埃迪卡斯特和数据科学家的当前实践（即，使用外部搜索引擎）。结果证明了埃迪斯坦特的有效性和有用性，与会者赞赏其对EDA的顺利和环境支持。我们还报告了有关代码推荐工具的几种设计意义。

translated by 谷歌翻译

Integrating Reward Maximization and Population Estimation: Sequential Decision-Making for Internal Revenue Service Audit Selection

Peter Henderson , Ben Chugg , Brandon Anderson , Kristen Altenburger , Alex Turk , John Guyton , Jacob Goldin , Daniel E. Ho

分类：机器学习

2022-04-25

We introduce a new setting, optimize-and-estimate structured bandits. Here, a policy must select a batch of arms, each characterized by its own context, that would allow it to both maximize reward and maintain an accurate (ideally unbiased) population estimate of the reward. This setting is inherent to many public and private sector applications and often requires handling delayed feedback, small data, and distribution shifts. We demonstrate its importance on real data from the United States Internal Revenue Service (IRS). The IRS performs yearly audits of the tax base. Two of its most important objectives are to identify suspected misreporting and to estimate the "tax gap" -- the global difference between the amount paid and true amount owed. Based on a unique collaboration with the IRS, we cast these two processes as a unified optimize-and-estimate structured bandit. We analyze optimize-and-estimate approaches to the IRS problem and propose a novel mechanism for unbiased population estimation that achieves rewards comparable to baseline approaches. This approach has the potential to improve audit efficacy, while maintaining policy-relevant estimates of the tax gap. This has important social consequences given that the current tax gap is estimated at nearly half a trillion dollars. We suggest that this problem setting is fertile ground for further research and we highlight its interesting challenges. The results of this and related research are currently being incorporated into the continual improvement of the IRS audit selection methods.

translated by 谷歌翻译

BanditMF: Multi-Armed Bandit Based Matrix Factorization Recommender System

Shenghao Xu

分类：机器学习

2021-06-21

多臂匪徒（MAB）提供了一种原则性的在线学习方法，以达到探索和剥削之间的平衡。由于表现出色和反馈学习低，没有学习在多种情况下采取行动，因此多臂匪徒在诸如推荐系统等应用程序中引起了广泛的关注。同样，在推荐系统中，协作过滤（CF）可以说是推荐系统中最早，最具影响力的方法。至关重要的是，新用户和不断变化的推荐项目池是推荐系统需要解决的挑战。对于协作过滤，经典方法是训练模型离线，然后执行在线测试，但是这种方法无法再处理用户偏好的动态变化，即所谓的冷启动。那么，如何在没有有效信息的情况下有效地向用户推荐项目？为了解决上述问题，已经提出了一个基于多臂强盗的协作过滤推荐系统，名为BanditMF。 BANDITMF旨在解决多军强盗算法和协作过滤中的两个挑战：（1）如何在有效信息稀缺的条件下解决冷启动问题以进行协作过滤，（2）强大社会关系域中的强盗算法问题是由独立估计与每个用户相关的未知参数并忽略用户之间的相关性引起的。

translated by 谷歌翻译

Comparison-based Conversational Recommender System with Relative Bandit Feedback

Zhihui Xie , Tong Yu , Canzhe Zhao , Shuai Li

分类：机器学习

2022-08-21

随着对话建议的最新进展，推荐系统能够通过对话互动积极而动态地引起用户偏好。为此，系统会定期查询用户对属性的偏好并收集其反馈。但是，大多数现有的对话推荐系统仅使用户能够提供对属性的绝对反馈。实际上，绝对反馈通常受到限制，因为用户在表达偏好时倾向于提供偏见的反馈。取而代之的是，由于用户偏好是固有的相对，因此用户通常更倾向于表达比较偏好。为了使用户能够在对话互动期间提供比较偏好，我们提出了一种基于比较的对话推荐系统。相对反馈虽然更实用，但并不容易合并，因为其反馈量表总是与用户的绝对偏好不匹配。通过有效地收集和了解交互式方式的相对反馈，我们进一步提出了一种新的Bandit算法，我们称之为RelativeConucb。与对话式推荐系统中的现有Bandit算法相比，合成和现实数据集的实验验证了我们提出的方法的优势。

translated by 谷歌翻译

A Nonparametric Contextual Bandit with Arm-level Eligibility Control for Customer Service Routing

Ruofeng Wen , Wenjun Zeng , Yi Liu

分类：机器学习

2022-09-08

亚马逊客户服务每年为数百万客户联系提供实时支持。尽管Bot-Resolver有助于自动化一些流量，但我们仍然看到对人类代理商的需求很高，也称为主题专家（SME）。客户在不同域中的问题（返回策略，设备故障排除等）进行宣传。根据他们的培训，并非所有中小型企业都有资格处理所有联系人。与合格的中小型企业的路由联系是一个非平凡的问题，因为中小企业的域名资格受训练质量的影响，并且可以随着时间的推移而改变。为了在同时学习真正的资格状态的同时，我们建议使用非参数上下文的强盗算法（K-Boot）以及资格控制（EC）算法来制定路由问题。 K-Boot模型以$ K $ -NN选择的类似样品和Bootstrap Thompson采样进行探索，并以类似的样本进行奖励。 EC通过最初符合系统的资格过滤武器（SME），并动态验证该信息的可靠性。提出的K-boot是一种通用匪徒算法，EC适用于其他土匪。我们的仿真研究表明，K-boot在最新的匪徒模型上进行性能，并且当存在随机弹性信号时，EC会提高K-Boot性能。

translated by 谷歌翻译

SHiFT: An Efficient, Flexible Search Engine for Transfer Learning

Cedric Renggli , Xiaozhe Yao , Luka Kolar , Luka Rimanic , Ana Klimovic , Ce Zhang

分类：机器学习

2022-04-04

转移学习可以看作是从头开始的数据和计算效率替代培训模型的替代方法。丰富的模型存储库（例如TensorFlow Hub）的出现使从业人员和研究人员能够在各种下游任务中释放这些模型的潜力。随着这些存储库的成倍增长，有效地为手头任务选择一个好的模型变得至关重要。通过仔细比较各种选择和搜索策略，我们意识到，没有一种方法优于其他方法，而混合或混合策略可以是有益的。因此，我们提出了Shift，这是用于转移学习的第一个下游任务感知，灵活和有效的模型搜索引擎。这些属性由自定义查询语言shift-ql以及基于成本的决策者以及我们经验验证的基于成本的决策者启用。受机器学习开发的迭代性质的促进，我们进一步支持对查询的有效递增执行，这需要与我们的优化共同使用时进行仔细的实施。

translated by 谷歌翻译

Efficient End-to-End AutoML via Scalable Search Space Decomposition

Yang Li , Yu Shen , Wentao Zhang , Ce Zhang , Bin Cui

分类：机器学习

2022-06-19

端到端的Automl吸引了学术界和行业的密集兴趣，它们在功能工程，算法/模型选择和超参数调整引起的空间中自动搜索ML管道。但是，现有的Automl系统在适用于具有较大高维搜索空间的应用程序域时会遇到可伸缩性问题。我们提出了火山洛（Volcanoml），这是一个可扩展且可扩展的框架，可促进对大型汽车搜索空间的系统探索。 Volcanoml引入并实施了将大型搜索空间分解为较小的基本构建块，并允许用户利用这些构建块来制定手头上的汽车问题的执行计划。 Volcanoml进一步支持火山风格的执行模型（类似于现代数据库系统支持的模型）来执行构建的计划。我们的评估表明，不仅火山团提高了汽车中搜索空间分解的表达水平，还导致了分解策略的实际发现，这些发现比先进的自动符号系统所采用的策略更有效率地更加有效。作为自动滑雪。

translated by 谷歌翻译

A Re-classification of Information Seeking Tasks and Their Computational Solutions

Zhiwen Tang , Grace Hui Yang

分类：人工智能

2019-09-26

本文介绍了寻求信息（是）任务，概念和算法的信息重新分类。拟议的分类系统提供了新的维度，以研究寻求任务和方法的信息。新尺寸包括搜索迭代，搜索目标类型和程序的数量，以实现这些目标。寻求任务的信息沿着这些尺寸呼叫合适的计算解决方案的差异。然后，该文章评论了符合每个新类别的机器学习解决方案。该论文结束了对系统的评估活动进行了审查。

translated by 谷歌翻译

Two-Stage Neural Contextual Bandits for Personalised News Recommendation

Mengyan Zhang , Thanh Nguyen-Tang , Fangzhao Wu , Zhenyu He , Xing Xie , Cheng Soon Ong

分类：机器学习

2022-06-26

我们考虑了个性化新闻推荐的问题，每个用户都以顺序消费新闻。现有的个性化新闻推荐方法的重点是利用用户兴趣，而忽略了推荐中的探索，从而导致反馈循环并长期损害了建议质量。我们基于上下文土匪推荐策略，自然可以解决剥削 - 探索权衡取舍。主要挑战是探索大规模项目空间并利用不确定性的深层表示的计算效率。我们提出了一个两阶段的分层主题，新的深层上下文强盗框架，以在有许多新闻项目时有效地学习用户偏好。我们为用户和新闻使用深度学习表示形式，并将神经上限限制（UCB）策略推广到广义添加剂UCB和BILINEAR UCB。大规模新闻建议数据集的经验结果表明，我们提出的政策是有效的，并且表现优于基线匪徒政策。

translated by 谷歌翻译

Hyperband: A Novel Bandit-Based Approach to Hyperparameter Optimization

Lisha Li , Kevin Jamieson , Giulia DeSalvo , Afshin Rostamizadeh , Ameet Talwalkar

分类：

2016-03-21

Performance of machine learning algorithms depends critically on identifying a good set of hyperparameters. While recent approaches use Bayesian optimization to adaptively select configurations, we focus on speeding up random search through adaptive resource allocation and early-stopping. We formulate hyperparameter optimization as a pure-exploration nonstochastic infinite-armed bandit problem where a predefined resource like iterations, data samples, or features is allocated to randomly sampled configurations. We introduce a novel algorithm, Hyperband, for this framework and analyze its theoretical properties, providing several desirable guarantees. Furthermore, we compare Hyperband with popular Bayesian optimization methods on a suite of hyperparameter optimization problems. We observe that Hyperband can provide over an order-of-magnitude speedup over our competitor set on a variety of deep-learning and kernel-based learning problems.

translated by 谷歌翻译

DeSkew-LSH based Code-to-Code Recommendation Engine

Fran Silavong , Sean Moran , Antonios Georgiadis , Rohan Saphal , Robert Otter

分类：人工智能

2021-11-05

机器学习源代码（MLONCODE）是一项流行的研究领域，该研究领域是由大规模代码存储库的可用性和开发挖掘源代码的强大概率和深度学习模型驱动的流行研究领域。代码到代码建议是MLONCODE中的任务，旨在推荐相关的，不同和简洁的代码片段，这些代码代码代码代码代码段可以在其开发环境（IDE）中使用开发人员编写的代码扩展。代码代码推荐引擎通过减少IDE切换和增加代码重用，保持提高开发人员生产力的承诺。现有的代码代码推荐引擎不会优雅地扩展到大的CodeBases，在代码存储库大小增加时，展示查询时间的线性增长。此外，现有的代码代码推荐引擎未能考虑排名函数中的代码存储库的全局统计信息，例如代码片段长度的分发，导致子最优检索结果。我们通过\ emph {senatus}来解决这两个弱点，这是一个新的代码代码推荐引擎。在SeNatus的核心是\ emph {de-skew} lsh一个新的局部敏感散列（lsh）算法，其索引快速（子线性时间）检索数据，同时使用新颖的抽象语法抵消片段长度分布中的偏差基于树的特征评分和选择算法。我们通过自动评估和专家开发人员用户学习评估SENATU，并发现该建议具有比竞争基线更高的质量，同时实现更快的搜索。例如，在CodeSearchNet DataSet上，我们显示SeNatus通过6.7 \％F1提高性能，并且与Facebook Aroma对代码到代码建议的任务相比，Query Time 16x更快。

translated by 谷歌翻译

A Contextual-Bandit Approach to Personalized News Article Recommendation

Lihong Li , Wei Chu , John Langford , Robert E. Schapire

分类：

2010-02-28

Personalized web services strive to adapt their services (advertisements, news articles, etc.) to individual users by making use of both content and user information. Despite a few recent advances, this problem remains challenging for at least two reasons. First, web service is featured with dynamically changing pools of content, rendering traditional collaborative filtering methods inapplicable. Second, the scale of most web services of practical interest calls for solutions that are both fast in learning and computation.In this work, we model personalized recommendation of news articles as a contextual bandit problem, a principled approach in which a learning algorithm sequentially selects articles to serve users based on contextual information about the users and articles, while simultaneously adapting its article-selection strategy based on user-click feedback to maximize total user clicks.The contributions of this work are three-fold. First, we propose a new, general contextual bandit algorithm that is computationally efficient and well motivated from learning theory. Second, we argue that any bandit algorithm can be reliably evaluated offline using previously recorded random traffic. Finally, using this offline evaluation method, we successfully applied our new algorithm to a Yahoo! Front Page Today Module dataset containing over 33 million events. Results showed a 12.5% click lift compared to a standard context-free bandit algorithm, and the advantage becomes even greater when data gets more scarce.

translated by 谷歌翻译

The Emerging Trends of Multi-Label Learning

Weiwei Liu , Haobo Wang , Xiaobo Shen , Ivor W. Tsang

分类：机器学习

2020-11-23

人类每天产生的exabytes数据，导致越来越需要对大数据带来的多标签学习的大挑战的新努力。例如，极端多标签分类是一个有效且快速增长的研究区域，可以处理具有极大数量的类或标签的分类任务;利用具有有限监督的大规模数据构建一个多标签分类模型对实际应用变得有价值。除此之外，如何收获深度学习的强大学习能力，有巨大努力，以更好地捕获多标签的标签依赖性学习，这是深入学习解决现实世界分类任务的关键。然而，有人指出，缺乏缺乏系统性研究，明确关注分析大数据时代的多标签学习的新兴趋势和新挑战。呼吁综合调查旨在满足这项任务和描绘未来的研究方向和新应用。

translated by 谷歌翻译

Dealing with Expert Bias in Collective Decision-Making

Axel Abels , Tom Lenaerts , Vito Trianni , Ann Nowé

分类：人工智能 | 机器学习

2021-06-25

可以将相当多的现实问题提出为决策问题，其中必须反复从一组替代方案中做出适当的选择。多次专家判断，无论是人为的还是人为的，都可以帮助做出正确的决定，尤其是在探索替代解决方案的昂贵时。由于专家意见可能会偏离，因此可以通过汇总独立判断来解决找到正确的替代方案的问题作为集体决策问题（CDM）。当前的最新方法集中于有效地找到最佳专家，因此如果所有专家均不合格或过于偏见，则表现不佳，从而可能破坏决策过程。在本文中，我们提出了一种基于上下文多臂匪徒问题（CMAB）的新算法方法，以识别和抵消这种偏见的专业知识。我们探索同质，异质和两极分化的专家小组，并表明这种方法能够有效利用集体专业知识，优于最先进的方法，尤其是当提供的专业知识质量降低时。我们的新型CMAB启发方法实现了更高的最终表现，并且在收敛的同时比以前的自适应算法更快。

translated by 谷歌翻译

Contextual Bandits with Large Action Spaces: Made Practical

Yinglun Zhu , Dylan J. Foster , John Langford , Paul Mineiro

分类：机器学习 | (统计)机器学习

2022-07-12

顺序决策中的一个核心问题是开发实用且计算上有效的算法，但支持灵活的通用模型的使用。关注上下文匪徒问题，最近的进度在可能的替代品数量（“动作”）很小时提供了可证明的有效算法，并具有很强的经验性能，但是在大型，连续的行动空间中进行决策的保证仍然难以捉摸，导致了重要的重要性理论与实践之间的差距。我们介绍了具有连续线性结构化作用空间的上下文匪徒的第一个有效的通用算法。我们的算法利用了（i）监督学习的计算序列，以及（ii）在动作空间上进行优化，并实现样本复杂性，运行时和内存，独立于动作空间的大小。此外，这是简单而实用的。我们进行大规模的经验评估，并表明我们的方法通常比标准基准相比具有较高的性能和效率。

translated by 谷歌翻译

Dynamic Global Sensitivity for Differentially Private Contextual Bandits

Huazheng Wang , David Zhao , Hongning Wang

分类：机器学习 | (统计)机器学习

2022-08-30

土匪算法已成为交互式建议的参考解决方案。但是，由于这种算法直接与用户进行改进的建议，因此对其实际使用提出了严重的隐私问题。在这项工作中，我们通过基于树的机制提出了一种差异性的线性上下文匪徒算法，以将拉普拉斯或高斯噪声添加到模型参数中。我们的关键见解是，随着模型在在线更新过程中收敛时，其参数的全局灵敏度随着时间的推移而缩小（因此命名为动态全局灵敏度）。与现有解决方案相比，我们动态的全球敏感性分析使我们能够减少噪声以获得$（\ epsilon，\ delta）$ - 差异隐私，并具有$ \ tilde o（\ log {t} \ sqrt中的噪声注入引起的额外遗憾） {t}/\ epsilon）$。我们通过动态全局灵敏度和我们提出的算法的相应上后悔界限提供了严格的理论分析。合成和现实世界数据集的实验结果证实了该算法对现有解决方案的优势。

translated by 谷歌翻译

HTML版本

Cross-domain User Preference Learning for Cold-start Recommendation

Huiling Zhou , Jie Liu , Zhikang Li , Jin Yu , Hongxia Yang

分类：机器学习

2021-12-07

跨域冷启动推荐是推荐系统越来越新兴的问题。现有的作品主要专注于解决跨域用户推荐或冷启动内容推荐。但是，当新域在早期发展时，它具有类似于源域的潜在用户，但互动较少。从源域中学习用户的偏好并将其转移到目标域中是至关重要的，特别是在具有有限用户反馈的新到达内容上。为了弥合这一差距，我们提出了一个自训练的跨域用户偏好学习（夫妻）框架，针对具有各种语义标签的冷启动推荐，例如视频的项目或视频类型。更具体地，我们考虑三个级别的偏好，包括用户历史，用户内容和用户组提供可靠的推荐。利用由域感知顺序模型表示的用户历史，将频率编码器应用于用于用户内容偏好学习的底层标记。然后，建议具有正交节点表示的分层存储器树以进一步概括域域的用户组偏好。整个框架以一种对比的方式更新，以先进先出（FIFO）队列获得更具独特的表示。两个数据集的广泛实验展示了用户和内容冷启动情况的夫妇效率。通过部署在线A / B一周测试，我们表明夫妇的点击率（CTR）优于淘宝应用程序的其他基线。现在该方法在线为跨域冷微视频推荐服务。

translated by 谷歌翻译

Learning to Rank with Small Set of Ground Truth Data

Jiashu Wu

分类：人工智能

2022-07-04

在过去的几十年中，研究人员已经付出了许多努力，调查用于排名在信息检索过程中检索到的查询结果的排名技术，或在推荐系统中对推荐产品进行排名。在该项目中，我们旨在调查搜索，排名以及建议技术，以帮助实现大学学术界搜索平台。与通常的信息检索方案不同，在我们的情况下，存在许多基础真理排名数据，我们对学术界排名的基础真相知识有限。例如，考虑到一些搜索查询，我们只知道一些高度相关的研究人员，因此应该排名最高，对于其他一些搜索查询，我们不知道应该将哪些研究人员排名最高。有限的地面真相数据使一些常规的排名技术和评估指标变得不可行，这是我们在本项目中面临的巨大挑战。该项目可以在很大程度上增强用户的学术搜索经验，有助于实现一个学术搜索平台，其中包括研究人员，出版物和研究信息领域，这不仅对大学学院，而且对学生的研究经验都有益。

translated by 谷歌翻译