智能论文笔记

A State Transition Model for Mobile Notifications via Survival Analysis

Yiping Yuan , Jing Zhang , Shaunak Chatterjee , Shipeng Yu , Romer Rosales

分类： (统计)机器学习 | 机器学习

2022-07-07

移动通知已成为社交网络服务的主要通信渠道，以使用户了解和参与。随着越来越多的移动应用程序向用户推出通知，他们不断面临关于发送什么，何时以及如何发送的决定。缺乏研究和方法论通常会导致启发式决策。许多通知到达不适当的时刻或引入太多中断，未能为用户提供价值并激发用户的投诉。在本文中，我们探讨了移动通知和用户参与度之间交互的独特功能。我们提出了一个国家过渡框架，以定量评估通知的有效性。在此框架内，我们开发了一个假设对数线性结构和Weibull分布的徽章通知的生存模型。我们的结果表明，与逻辑回归模型相比，该模型对应用程序的灵活性和卓越的预测准确性具有更大的灵活性。特别是，我们提供了一个在线用例，以进行通知交付时间优化，以显示我们如何做出更好的决策，推动更多用户参与度并为用户提供更多价值。

translated by 谷歌翻译

Multi-objective Optimization of Notifications Using Offline Reinforcement Learning

Prakruthi Prabhakar , Yiping Yuan , Guangyu Yang , Wensheng Sun , Ajith Muralidharan

分类：机器学习 | (统计)机器学习

2022-07-07

移动通知系统在各种应用程序中起着重要作用，以通信，向用户发送警报和提醒，以告知他们有关新闻，事件或消息的信息。在本文中，我们将近实时的通知决策问题制定为马尔可夫决策过程，在该过程中，我们对奖励中的多个目标进行了优化。我们提出了一个端到端的离线增强学习框架，以优化顺序通知决策。我们使用基于保守的Q学习的双重Q网络方法来应对离线学习的挑战，从而减轻了分配转移问题和Q值高估。我们说明了完全部署的系统，并通过离线和在线实验证明了拟议方法的性能和好处。

translated by 谷歌翻译

User Engagement and Churn in Mobile Health Applications

Babaniyi Yusuf Olaniyi , Ana Fernández del Río , África Periáñez , Lauren Bellhouse

分类： (统计)机器学习 | 机器学习

2022-06-16

移动健康应用程序正在通过改善沟通，效率和服务质量来彻底改变医疗保健生态系统。在低收入国家和中等收入国家，它们还发挥了独特的作用，是有关患者和医疗保健工作者的健康成果和行为的信息来源，同时提供了一个合适的渠道来提供个性化和集体的政策干预措施。我们提出了一个框架，以研究用户与移动健康的参与度，重点关注旨在在资源贫乏环境中为其支持的医疗保健工人和数字健康应用程序。这些应用程序产生的行为日志可以转换为表征每个用户活动的每日时间序列。我们使用概率和生存分析来建立多种有意义的参与度的个性化度量，这些措施可以定制适合每个卫生工作者特定需求的内容和数字干预措施。特别注意检测流失的问题，被理解为完全脱离接触的标志。我们讨论了我们的方法应用于安全交付应用程序的印度和埃塞俄比亚用户，这是一种熟练的亲生服务员的能力建设工具。这项工作代表了对移动健康应用程序中用户参与的全面表征的重要一步，这可以显着增强卫生工作者的能力并最终挽救生命。

translated by 谷歌翻译

Personalized Execution Time Optimization for the Scheduled Jobs

Yang Liu , Juan Wang , Zhengxing Chen , Ian Fox , Imani Mufti , Jason Sukumaran , Baokun He , Xiling Sun , Feng Liang

分类：机器学习

2022-03-11

Scheduled batch jobs have been widely used on the asynchronous computing platforms to execute various enterprise applications, including the scheduled notifications and the candidate pre-computation for the modern recommender systems. It is important to deliver or update the information to the users at the right time to maintain the user experience and the execution impact. However, it is challenging to provide a versatile execution time optimization solution for the user-basis scheduled jobs to satisfy various product scenarios while maintaining reasonable infrastructure resource consumption. In this paper, we describe how we apply a learning-to-rank approach plus a "best time policy" in the best time selection. In addition, we propose an ensemble learner to minimize the ranking loss by efficiently leveraging multiple streams of user activity signals in our scheduling decisions of the execution time. Especially, we observe the cannibalization cross use cases to compete the user's peak time slot and introduce a coordination system to mitigate the problem. Our optimization approach has been successfully tested with production traffic that serves billions of users per day, with statistically significant improvements in various product metrics, including the notifications and content candidate generation. To the best of our knowledge, our study represents the first ML-based multi-tenant solution of the execution time optimization problem for the scheduled jobs at a large industrial scale cross different product domains.

translated by 谷歌翻译

BCRLSP: An Offline Reinforcement Learning Framework for Sequential Targeted Promotion

Fanglin Chen , Xiao Liu , Bo Tang , Feiyu Xiong , Serim Hwang , Guomian Zhuang

分类：机器学习

2022-07-16

我们利用离线增强学习（RL）模型在现实世界中有预算限制的情况下进行连续的目标促销。在我们的应用程序中，移动应用程序旨在通过向客户发送现金奖金并在每个时间段内控制此类现金奖金的成本来促进客户保留。为了实现多任务目标，我们提出了预算限制的加强学习，以进行顺序促销（BCRLSP）框架，以确定要发送给用户的现金奖金的价值。我们首先找出目标策略和相关的Q值，这些Q值是使用RL模型最大化用户保留率的。然后添加线性编程（LP）模型以满足促销成本的限制。我们通过最大化从RL模型中汲取的动作的Q值来解决LP问题。在部署期间，我们将离线RL模型与LP模型相结合，以在预算约束下生成强大的策略。使用在线和离线实验，我们通过证明BCRLSP达到的长期客户保留率和比各种基线更低的成本来证明我们方法的功效。利用近乎实时的成本控制方法，提出的框架可以轻松地使用嘈杂的行为政策和/或满足灵活的预算约束。

translated by 谷歌翻译

RICON: A ML framework for real-time and proactive intervention to prevent customer churn

Arnab Chakraborty , Vikas Raturi , Shrutendra Harsola

分类：机器学习

2022-03-30

我们考虑实时流失预测的问题。由于推理生成的批处理模式，传统方法只能通过离线干预措施（例如测试消息，电子邮件或静态的产品内裸露）支持保留活动。实时流失预测中的其他最新作品并未评估精确取舍以在生产中部署此类模型的成本。在本文中，我们提出了RICON，这是一种灵活，具有成本效益且健壮的机器学习系统，可使用ClickStream数据实时预测客户流失倾向。除了流失倾向的预测外，RICON还基于产品使用智能提供了见解。通过在QBO高级客户的真实大数据上应用，我们展示了Ricon在存在强大的班级不平衡的情况下如何获得2.68的顶级升降机。此外，我们执行了一项广泛的比较研究，以证明我们对里昂的建模选择是合理的。最后，我们提到了如何将RICON与Intuit中的干预平台集成在一起，以实时的生产外环境有帮助。

translated by 谷歌翻译

The Role of "Live" in Livestreaming Markets: Evidence Using Orthogonal Random Forest

Ziwei Cong , Jia Liu , Puneet Manchanda

分类： (统计)机器学习 | 机器学习

2021-07-04

关于日益增长的直播媒介的一种普遍信念是，其价值在于其“实时”组成部分。我们通过比较实时事件需求的价格弹性如何在直播中和之后的生活中进行了比较，从而研究了这种信念。我们使用来自大型直播平台的独特且丰富的数据来做到这一点，该数据使消费者可以在流中期后购买录制版本的直播版本。在我们背景下的一个挑战是，存在高维混杂因素，其与治疗政策（即价格）和兴趣结果（即需求）的关系是复杂的，并且仅部分知道。我们通过使用广义正交随机森林框架来解决这一挑战，以进行异质治疗效果估计。我们发现在整个事件生命周期中，需求价格弹性的时间弹性都显着。具体而言，随着时间的流逝，需求变得越来越敏感，直到直播一天，那天就变成了无弹性。在生活后的时期，对录制版本的需求仍然对价格敏感，但远低于在播放前的时期。我们进一步表明，价格弹性的这种时间变化是由此类事件固有的质量不确定性以及在直播过程中与内容创建者进行实时互动的机会所驱动的。

translated by 谷歌翻译

How to "Improve" Prediction Using Behavior Modification

Galit Shmueli , Ali Tafti

分类：机器学习 | (统计)机器学习

2020-08-26

许多收集行为大数据的互联网平台都使用它来预测内部目的的用户行为及其业务客户（例如广告商，保险公司，安全部队，政府，政治咨询公司），他们利用了个性化，定位和其他决策的预测-制造。因此，提高预测精度非常有价值。数据科学研究人员设计了改善预测的算法，模型和方法。通过更大，更丰富的数据，还可以改善预测。除了改进算法和数据外，平台还可以通过使用行为修改技术将用户的行为推向其预测值，从而偷偷摸摸地实现更好的预测准确性，从而证明了更多的某些预测。这种明显的“改进”预测可能是通过使用强化学习算法结合预测和行为修改的。机器学习和统计文献中没有这种策略。研究其特性需要将因果关系与预测符号整合在一起。为此，我们将Pearl的因果Do（。）操作员纳入预测词汇中。然后，我们分解给定行为修改的预期预测误差，并确定影响预测能力的组件。我们的派生阐明了这种行为修改对数据科学家，平台，客户和行为被操纵的人类的影响。行为修改可以使用户的行为更加可预测，甚至更均匀；然而，当业务客户在实践中使用预测时，这种明显的可预测性可能不会推广。朝着他们的预测推动的结果可能与客户的意图矛盾，并且对操纵用户有害。

translated by 谷歌翻译

Applying Machine Learning to Life Insurance: some knowledge sharing to master it

Antoine Chancel , Laura Bradier , Antoine Ly , Razvan Ionescu , Laurene Martin

分类： (统计)机器学习 | 机器学习

2022-09-05

机器学习渗透到许多行业，这为公司带来了新的利益来源。然而，在人寿保险行业中，机器学习在实践中并未被广泛使用，因为在过去几年中，统计模型表明了它们的风险评估效率。因此，保险公司可能面临评估人工智能价值的困难。随着时间的流逝，专注于人寿保险行业的修改突出了将机器学习用于保险公司的利益以及通过释放数据价值带来的利益。本文回顾了传统的生存建模方法论，并通过机器学习技术扩展了它们。它指出了与常规机器学习模型的差异，并强调了特定实现在与机器学习模型家族中面对审查数据的重要性。在本文的补充中，已经开发了Python库。已经调整了不同的开源机器学习算法，以适应人寿保险数据的特殊性，即检查和截断。此类模型可以轻松地从该SCOR库中应用，以准确地模拟人寿保险风险。

translated by 谷歌翻译

Intelligent Request Strategy Design in Recommender System

Xufeng Qian , Yue Xu , Fuyu Lv , Shengyu Zhang , Ziwen Jiang , Qingwen Liu , Xiaoyi Zeng , Tat-Seng Chua , Fei Wu

分类：人工智能

2022-06-23

瀑布推荐系统（RS）是移动应用程序中RS的流行形式，是推荐的项目流，这些项目由连续页面组成，可以通过滚动浏览。在Waterfall RS中，当用户完成浏览页面时，Edge（例如，手机）将向Cloud Server发送请求，以获取新的建议页面，称为分页请求机制。 RSS通常将大量项目放入一页中，以减少众多分页请求中的过度资源消耗，但是，这将降低RSS根据用户的实时兴趣及时续订建议的能力，并导致贫穷的用户。经验。直观地，在页面内插入其他请求以更新频率的建议可以减轻问题。但是，以前的尝试，包括非自适应策略（例如，统一插入请求）最终会导致资源过度消费。为此，我们设想了一项名为智能请求策略设计（IRSD）的Edge Intelligence的新学习任务。它旨在通过根据用户的实时意图确定请求插入的适当情况来提高瀑布RSS的有效性。此外，我们提出了一种新的自适应请求插入策略的范式，名为基于Uplift的On-Ending Smart请求框架（AdareQuest）。 AdareQuest 1）通过将实时行为与基于基于注意力的神经网络相匹配的历史兴趣来捕获用户意图的动态变化。 2）估计根据因果推理插入的请求带来的用户购买的反事实提升。 3）通过在在线资源约束下最大化效用功能来确定最终请求插入策略。我们在离线数据集和在线A/B测试上进行了广泛的实验，以验证AdareQuest的有效性。

translated by 谷歌翻译

Nudge: Accelerating Overdue Pull Requests Towards Completion

Chandra Maddila , Sai Surya Upadrasta , Chetan Bansal , Nachiappan Nagappan , Georgios Gousios , Arie van Deursen

分类：人工智能 | 机器学习

2020-11-25

拉力请求是当今协作软件开发和代码审核过程的关键部分。但是，当审阅者或作者不积极参与拉动请求时，拉动请求也可以减慢软件开发过程。在这项工作中，我们设计了一项端到端服务，以提醒作者或审阅者与他们的逾期拉动请求互动，以加速逾期拉动请求。首先，我们根据努力估算和机器学习使用模型来预测给定拉的请求的完成时间。其次，我们使用活动检测来滤除可能逾期的拉请请求，但仍在采取足够的动作。最后，我们使用演员身份证来了解拉动请求的阻止者是谁，并推动适当的演员（作者或审稿人）。轻推的主要新颖性是它成功地减少了拉动请求解决时间，同时确保开发人员认为发送的通知在成千上万的存储库中是有用的。在Microsoft使用的147个存储库的随机试验中，Nudge能够将拉的请求分辨率时间减少60％，而与Nudge未发送通知的逾期拉动请求相比，该请求的8,500次拉。此外，收到推动通知的开发人员将这些通知的73％置于正面。我们观察到在Microsoft的8,000个存储库中扩展Nudge的部署时，我们观察到了类似的结果，在整整一年中，Nudge发送了210,000个通知。这表明了Nudge可以扩展到数千个存储库的能力。最后，我们对选择通知的定性分析指示了未来研究的领域，例如在拉动请求和开发人员的可用性中考虑依赖性。

translated by 谷歌翻译

Counterfactual Reasoning and Learning Systems: The Example of Computational Advertising.

分类：

This work shows how to leverage causal inference to understand the behavior of complex learning systems interacting with their environment and predict the consequences of changes to the system. Such predictions allow both humans and algorithms to select the changes that would have improved the system performance. This work is illustrated by experiments on the ad placement system associated with the Bing search engine.

translated by 谷歌翻译

A Review of Incident Prediction, Resource Allocation, and Dispatch Models for Emergency Management

Ayan Mukhopadhyay , Geoffrey Pettet , Sayyed Vazirizade , Di Lu , Said El Said , Alex Jaimes , Hiba Baroud , Yevgeniy Vorobeychik , Mykel Kochenderfer , Abhishek Dubey

分类：人工智能

2020-06-07

在过去的五十年中，研究人员已经开发了设计和改进了应急响应管理（ERM）系统的统计，数据驱动，分析和算法方法。该问题已被认为是本质上的困难，并且构成了不确定性下的时空决策，这在文献中已经解决了不同的假设和方法。该调查提供了对这些方法的详细审查，重点关注有关四个子流程的关键挑战和问题：（a）事件预测，（b）入射检测，（c）资源分配，和（c）计算机辅助调度紧急响应。我们突出了该领域前后工作的优势和缺点，并探讨了不同建模范式之间的相似之处和差异。我们通过说明这种复杂领域未来研究的开放挑战和机会的结论。

translated by 谷歌翻译

Deep Learning based Urban Vehicle Trajectory Analytics

Seongjin Choi

分类：机器学习

2021-11-15

“轨迹”是指由地理空间中的移动物体产生的迹线，通常由一系列按时间顺序排列的点表示，其中每个点由地理空间坐标集和时间戳组成。位置感应和无线通信技术的快速进步使我们能够收集和存储大量的轨迹数据。因此，许多研究人员使用轨迹数据来分析各种移动物体的移动性。在本文中，我们专注于“城市车辆轨迹”，这是指城市交通网络中车辆的轨迹，我们专注于“城市车辆轨迹分析”。城市车辆轨迹分析提供了前所未有的机会，可以了解城市交通网络中的车辆运动模式，包括以用户为中心的旅行经验和系统范围的时空模式。城市车辆轨迹数据的时空特征在结构上相互关联，因此，许多先前的研究人员使用了各种方法来理解这种结构。特别是，由于其强大的函数近似和特征表示能力，深度学习模型是由于许多研究人员的注意。因此，本文的目的是开发基于深度学习的城市车辆轨迹分析模型，以更好地了解城市交通网络的移动模式。特别是，本文重点介绍了两项研究主题，具有很高的必要性，重要性和适用性：下一个位置预测，以及合成轨迹生成。在这项研究中，我们向城市车辆轨迹分析提供了各种新型模型，使用深度学习。

translated by 谷歌翻译

Modelling Direct Messaging Networks with Multiple Recipients for Cyber Deception

Kristen Moore , Cody J. Christopher , David Liebowitz , Surya Nepal , Renee Selvey

分类：机器学习

2021-11-21

网络欺骗是作为对攻击者和数据盗贼保卫网络和系统的有希望的方法。然而，尽管部署相对便宜，但由于丰富的互动欺骗技术在很大程度上被手动的事实，规模的现实内容的产生是非常昂贵的。随着最近的机器学习改进，我们现在有机会为创建逼真和诱惑模拟内容带来规模和自动化。在这项工作中，我们提出了一个框架，以便在规模上自动化电子邮件和即时消息风格组通信。组织内的这种消息传递平台包含私人通信和文档附件内的许多有价值的信息，使其成为对手的诱惑目标。我们解决了模拟此类系统的两个关键方面：与参与者进行沟通的何时何地和生成局部多方文本以填充模拟对话线程。我们将LognormMix-Net时间点流程作为一种方法，建立在Shchur等人的强度建模方法上。〜\ Cite {Shchur2019Ints}为单播和多铸造通信创建生成模型。我们展示了使用微调，预先训练的语言模型来生成令人信服的多方对话线程。通过将LognormMix-Net TPP（要生成通信时间戳，发件人和收件人）使用语言模型来模拟实时电子邮件服务器，该语言模型生成多方电子邮件线程的内容。我们对基于现实主义的数量的基于现实的属性评估生成的内容，这鼓励模型学会生成将引起对手的注意力来实现欺骗结果。

translated by 谷歌翻译

Data-Centric Epidemic Forecasting: A Survey

Alexander Rodríguez , Harshavardhan Kamarthi , Pulak Agarwal , Javen Ho , Mira Patel , Suchet Sapre , B. Aditya Prakash

分类：机器学习

2022-07-19

COVID-19的大流行提出了对多个领域决策者的流行预测的重要性，从公共卫生到整个经济。虽然预测流行进展经常被概念化为类似于天气预测，但是它具有一些关键的差异，并且仍然是一项非平凡的任务。疾病的传播受到人类行为，病原体动态，天气和环境条件的多种混杂因素的影响。由于政府公共卫生和资助机构的倡议，捕获以前无法观察到的方面的丰富数据来源的可用性增加了研究的兴趣。这尤其是在“以数据为中心”的解决方案上进行的一系列工作，这些解决方案通过利用非传统数据源以及AI和机器学习的最新创新来增强我们的预测能力的潜力。这项调查研究了各种数据驱动的方法论和实践进步，并介绍了一个概念框架来导航它们。首先，我们列举了与流行病预测相关的大量流行病学数据集和新的数据流，捕获了各种因素，例如有症状的在线调查，零售和商业，流动性，基因组学数据等。接下来，我们将讨论关注最近基于数据驱动的统计和深度学习方法的方法和建模范式，以及将机械模型知识域知识与统计方法的有效性和灵活性相结合的新型混合模型类别。我们还讨论了这些预测系统的现实部署中出现的经验和挑战，包括预测信息。最后，我们重点介绍了整个预测管道中发现的一些挑战和开放问题。

translated by 谷歌翻译

SalienTrack: providing salient information for semi-automated self-tracking feedback with model explanations

Yunlong Wang , Jiaying Liu , Homin Park , Jordan Schultz-McArdle , Stephanie Rosenthal , Brian Y. Lim

分类：人工智能

2021-09-21

自我跟踪可以提高人们对他们不健康的行为的认识，为行为改变提供见解。事先工作探索了自动跟踪器如何反映其记录数据，但它仍然不清楚他们从跟踪反馈中学到多少，以及哪些信息更有用。实际上，反馈仍然可以压倒，并简明扼要可以通过增加焦点和减少解释负担来改善学习。为了简化反馈，我们提出了一个自动跟踪反馈显着框架，以定义提供反馈的特定信息，为什么这些细节以及如何呈现它们（手动引出或自动反馈）。我们从移动食品跟踪的实地研究中收集了调查和膳食图像数据，并实施了Salientrack，一种机器学习模型，以预测用户从跟踪事件中学习。使用可解释的AI（XAI）技术，SalientRack识别该事件的哪些特征是最突出的，为什么它们导致正面学习结果，并优先考虑如何根据归属分数呈现反馈。我们展示了用例，并进行了形成性研究，以展示Salientrack的可用性和有用性。我们讨论自动跟踪中可读性的影响，以及如何添加模型解释性扩大了提高反馈体验的机会。

translated by 谷歌翻译

In Pursuit of Interpretable, Fair and Accurate Machine Learning for Criminal Recidivism Prediction

Caroline Wang , Bin Han , Bhrij Patel , Cynthia Rudin

分类： (统计)机器学习 | 机器学习

2020-05-08

目的：我们研究使用机器学习（ML）模型的可解释的累入预测，并在预测能力，稀疏性和公平性方面分析性能。与以前的作品不同，本研究列举了输出概率而不是二进制预测的可解释模型，并使用定量公平定义来评估模型。本研究还研究了模型是否可以横跨地理位置概括。方法：我们在佛罗里达州和肯塔基州的两个不同的刑事核查数据集上生成了黑盒和可解释的ML模型。我们将这些模型的预测性能和公平与目前用于司法系统中使用的两种方法进行了比较，以预测审前常规率：Arnold PSA和Compas。我们评估了所有模型的预测性能，可以在两次跨越两次预测六种不同类型犯罪的模型。结果：几种可解释的ML模型可以预测常规和黑盒ML模型，比Compas或Arnold PSA更准确。这些模型在实践中可能有用。类似于Arnold PSA，这些可解释模型中的一些可以作为一个简单的表格写入。其他可以使用一组可视化显示。我们的地理分析表明ML模型应分开培训，以便单独的位置并随时间更新。我们还为可解释模型提供了公平分析。结论：可解释的机器学习模型可以在预测准确性和公平性方面表现，也可以表现，也可以表现，也可以执行不可解释的方法和目前使用的风险评估尺度。机器学习模型对于单独培训，可以更准确地进行不同的位置，并保持最新。

translated by 谷歌翻译

User-click Modelling for Predicting Purchase Intent

Simone Borg Bruun

分类：机器学习

2021-12-03

本文使用机器学习方法对建模用户行为进行建模的开放精算数学问题，以预测非寿命保险产品的购买意图。一家公司了解用户与其网站的互动是有价值的，因为它为消费者行为提供了丰富和个性化的洞察力。用户行为建模的大多数现有研究旨在解释或预测搜索引擎结果页面或在赞助搜索中估计点击率。这些模型基于关于网页的用户检测模式的概念和网页的项目表示。调查建模用户行为以预测商业网站的购买意图的问题，我们观察到用户的意图会产生高依赖，对用户如何在用户访问的不同网页的方式导航网站，什么样的网页用户互动，用户在每个网页上花了多少时间。灵感来自这些发现，我们提出了两种不同的方式代表用户会话的特征，导致了基于用户点击的购买预测的两个模型：一个基于馈送前向神经网络，另一个基于经常性神经网络。我们通过使用用户的人口统计特征将上述两种模型与模型进行比较，检查用户点击用户点击的歧视以预测购买意图。我们的实验结果表明，根据标准分类评估指标，我们的点击基础模型显着优于人口统计模型，并且基于用户点击的顺序表示的模型比基于点击特征工程的模型产生略大的性能。

translated by 谷歌翻译

AI in HCI Design and User Experience

Wei Xu

分类：人工智能

2023-01-03

In this chapter, we review and discuss the transformation of AI technology in HCI/UX work and assess how AI technology will change how we do the work. We first discuss how AI can be used to enhance the result of user research and design evaluation. We then discuss how AI technology can be used to enhance HCI/UX design. Finally, we discuss how AI-enabled capabilities can improve UX when users interact with computing systems, applications, and services.

translated by 谷歌翻译