图像分类器对输入中的小扰动的敏感性通常被视为其结构的缺陷。我们表明这种敏感性是分类器的基本属性。对于AL的$ N $-$ N $ Images的任何任意分类器,我们向所有级别显示出来,可以在那个类中更改除了一个微小的修改中的那个类中的所有图像的分类与任何$ P $ -Norm测量时的图像空间的直径相比,包括汉明距离。然后,我们研究这种现象在人类视觉感知中的表现如何,并讨论其对计算机视觉系统设计考虑的影响。
translated by 谷歌翻译
The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.
translated by 谷歌翻译
我们研究了Levin(1993)所述的动词交替类的程度和句子级预测任务。我们遵循并扩展了Kann等人的实验。(2019年),旨在探测静态嵌入是否编码动词的框架选择性。在单词和句子级别上,我们发现来自PLM的上下文嵌入不仅超过了非上下文嵌入,而且在大多数交替类中的任务上达到了惊人的高精度。此外,我们发现证据表明,PLM的中间层平均比所有探测任务中的较低层都能取得更好的性能。
translated by 谷歌翻译
诸如深度学习之类的复杂预测模型是拟合机器学习,神经网络或AI模型到一组培训数据的输出。这些现在是科学的标准工具。当前一代模型的一个关键挑战是它们是高度参数化的,这使得和解释预测策略变得困难。我们使用拓扑数据分析将这些复杂预测模型转换为代表拓扑视图的图片。结果是可以进行检查的预测的地图。这些方法扩展到跨不同领域的大型数据集,使我们能够检测训练数据中的错误,了解图像分类中的概括,并检查BRCA1基因中可能致病性突变的预测。
translated by 谷歌翻译
近年来,深度学习(DL)方法的流行程度急剧增加,并且在生物医学科学中的监督学习问题中的应用显着增长。但是,现代生物医学数据集中缺失数据的较高流行率和复杂性对DL方法提出了重大挑战。在这里,我们在深入学习的广义线性模型的背景下,对缺失数据进行了正式处理,这是一种监督的DL架构,用于回归和分类问题。我们提出了一种新的体系结构,即\ textit {dlglm},这是第一个能够在训练时在输入功能和响应中灵活地说明忽略和不可忽视的缺失模式之一。我们通过统计模拟证明,我们的方法在没有随机(MNAR)缺失的情况下胜过现有的监督学习任务方法。我们从UCI机器学习存储库中对银行营销数据集进行了案例研究,在该数据集中我们预测客户是否基于电话调查数据订阅了产品。
translated by 谷歌翻译
本文提出了一种新颖的邻居搜索算法,可实现TPU(Google Tensor处理单元)的峰值性能,超过了最先进的GPU算法,其召回水平相似。所提出的算法的设计是由准确的加速器性能模型的动机,该模型同时考虑了内存和指令瓶颈。我们的算法具有预期召回的分析保证,并且不需要维护复杂的索引数据结构或调整,因此它适用于经常更新的应用程序。我们的工作可在TPU上的Jax和Tensorflow的开源软件包中获得。
translated by 谷歌翻译
有效的沟通需要适应与每个交流伙伴共享的特质共同基础。我们研究了这个问题的特别具有挑战性的实例化:流行的游戏dixit。我们将一轮dixit作为多代理图像参考游戏,在其中(训练有素的)扬声器模型描述了目标图像,以使一个(预审计的)侦听器模型可以从一组干扰器中正确识别它,但另一个听众无法识别它。为了适应这种设置,演讲者必须利用与不同听众共享的共同点的差异。我们表明,在这种对比性的多代理设置中,在剪辑视觉编码器和大型语言模型之间进行基于注意力的适配器会产生与上下文相关的自然语言专业化,而无需直接监督。在一系列受控的实验中,我们表明说话者可以根据各对不同听众的特质优势和劣势来适应。此外,我们显示了说话者专业化对看不见的现实世界数据的零拍传输。我们的实验为复杂的多方设置中的自适应沟通提供了一步,并突出了Dixit等游戏带来的有趣的研究挑战。我们希望我们的工作能够激发创造性的新方法,以适应预处理的模型。
translated by 谷歌翻译
机器学习的进展使得可以预测免疫系统对预防性和治疗疫苗的反应。但是,设计疫苗的工程任务仍然是一个挑战。特别是,人类免疫系统的遗传变异性使设计肽疫苗很难在接种疫苗的种群中提供广泛的免疫力。我们介绍了一个用于评估和设计使用概率机器学习模型的肽疫苗的框架,并展示了其为SARS-COV-2疫苗生产设计的能力,该疫苗的表现优于先前的设计。我们提供了框架的近似性,可扩展性和复杂性的理论分析。
translated by 谷歌翻译
静态机器学习模型的理想化,经过训练并永远部署,这是不切实际的。随着输入分布的变化,该模型不仅会失去准确性,因此减少对受保护类别的偏见的任何约束都可能无法按预期工作。因此,研究人员已经开始探索随着时间的推移保持算法公平性的方法。一项工作重点是动态学习:每批次后重新训练,而另一个工作则介绍了强大的学习,该学习试图使算法与未来所有可能的变化进行鲁棒性。动态学习试图在发生后不久减少偏见,而健壮的学习通常会产生(过于)保守的模型。我们提出了一种预期的动态学习方法,用于纠正算法在发生偏见之前减轻算法。具体而言,我们利用有关下一个周期中人口亚组(例如,男性和女性申请人的相对比率)的相对分布的预期,以确定正确的参数,以实现重要性权衡方法。对多个现实世界数据集的实验的结果表明,这种方法有望预期偏差校正。
translated by 谷歌翻译
我们引入了一种新方法,用于纳米光器设备的逆设计,该方法可以确保由此产生的设计满足严格的长度限制,包括商业半导体铸造厂所需的最小宽度和间距约束。该方法采用了几个概念,从机器学习中,将拓扑优化的问题与严格的长度限制转变为无约束的随机梯度优化问题。具体而言,我们引入了一种有条件的发电机,用于可行设计,并采用直通估计器将梯度反向传播到潜在设计。我们通过设计几个常见的集成光子组件来证明我们方法的性能和可靠性。
translated by 谷歌翻译