可提供许多开源和商业恶意软件探测器。然而,这些工具的功效受到新的对抗性攻击的威胁,由此恶意软件试图使用例如机器学习技术来逃避检测。在这项工作中,我们设计了依赖于特征空间和问题空间操纵的对抗逃避攻击。它使用可扩展性导向特征选择来最大限度地通过识别影响检测的最关键的特征来最大限度地逃避。然后,我们将此攻击用作评估若干最先进的恶意软件探测器的基准。我们发现(i)最先进的恶意软件探测器容易受到简单的逃避策略,并且可以使用现成的技术轻松欺骗; (ii)特征空间操纵和问题空间混淆可以组合起来,以便在不需要对探测器的白色盒子理解的情况下实现逃避; (iii)我们可以使用解释性方法(例如,Shap)来指导特征操纵并解释攻击如何跨多个检测器传输。我们的调查结果阐明了当前恶意软件探测器的弱点,以及如何改善它们。
translated by 谷歌翻译
Photo-identification (photo-id) is one of the main non-invasive capture-recapture methods utilised by marine researchers for monitoring cetacean (dolphin, whale, and porpoise) populations. This method has historically been performed manually resulting in high workload and cost due to the vast number of images collected. Recently automated aids have been developed to help speed-up photo-id, although they are often disjoint in their processing and do not utilise all available identifying information. Work presented in this paper aims to create a fully automatic photo-id aid capable of providing most likely matches based on all available information without the need for data pre-processing such as cropping. This is achieved through a pipeline of computer vision models and post-processing techniques aimed at detecting cetaceans in unedited field imagery before passing them downstream for individual level catalogue matching. The system is capable of handling previously uncatalogued individuals and flagging these for investigation thanks to catalogue similarity comparison. We evaluate the system against multiple real-life photo-id catalogues, achieving mAP@IOU[0.5] = 0.91, 0.96 for the task of dorsal fin detection on catalogues from Tanzania and the UK respectively and 83.1, 97.5% top-10 accuracy for the task of individual classification on catalogues from the UK and USA.
translated by 谷歌翻译
噪音和不确定性通常是机器学习的敌人,训练数据中的噪声会导致预测中的不确定性和不准确性。但是,我们开发了一种机器学习体系结构,该体系结构从噪声本身中提取重要信息以改善预测。现象学计算,然后在一个目标变量中利用不确定性来预测第二个目标变量。我们将这种形式主义应用于pbzr $ _ {0.7} $ sn $ _ {0.3} $ o $ $ _ {3} $ crystal,使用介电常数的不确定性来推断热容量,并正确预测了相位过渡,否则无法扣除。在第二个示例中 - 液滴的单粒子衍射 - 我们利用粒子计数及其不确定性来推断地面真相衍射幅度,比仅利用粒子计数时提供更好的预测。我们的通用形式主义使机器学习中的不确定性剥削,在物理科学及其他地区具有广泛的应用。
translated by 谷歌翻译
数据标签噪声在监督学习应用中长期以来一直是一个重要的问题,因为它影响了许多广泛使用的分类方法的有效性。最近,重要的现实世界应用,如医学诊断和网络安全,已经产生了在Neyman-Pearson(NP)分类范式的重新兴趣,这在优选级别下限制了更严重的错误类型(例如,I错误)虽然最小化另一个(例如,II型错误)。但是,在标签噪声下对NP范例几乎没有研究。它有点令人惊讶的是,即使普通的NP分类器忽略训练阶段中的标签噪声,它们仍然能够控制I型错误,具有高概率。但是,他们支付的价格是I误差类型的过度保守性,因此电源的显着下降(即,1美元,II型错误)。假设领域专家在腐败严重程度上提供下限,我们提出了第一个理论支持算法,它适应NP范例下的训练标签噪声。由此产生的分类器不仅在所需水平下以高概率控制I误差,而且还提高功率。
translated by 谷歌翻译
对头部磁共振成像(MRI)检查的需求不断增长,以及全球放射科医生的短缺,导致在全球报告头部MRI扫描所花费的时间增加。对于许多神经系统疾病,这种延迟会导致发病率和死亡率增加。一种自动分解工具可以通过在成像时识别异常并确定这些扫描的报告优先级来减少异常检查的报告时间。在这项工作中,我们提出了一个卷积神经网络,用于检测$ \ text {t} _2 $加权的头部MRI扫描中临床上相关的异常。使用经过验证的神经放射学报告分类器,我们从两家英国两家大型医院进行了43,754张标记的数据集,以进行模型培训,并在800张测试集上证明了准确的分类(AUC下的区域(AUC)= 0.943),由800张扫描集进行了标签。神经放射学家团队。重要的是,当仅在一家医院接受扫描培训时,模型从另一家医院进行了扫描($ \ delta $ auc $ \ leq $ 0.02)。一项模拟研究表明,我们的模型将使异常检查的平均报告时间从28天到14天,并从两家医院的9天到5天,这表明在临床分类环境中使用了可行性。
translated by 谷歌翻译
扩散张量成像(DTI)已被用于研究神经退行性疾病对神经途径的影响,这可能导致这些疾病的更可靠和早期诊断,以及更好地了解它们如何影响大脑。我们介绍了一种基于标记为DTI光纤数据和相应统计数据的智能视觉分析系统,用于研究患者组。系统的AI增强界面通过组织和整体分析空间引导用户,包括统计特征空间,物理空间和不同组的患者的空间。我们使用自定义机器学习管道来帮助缩小此大型分析空间,然后通过一系列链接可视化务实拨动它。我们使用来自Parkinson进展标记倡议的研究数据库的实际数据进行多种案例研究。
translated by 谷歌翻译