本文报告了Chalearn的Autodl挑战系列的结果和后攻击分析,这有助于对自动学习(DL)进行分类,以便在各种环境中引入的深度学习(DL),但缺乏公平的比较。格式化所有输入数据模型(时间序列,图像,视频,文本,表格)作为张量,所有任务都是多标签分类问题。代码提交已在隐藏的任务上执行,具有限制时间和计算资源,推动快速获取结果的解决方案。在此设置中,DL方法占主导地位,但流行的神经结构搜索(NAS)是不切实际的。解决方案依赖于微调预培训的网络,架构匹配数据模块。挑战后测试没有透露超出强加时间限制的改进。虽然没有组件尤其原始或新颖,但是一个高级模块化组织出现了“Meta-Learner”,“数据摄入”,“模型选择器”,“模型/学习者”和“评估员”。这种模块化使得消融研究,揭示了(离坡)元学习,合奏和高效数据管理的重要性。异构模块组合的实验进一步证实了获胜解决方案的(本地)最优性。我们的挑战队遗产包括一个持久的基准(http://utodl.chalearn.org),获胜者的开放源代码,以及免费的“autodl自助服务”。
translated by 谷歌翻译
污水机构是现代社会中最重要且昂贵的基础设施之一。为了有效地管理污水机构,必须使用自动化的下水道检查。然而,在几十年来调查了下水道缺陷分类的同时,对评估下水道管道劣化水平所需的下水道管道,如水位,管材和管道形状进行了很少的关注。在这项工作中,我们同时分类下水道管道缺陷和属性,并呈现一种新的解码器聚焦的多任务分类架构交叉任务图神经网络(CT-GNN),其使用交叉任务信息来改进脱位的每任务预测。 CT-GNN架构通过利用交叉任务图和唯一类节点嵌入式扩展了传统的脱节任务头解码器。跨任务图可以基于任务类之间的条件概率来确定先验,或者使用自我关注动态确定。 CT-GNN可以添加到任何骨干网上并在参数计数的小幅增加时培训端到端。我们在污水数据集中的所有四个分类任务中实现最先进的性能,分别提高了5.3和8.0个百分点的缺陷分类和水位分类。我们还优于单个任务方法以及其他多任务分类方法,同时引入比以前的专注于以前的模型的方法较少的50倍。 Project Page http://vap.aau.dk/ctgnn提供的代码和模型
translated by 谷歌翻译
鉴于大量具有相似属性但域不同的标记数据的可用性,域的适应性是一种有吸引力的方法。在图像分类任务中,获得足够的标签数据具有挑战性。我们提出了一种名为Selda的新方法,用于通过扩展三种域适应方法来堆叠合奏学习,以有效解决现实世界中的问题。主要假设是,当将基本域适应模型组合起来时,我们可以通过利用每个基本模型的能力来获得更准确,更健壮的模型。我们扩展最大平均差异(MMD),低级别编码和相关比对(珊瑚),以计算三个基本模型中的适应损失。同样,我们利用一个两双连接的层网络作为元模型来堆叠这三个表现良好的域适应模型的输出预测,以获得眼科图像分类任务的高精度。使用与年龄相关的眼病研究(AREDS)基准眼科数据集的实验结果证明了该模型的有效性。
translated by 谷歌翻译
在医学中,图像注册对于图像引导的干预措施和其他临床应用至关重要。但是,很难解决,通过机器学习的出现,最近在该领域的医疗图像注册方面已经取得了很大的进步。深度神经网络的实施为某些医学应用提供了机会,例如在更少的时间内进行图像注册,以高精度,在操作过程中对抗肿瘤中发挥关键作用。当前的研究对基于无监督的深神经网络的医学图像注册研究的最新文献进行了全面的范围审查,其中包括到本领域在此日期中发表的所有相关研究。在这里,我们试图总结医学领域中无监督的基于深度学习的注册方法的最新发展和应用。在当前的全面范围审查中,精心讨论和传达了基本和主要概念,技术,从不同观点,新颖性和未来方向的统计分析。此外,这篇评论希望帮助那些被这一领域铆接的活跃读者深入了解这一激动人心的领域。
translated by 谷歌翻译
糖尿病(DM)可导致严重的微脉管破坏,最终导致糖尿病性视网膜病变(DR)或由于糖尿病引起的眼睛并发症。如果不受组织的检查,这种疾病会随着时间的流逝而增加,并最终导致完全视力丧失。检测到这种光学发展的一般方法是通过检查视网膜图像的血管,视神经头,微型毛发,出血,渗出液等。最终,这受到经验丰富的眼科医生和大量DM案例的数量的限制。为了启用早期有效的DR诊断,眼科领域需要强大的计算机辅助诊断(CAD)系统。我们的审查旨在为从学生到成熟的研究人员提供给任何人,他们想了解CAD系统及其算法可以完成的工作,再到建模以及计算机视觉和模式识别中的视网膜图像处理领域的发展方向。对于刚开始的人来说,我们特别强调了不同数据库和算法框架的逻辑,优势和缺点,重点是最近的方法。
translated by 谷歌翻译
无线系统应用中深度学习(DL)的成功出现引起了人们对与安全有关的新挑战的担忧。一个这样的安全挑战是对抗性攻击。尽管已经有很多工作证明了基于DL的分类任务对对抗性攻击的敏感性,但是从攻击的角度来看,尚未对无线系统的基于回归的问题进行基于回归的问题。本文的目的是双重的:(i)我们在无线设置中考虑回归问题,并表明对抗性攻击可以打破基于DL的方法,并且(ii)我们将对抗性训练作为对抗性环境中的防御技术的有效性分析并表明基于DL的无线系统对攻击的鲁棒性有了显着改善。具体而言,本文考虑的无线应用程序是基于DL的功率分配,以多细胞大量多输入 - 销售输出系统的下行链路分配,攻击的目的是通过DL模型产生不可行的解决方案。我们扩展了基于梯度的对抗性攻击:快速梯度标志方法(FGSM),动量迭代FGSM和预计的梯度下降方法,以分析具有和没有对抗性训练的考虑的无线应用的敏感性。我们对这些攻击进行了分析深度神经网络(DNN)模型的性能,在这些攻击中,使用白色框和黑盒攻击制作了对抗性扰动。
translated by 谷歌翻译
激光加工是一种高度灵活的非接触式制造技术,在学术界和行业中广泛使用。由于光和物质之间的非线性相互作用,模拟方法非常重要,因为它们通过理解激光处理参数之间的相互关系来帮助增强加工质量。另一方面,实验处理参数优化建议对可用处理参数空间进行系统且耗时的研究。一种智能策略是采用机器学习(ML)技术来捕获Picsecond激光加工参数之间的关系,以找到适当的参数组合,以创建对工业级氧化铝陶瓷的所需削减,并具有深层,平滑和无缺陷的模式。激光参数,例如梁振幅和频率,扫描仪的传递速度以及扫描仪与样品表面的垂直距离的速度,用于预测深度,最高宽度和底部宽度使用ML型号雕刻通道。由于激光参数之间的复杂相关性,因此表明神经网络(NN)是预测输出最有效的。配备了ML模型,该模型可以捕获激光参数与雕刻通道尺寸之间的互连,可以预测所需的输入参数以实现目标通道几何形状。该策略大大降低了开发阶段实验激光加工的成本和精力,而不会损害准确性或性能。开发的技术可以应用于各种陶瓷激光加工过程。
translated by 谷歌翻译
人格检测是心理学和自动人格预测(或感知)(APP)的一个古老话题,是对不同类型的人类生成/交换内容(例如文本,语音,图像,视频,视频)对个性的自动化(计算)预测。这项研究的主要目的是自2010年以来对应用程序的自然语言处理方法进行浅(总体)审查。随着深度学习的出现并遵循NLP的转移学习和预先培训的模型,应用程序研究领域已经成为一个热门话题,因此在这篇评论中,方法分为三个;预先训练的独立,预训练的基于模型的多模式方法。此外,为了获得全面的比较,数据集为报告的结果提供了信息。
translated by 谷歌翻译
他/她在讲话或写作中使用的那些词表现得很重要。由于传播信息基础架构(特别是互联网和社交媒体),人类通讯从面对面的交流中进行了显着改革。通常,自动人格预测(或感知)(APP)是对不同类型的人类生成/交换内容(例如文本,语音,图像,视频等)的人格的自动预测。这项研究的主要目的是从文本中提高应用程序的准确性。为此,我们建议使用五种新的应用程序方法,包括基于术语频率向量,基于本体的,富集基于本体的潜在语义分析(LSA)基于基于本体的频率和基于深度学习(BILSTM)的方法。这些方法是基本方法,可以通过基于分层注意力网络(HAN)作为元模型的集合建模(堆叠)来提高应用程序的准确性。结果表明,整体建模增强了应用程序的准确性。
translated by 谷歌翻译
通过使信息生产和复制民主化的技术,社交媒体中每日互动的很大一部分被谣言感染了。尽管对谣言检测和验证进行了广泛的研究,但到目前为止,尚未考虑计算谣言传播力量的问题。为了解决这一研究差距,本研究寻求一个模型来计算谣言(SPR)作为基于内容特征的功能的两类功能:虚假谣言(FR)和真实谣言(TR)。为此,将采用Allport和Postman的理论,它声称重要性和歧义是谣言和谣言的力量的关键变量。引入了两个类别的“重要性”(28个功能)和“歧义”(14个功能)的42个内容功能以计算SPR。提出的模型将在两个数据集(Twitter和Telegram)上进行评估。结果表明,(i)虚假谣言文件的传播力量很少不仅仅是真正的谣言。 (ii)两组虚假谣言和真实谣言的SPR平均值之间存在显着差异。 (iii)SPR作为标准可以对区分虚假谣言和真实谣言产生积极影响。
translated by 谷歌翻译