产品图像对于在电子商务平台中提供理想的用户体验至关重要。对于拥有数十亿种产品的平台,手动挑选和组织合格的图像非常耗时且耗尽劳动力。此外,要生成/选择的产品图像需要遵守众多且复杂的图像规则。为了解决这些挑战,在本文中,我们提出了一个新的学习框架,以便在电子商务中自动生成产品图像序列(AGPI)。为此,我们提出了一个多模式统一的图像序列分类器(MUISC),该分类器能够通过学习同时检测所有规则违规的类别。 MUISC利用文本审查反馈作为额外的培训目标,并利用产品文本描述提供额外的语义信息。根据离线评估,我们表明拟议的MUISC显着优于各种基线。除MUISC外,我们还将其他一些重要的模块集成在提出的框架中,例如主图像选择,不合格的内容检测和图像重复数据删除。借助所有这些模块,我们的框架在JD.com推荐平台中有效,有效地工作。到2021年12月,我们的AGPIS框架为约150万种产品生成了高标准图像,并获得了13.6%的拒绝率。
translated by 谷歌翻译
图形离群值检测是一项具有许多应用程序的新兴但至关重要的机器学习任务。尽管近年来算法扩散,但缺乏标准和统一的绩效评估设置限制了它们在现实世界应用中的进步和使用。为了利用差距,我们(据我们所知)(据我们所知)第一个全面的无监督节点离群值检测基准为unod,并带有以下亮点:(1)评估骨架从经典矩阵分解到最新图形神经的骨架的14个方法网络; (2)在现实世界数据集上使用不同类型的注射异常值和自然异常值对方法性能进行基准测试; (3)通过在不同尺度的合成图上使用运行时和GPU存储器使用算法的效率和可扩展性。基于广泛的实验结果的分析,我们讨论了当前渠道方法的利弊,并指出了多个关键和有希望的未来研究方向。
translated by 谷歌翻译
基于部分微分方程的物理模拟通常会生成空间场结果,这些结果可用于计算系统设计和优化系统的特定属性。由于模拟的密集计算负担,替代模型将低维输入映射到空间场通常是基于相对较小的数据集构建的。为了解决预测整个空间场的挑战,流行的核心区域线性线性模型(LMC)可以在高维空间场输出中解散复杂的相关性,并提供准确的预测。但是,如果通过基本函数与潜在过程的线性组合无法很好地近似空间场,则LMC会失败。在本文中,我们通过引入可演化的神经网络来线性化高度复杂和非线性空间场,以便LMC可以轻松地将非线性问题概括为非线性问题,同时保留了放大学性和可伸缩性。几个现实世界的应用程序表明,E-LMC可以有效利用空间相关性,显示出比原始LMC的最大提高约40%,并且表现优于其他最先进的空间场模型。
translated by 谷歌翻译
我们提出了一种新的域特定的生成预训练(DS-GPT)方法,用于文本生成,并将其应用于电子商务移动显示器上的产品Titleand审查总结问题。首先,我们采用了仅限解码器的变压器体系结构,该架构Fitswell通过组合输入和输出全部携带的微调任务。其次,我们在相关域中仅使用少量预训练数据是强大的。预先训练从一般语料库中的矛盾,如维基百科或通用需要巨大的时间和资源承诺,如果下游任务有限。 OUDSGPT在Limble DataSet中预先培训,中文短篇演示数据集(LCSTS)。第三,我们的模型不要求相关的人类标记数据。对于标题摘要任务,艺术状态明确地使用额外的背景知识训练和预测阶段。相比之下,我们的模型暗示 - 在公共Taobao.comDataset上微调后,旨在捕获这种知识并实现了重要的改进其他方法。对于审查摘要任务,我们利用JD.com在-UteedAtaset上,并观察到缺乏微调灵活性的标准机械进程方法的类似改进。我们的工作可以简单地扩展到其他文本生成任务的域。
translated by 谷歌翻译
冠状动脉造影是诊断冠状动脉疾病(CAD)的“黄金标准”。目前,检测和评估冠状动脉狭窄的方法不能满足临床需求,例如,在临床实践中是必要的预先检测狭窄的先前研究。提出了两种血管狭窄检测方法来协助诊断。第一个是一种自动方法,可以自动提取整个冠状动脉树并标记所有可能的狭窄。第二个是一个交互式方法。通过这种方法,用户可以选择任何船只分段,以进一步分析其狭窄。实验表明,该方法对于具有各种血管结构的血管造影是鲁棒的。自动狭窄检测方法的精度,灵敏度和$ F_1 $得分分别为0.821,0.757和0.788。进一步的调查证明,交互方法可以提供更精确的狭窄检测结果,我们的定量分析更接近现实。所提出的自动方法和交互方法是有效的,可以在临床实践中相互补充。第一方法可用于初步筛选,第二种方法可用于进一步定量分析。我们认为,所提出的解决方案更适合CAD的临床诊断。
translated by 谷歌翻译
冠状动脉造影是诊断冠状动脉疾病(CAD)的“黄金标准”。目前,检测和评估冠状动脉狭窄的方法不能满足临床需求,例如,在临床实践中是必要的预先检测狭窄的先前研究。提出了两种血管狭窄检测方法来协助诊断。第一个是一种自动方法,可以自动提取整个冠状动脉树并标记所有可能的狭窄。第二个是一个交互式方法。通过这种方法,用户可以选择任何船只分段,以进一步分析其狭窄。实验表明,该方法对于具有各种血管结构的血管造影是鲁棒的。自动狭窄检测方法的精度,灵敏度和$ F_1 $得分分别为0.821,0.757和0.788。进一步的调查证明,交互方法可以提供更精确的狭窄检测结果,我们的定量分析更接近现实。所提出的自动方法和交互方法是有效的,可以在临床实践中相互补充。第一方法可用于初步筛选,第二种方法可用于进一步定量分析。我们认为,所提出的解决方案更适合CAD的临床诊断。
translated by 谷歌翻译
已知基于优化的3D对象跟踪是精确且快速的,但对大型框架间位移敏感。在本文中,我们提出了一种快速有效的非本地3D跟踪方法。基于观察到错误的局部最小值主要是由于平面外旋转引起的,我们提出了一种混合方法,该方法将非本地和局部优化的不同参数结合在一起,从而在6D姿势空间中有效地进行非本地搜索。此外,为姿势优化提出了一种预先计算的基于强大轮廓的跟踪方法。通过使用带有多个候选对应的长搜索线,它可以适应不同的帧位移而无需粗到精细的搜索。在预计算之前,可以非常快速地进行姿势更新,从而使非本地优化实时运行。我们的方法优于大小位移的所有先前方法。对于大型位移,精度得到了极大的提高($ 81.7 \%\; \ text {v.s。} \; 19.4 \%$)。同时,只有CPU可以实现实时速度($> $ 50fps)。源代码可在\ url {https://github.com/cvbubbles/nonlocal-3dtracking}中获得。
translated by 谷歌翻译
基于池的主动学习(AL)通过依次从大型未标记数据池中选择信息的未标记样本并从Oracle/Ontoter中查询标签,从而取得了巨大成功。但是,现有的AL采样策略可能在分布外(OOD)数据方案中无法很好地工作,其中未标记的数据池包含一些不属于目标任务类别的数据示例。在OOD数据情景下实现良好的AL性能是一项具有挑战性的任务,因为Al采样策略与OOD样本检测之间的自然冲突。 Al选择很难由当前基本分类器进行分类的数据(例如,预测类概率具有较高熵的样品),而OOD样品往往具有比分布更均匀的预测类概率(即高熵)(即高熵)(ID ) 数据。在本文中,我们提出了一种采样方案,即用于主动学习的蒙特 - 卡洛帕累托优化(POAL),该方案从未标记的数据库中选择了具有固定批次大小的未标记样品的最佳子集。我们将AL采样任务施加为多目标优化问题,因此我们基于两个冲突的目标利用Pareto优化:(1)正常的AL数据采样方案(例如,最大熵)和(2)作为OOD样本。实验结果表明其对经典机器学习(ML)和深度学习(DL)任务的有效性。
translated by 谷歌翻译
异常检测(OD)文献表现出许多适用于不同领域的算法。但是,鉴于新的检测任务,尚不清楚如何选择要使用的算法,也不清楚如何在无监督的设置中设置其超参数(S)(HPS)。 HP调整是一个不断增长的问题,基于深度学习的许多新探测器的到来。尽管它们具有诸如任务驱动的表示学习和端到端优化之类的吸引力,但深层模型附带了一长串HP。令人惊讶的是,在离群矿业文献中选择模型的问题是“房间里的大象”。释放深层方法的最大潜力的重要因素,但很少有人说或系统地解决这个问题。在本文的第一部分中,我们对Deep OD方法的HP敏感性进行了第一个大规模分析,并通过35,000多个训练有素的模型进行了定量证明模型选择是不可避免的。接下来,我们设计了一个称为Robod的HP刺激性和可扩展的深度高音模型,该模型以不同的HP配置组装模型,绕过选择瘫痪。重要的是,我们引入了新的策略来加快整体培训的速度,例如参数共享,批处理/同时培训和数据亚采样,使我们能够更少的参数培训较少的模型。图像和表格数据集的广泛实验表明,与其现代对应物相比,机器人可以实现并保留强大的最先进的检测性能,同时仅将2-10%的时间与独立的幼稚的超氛围相比,训练。
translated by 谷歌翻译
虽然深度学习(DL)是渴望数据的,并且通常依靠广泛的标记数据来提供良好的性能,但主动学习(AL)通过从未标记的数据中选择一小部分样本进行标签和培训来降低标签成本。因此,近年来,在有限的标签成本/预算下,深入的积极学习(DAL)是可行的解决方案,可在有限的标签成本/预算下最大化模型性能。尽管已经开发了大量的DAL方法并进行了各种文献综述,但在公平比较设置下对DAL方法的性能评估尚未可用。我们的工作打算填补这一空白。在这项工作中,我们通过重新实现19种引用的DAL方法来构建DAL Toolkit,即Deepal+。我们调查和分类与DAL相关的作品,并构建经常使用的数据集和DAL算法的比较实验。此外,我们探讨了影响DAL功效的一些因素(例如,批处理大小,训练过程中的时期数),这些因素为研究人员设计其DAL实验或执行DAL相关应用程序提供了更好的参考。
translated by 谷歌翻译