在交叉语言设置中讨厌语音检测代表所有中型和大型在线平台的最重要的感兴趣区域。未能在全球范围内妥善解决这个问题已经过时地导致了道德上可疑的现实生活事件,人类死亡和仇恨本身的永久。本文说明了微调改变的多语言变压器模型(Mbert,XLM-Roberta)关于这一重要的社会数据科学任务,与英语到法语,反之亦然和每种语言的交叉思考,包括关于迭代改进和比较误差分析的部分。
translated by 谷歌翻译
本文报告了基准数据驱动的自动共鸣手势生成的第二个基因挑战。参与的团队使用相同的语音和运动数据集来构建手势生成系统。所有这些系统生成的运动都使用标准化的可视化管道将视频渲染到视频中,并在几个大型众包用户研究中进行了评估。与比较不同的研究论文不同,结果差异仅是由于方法之间的差异,从而实现了系统之间的直接比较。今年的数据集基于18个小时的全身运动捕获,包括手指,参与二元对话的不同人。十个团队参加了两层挑战:全身和上身手势。对于每个层,我们都评估了手势运动的人类风格及其对特定语音信号的适当性。我们的评估使人类的忠诚度与手势适当性解脱,这是该领域的主要挑战。评估结果是一场革命和启示。某些合成条件被评为比人类运动捕获更明显的人类样。据我们所知,这从未在高保真的头像上展示过。另一方面,发现所有合成运动比原始运动捕获记录要小得多。其他材料可通过项目网站https://youngwoo-yoon.github.io/geneachallenge2022/获得
translated by 谷歌翻译
我们通过反馈图来重新审视随机在线学习的问题,目的是设计最佳的算法,直至常数,无论是渐近还是有限的时间。我们表明,令人惊讶的是,在这种情况下,最佳有限时间遗憾的概念并不是一个唯一的定义属性,总的来说,它与渐近率是与渐近率分离的。我们讨论了替代选择,并提出了有限时间最优性的概念,我们认为是\ emph {有意义的}。对于这个概念,我们给出了一种算法,在有限的时间和渐近上都承认了准最佳的遗憾。
translated by 谷歌翻译
昆虫是我们生态系统的关键部分。可悲的是,在过去的几十年中,他们的人数令人担忧。为了更好地了解这一过程并监测昆虫的种群,深度学习可能会提供可行的解决方案。但是,鉴于其分类法的广度和典型的细粒度分析障碍,例如与低类变异性相比,较高的类内变异性,昆虫分类仍然是一项艰巨的任务。很少有基准数据集,这阻碍了更好的AI模型的快速发展。但是,稀有物种培训数据的注释需要专家知识。可解释的人工智能(XAI)可以协助生物学家执行这些注释任务,但是选择最佳XAI方法很难。我们对这些研究挑战的贡献是三重:1)从inaturist数据库中取样的野生蜜蜂的彻底注释图像的数据集,2)在野生蜜蜂数据集中训练的重新网络模型,可在野生蜜蜂数据集上获得与类似的最新出手的分类分数。经过其他细粒数据集培训的模型和3)对XAI方法的研究,以支持注释任务中的生物学家。
translated by 谷歌翻译