仇恨言语检测模型通常在持有的测试集上评估。但是,这有可能因为仇恨言语数据集中越来越有据可查的系统差距和偏见,因此绘制模型性能的不完整且潜在的误导性图片。为了实现更多针对性的诊断见解,最近的研究引入了仇恨言语检测模型的功能测试。但是,这些测试目前仅针对英语内容,这意味着它们无法支持全球数十亿语言所说的其他语言中更有效模型的开发。为了帮助解决这个问题,我们介绍了多语言Hatecheck(MHC),这是一套用于多语言仇恨言语检测模型的功能测试。 MHC涵盖了跨十种语言的34个功能,这比任何其他仇恨语音数据集更多。为了说明MHC的效用,我们训练和测试了高性能的多语言仇恨语音检测模型,并揭示了单语和跨语性应用的关键模型弱点。
translated by 谷歌翻译