Identification of named entities from legal texts is an essential building block for developing other legal Artificial Intelligence applications. Named Entities in legal texts are slightly different and more fine-grained than commonly used named entities like Person, Organization, Location etc. In this paper, we introduce a new corpus of 46545 annotated legal named entities mapped to 14 legal entity types. The Baseline model for extracting legal named entities from judgment text is also developed.
translated by 谷歌翻译
在人口稠密的国家中,悬而未决的法律案件呈指数增长。需要开发处理和组织法律文件的技术。在本文中,我们引入了一个新的语料库来构建法律文件。特别是,我们介绍了用英语的法律判断文件进行的,这些文件被分割为局部和连贯的部分。这些零件中的每一个都有注释,标签来自预定义角色的列表。我们开发基线模型,以根据注释语料库自动预测法律文档中的修辞角色。此外,我们展示了修辞角色在提高总结和法律判断预测任务的绩效方面的应用。我们发布了语料库和基线模型代码以及纸张。
translated by 谷歌翻译
图形上的分层聚类是数据挖掘和机器学习中的一项基本任务,并在系统发育学,社交网络分析和信息检索等领域中进行了应用。具体而言,我们考虑了由于Dasgupta引起的层次聚类的最近普及的目标函数。以前(大约)最小化此目标函数的算法需要线性时间/空间复杂性。在许多应用程序中,底层图的大小可能很大,即使使用线性时间/空间算法,也可以在计算上具有挑战性。结果,人们对设计只能使用sublinear资源执行全局计算的算法有浓厚的兴趣。这项工作的重点是在三个经过良好的sublinear计算模型下研究大量图的层次聚类,分别侧重于时空,时间和通信,作为要优化的主要资源:(1)(动态)流模型。边缘作为流,(2)查询模型表示,其中使用邻居和度查询查询图形,(3)MPC模型,其中图边缘通过通信通道连接的几台机器进行了分区。我们在上面的所有三个模型中设计用于层次聚类的sublinear算法。我们算法结果的核心是图表中的剪切方面的视图,这使我们能够使用宽松的剪刀示意图进行分层聚类,同时仅引入目标函数中的较小失真。然后,我们的主要算法贡献是如何在查询模型和MPC模型中有效地构建所需形式的切割稀疏器。我们通过建立几乎匹配的下限来补充我们的算法结果,该界限排除了在每个模型中设计更好的算法的可能性。
translated by 谷歌翻译
尽管环境条件不利,现代农业仍在不断发展以增加产量。一种有希望的方法是“温室种植”,为耕种的植物提供了微气候,以克服不利的气候。然而,大型的温室在整个复合物中都会形成不均匀的微气候,需要高度的人类监督。我们建议部署农业机器人,以在温室中创造和维持积极的生态条件,从而降低人工成本并增加产量。该原型将包含两个主要系统,即导航系统和数据分析系统。导航系统将由Arduino控制,并且将使用ESP8266微芯片处理数据分析。用于测量温室参数的许多传感器将安装在机器人上。它将遵循预定义的路径,同时在检查点进行读数。微芯片将从传感器收集和处理数据,传输到云,并向执行器发出命令。将定期测量土壤和气候参数,例如温度,湿度,光强度,土壤水分,pH值。当参数不在指定的范围内时,农业机器人将采取纠正措施,例如打击器/加热器,开始灌溉等。如果需要外部干预,例如肥料,则将相应地指示。在大规模的温室中部署这样的农业机器人来监测和控制小气候,可以降低人工成本,同时提高生产率。尽管有初始成本,但它可以通过提供灵活性,低功耗和易于管理来提供高度投资回报,以帮助温室提高水效率,提供均匀分散和受控的阳光强度,温度和湿度。
translated by 谷歌翻译
鉴于NIMH的研究领域标准(RDOC),功能性神经影像学的出现,新颖的技术和方法为开发精确和个性化的预后和精神障碍的诊断提供了新的机会。机器学习(ML)和人工智能(AI)技术在精神病学的新时代中起着越来越重要的作用。将ML/AI与神经调节技术相结合,可以在临床实践和有效的治疗治疗中提供可解释的解决方案。先进的可穿戴技术和移动技术还要求ML/AI在移动心理健康中的数字表型中的新作用。在这篇综述中,我们通过在精神病学实践中结合神经影像学,神经调节和先进的移动技术,对ML方法和应用进行全面综述。此外,我们回顾了ML在精确精神病学中ML在分子表型和跨物种生物标记鉴定中的作用。我们进一步以封闭的环境方式讨论了可解释的AI(XAI)和因果关系测试,并突出了多媒体信息提取和多模式数据融合中的ML潜力。最后,我们讨论精神病学方面的概念和实践挑战,并在未来的研究中突出ML机会。
translated by 谷歌翻译
远程预测是许多决策支持系统的起点,需要在预测值上从高级聚合模式中汲取推断。最先进的时间序列预测方法要么受到Long-Horizo n预测的概念漂移,或者未能准确地预测连贯和准确的高水平聚集体。在这项工作中,我们提出了一种新颖的概率预测方法,其在基础级别和预测总统计方面产生了一致的预测。我们使用新推断方法实现预测基础级和聚合统计数据之间的一致性。我们的推断方法基于KL分歧,可以在封闭形式中有效地解决。我们表明,我们的方法在基本级别和静电汇总推断上的预测性能提高了三种不同域的真实数据集的帖子推断。
translated by 谷歌翻译
在过去十年中,已经开发出新的深度学习(DL)算法,工作负载和硬件来解决各种问题。尽管工作量和硬件生态系统的进步,DL系统的编程方法是停滞不前的。 DL工作负载从DL库中的高度优化,特定于平台和不灵活的内核,或者在新颖的操作员的情况下,通过具有强大性能的DL框架基元建立参考实现。这项工作介绍了Tensor加工基元(TPP),一个编程抽象,用于高效的DL工作负载的高效,便携式实现。 TPPS定义了一组紧凑而多才多艺的2D张镜操作员(或虚拟张量ISA),随后可以用作构建块,以在高维张量上构建复杂的运算符。 TPP规范是平台 - 不可行的,因此通过TPPS表示的代码是便携式的,而TPP实现是高度优化的,并且特定于平台。我们展示了我们使用独立内核和端到端DL&HPC工作负载完全通过TPPS表达的方法的效力和生存性,这在多个平台上优于最先进的实现。
translated by 谷歌翻译