The usage of technologically advanced devices has seen a boom in many domains, including education, automation, and healthcare; with most of the services requiring Internet connectivity. To secure a network, device identification plays key role. In this paper, a device fingerprinting (DFP) model, which is able to distinguish between Internet of Things (IoT) and non-IoT devices, as well as uniquely identify individual devices, has been proposed. Four statistical features have been extracted from the consecutive five device-originated packets, to generate individual device fingerprints. The method has been evaluated using the Random Forest (RF) classifier and different datasets. Experimental results have shown that the proposed method achieves up to 99.8% accuracy in distinguishing between IoT and non-IoT devices and over 97.6% in classifying individual devices. These signify that the proposed method is useful in assisting operators in making their networks more secure and robust to security breaches and unauthorized access.
translated by 谷歌翻译
Learning linear temporal logic (LTL) formulas from examples labeled as positive or negative has found applications in inferring descriptions of system behavior. We summarize two methods to learn LTL formulas from examples in two different problem settings. The first method assumes noise in the labeling of the examples. For that, they define the problem of inferring an LTL formula that must be consistent with most but not all of the examples. The second method considers the other problem of inferring meaningful LTL formulas in the case where only positive examples are given. Hence, the first method addresses the robustness to noise, and the second method addresses the balance between conciseness and specificity (i.e., language minimality) of the inferred formula. The summarized methods propose different algorithms to solve the aforementioned problems, as well as to infer other descriptions of temporal properties, such as signal temporal logic or deterministic finite automata.
translated by 谷歌翻译
Angluin的L*算法使用会员资格和等价查询了解了常规语言的最低(完整)确定性有限自动机(DFA)。它的概率近似正确(PAC)版本用足够大的随机会员查询替换等效查询,以使答案获得高级信心。因此,它可以应用于任何类型的(也是非规范)设备,可以将其视为合成自动机的算法,该算法根据观测值抽象该设备的行为。在这里,我们对Angluin的PAC学习算法对通过引入一些噪音从DFA获得的设备感兴趣。更确切地说,我们研究盎格鲁因算法是否会降低噪声并产生与原始设备更接近原始设备的DFA。我们提出了几种介绍噪声的方法:(1)嘈杂的设备将单词的分类W.R.T.倒置。具有很小概率的DFA,(2)嘈杂的设备在询问其分类W.R.T.之前用小概率修改了单词的字母。 DFA和(3)嘈杂的设备结合了W.R.T.单词的分类。 DFA及其分类W.R.T.柜台自动机。我们的实验是在数百个DFA上进行的。直言不讳地表明,我们的主要贡献表明:(1)每当随机过程产生嘈杂的设备时,盎格鲁因算法的行为都很好,(2)但使用结构化的噪声却很差,并且(3)几乎肯定是随机性的产量具有非竞争性语言的系统。
translated by 谷歌翻译
意见摘要是创建摘要的任务,以获取用户评论中的流行意见。在本文中,我们介绍了Geodesic Summarizer(GeoSumm),这是一种新型系统,可执行无监督的提取意见摘要。 GeoSumm涉及基于编码器的表示模型,该模型将文本表示为潜在语义单元的分布。 GeoSumm通过在多个解码器层上对预训练的文本表示进行字典学习来生成这些表示。然后,我们使用这些表示形式使用新型的基于测量距离的评分机制来量化审查句子的相关性。我们使用相关得分来确定流行意见,以构成一般和特定方面的摘要。我们提出的模型GeoSumm在三个意见摘要数据集上实现了最先进的性能。我们执行其他实验来分析模型的功能,并展示跨不同域{\ x}的概括能力。
translated by 谷歌翻译
我们考虑使用人解剖模型来解释黑盒系统的时间行为的问题。为此,根据最近的研究趋势,我们依靠确定性有限自动机(DFAS)和线性时间逻辑(LTL)公式的基本但可解释的模型。与学习DFA和LTL公式的大多数现有作品相反,我们仅依靠积极的例子。我们的动机是,通常很难从黑盒系统中观察到负面例子。为了仅从积极的示例中学习有意义的模型,我们设计了依赖于模型作为正规化器的简洁性和语言最小性的算法。为此,我们的算法采用了两种方法:一种符号和反例引导。尽管符号方法利用语言最小值作为约束满意度问题的有效编码,但反例引入的人依靠生成合适的负面示例来修剪搜索。两种方法都为我们提供了有效的算法,并在学习模型上具有理论保证。为了评估我们的算法的有效性,我们在合成数据上评估了所有算法。
translated by 谷歌翻译
机器学习系统通常被部署用于做出关键决策,例如信用贷款,招聘等。在做出决策时,此类系统通常会在其中间表示中对用户的人口统计信息(例如性别,年龄)进行编码。这可能会导致对特定人口统计的决定。先前的工作集中在中间表示方面,以确保公正的决策。但是,随着任务或人口统计分布的变化,这些方法无法保持公平。为了确保野外的公平性,对于系统来说,适应以渐进方式访问新数据的更改很重要。在这项工作中,我们建议通过在渐进学习环境中介绍学习公平表示的问题来解决此问题。为此,我们介绍了公平意识的增量表示学习(FAIRL),这是一种代表学习系统,可以维持公平,同时逐步学习新任务。 Fairl能够通过控制学习表示的速度延伸功能来实现公平和学习新任务。我们的经验评估表明,Fairl能够在目标任务上实现高性能的同时做出公正的决定,表现优于几个基线。
translated by 谷歌翻译
原型网络(PN)是一个简单而有效的射击学习策略。这是一种基于公制的元学习技术,通过计算欧几里得距离到每个类的原型表示,可以执行分类。常规的PN属性对所有样品的重要性都具有相同的重要性,并通过简单地平均属于每个类的支持样品嵌入来生成原型。在这项工作中,我们提出了一种新颖的PN版本,该版本将权重归因于对应于它们对支持样本分布的影响的样品。根据样品分布的平均嵌入(包括样本和排除样品的平均嵌入)之间的最大平均差异(MMD)计算样品的影响权重。此外,在没有该样品的情况下,使用MMD根据分布的变化来测量样品的影响因子。
translated by 谷歌翻译
实际上,所有验证和综合技术都假定正式规格很容易获得,在功能上正确并完全匹配工程师对给定系统的理解。但是,在实践中,这种假设通常是不现实的:正式化系统要求非常困难,容易出错,并且需要大量的培训。为了减轻这一严重的障碍,我们提出了一种从根本上新颖的编写形式规范的方法,称为线性时间逻辑(LTL)的规范草图。关键的想法是,工程师可以提供部分LTL公式,称为LTL草图,在该公式中很难形式化。给定一组描述规范应该或不应允许的系统行为的示例,然后将所谓的草图算法的任务完成给定的草图,以使所得的LTL公式与示例一致。我们表明,决定是否可以完成草图属于复杂性NP,并呈现两个基于SAT的草图算法。我们还证明,素描是使用原型实现编写形式规格的实用方法。
translated by 谷歌翻译
通过机器学习模型学到的文本表示通常编码用户的不良人口统计信息。基于这些表示形式的预测模型可以依靠此类信息,从而产生偏见的决策。我们提出了一种新颖的偏见技术,即公平意识的速率最大化(农场),该技术使用速率依赖函数来消除受保护的信息,以表示属于相同受保护的属性类别的实例不相关。Farm能够在有或没有目标任务的情况下进行辩论式表示。还可以适应农场同时删除有关多个受保护属性的信息。经验评估表明,Farm在几个数据集上实现了最新的性能,并且学会的表示形式泄漏了受保护的属性信息明显减少,以防止非线性探测网络攻击。
translated by 谷歌翻译
在车辆场景中的毫米波链路的光束选择是一个具有挑战性的问题,因为所有候选光束对之间的详尽搜索都不能在短接触时间内被确认完成。我们通过利用像LIDAR,相机图像和GPS等传感器收集的多模级数据来解决这一问题。我们提出了可以在本地以及移动边缘计算中心(MEC)本地执行的个人方式和分布式融合的深度学习(F-DL)架构,并研究相关权衡。我们还制定和解决优化问题,以考虑实际的光束搜索,MEC处理和传感器到MEC数据传送延迟开销,用于确定上述F-DL架构的输出尺寸。在公开的合成和本土现实世界数据集上进行的广泛评估结果分别在古典RF光束上释放出95%和96%的束选择速度提高。在预测前10个最佳光束对中,F-DL还优于最先进的技术20-22%。
translated by 谷歌翻译