现在,民间传说要了解在线社交网络(OSN)平台中用户的活动模式,需要查看他的朋友或他所跟随的朋友。普遍的看法是,这些朋友会对用户产生影响,从而影响他的决定是否重新分享内容。呈现这种直觉,开发了各种模型,以预测信息在OSN中的传播方式,类似于感染在人群中的传播方式。在本文中,我们重新审视了这个世界观点并得出新的结论。给定一组用户$ v $,我们研究了预测用户$ u \ in v $中是否会在以下时间窗口中通过v $中的某些$ v \在v $中重新分享内容的任务。 $ v $在上一个时间窗口中。我们为此任务设计了几种算法,从仅学习$ u $ u $的条件概率分布的简单贪婪算法,忽略了$ v $的其余部分,到卷积神经网络基于卷积的神经网络算法,该算法接收了所有$ $的活动的活动v $,但没有明确收到社交链接结构。我们在Twitter收集的四个数据集上测试了我们的算法,每个数据集围绕2020年的另一个流行主题进行了旋转。在四个数据集中,最佳性能,平均F1分数为0.86,是通过卷积神经网络实现的。简单,社交链接无知的算法的平均F1得分为0.78。
translated by 谷歌翻译
本次调查绘制了用于分析社交媒体数据的生成方法的研究状态的广泛的全景照片(Sota)。它填补了空白,因为现有的调查文章在其范围内或被约会。我们包括两个重要方面,目前正在挖掘和建模社交媒体的重要性:动态和网络。社会动态对于了解影响影响或疾病的传播,友谊的形成,友谊的形成等,另一方面,可以捕获各种复杂关系,提供额外的洞察力和识别否则将不会被注意的重要模式。
translated by 谷歌翻译
能够推荐在线社交网络中用户之间的链接对于用户与志趣相投的个人以及利用社交媒体信息发展业务的平台本身和第三方联系很重要。预测通常基于无监督或监督的学习,通常利用简单而有效的图形拓扑信息,例如普通邻居的数量。但是,我们认为有关个人个人社会结构的更丰富信息可能会带来更好的预测。在本文中,我们建议利用良好的社会认知理论来提高链接预测绩效。根据这些理论,个人平均将自己的社会关系安排在五个同心圆下,以减少亲密关系。我们假设不同圈子中的关系在预测新链接方面具有不同的重要性。为了验证这一主张,我们专注于流行的功能萃取预测算法(既无监督和监督),并将其扩展到包括社交圈的意识。我们验证了这些圆圈感知算法对几个基准测试的预测性能(包括其基线版本以及基于节点的链接和GNN链接预测),利用了两个Twitter数据集,其中包括一个视频游戏玩家和通用用户的社区。我们表明,社会意识通常可以在预测绩效方面有重大改进,击败了Node2Vec和Seal等最新解决方案,而不会增加计算复杂性。最后,我们表明可以使用社交意识来代替针对特定类别用户的分类器(可能是昂贵或不切实际)的。
translated by 谷歌翻译
尽管社交媒体中的Echo Chambers受到了相当大的审查,但仍缺少用于检测和分析的一般模型。在这项工作中,我们旨在通过提出一个概率的生成模型来填补这一空白,该模型通过一系列具有一定程度的回声室行为来解释社交媒体足迹(即社交网络结构和信息传播)。并以极性。具体而言,回声室被建模为可渗透到具有相似意识形态极性的信息的社区,并且对相反的倾向信息不渗透:这允许将回声室与缺乏明确意识形态保持一致的社区区分。为了了解模型参数,我们提出了对广义期望最大化算法的可扩展的随机适应,该算法优化了观察社会联系和信息传播的关节可能性。合成数据的实验表明,我们的算法能够及其具有回声室行为和意见极性的程度正确地重建地面真相社区。关于两极分化社会和政治辩论的现实数据的实验,例如英国脱欧公投或COVID-19疫苗运动,证实了我们提议在检测回声室方面的有效性。最后,我们展示了我们的模型如何提高辅助预测任务的准确性,例如立场检测和未来传播的预测。
translated by 谷歌翻译
在明确的政治事件(例如选举)的背景下,经常对两极分化和回声室进行研究,而在非政治背景下,很少有学术研究检查了政治团体的混合。在非政治背景下研究政治两极分化的一个主要障碍是,政治倾向(即左派与右取向)通常是未知的。尽管如此,众所周知,政治倾向与许多生活方式选择相关联(有时很强),导致刻板印象,例如“拿铁咖啡自由主义者”。我们开发了一个机器学习分类器,以推断出从非政治文本中倾斜的政治倾向,并且可以选择地,用户在社交媒体上关注的帐户。我们使用在Twitter上共享的选民建议申请结果作为我们的地面图,并在Twitter数据集上训练并测试我们的分类器,其中包括3200个用户的3200个最新推文,此前删除了任何有政治文本的推文。我们将大多数用户的政治倾向正确分类(F1分数从0.70到0.85,具体取决于覆盖范围)。我们发现政治活动水平与我们的分类结果之间没有关系。我们将分类器应用于英国新闻共享的案例研究,发现一般而言,政治新闻的共享表现出独特的左右鸿沟,而体育新闻则没有。
translated by 谷歌翻译
社交网络(SN)是一个由代表它们之间相互作用的群体组成的社会结构。 SNS最近被广泛使用,随后已成为产品推广和信息扩散的合适平台。 SN中的人们直接影响彼此的利益和行为。 SNS中最重要的问题之一是,如果选择将它们作为网络扩散场景的种子节点选择,那么他们可以以级联的方式对网络中的其他节点产生最大影响。有影响力的扩散器是人们,如果他们被选为网络中出版问题中的种子,那么该网络将拥有最多了解该扩散实体的人。这是称为影响最大化(IM)问题的文献中的一个众所周知的问题。尽管已证明这是一个NP完整的问题,并且在多项式时间内没有解决方案,但有人认为它具有子模块化功能的属性,因此可以使用贪婪的算法来解决。提出改善这种复杂性的大多数方法都是基于以下假设:整个图都是可见的。但是,此假设不适合许多真实世界图。进行了这项研究,以扩展使用链接预测技术与伪可见性图的电流最大化方法。为此,将一种称为指数随机图模型(ERGM)的图生成方法用于链接预测。使用斯坦福大学SNAP数据集的数据对所提出的方法进行了测试。根据实验测试,所提出的方法在现实世界图上有效。
translated by 谷歌翻译
The detection of state-sponsored trolls acting in information operations is an unsolved and critical challenge for the research community, with repercussions that go beyond the online realm. In this paper, we propose a novel AI-based solution for the detection of state-sponsored troll accounts, which consists of two steps. The first step aims at classifying trajectories of accounts' online activities as belonging to either a state-sponsored troll or to an organic user account. In the second step, we exploit the classified trajectories to compute a metric, namely "troll score", which allows us to quantify the extent to which an account behaves like a state-sponsored troll. As a study case, we consider the troll accounts involved in the Russian interference campaign during the 2016 US Presidential election, identified as Russian trolls by the US Congress. Experimental results show that our approach identifies accounts' trajectories with an AUC close to 99\% and, accordingly, classify Russian trolls and organic users with an AUC of 97\%. Finally, we evaluate whether the proposed solution can be generalized to different contexts (e.g., discussions about Covid-19) and generic misbehaving users, showing promising results that will be further expanded in our future endeavors.
translated by 谷歌翻译
预测Twitter等社交媒体用户的地理位置已经发现了几种在健康监测,紧急监测,内容个性化和社会研究中的应用。在这项工作中,我们通过设计和评估基于加权多层的文献的新方法对该领域的研究有助于与最先进的深度学习技术相结合。探索的方法从类似的底层结构(扩展提及和/或跟随网络)出发,而是使用不同的信息处理策略,例如,通过转换和归纳算法 - RGCNS和GraphSage的信息扩散,以及节点嵌入node2vec +。然后,这些图形与注意机制结合到将用户的文本视图结合到模型中。我们评估每个方法的性能,并将它们与基线模型进行比较,在公开的推特 - 美国数据集中;我们还根据拉丁美洲的大型Twitter捕获,提供新的数据集。最后,我们的工作讨论了在不同标签定义和指标的背景下的方法中的比较的局限性和有效性。
translated by 谷歌翻译
Recently, online social media has become a primary source for new information and misinformation or rumours. In the absence of an automatic rumour detection system the propagation of rumours has increased manifold leading to serious societal damages. In this work, we propose a novel method for building automatic rumour detection system by focusing on oversampling to alleviating the fundamental challenges of class imbalance in rumour detection task. Our oversampling method relies on contextualised data augmentation to generate synthetic samples for underrepresented classes in the dataset. The key idea exploits selection of tweets in a thread for augmentation which can be achieved by introducing a non-random selection criteria to focus the augmentation process on relevant tweets. Furthermore, we propose two graph neural networks(GNN) to model non-linear conversations on a thread. To enhance the tweet representations in our method we employed a custom feature selection technique based on state-of-the-art BERTweet model. Experiments of three publicly available datasets confirm that 1) our GNN models outperform the the current state-of-the-art classifiers by more than 20%(F1-score); 2) our oversampling technique increases the model performance by more than 9%;(F1-score) 3) focusing on relevant tweets for data augmentation via non-random selection criteria can further improve the results; and 4) our method has superior capabilities to detect rumours at very early stage.
translated by 谷歌翻译
情绪预测在心理健康和情绪感知计算中起着至关重要的作用。情绪的复杂性质是由于其对一个人的生理健康,精神状态和周围环境的依赖而产生的,这使其预测一项艰巨的任务。在这项工作中,我们利用移动传感数据来预测幸福和压力。除了一个人的生理特征外,我们还通过天气和社交网络纳入了环境的影响。为此,我们利用电话数据来构建社交网络并开发机器学习体系结构,该架构从图形网络的多个用户中汇总信息,并将其与数据的时间动态集成在一起,以预测所有用户的情感。社交网络的构建不会在用户的EMA或数据收集方面产生额外的成本,也不会引起隐私问题。我们提出了一种自动化用户社交网络影响预测的架构,能够处理现实生活中社交网络的动态分布,从而使其可扩展到大规模网络。我们广泛的评估突出了社交网络集成提供的改进。我们进一步研究了图形拓扑对模型性能的影响。
translated by 谷歌翻译
随着越来越受欢迎和易于访问互联网,在线谣言的问题正在升级。人们依靠社交媒体,易于获取信息,但将牺牲猎物陷入错误信息。在线帖子缺乏可信度评估技术,以便在到达时立即识别谣言。现有研究制定了通过开发机器学习和深度学习算法来打击在线谣言的若干机制。到目前为止的文献为凭借巨大的训练数据集提供了谣言分类的监督框架。然而,在监督学习的在线情景中,动态谣言识别变得困难。在线谣言的早期检测是一个具有挑战性的任务,与他们有关的研究相对较少。只要在线出现,就需要小时才能识别谣言。这项工作提出了一种简洁的谣言检测框架,依赖于在线帖子的内容和使用最先进的聚类技术。拟议的体系结构优于几种现有基线,并且比几种监督技术更好。提出的方法,轻巧,简单,坚固,提供了作为在线谣言识别的工具采用的适用性。
translated by 谷歌翻译
过去,现实世界中社交网络的图表错过了两个重要元素:连接的多重性和表示时间。为此,在本文中,我们为社交网络提供了一个新的动态异质图表示,其中包括图形的每个组件中的时间,即节点和边缘,每种捕获异质性的不同类型。我们通过提出四个与时间有关的查询和深度学习问题来说明这种表示的力量,这些查询和深度学习问题无法轻易在常规的均匀图表中处理。作为概念的证明,我们介绍了新的社交媒体平台(Steemit)的详细表示,我们用它来说明动态查询功能以及使用图形神经网络(GNNS)的预测任务。结果说明了动态异质图表示对社交网络的模型的力量。鉴于这是一个相对研究的领域,我们还说明了在查询优化方面的未来工作以及异质图结构的新动态预测任务的机会。
translated by 谷歌翻译
社交媒体的回声室是一个重要的问题,可以引起许多负面后果,最近影响对Covid-19的响应。回声室促进病毒的阴谋理论,发现与疫苗犹豫不决,较少遵守面具授权,以及社会疏散的实践。此外,回声室的问题与政治极化等其他相关问题相连,以及误导的传播。回声室被定义为用户网络,用户只与支持其预先存在的信仰和意见的意见相互作用,并且他们排除和诋毁其他观点。本调查旨在从社会计算的角度检查社交媒体上的回声室现象,并为可能的解决方案提供蓝图。我们调查了相关文献,了解回声室的属性以及它们如何影响个人和社会。此外,我们展示了算法和心理的机制,这导致了回声室的形成。这些机制可以以两种形式表现出:(1)社交媒体推荐系统的偏见和(2)内部偏见,如确认偏见和精梳性。虽然减轻内部偏见是非常挑战的,但努力消除推荐系统的偏见。这些推荐系统利用我们自己的偏见来个性化内容建议,以使我们参与其中才能观看更多广告。因此,我们进一步研究了回声室检测和预防的不同计算方法,主要基于推荐系统。
translated by 谷歌翻译
Covid-19的传播引发了针对亚洲社区的社交媒体的种族主义和仇恨。然而,关于种族仇恨在大流行期间的差异和柜台垂直在减轻这种蔓延的角色时,很少见过。在这项工作中,我们研究了通过推特镜头的反亚洲仇恨演讲的演变和传播。我们创建了Covid-讨厌,这是一个跨越14个月的反亚洲仇恨和柜台的最大数据集,含有超过2.06亿推文,以及超过1.27亿节节点的社交网络。通过创建一个新的手工标记数据集,3,355推文,我们培训文本分类器以识别仇恨和柜台jeech推文,以实现0.832的平均宏F1得分。使用此数据集,我们对推文和用户进行纵向分析。社交网络的分析揭示了可恨和柜台的用户互相互动,彼此广泛地互动,而不是生活在孤立的极化社区中。我们发现在暴露于仇恨内容后,节点很可能变得仇恨。值得注意的是,柜台椎间目可能会阻止用户转向仇恨,可能暗示在Web和社交媒体平台上遏制讨厌的解决方案。数据和代码是在http://claws.cc.gatech.edu/covid。
translated by 谷歌翻译
推文是在线社交媒体中最简洁的交流形式,其中一条推文有可能制作或打破对话的话语。在线仇恨言论比以往任何时候都更容易访问,并且扼杀其传播对于社交媒体公司和用户进行友好沟通至关重要。除了最近的一条推文分类,无论导致这一点的推文线程/上下文如何,大多数研究都集中在对单个推文进行分类。遏制仇恨言论的经典方法之一是在仇恨言论邮寄后采用反应性策略。事实上的事实策略导致忽略了微妙的帖子,这些帖子并未显示出自己激发仇恨言论的潜力,但可能会在随后在帖子的答复中随后的讨论中进行预言。在本文中,我们提出了Dragnet ++,该论文旨在预测推文可以通过其未来的回复链引入的仇恨强度。它使用推文线程的语义和传播结构来最大化导致每个后续推文的仇恨强度的上下文信息。我们探索了三个公开可用的Twitter数据集 - 反种族主义包含有关社交媒体讨论在美国政治和COVID-19的背景期间关于种族主义言论的回答推文;反社会介绍了一个关于反社会行为的19000万推文的数据集;和反亚洲介绍了基于19日大流行期间的反亚洲行为的Twitter数据集。所有策划的数据集都包含Tweet线程的结构图信息。我们表明,Dragnet ++的表现大大优于所有最先进的基线。它比人相关系数的最佳基线降低了11 \%的利润率,而反种族主义数据集则在RMSE上降低了25 \%,而其他两个数据集则具有相似的性能。
translated by 谷歌翻译
社交媒体在现代社会中尤其是在西方世界中的政策制定方面已经变得极其影响力(例如,48%的欧洲人每天或几乎每天都使用社交媒体)。 Twitter之类的平台使用户可以关注政客,从而使公民更多地参与政治讨论。同样,政客们使用Twitter来表达他们的观点,在当前主题上进行辩论,并促进其政治议程,以影响选民行为。先前的研究表明,传达负面情绪的推文可能会更频繁地转发。在本文中,我们试图分析来自不同国家的政客的推文,并探索他们的推文是否遵循相同的趋势。利用最先进的预训练的语言模型,我们对从希腊,西班牙和英国的成千上万的推文进行了情感分析,包括权威的行政部门。我们通过系统地探索和分析有影响力和不流行的推文之间的差异来实现这一目标。我们的分析表明,政治家的负面推文更广泛地传播,尤其是在最近的时代,并突出了情感和受欢迎程度相交的有趣趋势。
translated by 谷歌翻译
为了解决疫苗犹豫不决,这会损害COVID-19疫苗接种运动的努力,必须了解公共疫苗接种态度并及时掌握其变化。尽管具有可靠性和可信赖性,但基于调查的传统态度收集是耗时且昂贵的,无法遵循疫苗接种态度的快速发展。我们利用社交媒体上的文本帖子通过提出深入学习框架来实时提取和跟踪用户的疫苗接种立场。为了解决与疫苗相关话语中常用的讽刺和讽刺性的语言特征的影响,我们将用户社交网络邻居的最新帖子集成到框架中,以帮助检测用户的真实态度。根据我们从Twitter的注释数据集,与最新的仅文本模型相比,从我们框架实例化的模型可以提高态度提取的性能高达23%。使用此框架,我们成功地验证了使用社交媒体跟踪现实生活中疫苗接种态度的演变的可行性。我们进一步显示了对我们的框架的一种实际用途,它可以通过从社交媒体中感知到的信息来预测用户疫苗犹豫的变化的可能性。
translated by 谷歌翻译
本研究的目的是通过整合基于物理和人类感知的特征来开发和测试城市洪播北卡斯的新型结构化深度学习建模框架。我们提出了一种新的计算建模框架,包括基于关注的空间 - 时间图卷积网络(ASTGCN)模型以及实时收集的不同数据流,并在模型中收集,以考虑空间和时间信息和依赖项这改善了洪涝灾害。计算建模框架的新颖性是三倍;首先,由于空间和时间图卷积模块,该模型能够考虑淹没传播中的空间和时间依赖性;其次,它使得能够捕获异构时间数据流的影响,这些数据流可以发挥洪水状态,包括基于物理的特征,例如降雨强度和水高度,以及人类感知数据,例如洪水报告和人类活动的波动。第三,其注意机制使模型能够将其关注最有影响力的特征指示。我们展示了建模框架在德克萨斯州哈里斯县的背景下作为洪水事件的案例研究和飓风。结果表明,该模型为人口普查道级别的城市洪水淹没了卓越的性能,精度为0.808,并召回0.891,这与其他一些新颖的模型相比表现出更好的表现更好。此外,ASTGCN模型性能提高了异构动态功能,仅依赖于基于物理的特征,这表明了使用异源人类感测数据的洪水截图,
translated by 谷歌翻译
最近受到在线叙述驱动的疫苗犹豫会大大降低了疫苗接种策略的功效,例如Covid-19。尽管医学界对可用疫苗的安全性和有效性达成了广泛的共识,但许多社交媒体使用者仍被有关疫苗的虚假信息淹没,并且柔和或不愿意接种疫苗。这项研究的目的是通过开发能够自动识别负责传播反疫苗叙事的用户的系统来更好地理解反疫苗情绪。我们引入了一个公开可用的Python软件包,能够分析Twitter配置文件,以评估该个人资料将来分享反疫苗情绪的可能性。该软件包是使用文本嵌入方法,神经网络和自动数据集生成的,并接受了数百万条推文培训。我们发现,该模型可以准确地检测出抗疫苗用户,直到他们推文抗Vaccine主题标签或关键字。我们还展示了文本分析如何通过检测Twitter和常规用户之间的抗疫苗传播器之间的道德和情感差异来帮助我们理解反疫苗讨论的示例。我们的结果将帮助研究人员和政策制定者了解用户如何成为反疫苗感以及他们在Twitter上讨论的内容。政策制定者可以利用此信息进行更好的针对性的运动,以揭露有害的反疫苗接种神话。
translated by 谷歌翻译
社交媒体的自杀意图检测是一种不断发展的研究,挑战了巨大的挑战。许多有自杀倾向的人通过社交媒体平台分享他们的思想和意见。作为许多研究的一部分,观察到社交媒体的公开职位包含有价值的标准,以有效地检测有自杀思想的个人。防止自杀的最困难的部分是检测和理解可能导致自杀的复杂风险因素和警告标志。这可以通过自动识别用户行为的突然变化来实现。自然语言处理技术可用于收集社交媒体交互的行为和文本特征,这些功能可以传递给特殊设计的框架,以检测人类交互中的异常,这是自杀意图指标。我们可以使用深度学习和/或基于机器学习的分类方法来实现快速检测自杀式思想。出于这种目的,我们可以采用LSTM和CNN模型的组合来检测来自用户的帖子的这种情绪。为了提高准确性,一些方法可以使用更多数据进行培训,使用注意模型提高现有模型等的效率。本文提出了一种LSTM-Incription-CNN组合模型,用于分析社交媒体提交,以检测任何潜在的自杀意图。在评估期间,所提出的模型的准确性为90.3%,F1分数为92.6%,其大于基线模型。
translated by 谷歌翻译