arxiv每日论文151(Arxiv网络科学论文摘要16篇)
- 基于样本的网络推断和影响力最大化;
- 通过邻域 Wasserstein 重建的图自动编码器;
- 一种用于重排序邻接矩阵的深度生成模型;
- 剖析LFR 参数空间中节点聚类的图度量表现;
- 拆解复杂互联系统中的信息流;
- 使用 XGBoost 和概率混合模型模拟用户级 Twitter 活动;
- 识别 Twitter 话语中针对 COVID-19 疫苗的错误信息的采用或拒绝;
- VaccineLies:一种自然语言资源,用于学习识别有关 COVID-19 和 HPV 疫苗的错误信息;
- 从犹豫框架到疫苗犹豫概况:立场、本体论承诺和道德基础之旅;
- 乘车服务是否会应对计划外的铁路中断?移动弹性和差异的自然实验分析;
- 对抗性文本扰动的数据驱动缓解;
- 网络平台与同质化下的公平曝光问题;
- PGE:用于错误检测的稳健产品图嵌入学习;
- 由于有益而昂贵的传染而导致的社会性社会困境;
- 非马尔可夫流行病模型的动态生存分析;
- EINNs:流行病学信息神经网络;
原文标题: Network Inference and Influence Maximization from Samples
地址: http://arxiv.org/abs/2106.03403
作者: Zhijie Zhang, Wei Chen, Xiaoming Sun, Jialin Zhang
摘要: 影响力最大化是在社会网络中选择少量种子节点以最大化从这些种子传播的影响力的任务。在过去的二十年里,它已被广泛研究。在规范设置中,社会网络及其扩散参数作为输入给出。在本文中,我们考虑了更现实的采样设置,其中网络未知,我们只有一组被动观察的级联,记录每个扩散步骤中激活节点的集合。我们研究了这些级联样本 (IMS) 的影响最大化任务,并在种子集分布的温和条件下为其提供了常数逼近算法。为了实现优化目标,我们还为网络推理问题提供了一种新颖的解决方案,即从级联数据中学习扩散参数和网络结构。与之前的解决方案相比,我们的网络推理算法需要更弱的假设,并且不依赖于最大似然估计和凸规划。我们的 IMS 算法通过允许恒定的近似比来增强学习然后优化方法,即使在扩散参数难以学习的情况下,我们也不需要任何与网络结构或扩散参数相关的假设。
通过邻域 Wasserstein 重建的图自动编码器原文标题: Graph Auto-Encoder Via Neighborhood Wasserstein Reconstruction
地址: http://arxiv.org/abs/2202.09025
作者: Mingyue Tang, Carl Yang, Pan Li
摘要: 图神经网络(GNN)最近引起了广泛的研究关注,主要是在半监督学习的背景下。当首选与任务无关的表示或监督根本不可用时,自动编码器框架会派上用场,它具有用于无监督 GNN 训练的自然图重建目标。然而,现有的图自动编码器旨在重建直接链接,因此以这种方式训练的 GNN 仅针对面向邻近的图挖掘任务进行优化,并且在拓扑结构很重要时会达不到要求。在这项工作中,我们重新审视了 GNN 的图编码过程,该过程本质上是学习将每个节点的邻域信息编码为嵌入向量,并提出了一种新的图解码器,通过 Neighborhood Wasserstein Reconstruction 重建有关邻近度和结构的整个邻域信息。西北地区)。具体来说,从每个节点的 GNN 嵌入中,NWR 联合预测其节点度和邻居特征分布,其中分布预测采用基于 Wasserstein 距离的最优传输损失。在合成和真实世界网络数据集上的大量实验表明,使用 NWR 学习的无监督节点表示在面向结构的图挖掘任务中具有更大的优势,同时在面向邻近的任务中也具有竞争性能。
一种用于重排序邻接矩阵的深度生成模型原文标题: A Deep Generative Model for Reordering Adjacency Matrices
地址: http://arxiv.org/abs/2110.04971
作者: Oh-Hyun Kwon, Chiun-How Kao, Chun-houh Chen, Kwan-Liu Ma
摘要: 根据节点排序,邻接矩阵可以突出图的不同特征。因此,导出“正确”节点排序是将图可视化为邻接矩阵的关键步骤。用户经常使用不同的方法尝试多次矩阵重新排序,直到找到满足分析目标的一种。然而,这种试错法既费力又杂乱无章,这对新手来说尤其具有挑战性。本文介绍了一种技术,使用户能够毫不费力地找到他们想要的矩阵重新排序。具体来说,我们设计了一个生成模型,该模型学习给定图的不同矩阵重新排序的潜在空间。我们还通过创建各种矩阵重新排序的映射,从学习的潜在空间构建直观的用户界面。我们通过对生成的重新排序和学习的潜在空间的定量和定性评估来展示我们的方法。结果表明,我们的模型能够学习各种矩阵重新排序的潜在空间。该领域的大多数现有研究通常集中在开发可以针对特定情况计算“更好”矩阵重新排序的算法。本文介绍了一种全新的图矩阵可视化方法,其中机器学习模型学习生成图的各种矩阵重新排序。
剖析LFR 参数空间中节点聚类的图度量表现原文标题: Dissecting graph measure performance for node clustering in LFR parameter space
地址: http://arxiv.org/abs/2202.09827
作者: Vladimir Ivashkin, Pavel Chebotarev
摘要: 表示节点之间的接近度或距离的图度量可以用于使用度量聚类算法的图节点聚类。有许多措施适用于这项任务,哪一个表现更好是一个悬而未决的问题。我们研究了 25 种图度量在具有不同参数的生成图上的性能。虽然通常度量比较仅限于特定数据集上的一般度量排名,但我们的目标是根据图特征探索各种度量的性能。使用 LFR 图生成器,我们创建了一个包含 11780 个图的数据集,涵盖了整个 LFR 参数空间。对于每个图,我们使用 k-means 算法评估每个考虑的度量的聚类质量。基于此,我们确定参数空间每个区域的最佳度量。我们发现参数空间由不同的区域组成,其中一种特定的度量是最好的。我们分析结果区域的几何形状并用简单的标准对其进行描述。给定特定的图参数,这使我们能够推荐用于聚类的特定度量。
拆解复杂互联系统中的信息流原文标题: Dismantling the information flow in complex interconnected systems
地址: http://arxiv.org/abs/2202.09692
作者: Arsham Ghavasieh, Giulia Bertagnolli, Manlio De Domenico
摘要: 微观结构损伤,例如神经系统的损伤或城市交通网络的中断,可能会在更大的拓扑尺度上分别损害对系统功能至关重要的动力学,例如电化学信号或人流,或任何其他类型的信息交换。损坏通常通过逐步移除组件或连接来建模,因此,系统的稳健性是根据其结构分裂成断开连接的子系统的速度来评估的。然而,这种方法未能捕捉到损伤如何阻碍跨尺度信息的传播,因为即使没有碎片,系统功能也会退化——例如,病态但结构整合的人脑。在这里,我们探讨了对复杂网络顶部动态过程损伤的响应,以研究这种信息流是如何受到影响的。我们发现移除网络连接的中心节点可能会产生微不足道的影响,这挑战了传统的假设,即仅结构指标就足以深入理解复杂系统的运行方式。使用明确考虑流动动力学的破坏性协议,我们分析了从生物到基础设施的合成和经验系统,并表明有可能在完全结构解体之前将系统推向功能碎片化。
使用 XGBoost 和概率混合模型模拟用户级 Twitter 活动原文标题: Simulating User-Level Twitter Activity with XGBoost and Probabilistic Hybrid Models
地址: http://arxiv.org/abs/2202.08964
作者: Fred Mubang, Lawrence Hall
摘要: Volume-Audience-Match 模拟器或 VAM 被应用于预测 Twitter 上与国际经济事务相关的未来活动。应用 VAM 进行时间序列预测以预测:(1)总活动数,(2)活跃老用户数,以及(3)从预测开始时间开始的 24 小时内的新活跃用户数。 VAM 然后使用这些体积预测来执行用户链路预测。在未来的 24 个时间步中,每个活动都分配了一个用户-用户边。 VAM 在时间序列和用户分配任务中都大大优于一组基线模型
识别 Twitter 话语中针对 COVID-19 疫苗的错误信息的采用或拒绝原文标题: Identifying the Adoption or Rejection of Misinformation Targeting COVID-19 Vaccines in Twitter Discourse
地址: http://arxiv.org/abs/2202.09445
作者: Maxwell Weinzierl, Sanda Harabagiu
摘要: 尽管已经接种了数十亿剂 COVID-19 疫苗,但仍有太多人犹豫不决。人们认为,在社交媒体上传播的有关 COVID-19 疫苗的错误信息会导致人们对疫苗接种犹豫不决。然而,暴露于错误信息并不一定表明错误信息的采用。在本文中,我们描述了一个新的框架,用于根据态度一致性及其属性来识别对错误信息的立场。态度一致性、接受或拒绝错误信息与微博内容之间的相互作用在一种新的神经架构中得到了利用,其中对错误信息的立场被组织在一个知识图中。这种新的神经框架能够以最先进的结果识别对有关 COVID-19 疫苗的错误信息的立场。这些实验是在一个新的关于 COVID-19 疫苗的错误信息数据集(称为 CoVaxLies)上进行的,该数据集是从最近的 Twitter 讨论中收集的。由于 CoVaxLies 提供了有关 COVID-19 疫苗的错误信息的分类,我们能够显示哪种类型的错误信息最常被采用,而哪种类型的错误信息大多被拒绝。
VaccineLies:一种自然语言资源,用于学习识别有关 COVID-19 和 HPV 疫苗的错误信息原文标题: VaccineLies: A Natural Language Resource for Learning to Recognize Misinformation about the COVID-19 and HPV Vaccines
地址: http://arxiv.org/abs/2202.09449
作者: Maxwell Weinzierl, Sanda Harabagiu
摘要: 已经接种了数十亿剂 COVID-19 疫苗,但许多人仍然犹豫不决。人们认为,在社交媒体上传播的有关 COVID-19 疫苗和其他疫苗的错误信息会导致人们对疫苗接种犹豫不决。自动识别 Twitter 上针对疫苗的错误信息的能力取决于数据资源的可用性。在本文中,我们介绍了 VaccineLies,这是一组大量传播有关两种疫苗的错误信息的推文:COVID-19 疫苗和人乳头瘤病毒 (HPV) 疫苗。错误信息目标按疫苗特定分类法进行组织,揭示了错误信息的主题和关注点。错误信息分类法的本体论承诺提供了一种理解,即哪些错误信息主题和担忧主导了有关疫苗谎言中涵盖的两种疫苗的讨论。 VaccineLies 的培训、测试和开发集的组织邀请开发新的监督方法来检测 Twitter 上的错误信息并确定对它的立场。此外,VaccineLies 可以成为开发专注于针对其他疫苗的错误信息的数据集的垫脚石。
从犹豫框架到疫苗犹豫概况:立场、本体论承诺和道德基础之旅原文标题: From Hesitancy Framings to Vaccine Hesitancy Profiles: A Journey of Stance, Ontological Commitments and Moral Foundations
地址: http://arxiv.org/abs/2202.09456
作者: Maxwell Weinzierl, Sanda Harabagiu
摘要: 尽管已经接种了数十亿剂 COVID-19 疫苗,但仍有太多人犹豫不决。 Twitter 具有广泛的影响力和每日曝光率,是一个很好的资源,可以用来检查人们如何构建他们的疫苗犹豫情况并揭示疫苗犹豫情况。在本文中,我们揭示了我们的处理过程,从识别 9,133,471 条讨论 COVID-19 疫苗的原始推文中的疫苗犹豫框架,建立它们的本体论承诺,注释它们暗示的道德基础到自动识别推文作者的立场我们已识别的任何 CoVaxFrames。当我们发现 805,336 位 Twitter 用户在 9,133,471 条原始推文或他们的 17,346,664 条转推中对某些 CoVaxFrames 持立场时,我们能够推导出这些用户的 9 种不同的疫苗犹豫配置文件,并根据框架的本体承诺解释这些配置文件他们在推文中唤起了他们对唤起框架的立场的价值。
乘车服务是否会应对计划外的铁路中断?移动弹性和差异的自然实验分析原文标题: Does ridesourcing respond to unplanned rail disruptions? A natural experiment analysis of mobility resilience and disparity
地址: http://arxiv.org/abs/2202.09466
作者: Elisa Borowski, Jason Soria, Joseph Schofer, Amanda Stathopoulos
摘要: 城市轨道交通网络为许多城市系统提供了获得机会和生计的重要途径。确保这些服务具有弹性(即表现出对中断的有效响应和从中断中恢复)是一项关键的经济和社会优先事项。城市轨道系统应对中断的能力越来越多地取决于复杂的交通选择拼凑而成,其中替代模式可以补充和填补服务空白。本研究分析了乘车服务在提供适应性移动能力方面的作用,该能力可用于填补轨道交通服务中的无通知差距,解决弹性的分配影响问题。通过自然实验,我们系统地确定了芝加哥一年内发生的 28 次重大交通中断,并在时间和空间上将它们与拼车出行数据相匹配。使用多层次混合建模,我们量化了芝加哥这个种族和经济多样化城市的按需出行适应性使用的变化。我们的研究结果表明,在轨道交通中断期间,自适应乘车服务的差距填补潜力受到车站、社区和地区层面因素的显著影响。具体来说,在工作日、非节假日和更严重的中断期间,在白人居民和过境通勤者比例较高的社区地区,以及在城市更富裕的北区,更多地转向乘车服务。这些研究结果表明,虽然乘车服务似乎在铁路中断期间提供了适应能力,但它的好处似乎对已经经历了有限流动选择的低收入有色人种社区来说并不公平。
对抗性文本扰动的数据驱动缓解原文标题: Data-Driven Mitigation of Adversarial Text Perturbation
地址: http://arxiv.org/abs/2202.09483
作者: Rasika Bhalerao, Mohammad Al-Rubaie, Anand Bhaskar, Igor Markov
摘要: 社会网络已成为我们生活中不可或缺的一部分,数十亿人产生了越来越多的文本。在这样的规模下,内容政策及其执行变得至关重要。为了自动审核,自然语言处理 (NLP) 分类器会检测可疑内容。然而,高性能分类器受到拼写错误和对抗性文本扰动的阻碍。在本文中,我们将有意和无意的对抗性文本扰动分为十种类型,并提出了一种去混淆管道,以使 NLP 模型对这种扰动具有鲁棒性。我们提出了 Continuous Word2Vec (CW2V),这是我们的数据驱动学习词嵌入的方法,可确保词的扰动具有与原始词相似的嵌入。我们表明,与基于字符 ngram 的嵌入相比,CW2V 嵌入通常对文本扰动具有更强的鲁棒性。我们强大的分类管道结合了反混淆和分类,使用建议的防御方法和词嵌入来分类 Facebook 帖子是否请求参与,例如喜欢。我们的管道导致参与诱饵分类从 0.70 到 0.67 AUC 与对抗性文本扰动,而基于字符 ngram 的词嵌入方法导致下游分类从 0.76 到 0.64。
网络平台与同质化下的公平曝光问题原文标题: Online Platforms and the Fair Exposure Problem Under Homophily
地址: http://arxiv.org/abs/2202.09727
作者: Jakob Schoeffer, Alexander Ritchie, Keziah Naggita, Faidra Monachou, Jessie Finocchiaro, Marc Juarez
摘要: 随着政治极端主义的加剧,在线平台因助长两极分化而受到批评。一种批评集中在回声室和这些平台向用户提供的推荐内容上。在这项工作中,我们引入了公平曝光问题:在平台干预能力有限的情况下,目标是通过类似于公平所施加的约束来强制两组用户之间的内容(例如,新闻文章)传播平衡美国过去的学说。群体的特点是不同的隶属关系(例如,政治观点)并且对内容有不同的偏好。我们开发了一个程式化的框架,在同质性下对组内和组间的内容传播进行建模,并且我们将平台的决策制定为一个优化问题,旨在最大限度地提高用户参与度,可能在公平约束下。我们的主要公平概念要求每个群体看到他们喜欢和不喜欢的内容的混合,鼓励信息多样性。促进这种信息多样性通常被认为是可取的,也是打破有害回声室的潜在手段。我们研究了公平不可知和公平感知问题的解决方案。我们证明,与公平无关的方法不可避免地会导致平台的群体同质化目标。通过施加公平约束只能部分缓解这种情况:我们表明,存在最优的公平感知解决方案,该解决方案针对具有不同类型内容的一个组,而另一组仅针对一种不一定是该组最喜欢的类型。最后,使用真实世界数据的模拟,我们研究系统动力学并量化公平的价格。
PGE:用于错误检测的稳健产品图嵌入学习原文标题: PGE: Robust Product Graph Embedding Learning for Error Detection
地址: http://arxiv.org/abs/2202.09747
作者: Kewei Cheng, Xian Li, Yifan Ethan Xu, Xin Luna Dong, Yizhou Sun
摘要: 尽管近年来产品图(PGs)因其在产品搜索和推荐中的成功应用而受到越来越多的关注,但由于不可避免地涉及各种错误,PGs的广泛功能可能会受到限制。因此,验证 PG 中三元组的正确性以提高其可靠性至关重要。知识图(KG)嵌入方法具有很强的错误检测能力。然而,现有的 KG 嵌入方法可能并不直接适用于 PG,因为它具有明显的特点:(1)PG 包含丰富的文本信号,需要对文本信息和图结构进行联合探索; (2) PG包含大量的属性三元组,其中属性值由自由文本表示。由于自由文本过于灵活,无法在 KG 中定义实体,因此使用 id 将实体映射到其嵌入的传统方法不再适用于属性值表示; (3) PG 中的嘈杂三元组会误导嵌入学习并严重损害错误检测的性能。为理解决上述挑战,我们提出了一种端到端的抗噪嵌入学习框架 PGE,以共同利用 PG 中的文本信息和图结构来学习嵌入以进行错误检测。真实世界产品图的实验结果证明了所提出的框架与最先进的方法相比的有效性。
由于有益而昂贵的传染而导致的社会性社会困境原文标题: Social dilemmas of sociality due to beneficial and costly contagion
地址: http://arxiv.org/abs/2202.09905
作者: Daniel B. Cooney, Dylan H. Morris, Simon A. Levin, Daniel I. Rubenstein, Pawel Romanczuk
摘要: 自然界的社会性水平差异很大。有些物种是孤独的;其他人生活在家庭团体中;有些形成了复杂的多家庭社会。社会互动水平的提高可以促进有用的创新和有益信息的传播,但也可以促进有害传染病的传播,例如传染病。很自然地假设这些传染过程塑造了复杂社会系统的演变,但在传染施加的选择压力下对社会性动态的明确描述仍然难以捉摸。我们考虑了一个模型,用于在存在有益和代价高昂的传染的情况下发展社交策略。我们在三个时间尺度上研究该模型的动态:使用易感-感染-易感 (SIS) 模型来描述给定社交策略的传染传播,复制方程来研究两个不同社交水平的变化部分,以及自适应动态研究人口社会性水平长期演变的方法。对于关于感染的收益和成本的广泛假设,我们确定了一个社会困境:演化稳定的社会性策略 (ESS) 不同于集体最优——对所有个人来说都是最好的社会性水平。特别是,当良好传染比不良传染更容易(分别更小)传播时,社会互动的 ESS 水平大于(分别小于)社会最优值。我们的研究结果揭示了传染如何影响社会互动的演变,但也揭示了演化不一定会导致人群进入对任何人或所有人都有利的社会结构。
非马尔可夫流行病模型的动态生存分析原文标题: Dynamic Survival Analysis for non-Markovian Epidemic Models
地址: http://arxiv.org/abs/2202.09948
作者: Francesco Di Lauro, Wasiur R. KhudaBukhsh, Istvan Z. Kiss, Eben Kenah, Max Jensen, Grzegorz A. Rempala
摘要: 我们提出了一种在最小假设下分析随机流行病模型的新方法。这种被称为 DSA 的方法基于一个简单而强大的观察,即 PDE 系统描述的群体水平平均场轨迹也可能近似于个体水平的感染和恢复时间。这个想法产生了某种基于非马尔可夫主体的模型,并为感染和/或恢复时间的随机样本提供了主体级别的似然函数。对来自英国 FMD 和印度 COVID-19 的合成和真实流行病数据的广泛数值分析显示出良好的准确性,并证实了该方法在基于似然的参数估计中的多功能性。随附的软件包为潜在用户提供了一个实用工具,用于借助 DSA 方法对流行病数据进行建模、分析和解释。
EINNs:流行病学信息神经网络原文标题: EINNs: Epidemiologically-Informed Neural Networks
地址: http://arxiv.org/abs/2202.10446
作者: Alexander Rodríguez, Jiaming Cui, Naren Ramakrishnan, Bijaya Adhikari, B. Aditya Prakash
摘要: 我们引入了一类新的基于物理的神经网络——EINN——为流行病预测而设计。我们研究如何利用机械模型提供的理论灵活性以及 AI 模型提供的数据驱动的可表达性来摄取异构信息。尽管神经预测模型在多项任务中取得了成功,但长期预测和预测趋势变化仍然是开放的挑战。流行病学 ODE 模型包含可以指导我们完成这两项任务的机制;但是,它们在摄取数据源和模拟复合信号方面的能力有限。因此,我们建议使用流行机制模型来监督神经网络,同时学习它们的隐藏动态。我们的方法 EINN 允许神经模型灵活地学习疾病传播动力学并在通用框架中使用辅助特征。与以前的工作相比,我们不假设完整动力学的可观察性,也不需要在训练期间对 ODE 方程进行数值求解。我们彻底的实验展示了我们的方法与其他重要替代方案的明显好处。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在公众号“网络科学研究速递”(netsci)和个人博客进行同步更新。
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com