异质信息网络的研究现状综述,阅读之后可以对异质信息网络有一个大概的了解
2023-09-27 09:46:12 1.84MB ML
1
近年来,基于异质信息网络的研究受到国内外广泛的关注,很多研究工作(如聚类、分类、推荐等)都是在异质信息网络上开展的。异质信息网络是一种包含不同类型节点和边的网络,它具有更加复杂的网络结构和更加丰富的语义信息,可以更全面地表示系统的组成对象和他们之间的关系。在异质信息网络中,度量节点间的相似性是开展聚类、推荐等工作的基础。目前,国内外已提出许多相似性度量方法来解决异质信息网络节点相似性度量的问题,HeteSim算法就是其中一种代表性方法。HeteSim是一种基于双向随机游走的度量方法,目前HeteSim相似度计算均采用单节点计算模式,然而随着信息网络的急剧膨胀,传统的单节点计算模式已无法满足HeteSim快速计算的需求,开发在集群上运行的HeteSim并行化算法成为当务之急。本文基于分布式计算框架Spark,研究并实现了异质信息网络相似性度量方法HeteSim的并行化算法。首先,本文提出基于矩阵乘法的HeteSim并行化算法。HeteSim并行化的核心是矩阵乘法的并行化,本文针对传统矩阵乘法并行化算法内存消耗大,网络开销大,执行时间长的缺点,提出改进算法,并基于改进算法,实现了基于矩阵乘
2022-09-21 18:07:15 4.87MB
1
This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part of the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation, broadcasting, reproduction on microfilms or in any other physical way, and transmission or information storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology now known or hereafter developed.
2022-04-30 15:14:43 4.65MB Heterogeneous Data Analysis
1
表征学习为各种人工智能领域提供了一种革命性的学习范式。在本次调查中,我们研究和回顾了表征学习的问题,重点是由不同类型的顶点和关系组成的异构网络。这个问题的目标是自动将输入异构网络中的对象(最常见的是顶点)投影到潜在的嵌入空间中,这样网络的结构和关系属性都可以被编码和保留。然后可以将嵌入(表示)用作机器学习算法的特征,以解决相应的网络任务。为了学习表达性嵌入,当前的研究进展可以分为两大类:浅层嵌入学习和图神经网络。在对现有文献进行彻底审查后,我们确定了几个尚未解决的关键挑战,并讨论了未来的方向。最后,我们构建了异构图基准以促进对这个快速发展的主题的开放研究。
1
A Survey on Heterogeneous Graph Embedding: Methods, Techniques, Applications and Sources 异构图 (HG) 也称为异构信息网络,在现实世界中无处不在;因此,HG 嵌入旨在在低维空间中学习表示,同时保留下游任务(例如,节点/图分类、节点聚类、链接预测)的异构结构和语义,近年来引起了相当大的关注。在本次调查中,我们对 HG 嵌入方法和技术的最新发展进行了全面审查。我们首先介绍了 HG 的基本概念,并讨论了与同构图表示学习相比,HG 嵌入的异质性带来的独特挑战;然后我们根据他们在学习过程中使用的信息系统地调查和分类最先进的 HG 嵌入方法,以解决 HG 异质性带来的挑战。特别是对于每一种有代表性的HG嵌入方法,我们都进行了详细的介绍,并进一步分析了其优缺点;同时,我们还首次探索了不同类型的 HG 嵌入方法在现实工业环境中的变革性和适用性。此外,我们进一步介绍了几个广泛部署的系统,这些系统已经证明了 HG 嵌入技术在解决具有更广泛影响的实际应用问题方面的成功。为了促进该领域的未来研究和应用,我们还总结了开源代码、现有图学习平台和基准数据集。最后,我们探讨了 HG 嵌入的其他问题和挑战,并预测了该领域的未来研究方向。
1