• 融合结构与属性相似性的加权图聚集算法

    融合结构与属性相似性的加权图聚集算法

    论文摘要图聚集技术是将一个大规模图用简洁的小规模图来表示,同时保留原始图的结构和属性信息的技术。现有算法未同时考虑节点的属性信息与边的权重信息,导致图聚集后与原始图存在较大差异...
  • 基于最小哈希的重复数据清洗方法

    基于最小哈希的重复数据清洗方法

    论文摘要大数据时代,数据的处理和应用受到了极大关注,重复数据清洗作为数据预处理的一部分,影响着数据预处理的效率和结果。主要针对重复数据进行处理,现有的方法主要采用了datacl...