行为序列模式识别在泛娱乐平台用户兴趣发现中的应用

行为序列模式识别在泛娱乐平台用户兴趣发现中的应用

论文摘要

泛娱乐是现阶段互联网发展的重要特征之一,移动互联网泛娱乐化的趋势,激活了用户固有的、旺盛的娱乐社交需求。用户在产品使用过程中产生了大量日志,包含了一切行为的时间、地点、内容、互动、消费等信息,企业如何充分利用用户在其产品上留下的海量日志,运用数据挖掘技术,对用户进行深刻洞察,挖掘用户属性,揣摩用户的喜好,提取出对企业有价值的信息,以实现平台效益的最大化,也成为了工业界和学术界一个热点研究话题。带有时序信息的行为日志,又称为行为路径,蕴含了用户跳转习惯、路径偏好等有价值的信息,为了引导用户持续深入体验产品的价值,最大限度的激发用户兴趣,互联网行业普遍采用用户行为路径分析方法,该方法又可以称为行为序列模式挖掘,是一种将序列挖掘技术与用户行为路径相结合,探索行为规律,发现兴趣模式,从而获知产品使用情况,找到优化方向的分析方法。本文积极探索了行为序列模式识别技术在用户兴趣发现中的应用,从挖掘偏好路径、提取关键功能点、分析低活跃用户特征三个角度,构建了一个多层次用户兴趣分析体系,并以某泛娱乐平台的用户真实行为数据为基础,通过实验,论证了该体系的可行性,具体工作如下。首先提出了有效行为和有效序列的概念,并据此完成了数据清洗和整理,形成了供后续分析的基础数据,然后从序列长度、行为种类等角度进行了基本的数据探索和特征分析。其次,基于隐马尔可夫模型的参数估计问题,设计实验,进行了用户兴趣模式的挖掘。实验根据序列长度将基础数据进行了分组,并且为了保证模型科学训练,不被分布差异过大的数据所误导,本文还提出了针对性的分层采样方案。在结果评估阶段,基于已知行为所属场景天然属于隐藏状态的事实,设计出了隐藏状态准确率的指标,利用该指标挑选出了较优模型,进而模拟出最可能的行为路径,从这些模拟的路径中发现出了用户的路径偏好规律,并说明了这些模拟序列在兴趣发现中的实际指导意义。然后,为了解决泛娱乐平台中重要功能的发现问题,本文基于数学领域中图论的思想,提出了以行为为节点,以行为的跳转关系为边构建图的方案,将问题抽象成为图论中的关键节点发现问题。在关键节点发现的方案中,选用了三种从不同角度刻画节点重要性的指标。在实验分析阶段,利用不同序列长度的分组数据,分别进行了图形的构建和关键节点的发现,并在每个指标下得出了头部的结果,通过对比不同组别和不同指标的结果,给出了对系统起到重要作用的功能,并针对这个结果对产品提出了优化建议,证明了该场景下图模型的可行性。最后,聚焦于泛娱乐生态促活问题,设计了对比实验,将平台的低活跃用户和高活跃用户的行为序列进行对比,以高活跃的数据指标作为参考,观察指标为界面跳出率和界面退出率,提出了用于衡量两组数据差异度的指标比例差值。针对跳出率和退出率,选取比例差值大于阈值的行为界面作为实验结果。然后从实际业务出发,解释了这些界面对用户流失造成了哪些具体的影响,并给出了优化方案,最后还提出了其他针对性的的促活建议。

论文目录

  • 摘要
  • abstract
  • 第1章 引言
  •   1.1 研究背景
  •   1.2 研究意义
  •   1.3 国内外研究现状
  •   1.4 创新点概述
  •   1.5 论文组织结构
  • 第2章 序列数据获取及特征分析
  •   2.1 日志采集
  •   2.2 有效序列提取
  •   2.3 数据特征分析
  •     2.3.1 序列长度分布
  •     2.3.2 行为种类分布
  •     2.3.3 行为个数分布
  •   2.4 本章小结
  • 第3章 基于HMM的兴趣模式挖掘
  •   3.1 算法研究
  •     3.1.1 基本概念和模型表示
  •     3.1.2 模型参数学习算法
  •   3.2 基于HMM算法进行兴趣发现的应用实验
  •     3.2.1 实验设计
  •     3.2.2 评估指标
  •     3.2.3 实验数据集
  •     3.2.4 实验结果及分析
  •   3.3 本章小结
  • 第4章 基于图论的关键功能提取
  •   4.1 图论简介
  •     4.1.1 基本概念
  •     4.1.2 图论的应用
  •     4.1.3 关键节点发现算法
  •   4.2 基于图论提取关键点的应用实验
  •     4.2.1 实验设计
  •     4.2.2 实验数据集
  •     4.2.3 实验结果及分析
  •   4.3 本章小结
  • 第5章 低活跃用户特征分析
  •   5.1 常用分析指标介绍
  •   5.2 低活跃用户特征分析实验
  •   5.3 促活方案建议
  •   5.4 本章小结
  • 第6章 总结与展望
  •   6.1 本文总结
  •   6.2 工作展望
  • 参考文献
  • 致谢
  • 个人简历 在读期间发表的学术论文与研究成果
  • 文章来源

    类型: 硕士论文

    作者: 马双剑

    导师: 熊巍

    关键词: 序列挖掘,兴趣模式,泛娱乐移动平台,用户行为分析

    来源: 对外经济贸易大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,互联网技术

    单位: 对外经济贸易大学

    分类号: TP393.09;O211.61

    DOI: 10.27015/d.cnki.gdwju.2019.000004

    总页数: 49

    文件大小: 5183K

    下载量: 48

    相关论文文献

    • [1].融合情境因素的电子商务用户兴趣挖掘仿真[J]. 计算机仿真 2020(04)
    • [2].基于背景和内容的微博用户兴趣挖掘[J]. 软件学报 2017(02)
    • [3].一种基于用户兴趣的个性化建模方法[J]. 内燃机与配件 2017(04)
    • [4].面向推荐的用户兴趣扩展方法[J]. 山东大学学报(工学版) 2017(02)
    • [5].微博中结合转发特性的用户兴趣话题挖掘方法[J]. 计算机应用研究 2017(07)
    • [6].支持联机分析处理的推特用户兴趣维层次提取方法[J]. 电子与信息学报 2017(09)
    • [7].基于信任与用户兴趣变化的协同过滤方法研究[J]. 情报学报 2017(02)
    • [8].用户兴趣变化下的协同过滤最优推荐仿真[J]. 计算机仿真 2016(08)
    • [9].百度贴吧用户兴趣分类[J]. 福建电脑 2014(11)
    • [10].微博用户兴趣发现研究[J]. 现代图书情报技术 2015(01)
    • [11].满足用户兴趣漂移的计算自适应快速推荐算法[J]. 计算机应用研究 2015(09)
    • [12].《解忧杂货店》走进现实[J]. 时代报告 2016(12)
    • [13].基于用户兴趣领域中可信圈挖掘的推荐模型[J]. 西北工业大学学报 2019(06)
    • [14].基于信息内容和用户关系的用户兴趣分类[J]. 河北省科学院学报 2018(02)
    • [15].基于情景和浏览内容的层次性用户兴趣建模[J]. 计算机系统应用 2017(01)
    • [16].基于改进的关联规则挖掘算法的用户兴趣挖掘[J]. 计算机时代 2016(09)
    • [17].基于学术产出挖掘的用户兴趣建模研究[J]. 图书情报工作 2013(18)
    • [18].国内用户兴趣建模研究进展[J]. 情报杂志 2013(05)
    • [19].面向个性化服务的用户兴趣偏移检测及处理方法[J]. 电子技术 2009(11)
    • [20].多层次用户兴趣模式的动态捕捉[J]. 计算机工程与应用 2009(36)
    • [21].基于分类的用户兴趣漂移模型[J]. 情报杂志 2008(01)
    • [22].基于时间权重和用户兴趣变化的协同过滤算法[J]. 皖西学院学报 2020(02)
    • [23].关于网络用户兴趣数据信息快速查询仿真研究[J]. 计算机仿真 2018(12)
    • [24].基于消费行为理解与分析的用户兴趣建模方法[J]. 电脑知识与技术 2019(14)
    • [25].基于用户兴趣及迁移的话题模型分析[J]. 软件导刊 2018(06)
    • [26].基于数据挖掘的网络购物用户兴趣分类研究[J]. 计算机仿真 2018(07)
    • [27].基于复杂网络及神经网络挖掘用户兴趣的方法[J]. 计算机技术与发展 2016(12)
    • [28].基于图像语义的用户兴趣建模[J]. 数据分析与知识发现 2017(04)
    • [29].社交网络大数据环境下的用户兴趣层次化模型研究[J]. 教育观察(上半月) 2016(08)
    • [30].一种基于用户兴趣的微博实体链接方法[J]. 计算机应用研究 2016(07)

    标签:;  ;  ;  ;  

    行为序列模式识别在泛娱乐平台用户兴趣发现中的应用
    下载Doc文档

    猜你喜欢