基于隐私保护的数据建模与算法研究

基于隐私保护的数据建模与算法研究

论文摘要

随着大数据在工业生产、科学研究中的广泛应用,原始数据的隐私保护已经成为十分重要的问题。本文针对原始数据的隐私保护问题,构建层次结构,并介绍了只包含分析计算结果的层次结构数据。针对传统回归分析算法,提出了具有层次结构数据的多元线性回归分析算法以及非线性回归分析算法。同时利用实际问题进行算法验证,说明具有层次结构数据的回归分析算法能在有效保证原始数据隐私的前提下,准确计算各部分的偏回归系数,为大数据的分析处理提供一种有益的尝试。本文的主要工作如下:(1)基于层次结构数据,本文提出了多元线性回归分析的偏回归系数计算方法。该方法在传统线性回归计算方法的基础上通过计算下层中每个部分的偏回归系数及上下层之间的层次结构矩阵,来计算上层的总体偏回归系数。利用统计年鉴数据以及随机数据从实际应用中证明了具有层次结构数据的多元线性回归分析算法与传统多元线性回归模型在计算偏回归系数时具有等效性,且对于偏回归系数能分区计算,提高了数据处理的效率。同时,从数据实验中可得利用层次结构数据可以避免原始数据在算法中参与传输、计算,有效地解决了原始数据的隐私保护问题。(2)针对更为复杂的非线性模型,在具有层次结构数据的多元线性回归分析算法基础上,提出了一类可线性化的非线性回归分析算法。并以柯布-道格拉斯生产函数的计算方法为例,给出了多元非线性回归分析中基于线性化方法的偏回归系数的求解方法,并利用层次结构中局部模型与整体模型之间的关系构建、计算模型各部分的偏回归系数。以统计年鉴数据进行验证,可得基于层次结构模型的结果与基于原始数据计算的结果仅存在精度误差。层次结构数据的使用有效避免了可线性化的非线性回归分析算法在计算多个部分偏回归系数时,由于原始数据参与传递导致的潜在数据泄露的情况。(3)为了满足隐私数据所构建的模型达到显著性指标,实现具有层次结构数据的多元回归分析中各层偏回归系数达到显著的目的,本文研究了底层回归算法的显著性。由于上层模型中无原始数据参与,因此底层模型的显著性将影响上层模型的显著性。因此要求底层模型构建时能克服由于大数据导致的I类错误增加的问题,本文利用基于FWER的多重假设检验,对大数据中的较易获得且具有实际意义的基因数据进行实例分析,得到结果表明多重假设检验能有效避免I类错误的出现。由此说明在层次结构的底层算法求解时进行基于大数据的多重假设检验显得尤为重要。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 大数据与隐私保护
  •   1.2 相关基本概念与算法
  •     1.2.1 数据的层次结构
  •     1.2.2 基本算法
  •   1.3 本文的主要内容及创新点
  •     1.3.1 本文的主要研究内容
  •     1.3.2 本文的创新点
  • 第二章 具有层次结构数据的线性回归模型构建与应用
  •   2.1 引言
  •   2.2 具有层次结构数据的多元线性回归模型
  •     2.2.1 层次结构数据的构造
  •     2.2.2 部分偏回归系数计算
  •     2.2.3 总体偏回归系数计算
  •   2.3 模型应用
  •     2.3.1 基于两层层次结构的经济模型实验
  •     2.3.2 基于多层层次结构的随机数据实验
  •   2.4 小结
  • 第三章 具有层次结构数据的可线性化非线性回归模型研究
  •   3.1 引言
  •   3.2 具有层次结构数据的非线性回归分析的线性化模型构建
  •     3.2.1 非线性回归分析的线性化研究
  •     3.2.2 具有层次结构数据的可线性化非线性偏回归系数模型研究
  •   3.3 模型应用
  •   3.4 小结
  • 第四章 具有层次结构数据的多元线性回归模型检验
  •   4.1 引言
  •   4.2 基于FWER的 Bonferroni检验
  •   4.3 基于回归分析的乳腺癌致病基因筛选及支持向量机验证
  •     4.3.1 基于回归分析的乳腺癌致病基因筛选
  •     4.3.2 基于支持向量机算法的结果验证
  •     4.3.3 实验结果
  •   4.4 小结
  • 第五章 总结与展望
  •   5.1 全文总结
  •   5.2 未来展望
  • 致谢
  • 参考文献
  • 附录:作者在攻读硕士学位期间发表的论文及参加的活动
  • 文章来源

    类型: 硕士论文

    作者: 赵芸

    导师: 唐旭清

    关键词: 隐私保护模型,层次结构数据,回归分析,多重假设检验

    来源: 江南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 江南大学

    分类号: O212.1;TP309

    总页数: 46

    文件大小: 8402K

    下载量: 75

    相关论文文献

    • [1].大数据时代个人隐私保护探讨[J]. 科技传播 2020(01)
    • [2].基于利益最大化的位置隐私保护技术研究[J]. 智能计算机与应用 2020(01)
    • [3].数字经济中的隐私保护与支配地位滥用[J]. 中国社会科学院研究生院学报 2020(01)
    • [4].基于隐私保护的政府大数据治理研究[J]. 大数据 2020(02)
    • [5].大数据背景下个人隐私保护研究[J]. 信息与电脑(理论版) 2020(03)
    • [6].基于区间区域的位置隐私保护方法[J]. 计算机工程与应用 2020(08)
    • [7].新闻聚合平台的算法规制与隐私保护[J]. 现代传播(中国传媒大学学报) 2020(04)
    • [8].浅析大数据行业发展现状及个人隐私保护[J]. 计算机产品与流通 2020(04)
    • [9].大数据背景下隐私保护屏障的分析与研究[J]. 法制与社会 2020(08)
    • [10].大数据时代大学生网络环境隐私保护行为调查分析[J]. 黑龙江教育(理论与实践) 2020(05)
    • [11].持续监控下差分隐私保护[J]. 软件学报 2020(06)
    • [12].满足差分隐私保护的数据分析方法的设计与实现[J]. 电视技术 2019(22)
    • [13].联邦学习安全与隐私保护研究综述[J]. 西华大学学报(自然科学版) 2020(04)
    • [14].大数据下信息通信技术中的隐私保护[J]. 信息与电脑(理论版) 2020(12)
    • [15].面向各类攻击的差分隐私保护模型[J]. 网络安全技术与应用 2020(08)
    • [16].面向共谋攻击的位置隐私保护方案[J]. 佳木斯大学学报(自然科学版) 2020(04)
    • [17].旅游大数据商业化应用中的游客隐私保护研究[J]. 福建电脑 2020(08)
    • [18].“互联网+”时代高校学生隐私保护研究[J]. 科技创新与生产力 2020(09)
    • [19].一种新的多用户位置隐私保护方案[J]. 工程科学与技术 2020(05)
    • [20].大数据时代个人隐私保护的路径重构[J]. 现代企业 2020(10)
    • [21].大数据时代数据主权与隐私保护面临的安全挑战[J]. 管理现代化 2019(01)
    • [22].隐私计算—面向隐私保护的新型计算[J]. 信息通信技术 2018(06)
    • [23].大数据的安全与隐私保护研究[J]. 河南科技 2018(35)
    • [24].电商个性化背景下企业间隐私保护的主从博弈分析[J]. 经济与管理 2019(02)
    • [25].车载自组织网络的隐私保护综述[J]. 信息网络安全 2019(04)
    • [26].大数据背景下图书馆读者隐私保护探讨研究[J]. 中国科技产业 2019(04)
    • [27].美英澳政府数据开放隐私保护政策法规的考察与借鉴[J]. 情报理论与实践 2019(06)
    • [28].医疗大数据的隐私伦理问题研究[J]. 锦州医科大学学报(社会科学版) 2019(03)
    • [29].高校大数据应用中的安全及隐私保护研究[J]. 网络安全技术与应用 2019(09)
    • [30].美国《儿童在线隐私保护法》的适用与商业合规[J]. 中国信息安全 2019(10)

    标签:;  ;  ;  ;  

    基于隐私保护的数据建模与算法研究
    下载Doc文档

    猜你喜欢