选股模型论文-黄志辉

选股模型论文-黄志辉

导读:本文包含了选股模型论文开题报告文献综述及选题提纲参考文献,主要关键词:量化投资,深度学习,卷积神经网络,量化选股

选股模型论文文献综述

黄志辉[1](2019)在《基于卷积神经网络的量化选股模型研究》一文中研究指出近年来,随着AlphaGo等人工智能的出现,深度学习逐渐为人们所知并引发了一股新的学习热潮,与此同时,我国的量化投资行业也在迅速发展,但与国外量化投资行业仍有较大差距。从本质上而言,量化投资是通过对金融数据进行建模来去预测股票或期货等金融产品收益,这与深度学习有异曲同工之妙,因此将两者有机结合起来是可行的。通过将深度学习应用到量化投资,一方面为量化投资提供一种新的研究思路与建模方法,另一方面有助于投资者更准确预测股价,降低投资风险和获取投资收益。本文主要研究卷积神经网络在量化选股中的应用,研究对象为2008年1月1日至2018年1月1日的沪深300成分股,首先本文通过增加一个技术指标维度将一维的时间序列转化为二维矩阵数据以用于卷积神经网络模型的训练与预测;其次为了更有效地利用数据,本文通过窗口滚动方式将数据分为五个训练集和五个测试集以用于建模;然后,本文研究了卷积核大小、卷积核数量、全连接神经元数量、dropout概率以及优化器对卷积神经网络模型预测结果的影响并对模型进行相应的参数优化,之后本文将卷积神经网络模型预测结果与逻辑回归、BP神经网络与LSTM神经网络的预测结果进行对比,最后构建基于卷积神经网络构建相应的沪深300选股策略进行研究分析与评判,并与基于逻辑回归、BP神经网络和LSTM的沪深300选股策略再次进行比较分析。通过对比卷积神经网络与逻辑回归、BP神经网络与LSTM神经网络的模型准确度,我们发现卷积神经网络的预测效果要优于其他3个模型,此外,本文基于卷积神经网络构建了一个沪深300量化选股策略,策略在5年回测期内获得了186.6%的总收益和125.51%的超额收益,年化收益高达23.44%,夏普比率为1.47,为了更好的评估模型的选股有效性,本文构建相应的多空对冲策略,经过多空对冲后,策略获得总收益为160.55%,平均年化收益高达21.11%,最大回撤为-2.39%,平均夏普率高达5.18,最后,对比卷积神经网络与逻辑回归、BP神经网络及LSTM神经网络在量化选股上的表现,结果表明卷积神经网络的总收益、超额收益以及夏普率都要高于其他3个模型,且从分年表现而言,卷积神经网络在每一年中都要优于逻辑回归模型,因此,卷积神经网络是一个有效的量化选股模型。(本文来源于《浙江大学》期刊2019-06-04)

李杰[2](2019)在《基于随机森林算法的多因子选股模型研究》一文中研究指出本文研究目的为怎样利用机器学习方法与传统多因子选股模型相结合,并构建基于随机森林算法的多因子选股模型,通过随机森林算法对个股进行分类从而筛选出具有投资价值的股票,进而构造有效的投资组合。本文以全A股票作为股票池,以各个大类因子作为因子池,分别选取了价值类、成长类、动量类、财务质量类、技术类以及分析师情绪类六大类共23个因子作为备选因子,因子数据的选取为2010年1月到2017年12月每月最后一个交易日的数据,以因子数据和对应下期股票月收益率数据构建样本集。其中将2010年1月到2013年12月的样本用于模型参数寻优,以确定随机森林算法超参数和最优训练窗长;将2014年1月到2017年12月的样本用于样本外模型回测,以分析模型选股效果。基于随机森林算法的多因子选股模型是一个动态的选股模型,其在每个回测时段都要利用过去6个月的样本数据对模型进行训练,利用当期因子数据进行预测,选取预测概率排名靠前的50只股票作为下期股票持仓,并对其进行等权配置。模型的整个构建过程大体可分为叁个部分:数据预处理及有效因子筛选、模型参数优化与结果分析、模型改进与优化。本文基于随机森林算法的多因子选股模型在回测期2014年1月到2017年12月内取得的总收益为160.05%,年化收益为27.64%,大幅度领先市场基准(沪深300与中证500),可证明该选股模型具有较好的选股性能。同时对比分析非动态学习模型,本文构建的动态学习模型体现出其时效性,在一定程度上能反映市场的变化。另外在模型的改进与优化方面,通过以预测概率加权确定组合权重、以因子重要性进行因子再筛选、进行因子轮动都能提升原模型的选股效果。(本文来源于《哈尔滨工业大学》期刊2019-06-01)

陈雨甜[3](2019)在《线性与非线性多因子选股模型在A股市场应用的比较研究》一文中研究指出近年来,量化投资在国内如雨后春笋般的兴起。量化投资的兴起将引领A股市场向着专业与成熟的方向前进。目前这一新型的投资方法逐渐被市场上的广大机构投资者所接受,他们从各个角度对其进行了大量的研究。多因子选股模型实际上是整个量化模型在组合投资领域最重要的一个模型。它在美国市场上从上个世纪五六十年代开始,到90年代了多因子选股模型的在海外市场已经得到了非常成功的应用。然而在我国多因子模型也是量化投资领域研究和应用最多的模型。以往的研究多集中在筛选有效性因子或是对于模型算法本身进行精度的改进。很少有研究将目光集中于线性与非线性模型选股优劣的比较及其在A股市场上的适用性。本文的研究主要集中于从多角度线性与非线性多因子选股模型在A股市场上进行比较研究。结合A股市场发展的实际状况及其本身的特殊性,确定了在A股市场上进行选股的要求与评价标准。通过选取了27个基本面因子,并基于分组回测分别对线性与非线性多因子选股模型进行了有效性检验。在此基础上选取上证指数样本股在2014年1月1日至2019年5月1日这一样本区间进行实证检验,并从不同训练集长度、不同持仓数量以及不同市场风格切换叁种角度,对于线性与非线性两类模型进行比较,从而对于不同模型在A股市场的是适用情况进行分析。(本文来源于《哈尔滨工业大学》期刊2019-06-01)

李倩倩[4](2019)在《多因子量化选股模型建立及优化》一文中研究指出股市在不断的变化,所以从目前来看,不断探讨哪些指标在量化选股中更为有效,是具有现实意义的。这也是本文研究工作开始的初衷。在整个研究过程中,保持数据的严谨性、中立性、数据处理方法的科学性对于研究结论的准确性来说至关重要。本文首先构建了一个比较全面的候选因子库,通过对候选因子数据进行异常值、缺失值、标准化、市值中性化、行业中性化等一系列的处理之后,本文对候选因子进行有效性检验及再筛选,最终认为RP_TTM(净利润TTM/总市值)、BP_LF(净资产TTM/总市值)、operete_profin gr_TM(营业利润增长率TTM)、sales_gr_TTM(营业收入增长率)、BOOK_LEVEL(账面杠杆)、stock_to market_volatility(个股与市场波动率比值)、REV_LAST1M_MAX(近一个月日收益率最大值)、RSI(相对强弱)等八个因子是较为有效的因子。在得出有效因子之后,本文利用打分法来构建八因子选股模型,回测区间选定为2016年1月至2019年4月。通过对模型的回测,我们发现本文构建的八因子模型相比于沪深300,有着较为稳定的超额收益。在整个回测时间段内,八因子模型的总收益为41.02%,年化收益为11.07%。相比于基准的收益情况,八因子模型相对总收益为32.28%,年化平均超额收益为8.92%。为了深入研究,我们对原有模型进行优化,优化方案为“在利用八因子模型进行正式选股之前,首先以增长率-经营活动产生的现金流量净额(TTM)指标对股票池进行初步筛选”。通过对优化八因子模型进行回测,我们发现加入增长率-经营活动产生的现金流量净额(TTM)指标优化后的八因子模型回测表现更好。优化八因子模型相比于沪深300,有着较为稳定的超额收益。在整个回测时间段内,优化八因子模型的总收益为47.89%,年化收益为12.70%。相比于基准的收益情况,优化八因子模型相对总收益为39.15%,年化平均超额收益为10.62%。本文最后的工作是对本文建立的八因子模型、优化八因子模型与经典的Fama-French叁因子进行对比分析。经过回测我们发现:本文建立的优化八因子相比于经典的叁因子模型,在回测区间的表现更好。优化模型的回测总收益、回测年化收益、相对总收益、年化平均超额收益、Alpha、年化夏普比率和索提诺比率等指标均优于叁因子模型对应指标,说明在回测区间内依据优化八因子模型建立的投资策略具有更强的获利能力。同时,优化八因子模型拥有更加小的年化波动率、最大回撤绝对值及下行风险,说明在回测区间内依据优化八因子模型建立的投资策略相比于叁因子模型更加稳定。(本文来源于《山东大学》期刊2019-05-31)

董坚[5](2019)在《基于深度模型和谱方法的多因子选股策略研究》一文中研究指出量化投资有着纪律性、系统性和分散化投资等诸多优点,因此其越来越受到学术界和投资界的关注。近些年随着人工智能和深度学习技术的发展,学者与投资实践者把更多的机器学习算法应用到投资领域的各个方面并取得了不错的投资收益。与成熟的海外市场相比,量化投资在国内市场具有更广阔的发展空间和研究价值,本文基于国内市场上对数据挖掘和深度学习在量化选股和统计套利中的应用进行了研究,提出了基于深度模型和谱方法的组合选股模型。文章的主要工作分为如下叁个部分:1.将深度学习算法应用到量化选股的问题中。本文用IRGAN(Information Retrieval in Generative Adversarial Networks)作为选股模型,然后设计了一个卷积网络结构并嵌套在IRGAN的生成器和判别器组件中,根据模型的输出得到选股结果。实验结果表明,本文方法在选择高收益率股票上的精度优于其他对比方法。2.将谱方法应用到统计套利选择价格曲线相似的股票组合的问题中。本文用动态时间规整距离替换欧氏距离作为股票的距离度量,通过谱聚类算法聚类产生相似股票组合。实验结果表明,在中低频时间尺度上,本文方法分析出的相似股票组合在价格曲线走势的相似程度上高于其他对比算法。3.提出基于深度模型和谱方法的组合选股模型。本文将深度模型选择出的股票作为核心股票集,用基于谱方法的相似股模型得到与核心股票的价格曲线走势相似的相似股票集,将核心股票集和相似股票集作为组合选股模型的选股结果。实验结果表明,本文提出的组合模型能够大幅提高模型选股的精度并且该模型的回测收益好于其他对比算法。(本文来源于《南京大学》期刊2019-05-20)

张文秀[6](2019)在《基于分位数回归的Barra因子选股模型研究》一文中研究指出目前,量化投资己成为成熟金融市场最重要的投资模式之一,将来量化投资也会在中国金融市场上占有重要的一席之位。随着我国金融产品的流动性的加强和金融衍生品的种类增多等投资环境的变化,量化投资在我国金融领域将施展越来越重要的作用。股票是金融市场上重要的投资品种之一,因此,多因子选股是受到国内外投资者重点关注的量化策略。Fama和French两位学者的叁因子模型和五因子模型是多因子选股模型中的里程碑之作,此后,大量的学者和投资者对多因子的选择和模型的构建进行了深入的研究。在量化投资领域里,有关多因子模型有效因子的选取主要采用打分法和回归法。本文采用回归法,并以此为基础构建投资组合。本文选取了基于中国股票市场开发的Barra因子模型的Barra风格因子,由于各股票的因子值分布并不服从正态分布,大部分存在尖峰厚尾和极端值的问题,故选取分位数回归会比线性回归更为适用。首先,利用一元分位数回归进行因子的有效性验证,之后利用相关性检验对冗余因子进行剔除,并选出了五个因子;最后,基于因子对高收益率股票和低收益股票的尾部影响,利用多元分位数回归模型构建因子选股策略,用当期因子值和回归系数计算得到的预期收益率对股票进行分组,进行回测。结果表明:从股票因子的回归的系数绝对值上的层面来看,非线性市值因子和成长因子对高收益的股票影响会相对显着;而规模、动量和波动率因子对低收益率的股票影响会显着一些。对于成长因子和非线性市值因子构建的分位数回归多因子策略,在90%分位数处的样本期内的年化收益率为29.55%,高于QR(0.1)的策略的年化收益率;对于规模、反转和波动率因子构建的多因子策略,在10%分位数处的样本期内的年化收益率为39.26%,高于QR(0.9)的策略的年化收益率,此外,这两个模型的年化收益率均高于基准模型的策略的年化收益率;同时,也论证了在中国股票市场,规模因子、反转因子和波动因子具有较强的适用性。(本文来源于《山东大学》期刊2019-05-20)

吴海韬[7](2019)在《基于RSRS择时指标的量化投资选股多因子模型优化研究》一文中研究指出随着中国金融市场逐渐开放,金融秩序不断完善,量化投资在中国越来越受到重视。量化投资指通过寻找经济金融数据之间的关系,以获得稳定利润和超额收益为目的数量化投资。在量化投资中,股票多因子模型是应用比较广泛的模型结构,其发展历程由CAPM模型的单因子模型开始到APT模型再到着名的叁因子模型,折射出了股票多因子模型背后的强大生命力。而单因子挖掘作为股票多因子模型最基础的工作自然是重中之重,没有具有显着盈利效应和稳健性的因子,多因子模型的超额收益自然无从说起。因此,本文以沪深300成分股为样本股票池,选择样本期为2012年1月到2019年1月的月度样本股票价格数据,使用第叁方平台聚宽基于Python的研究模块实现数据清洗、去极值、标准化、市值行业中性化,再使用RLM回归模型对候选因子集中因子进行回归分析,在候选因子集中检验各个因子,并且通过检验收益率序列T值和IC均值、IR值等逐步筛选显着因子,缩小具备显着性的因子集,最终在显着因子集间相进行关性检验,取得相关系数矩阵,得出长期来看显着的因子有BP因子、ROE因子、反转因子、市值因子。在对有效因子进行金融逻辑判断后,筛选出BP因子和ROE因子作为基本股票多因子模型的核心因子并使用ICIR值作为其相应权重值,使用打分排序法作为其基本逻辑框架,在样本期对该模型进行绩效评估,并且使用RSRS技术择时指标对模型进行优化,使模型获得稳定超额收益的同时,减少绝对收益的损失。在对比相同策略的量化私募绩效指标后,发现经过RSRS优化后的股票多因子模型绩效指标显着战胜量化私募中位数指标。(本文来源于《广西大学》期刊2019-05-01)

陈俊宏[8](2019)在《基于SMO算法的支持向量机选股模型研究》一文中研究指出随着近年来数理金融的不断完善,以及计算机技术的逐渐成熟,股票量化投资逐步发展起来。支持向量机(Support Vector Machine,SVM)作为很好的分类技术,国内外学者将其应用到股票选取中,做到了对股票收益率高低的分类及市场预测,但是由于股票市场数据的庞大和复杂性导致传统支持向量机分类精度不高。本文采用了序列最小化算法(Sequential Minimal Optimization,SMO)对支持向量机选股模型进行优化。首先选取对股票收益率影响较大的财务指标,利用这些财务指标降维分析所得数据建立基于SMO算法改进的支持向量机选股模型(SMOSVM),在模型构建方面,SMO-SVM选股模型在模型训练和测试时期准确率都高于SVM选股模型,尤其是在对于高收益股票的分类精度上有着明显的优势。接着使用选股模型进行股票投资组合的选取并将所选投资组合进行市场检验。经过对投资组合的市场检验,基于SMO算法优化的支持向量机选股模型所选股票投资组合的收益表现和风险方面均优于支持向量机选股模型。紧接着将市场周期分为上涨期、震荡期和下跌期,对投资组合进行分阶段的市场检验,结果显示,在上涨期,SMO投资组合承受高系统性风险的同时有着高的风险报酬,其收益高于上证综合指数和SVM投资模型;在震荡期,SMO投资组合有着不错的稳定性,基本维持着原有的超额收益;在下跌期通过风险指数的对比得出,承受相同风险的情况下,SMO有着更高的期望收益。本文对支持向量机进行算法优化可以使其更好的应用在量化金融领域,同时也为今后支持向量机的应用研究提供了新的思路。(本文来源于《电子科技大学》期刊2019-04-24)

黄媛[9](2019)在《基于LSTM神经网络的多因子选股模型实证研究》一文中研究指出近年来,人工智能AI发展之势迅猛,人工智能机器人AlphaGO对战人类大获全胜,“智能+”首次写入2019年国务院政府工作报告,种种迹象无不说明人工智能在我们生活中扮演着日益重要的角色。量化投资为金融领域的一个庞大分支,其中,多因子选股是一项较为成熟的选股技术。因此,本文将深度学习应用于多因子选股,构建了基于LSTM神经网络算法的多因子选股模型。通过与SVM算法对比,发现LSTM神经网络算法比SVM算法更适用股票这类时间序列数据,并将LSTM预测出来的股票进行回测发现其能够获得超过比较基准的收益率。本文选取2012年1月至2018年12月的每一周最后一个交易日的动态沪深300成分股的因子截面数据作为数据样本,其中2012年1月到2017年12月的数据作为模型的训练数据和验证数据,2018年1月至2018年12月作为模型的测试数据。在选取候选因子方面,分别选取质量、动量、价值、常用技术指标、每股指标、情绪、成长、分析师预期、基础科目与衍生和收益与风险等十类因子,合计因子244个,这在广度和深度上均扩大了候选因子的选取范围。本文模型的构建主要分为以下几个步骤:首先,对原始数据依次进行数据预处理、标签标记和主成分分析降维,然后将处理后得到的新数据喂入支持向量机模型和长短期记忆神经网络模型中作比较分析,通过对比发现LSTM模型更适合股票这类非线性的时间序列数据。其次,在LSTM模型中进行训练、学习,并通过学习得到一个优质模型。最后,将测试数据喂入学习得到的优质模型中进行预测,并依据模型预测得到的结果,选择一些股票构建等权重投资组合作回测检验,以期获得超过同期基准的收益率。通过年化收益率、夏普比率、信息比率和最大回测等评价指标对模型进行评估发现,本文构建的回测模型在2018年这一年间的年化收益率超过比较基准的收益率。(本文来源于《湘潭大学》期刊2019-04-23)

李俊豪[10](2019)在《基于衰变IC加权的多因子选股模型》一文中研究指出在基于传统的多因子选股模型下,进行了对因子权重分配的改进。在选取有效性因子后,使用衰变IC因子赋权方法得出更为符合市场的选股模型,并根据模型每个月进行重新调仓使用沪深300指数作为基准进行超额收益率的计算。结果表明该模型的回测表现优于同期沪深300指数表现,在验证了衰变IC加权模型的有效性后,推广该模型,更好地为广大投资者提供研究建议。(本文来源于《电脑知识与技术》期刊2019年11期)

选股模型论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文研究目的为怎样利用机器学习方法与传统多因子选股模型相结合,并构建基于随机森林算法的多因子选股模型,通过随机森林算法对个股进行分类从而筛选出具有投资价值的股票,进而构造有效的投资组合。本文以全A股票作为股票池,以各个大类因子作为因子池,分别选取了价值类、成长类、动量类、财务质量类、技术类以及分析师情绪类六大类共23个因子作为备选因子,因子数据的选取为2010年1月到2017年12月每月最后一个交易日的数据,以因子数据和对应下期股票月收益率数据构建样本集。其中将2010年1月到2013年12月的样本用于模型参数寻优,以确定随机森林算法超参数和最优训练窗长;将2014年1月到2017年12月的样本用于样本外模型回测,以分析模型选股效果。基于随机森林算法的多因子选股模型是一个动态的选股模型,其在每个回测时段都要利用过去6个月的样本数据对模型进行训练,利用当期因子数据进行预测,选取预测概率排名靠前的50只股票作为下期股票持仓,并对其进行等权配置。模型的整个构建过程大体可分为叁个部分:数据预处理及有效因子筛选、模型参数优化与结果分析、模型改进与优化。本文基于随机森林算法的多因子选股模型在回测期2014年1月到2017年12月内取得的总收益为160.05%,年化收益为27.64%,大幅度领先市场基准(沪深300与中证500),可证明该选股模型具有较好的选股性能。同时对比分析非动态学习模型,本文构建的动态学习模型体现出其时效性,在一定程度上能反映市场的变化。另外在模型的改进与优化方面,通过以预测概率加权确定组合权重、以因子重要性进行因子再筛选、进行因子轮动都能提升原模型的选股效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

选股模型论文参考文献

[1].黄志辉.基于卷积神经网络的量化选股模型研究[D].浙江大学.2019

[2].李杰.基于随机森林算法的多因子选股模型研究[D].哈尔滨工业大学.2019

[3].陈雨甜.线性与非线性多因子选股模型在A股市场应用的比较研究[D].哈尔滨工业大学.2019

[4].李倩倩.多因子量化选股模型建立及优化[D].山东大学.2019

[5].董坚.基于深度模型和谱方法的多因子选股策略研究[D].南京大学.2019

[6].张文秀.基于分位数回归的Barra因子选股模型研究[D].山东大学.2019

[7].吴海韬.基于RSRS择时指标的量化投资选股多因子模型优化研究[D].广西大学.2019

[8].陈俊宏.基于SMO算法的支持向量机选股模型研究[D].电子科技大学.2019

[9].黄媛.基于LSTM神经网络的多因子选股模型实证研究[D].湘潭大学.2019

[10].李俊豪.基于衰变IC加权的多因子选股模型[J].电脑知识与技术.2019

标签:;  ;  ;  ;  

选股模型论文-黄志辉
下载Doc文档

猜你喜欢