首页 > 其他分享 >R语言逻辑回归Logistic选股因素模型交易策略及沪深300指数实证

R语言逻辑回归Logistic选股因素模型交易策略及沪深300指数实证

时间:2023-04-07 21:23:05浏览次数:45  
标签:组合 300 模型 Logistic 选股 收益率 回归

全文链接:http://tecdat.cn/?p=32071

原文出处:拓端数据部落公众号

随着中国的证券市场规模的不断壮大、市场创新不断深化、信息披露不断完善、市场监管不断强化,随着现代投资组合理论的发展和计算机技术的进步,投资者为了在股票交易中取得更多的收益,就需要有合理有效的投资策略,因素模型的基础上发展出众多量化研究模型。对于这些模型的研究能够帮助投资者有效的跟踪市场的变化,为得出更好的投资策略而提供帮助。Logistic选股模型正是这些众多模型中的一个。

因素模型

因素模型是建立在证券收益率对各种因素或指数变动具有一定敏感性的假设基础之上的一种模型。证券的收益率具有相关性,这种相关性是通过对模型中的一个或多个因素的共同反应而体现出来。证券收益率中不能被因素模型所解释的部分被认为是各种证券的个性,因而与其他证券无关。因素模型也被称为指数模型(Index model)或夏普模型(Sharp model)。

研究思路

本文以多因素模型在股票交易中的应用为背景,帮助客户针对Logistic选股模型的理论基础以及模型原理方面分析Logistic选股模型的可行性与稳定性。为保证模型的可靠和稳定,使用过去五年的历史数据来检测模型。

Logistic模型在股票交易中的选股策略

结合以上多因素模型与Logistic回归分析的知识可以得到基于Logistic选股模型。这里采用沪深300指数作为基准,将沪深300中的个股作为研究对象,研究其收益率超过沪深300股指收益率的概率。

这里Logistic选股模型研究的窗口期选择为一个月,在当月的最后一个交易日以股票或指数投资组合的收盘价买入股票或指数资产组合,在次月的最后一个交易日以股票或指数投资组合的收盘价卖出股票或指数资产组合。

image.png

这样将即可以使用Logistic回归分析结合历史数据对组合中每支股票进行回归分析。利用回归分析结果预测每只股票下个月收益率大于指数投资组合收益率的概率,这时我们选取预测中收益率大于基准收益率概率排名前40支股票,等权重组合,在当月的最后一个交易日以收盘价买入,在次月的最后一个交易日以收盘价卖出。如此即为Logistic选股模型的交易策略。

实证结果分析

#读取数据

file=list.files(".",pattern=".Rdata")

 

for(i in file)load(i)

#计算对数收益率
data$return2=c(0,( log((data$CLOSE.y[-1])/data$CLOSE.y[-nrow(data)])))

合并因子数据和收益率数据

image.png

image.png

经过对模型的检验得到以下结果:

逻辑回归收益分布

image.png 逻辑回归收益的直方图 可以看到大部分收益分布在大于0的区域

图中显示了根据模型所选股票在当期的收益率分布。从图中可以看出大部分股票收益率分布在0%至-10%之间,将近半数的股票在其交易当期内具有小额负收益。

image.png

image.png

这个图横轴代表时间。纵轴代表使用逻辑回归模型结果在不同时间点的收益

累计收益

image.png  

组合累积和基准累积

image.png

这个图横轴代表时间。纵轴代表使用逻辑回归模型结果在不同时间点的收益率:

image.png

通过图中对利用Logistic选股模型选出的组合的收益率和基准收益率的对比可以看出看出通过Logistic选股模型选出的组合具有一个较平稳的收益率,而且在绝大数的时间内收益率超过了基准收益。由此可以看出Logistic选股模型具有一定的稳定性和有效性,在绝大多数的情况下可以选出收益率高于基准收益的组合。

组合和基准每月的收益率的对比图

2.png

1.png

逻辑回归模型结果

Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-0.86049  -0.32622  -0.05835  -0.00147   2.24675  

Coefficients:
                      Estimate Std. Error z value Pr(>|z|)
(Intercept)          7.199e+00  9.101e+00   0.791    0.429
SHARE_TOTALTRADABLE -9.482e-10  1.934e-09  -0.490    0.624
MKT_CAP             -4.653e-11  5.952e-11  -0.782    0.434
MV                  -1.687e+00  2.033e+00  -0.830    0.407
pe                  -9.811e-02  1.128e-01  -0.870    0.384

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 16.081  on 41  degrees of freedom
Residual deviance: 11.560  on 37  degrees of freedom
  (1 observation deleted due to missingness)
AIC: 21.56

总结

构建了Logistic选股模型,并利用历史数据经行回测,验证模型的有效性,并根据实验数据得到结果证明Logistic选股模型可以在大部分情况下为投资者选出一个收益率能够超过基准收益的投资组合。但是本文的研究也可能存在以下问题和漏洞:

  1. 本文选取了过去5年的历史数据,其中会有较多的数据缺失,数据缺失较多的股票不会计入模型,可能会造成结果的偏差。
  2. 对于部分股票具有数据缺失,在经行Logistic回归分析的时候会造成回归结果的不准确,从而影响最终结果。
  3. 本文中只是选取前3年的数据经行Logistic回归分析,在计算更近时期的收益时,并没有加入之后新的因子数据经行计算,可能造成分析的不准确。
  4. 本文只是解析了Logistic选股模型的原理并构建模型加以验证,其中没有对因子的选取进行验证,不能保证所有的因子都具有极大的相关性,其中也可能会有部分因子导致结果的偏差。
  5. 在实验中所用到的数据可能由于现实中信息披露的可靠性、稳定性、时效性等问题导致实验结果不是完全的可靠。
  6. 本文中忽略了如果使用Logistic选股模型经行交易对市场的影响。
  7. 本文采用的是以季度发布的数据,实验中不能对季度中因子变化导致的影响作出分析。

参考文献

[1]:黄志文. Logistic选股模型及其在沪深300中的实证[R].国信证券,2010.

[2]:黄志文.传统多因素模型及其在沪深300 中的实证[R].国信证券,2010.

[3]:滋维·博迪.投资学[M].第九版.机械工业出版社,2012;127-172.


QQ截图20220530183037.png 最受欢迎的见解

1.R语言对S&P500股票指数进行ARIMA + GARCH交易策略

2.R语言改进的股票配对交易策略分析SPY—TLT组合和中国股市投资组合

3.R语言时间序列:ARIMA GARCH模型的交易策略在外汇市场预测应用

4.TMA三均线期指高频交易策略的R语言实现

5.r语言多均线量化策略回测比较

6.用R语言实现神经网络预测股票实例

7.r语言预测波动率的实现:ARCH模型与HAR-RV模型

8.R语言如何做马尔科夫转换模型markov switching model

9.matlab使用Copula仿真优化市场风险

标签:组合,300,模型,Logistic,选股,收益率,回归
From: https://www.cnblogs.com/tecdat/p/17297387.html

相关文章

  • 股票选股公式代写、高点低点时空坐标主图指标公式
    飞狐指标公式精品主图飞狐时空坐标主图指标源码原理解析:A3赋值:4X1%之字转向的前1个波峰位置A4赋值:4X2%之字转向的前1个波谷位置A5赋值:4X1%之字转向的前1个波峰值A6赋值:4X2%之字转向的前1个波谷值FH赋值:A3-A3/7的整数部分*7-1FL赋值:A4-A4/7的整数部分*7-1A7赋值:A5-A6当满足......
  • LightOJ - 1300 Odd Personality(边双连通+奇圈判定)
    题目大意:给出一张无向图,要求找出符合条件的点条件如下:从该点出发,经过一定数量的边,又回到该点,经过的边不能重复经过,且经过的边的数量为奇数解题思路:要回到原点,且不能重复经过边,只能在边双连通分量中找了接着要判断的是有多少个点,只要边双连通分量中有奇圈,那么这个连通分量中的所......
  • LabVIEW网口TCP通讯西门子PLC,支持200、300、1200、1500、400、SMART全系列
    LabVIEW网口TCP通讯西门子PLC,支持200、300、1200、1500、400、SMART全系列PLCS7协议官方工具包,常用功能一网打尽。1.命令帧读写。程序源码,命令帧文本编写,不调用dll,不安装插件,完胜OPC等。创作不易,非诚勿扰。谢谢大家。YID:6787669089987972......
  • 【花雕学AI】4月5日,ChatGPT中国财经背景分析:昨天沪指重返3300点,这说明了什么?
        附录:一、ChatGPT是一个可以和你聊天的人工智能程序,它可以用文字回答你的问题,也可以根据你的提示写出文章、歌词、代码等内容。ChatGPT是由一个叫OpenAI的机构开发的,它使用了一种叫做GPT的技术,这种技术可以让它从互联网上学习大量的文字信息,然后根据文字之间......
  • GEOM30009 图像环境
    GEOM30009IMAGINGTHEENVIRONMENTGroupAssignment2AssessingBurnScarsUsingSatelliteImageryDueforsubmissionat11:55pmonFridayofWeek6Value:15%ofSubjectMarkObjectiveTheaimofthisassignmentistolearnhowtoassessbushfireburnscar......
  • nginx keepalive_timeout 300; 504 Gateway Time-out
    实践:1、http{includemime.types;#includeluawaf.conf;includeproxy.conf;default_typeapplication/octet-stream;server_names_hash_bucket_size512;client_header_buffer_size32k;large_client_header_buffers432k;client_max_b......
  • restHighLevelClient 操作报错:listener timeout after waiting for [30000] ms
     java.io.IOException:listenertimeoutafterwaitingfor[30000]msatorg.elasticsearch.client.RestClient$SyncResponseListener.get(RestClient.java:905)atorg.elasticsearch.client.RestClient.performRequest(RestClient.java:229)atorg.elasti......
  • 如何使用自定义通达信指标(附带3技术指标3选股指标)
    通达信类型的交易软件都支持通达信指标公式,电脑端推荐使用东方财富,同花顺,通达信自己也有电脑端,但是做得不好。手机端可以下载通达信APP,最好是安卓版,IOS的通达信有bug,不知道修复了没。点击日线再点更多选更多指标点新建就可以进入公式编辑界面,或者可以选择已有的公式进行修改点条件......
  • DC-DC直流线性可调升压模块高压稳压输出电源5v12v24v48v转0-300V0-500V/0-600V/0-1000
    GRB系列非隔离宽电压输入高电压稳压输出特点 效率高达75%以上 1*2英寸标准封装 单电压输出 可直接焊在PCB上 工作温度:-40℃~+75℃ 阻燃封装,满足UL94-V0要求 温度特性好 电压控制输出,输出电压随控制电压的变化线应用GRB系列模块电源是一种DC-DC升压变换器。该模块电......
  • 百年图书馆携手浪潮信息,让300余万册实体文献绽放新彩
    书籍是人类进步的阶梯,对于高校来说,图书馆建设水平直接关乎人才培养的质量。随着数字世界与物理世界的深度融合,图书馆数字信息资源的建设也呈迅速增长之势。秉持“以人为本、......