22年的综述最近读了3篇,总结笔记如下:
本期所有论文链接:2022综述 https://www.alipan.com/s/Y7YnnXjM3nn 点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载极速在线查看,视频原画倍速播放。
(2022)Decision Fusion for Stock Market Prediction: A Systematic Review
评价:原文值得精读,质量高。混合模型有前景,但论文有75篇,可以结合自己喜好挑着看
一作是中国科学技术大学的,在马来西亚读博,作者说多模型融合决策比单模型预测强,但多模型融合决策方面的综述不多,所以有了这篇综述。
作者指出决策融合包含:数据融合、特征融合、决策融合,融合没有特定的方法。然后总结了每种预测模型的特色,总结目前各种决策融合的方法,并基于预测模型的结构进行分类,最后描述未来方向。作者找了642篇论文,过滤出75篇质量好的。
第4部分盘点了各学习器(就是混合模型中的每个模型,叫做一个learner)的特点:
混合模型中分两种情况(FIGURE 4对此作出了解释):
1、不同模型用相同算法:
table 3 统计了分类任务中,各论文使用的算法;
table 4 统计了回归任务中,各论文使用的算法;
2、不同模型用不同算法:
table5分类任务的;
table6回归任务的;
FIGURE 5展示了2种任务的具体内容,table7、table8是相关统计。
第5部分盘点了混合模型的决策方法:
FIGURE 6展示了分类、回归的决策方法。其中Voting,tree-based(ref27表现最好)用的最多,FIGURE 7、8统计了各论文对不同决策方法的使用情况。
第6部分总结了混合模型的类型,有四种(FIGURE 9是他们的架构图):
1) traditional ensemble。 用的人最多且从2000年开始每年都在涨。每个learner生成完整预测
2) decomposition-based ensemble。2015年后开始流行,回归任务独有,每个learner生成部分预测
3) fusion models integrating auxiliary forecasting。1990年出现,把辅助的结果融合给主模型,比较小众。(辅助可以是model也可以不是,我觉得可以用fuzzy control试试)
4) two-stage ensemble。第一阶段的预测结果作为第二阶段的输入,比较小众。
展望:混合模型可以加入更多算法,如jump-diffusion model、GAN、GNN和capsule network,可以成为研究人员的未来方向;把情绪分析加入到决策融合 来提升预测能力。
(2022)A comprehensive review on multiple hybrid deep learning approaches for stock prediction
评价:原文值得精读,作者提炼出了论文精华,能让读者对模型的具体算法、处理流程有详细了解,并直接指导实践。
印度的,作者能简要讲出历史论文的亮点,省得自己看论文了。
盘点了4种主流应用的效果对比、原理、历年来部分paper的结果,评估性能用RMSE( root mean square error), MAPE, MAE,MSE等。
1,Autoregressive Integrated Moving Average (ARIMA)
人们对于时序数据进行统计分析时,数据得是平稳的,比如均值方差啥的不能变,但现实里它会变,ARIMA就是用来解决非平稳性的。
1997年提出,Fig1 是它的流程图,Fig2是算法示意图 19年、21年的几篇可以看看,19年Roy那篇预测准确率达到90%
2、LSTM,Fig3,4是模型图和流程图, Fig5是算法图。 结论说这个比ARIMA强很多。
3、CNN。这个主要讲 CNN-LSTM。 输入信号(买卖信号),用卷积层提取特征,池化层降低kernel数,flatten layer把所有特征转为单维向量,把单位向量作为输入传给LSTM层,Fig6是流程图,Fig7是模型图,Fig8是算法示意图。
(李沐的课里提到过CNN处理序列就是把数据看成1维向量处理,不同特征看作通道(这怎么看?可能意思是不同特征的数据,比如10天的收盘价(10,1)的一维向量,10天的某个指标值又是个(10,1) 一维向量)
后来陆续出现了:2020 CNN-BiLSTM-AM,2021 CEEMD-CNN-LSTM,CNN比其他网络更能capture rapid changes,2021 GC–CNN,2021 one dimensional CNN,2020 基于reinforcement learning并用CNN提取特征用于量化风险,2021 Hybrid of CNN-TLSTM (tanh-LSTM) 比单个模型强,回撤小,也是CNN提取特征。
4、情绪分析
NLP分析文本情绪(我试试用模糊理论情绪分类?比如小乐观、中乐观、大乐观,或用注意力去分析文本情绪),Fig9是流程图。
作者在结论总结了一下:LSTM and Hybrid LSTM 预测价格更好, CNN and Hybrid CNN预测趋势更好,CNN-LSTM Hybrid适合资产组合,hybrid CNN and LSTM适合做日内高频。
(2022)Algorithmic Trading and Cryptocurrency-a literature review and key findings
评价:原文不值得看
只讲了交易算法在加密货币领域的应用现状,比如谁把数据挖掘用在了加密货币,给个论文链接,高频交易在加密币上比较受限,给个论文链接,就只粗浅地描述历史,没有亮点。
-------------正文结束-------------
我的研究方向是机器学习在金融预测领域的应用,啃论文是体力活,大家资源共享能少走弯路,
我筛选出的所有论文及代码链接,都放在公众号-想啃论文了,
里面还有我开发的机器人,用于实盘验证论文策略,并输出交易信号,大家可免费使用,仅供科研交流。