首页 > 其他分享 >机器学习金融预测领域2023部分综述论文阅读记录

机器学习金融预测领域2023部分综述论文阅读记录

时间:2024-03-23 16:23:12浏览次数:24  
标签:预测 综述 AI 论文 2023 LSTM

23年的综述最近读了3篇,总结笔记如下:

本期所有论文链接:2023综述 https://www.alipan.com/s/ySur3StxKip 点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载极速在线查看,视频原画倍速播放。

(2023)A_Systematic_Survey_of_AI_Models_in_Financial_Mark
评价:原文写的一般,可以不看。

这篇综述概述了当前的混合模型、评价指标、未来方向,指出金融市场传统的交易策略是基本面分析fundamental analysis (FA)和技术分析technical analysis(TA)。目前AI通常用在三个领域:优化投资组合、预测未来价格或趋势、对新闻或媒体进行情绪分析,其中优化投资组合涉及选股优化、管理和评估交易的资产,预测涉及股票、加密货币、外汇、期货。

作者从三个来源(Springer Link、the IEEE Xplore database、ACM digital library)按关键字(table 4 里的)搜了585篇2018~2023年的论文,
筛选摘要挑出95篇满足标准的,读了读并打分,最终挑了51篇,在table 5(ref就是下面参考文献里的论文索引)。通过对这51篇分析,得出以下结论:
市场:股票67%、加密货币16%、外汇12%、期货6%
数据:92%都用的日线,多用1~5年或5~10年的。用商业收费数据的多,雅虎财经的免费(但只有日线)。
深度学习算法: gated recurrent unit (GRU) and LSTM 在时序预测中表现出很大潜力。LSTM(49%),SVM and MLP (35%),CNN、random forest (RF)、and bi-LSTM (18% each)
混合模型:CNN + LSTM(55%),neuro-fuzzy logic (18%),LSTM-GRU, LSTM-RNN, and MLP-CNN (9% each)
评价指标:主要用sharpe ratio,ROI,max drawdown
评估模型性能的指标:主要用mean absolute percentage error (MAPE) - 33%, root mean square error (RMSE) - 33%, accuracy (31%),
mean absolute error (MAE) - 29%, mean squared error (MSE) - 29%, F measure (F1) - 20% and precision (20%)
模型输出:通常为预测的价格,或者趋势方向(上,下,不动)

table7显示9个论文用了策略,除了这9个,其余42篇论文的策略 are specialized techniques and thus require a financial, economic, and statistical understanding of the financial market to implement.Figure17是挑出的51篇文章对应的期刊,最下面6个是顶刊

最终结论:混合模型比传统机器学习技术表现更好.


(2023)Machine learning-based approaches for financial market prediction: A comprehensive review
评价:原文不值得看
作者找了1995~2019得2326篇论文,基于此分析了AI在股票市场的应用。这篇综述就是把一堆论文概括了一下,按照时间顺序,讲哪个作者用了啥技术,结论是啥。
我从近5年的开始记录了几篇结论有价值的论文(就是从本论文11页最后一段开始),其余的论文作者也没说清楚有啥重点:
11页最下面ref37,2022,发现仅靠历史数据不够,加上对社交媒体上情绪的分析,可以使预测准确率增加到80%.
12页ref38,2020,第一个把词嵌入和深度学习结合,用including LSTM networks, RNNs, and CNNs, word embedding models Word2Vec, GloVe, and FastText 比了一圈,发现词嵌入和深度学习结合可以预测方向。测试是用伊斯坦布尔的银行股,收集它的新闻、评论。
12页ref39,2020,是个综述,盘点了关于股票预测的机器学习算法。
12页ref40,2021,发现单一预测模型不够用,得用混合模型,他用机器学习和均值优化投资组合,提出极端梯度增强(XGBoost)和增强萤火虫算法(IFA,用来微调XGBoost)组合模型来预测股票价格。说用在A股优于现状,但没说现状是啥样。
12页ref41,2021,综述,看了353篇论文,说神经网络和模糊逻辑能用来预测,the most frequently cited authors in this area are Markowitz and Lebaron.
13页ref42,2021,综述,说用 root-mean-square error (RMSE)评估,LSTM最强;用夏普率评估,强化学习最强。 建议大家按需选择
13页ref44,2021,调查,异常推断在机器学习领域应用,用基于regression trees的集成算法准确预测了一天内的价格异常变动。
14页ref46,2022,对比了SVM,CNN,Regression-based model,LSTM,发现SVM and the mix of CNN and LSTM are effective at forecasting stock prices.


(2023)A Comprehensive Review on Financial Explainable AI
评价:原文不值得看
这篇综述研究AI可解释性在金融领域现状,作者起了个名:FinXAI。因为传统策略像白盒能看懂但难满足预期性能,AI像黑盒但大部分情况能满足预期性能,所以想让黑盒变白盒,从而让人放心用使用AI。作者从Scopus搜索并分析了69篇论文,讲了这些论文怎么解释模型,怎么解释特征,还解释了哪些内容。

 

   -------------正文结束-------------
我的研究方向是机器学习在金融预测领域的应用,啃论文是体力活,大家资源共享能少走弯路,
我筛选出的所有论文及代码链接,都放在公众号-想啃论文了
里面还有我开发的机器人,用于实盘验证论文策略,并输出交易信号,大家可免费使用,仅供科研交流。

标签:预测,综述,AI,论文,2023,LSTM
From: https://www.cnblogs.com/zhaot1993/p/18091248

相关文章

  • 【附源码】JAVA计算机毕业设计音乐平台设计与实现(springboot+mysql+开题+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着信息技术的飞速发展,互联网已经渗透到人们生活的方方面面,音乐作为人们日常生活的重要娱乐方式,其在线化、平台化的发展趋势日益明显。近年来,音乐平......
  • 【附源码】JAVA计算机毕业设计音乐平台的设计(springboot+mysql+开题+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着数字技术的迅猛发展,音乐产业正在经历一场深刻的变革。传统音乐销售模式逐渐式微,而在线音乐平台以其便捷性、多样性和互动性,迅速占领了市场。当前......
  • SpringBoot 面向面试学习(2023.03.23更新)
    导语在网上找了很多SpringBoot相关的教程,要么是针对初学者面向实战入门的视频,要么基于面试但存在收费或不全面的问题……因此参考网上博客特此总结了一些可能常见的面试题,循序渐进,以问题为导向,以面试为场景进行学习/复习。JavaGuide提供的Spring常见面试题总结可以去看,里面......
  • #17 2023.3.18
    645.loj4038「SNOI2024」树V图646.loj4039「SNOI2024」矩阵647.loj4040「SNOI2024」拉丁方648.loj4041「SNOI2024」平方数649.loj4042「SNOI2024」公交线路650.loj3903「PA2022」Palindrom651.loj3904「PA2022」WielkiZderzaczTermionów652.loj......
  • 论文研读(含2G的CSI数据集+导入数据的代码):CSI-Former: Pay More Attention to Pose Est
    论文概述本文提出了一种新的基于WiFi的姿态估计方法。基于WiFi的信道状态信息(CSI),提出了一种新的结构CSI-former。为了评估CSI-former的性能,本文建立了一个新的数据集Wi-Pose。该数据集由5GHzWiFiCSI、相应的图像的骨架点注释组成。背景Transformer由于其强大的多头注意力......
  • django《大学计算机》课程思政资源共享平台(源码+mysql+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景:在当今信息化社会,教育领域正逐渐实现数字化转型,其中课程资源的共享与利用成为提高教学效率和质量的关键。特别是对于《大学计算机》这类基础且重要的课程,构......
  • django+Mybatis的医生在线诊所平台(源码+mysql+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景:随着互联网技术的迅猛发展和普及,越来越多的传统行业开始向数字化转型。医疗健康领域作为与人们生活密切相关的行业,其服务模式也正逐渐从传统的面对面诊疗转......
  • djangoJAVA汽车年审管理系统(源码+mysql+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景:随着汽车产业的快速发展,汽车已经成为人们日常生活中不可或缺的交通工具。然而,随着汽车数量的增加,汽车安全问题也日益凸显。为了确保道路交通安全,各国政府都......
  • 【附源码】django计算机毕业设计web的房屋租赁系统的设计与实现(源码+mysql+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景:随着经济的发展和社会的进步,人们对于居住环境的需求越来越高。房屋租赁市场作为房地产市场的重要组成部分,近年来呈现出快速发展的态势。然而,传统的房屋租赁......
  • BUPT 2024 Spring Training #3(ICPC2023 杭州站)Ag复盘
    D-OperatorPrecedence求一个长度为\(2n\)的序列\(a_{2n}\)满足条件\((a_1×a_2)+(a_3×a_4)+\ldots+(a_{2n-1}×a_{2n})=a_1×(a_2+a_3)×\ldots×(a_{2n-2}+a_{2n-1})×a_{2n}\)solution构造题显然找特殊规律。考虑到乘法构造难度大于加法,可以从乘法开始考虑。......