机器学习与量化交易分类任务

时间：2024-06-05 21:36:09浏览次数：30

标签：机器策略模型分类学习算法回测 Learning 量化

> Julyedu.com 感谢白嫖的七月在线专注数据领域的在线教育
01 自动化交易综述

时间序列分析
策略建模及其优化方法
策略评价与回测
风险管理
交易策略的实现
交易策略的执行
BP(Back Proppagation)算法

误差反向传播(Error Back Propagation, BP)算法。
学习过程由信号的正向传播与误差的反向传播两个过程组成。
Algorithmic Trading Without Bullshit 算法交易综述

Algorithmic Trading利用自动化平台，执行预先设置的一系列规则完成交易行为。

提出假设移动平均数神经网络
SVM是一种监督学习算法,它可以用于分类和回归分析。
时间序列分析

建立模型
回测验证
执行交易

交易策略的来源 Strategy
1.市场微观结构研究(for HFT mostly) 微观市场尺度
ORDER BookS 下单 bid ask symbol 数量 limit price撮合价格
预测下一个 tick

2.基金结构套利(fund structure arbitrage)
3.机器学习/人工智能函数模型
线性回归模型

历史数据 X 二维向量 x1 x2
新的输入 training
学习算法
模型 w向量权重
模型
输出

SVM
DNN
RF
NB 朴素贝叶斯(Naïve Bayes, NB)算法

Price/MA指标训练集
决策边界
线性分类器

Four paradigms of machine learning
Connectionism 联结主义神经网络连接加权线性变换
Symbolism 形象符号主义不规则决策树可解释
Frequentists
Bayesian 贝叶斯

A (super) Brief History of A.l
58-69 NNs, logics 逻辑主义
7OS WINTER 寒冬
80-95 NNS 黑盒
95-10 SVMs and statistical learning 数据背景
10s-current
06-11

hinton教授
Ruslan Salakhutdinov
Stephen Muggleton

Machine Learning in a nutshell
Data
Model & Objective Function
Optimization 寻找函数极值

监督学习

Machine Learning & Trading
Limit Order Book Modeling 高频微观尺度
Price-based Classification Models 基于价格分类 MA5 MACD
Text-based Classification Models 自然语言文本爬取噪声大风控
Reinforcement Learning 强化学习

4 Key Factors that makes magic happens
Good Model and Efficient Training Algorithms ML
Hardware( GPU/CPU)
(high quality) DATA
Platform(keras/tensorflow/sklearn)
ML(Machine Learning)、DP(Deep Learning)

深度学习
CNN for spatial data(空间次序) 卷积神经
LSTM for temporal data(时间次序)

隐马尔可夫模型（Hidden Markov Model，HMM ）是一种统计模型，用于描述一个含有隐含未知参数的马尔可夫过程。

强化学习
envir
agent
policy
reward
action

cs231N

自然语言处理
文本编码器上下文向量语义定义语义关联
新闻编码标记神经网络
非监督学习

特征工程定义X输入向量指标 MA5
特征选择 feature

训练分类器
建立

交易策略的评估
1. 策略基本假设
2. Sharp Ratio
3. 杠杆
4. 频率
5. 风险
6. W/L
7. 模型复杂度
VC Dimension:全称是Vapnik-Chervonenkis dimension。其用来衡量一个模型的复杂度
8. 最大亏损(Maxium drawdown)
9. Benchmarking

何谓回测?
将交易策略在历史数据中进行合理验证的过程

回测的意义1.策略筛选2.策略优化3.策略验证

错误的回测方法
很多情况下，回测结果不错，实盘交易不尽如人意，造成的偏差原因主要有:
1.乐观主义偏差。(special look back region)
时间旅行。
程序Bug
2. Train/Val/Test set 训练验证测试
3. 幸存者误差

sklearn
pandas

事件驱动

#event driven
while True:
	new_even = get new_event()
	if new event.something=="whatever"
		do_something()
	if new event.something== "all right"
		do_something_else()
	tick(50)  #wait 50 milliseconds

Event
Event Queue
DataHandler
Strategy
Portfolio
ExecutionHandler
Backtest

08 自动交易系统的搭建 2000个

Scikit-learn（以前称为scikits.learn，也称为sklearn）是针对Python 编程语言的免费软件机器学习库。它具有各种分类，回归和聚类算法，包括支持向量机，随机森林，梯度提升，k均值和DBSCAN，并且旨在与Python数值科学库NumPy和SciPy联合使用。
Random Forest 随机森林 2001
RFR是一种集成学习方法,通过组合多个决策树模型进行预测,以提高预测准确性。
ExtraTreesRegressor 完全随机树 04-06
抗击过拟合界面问题

将数据集划分为训练集和测试集

损失函数
均方误差（Mean Squared Error，MSE）作为评估指标
反映估计量与被估计量之间差异程度的一种度量。设t是根据子样确定的总体参数θ的一个估计量，(θ-t)2的数学期望，称为估计量t的均方误差。它等于σ2+b2，其中σ2与b分别是t的方差与偏倚。

标签：机器,策略,模型,分类,学习,算法,回测,Learning,量化
From： https://www.cnblogs.com/amingmm/p/18233607

实验15-使用RESNET完成图像分类
model.py#-*-coding:utf-8-*-"""author:ZhouChendatetime:2019/6/259:10desc:实现模型"""fromkeras.modelsimportModelfromkeras.layersimportConv2D,MaxPooling2D,BatchNormalization,Flatten,Input,ZeroPadding2D......
钉钉机器人远程重启系统服务
fromflaskimportFlask,requestimportsubprocessapp=Flask(__name__)@app.route('/send_message',methods=['GET'])defsend_message():webhook_url='https://oapi.dingtalk.com/robot/send?access_token=YOUR_TOKEN'#......
Java线程池分类简单列举
一、Java四种线程池Java通过Executors提供四种线程池，分别为newSingleThreadExecutor创建一个单线程化的线程池，它只会用唯一的工作线程来执行任务，保证所有任务按照指定顺序(FIFO,LIFO,优先级)执行。newFixedThreadPool创建一个定长线程池，可控制线程最大并发数，超出......
机器学习学习
机器学习是一个涵盖广泛且深入的领域，其复杂性和多样性使得在2000字的篇幅内全面介绍其所有方面颇具挑战。然而，我可以提供一个简化的概述，涵盖机器学习的基础概念、主要类型、应用以及未来趋势。一、引言机器学习是人工智能领域的一个子集，它赋予计算机系统从数据中学习并做出预......
【杂谈】AIGC之ChatGPT-与智能对话机器人的奇妙对话之旅
与智能对话机器人的奇妙对话之旅引言在数字时代的浪潮中，ChatGPT如同一位智慧的旅伴，它不仅能够与我们畅谈古今，还能解答我们的疑惑，成为我们探索知识海洋的得力助手。今天，就让我们走进ChatGPT的世界，一探这位智能对话机器人的奥秘。起源：ChatGPT的诞生ChatGPT的诞生，可以追溯......
六足机器人运动学
文章目录前言六足机器人运动学分析1.正运动学2.逆运动学3.MATLAB验证正逆解代码前言六足机器人运动学六足机器人运动学分析六足机器人运动学分析就是将空间直角坐标系建立再机器人腿部的关节上将腿部各关节之间的间距，关节的夹角进行关系转换，求解其位置......
【机器学习基础】Python编程02：五个实用练习题的解析与总结
Python是一种广泛使用的高级编程语言，它在机器学习领域中的重要性主要体现在以下几个方面：简洁易学：Python语法简洁清晰，易于学习，使得初学者能够快速上手机器学习项目。丰富的库支持：Python拥有大量的机器学习库，如scikit-learn、TensorFlow、Keras和PyTorch等，这些库提供了......
第三届机器人、人工智能与信息工程国际学术会议（RAIIE 2024）
【ACM独立出版/Fellow大咖云集】2024年第二届机器人、人工智能与信息工程国际学术会议（RAIIE2024）20243rdInternationalSymposiumonRobotics,ArtificialIntelligenceandInformationEngineering大会官网：https://ais.cn/u/juURra大会时间：2024年07月05-07日大会地点：新......
【机器学习算法】降维
降维算法是数据预处理中的一种技术，主要用于减少数据集中的特征数量，同时尽可能保留原始数据的重要信息。数模掌握线性降维方法就已经很强了。目录线性降维方法主成分分析（PCA）线性判别分析（LDA）非线性降维方法基于核函数的非线性降维方法基于特征值的非线性降维方法（流型......
【机器学习算法】回归算法（下） #一文归纳众多算法，建议收藏
本文介绍一些传统的机器学习中的有监督算法，然后讲一下集成算法，并给出一张各种算法的“谱系”图。同时，本文对很多算法都给出了示意图系列文章目录【机器学习概念】【机器学习流程】【机器学习算法】回归算法（上）【机器学习算法】回归算法（中）目录SVM（支持向量机）软边界和......

机器学习与量化交易分类任务

相关文章

赞助商

阅读排行

机器学习与量化交易 分类任务

相关文章

赞助商

阅读排行

机器学习与量化交易分类任务