一、机器学习概述
1、人工智能概述
人工智能发展必备三要素:
- 数据
- 算法
- 计算力
人工智能、机器学习、深度学习
- 机器学习是人工智能的一个实现途径
- 深度学习是机器学习的一种方法
机器学习、深度学习能做什么
- 传统预测:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类
- 图像识别:街道交通标志检测、人脸识别
- 自然语言处理:文本分类、情感分析、自动聊天、文本检测
什么是机器学习
定义:机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测
构成:数据+模型+预测
数据集构成:特征值+目标值 例如:识别猫和狗: 特征值:图片目标值:猫/狗**-类别**
机器学习算法分类
算法分类:监督学习+无监督学习
监督学习:预测
- 定义:输入数据是由输入特征和目标值所组成,即有标准答案;函数的输出可以是一个连续的值,称为回归;也可以是一个离散的值,称为分类
- 分类:k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
- 回归:线性回归、岭回归
无监督学习
- 定义:输入数据是由输入特征值组成,没有目标值,即无标准答案。
- 聚类:k-means
半监督学习:
- 定义:训练集同时包含有标记样本数据和未标记样本数据
强化学习:
- 定义:实质是make decisions 问题,即自动进行决策,并且可以做连续决策
机器学习工作流程
- 获取数据
- 数据基本处理
- 特征工程
- 机器学习(模型训练)
- 模型评估
1)结果达到要求,上线服务
2)没有达到要求,重新上面步骤
- 应用