机器学习模型
在 MySkill 继续学习,最后教授的材料是关于机器学习的。在这篇文章中,我将分享机器学习的一个概念或一个粗略的想法。我想分享一下如何一步一步地在python中构建机器学习模型,但我仍然需要了解它。因为这对我来说也很难:(
作为数据科学家,我们需要了解构建机器学习模型。如果您查看数据科学家的职位空缺,其中一项要求是具备机器学习方面的专业知识。因为数据科学家所做的任务是使用机器学习构建算法模型。
在我们建立机器学习模型之前,我们需要知道机器学习是什么,机器学习的类型,以及机器学习是如何工作的。
什么是机器学习?
赫伯特·亚历山大·西蒙
“机器学习关注的是通过经验自动提高性能的计算机程序。”
因此,可以说机器学习是一种无需用户指导即可自行学习的机器。
我们什么时候使用机器学习?
在处理确定性解决方案不足的复杂任务时
示例:识别语音/图像
构建个性化系统时
示例:推荐和个性化
处理难以跟踪的任务时
示例:例如,自动驾驶、欺诈检测
机器学习应用示例
预言: 移动贷款服务,可预测付款失败的可能性
图像识别: 人脸识别
金融业: 欺诈调查和信用检查。
机器学习的类型
有两种常用的机器学习类型
什么是目标列?目标列是要预测的列。
监督学习的类型
- 分类
- 回归
无监督学习的类型
- 聚类
它是如何工作的?
我们想预测鸢尾花的种类。因为数据有标签,所以使用的机器学习类型是监督学习。那么如何确定要使用的模型呢?什么是回归?还是分类?甚至任何其他模型?你需要一一尝试,然后比较哪个结果更好
物种 column 将用作要预测的列。机器学习会自行从其他列或通常所说的特征中学习。
例如,如果萼片长度 3.7,萼片宽度 3.0,花瓣长度 5.5,花瓣宽度 2.5,那么物种类型是什么?从特征来看,机器可以预测物种的类型,无论是 setosa、virginica 还是 versicolor。
构建机器学习
你要做的第一件事是 EDA(探索性数据分析)。 然后,之后你可以做建模算法。如果模型评估的结果很好,那么最后一步就是部署。
您通常在数据预处理中做什么?
数据准备
- 检查行数和列数
- 检查数据类型
- 检查缺失值
- 检查描述性统计
- 检查分布
- 检查相关性
- 检查异常值
- 检查重复
在此步骤中,您必须准备数据。数据有问题吗?缺失值、异常值、错误标签示例
如果有缺失值怎么办?
您有 2 个选项:
1.删除数据
2. 估算数据
你在特征工程中通常做什么?
有2种:
1. 转换功能(例如,将日期转换为工作日、标准化)
2. 特征创建(例如,文本的 n-gram,如果单词被大写以检测名称等)
谢谢!
https://machinelearningknowledge.ai/python-libraries-for-machine-learning-beginners-guide/
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
本文链接:https://www.qanswer.top/37906/02051911
标签:机器,检查,模型,示例,学习,数据 From: https://www.cnblogs.com/amboke/p/16707018.html