首页 > 其他分享 >机器学习day1

机器学习day1

时间:2023-01-14 12:23:18浏览次数:31  
标签:机器 特征 day1 学习 处理 词语 文本 数据

sklearn数据集

load_* 小数据集
fetch_* 大数据集,默认下载到家目录下的scikit_learn_data

对数据的索引

  1. []
  2. .
    img

特征工程

字典类型特征处理

img

文本特征处理

  1. 文本特征处理分为两类:英文文本、中文文本,其中中文文本需要进行空格分词
    img
    img
  2. 按分类方法分类可分为CountVectorizer,TfidfVectorizer两类,前者统计词语出现次数,而后者统计词语的重要程度,更适合文本特征处理。
    img

标签:机器,特征,day1,学习,处理,词语,文本,数据
From: https://www.cnblogs.com/lmyy/p/17051550.html

相关文章

  • 漏洞免费实战部分-安卓应用漏洞学习case5
    前期回顾漏洞免费实战部分-安卓应用层getLastPathSegment函数问题漏洞实战部分2-安卓应用ZipEntry对象问题实战漏洞实战部分3-ContentProvider组件的openFile接口问题......
  • 安卓学习1--基础属性详解
    基础属性详解11.layout_width:组件的宽度232.layout_height:组件的高度453.id:为TextView设置一个组件id674.text:设置显示的文本内容895.textCo......
  • 安卓学习3--实现跑马灯效果的TextView
    实现跑马灯效果的TextView11.android:singleLine:内容单行显示232.android:focusable:是否可以获取焦点453.android:focusableinTouchMode:用于控制视图在触摸模式......
  • 安卓学习2--带阴影的TextView
    带阴影的TextView11.android:shadowColor:设置阴影颜色,需要与shadowRadius一起使用232.android:shadowRadius:设置阴影的模糊程度,设为0.1就变成字体颜色,建议使用3.04......
  • JAVASE强化基础Day1
    总结:java跨平台性:首先编写java文件,再通过编码变成class文件,最后通过JVM(JAVA虚拟机)跨平台可以运行编码:java代码编码一般再eclipse和idea上都式TUF-8,如果发现代码的中文......
  • Jmeter学习:后置处理器--正则表达式提取器
    一、正则表达式提取器功能:通过该组件,我们可以通过正则表达式提取所需要的值,功能非常强大请务必了解Java正则表达式的常见用法(匹配模式、组概念),参考:https://www.runo......
  • <Verilog学习>Verilog设计参数化的译码器与编码器,以及设计4位格雷码计数器
    使用Quartus+modelsim完成设计目录1.参数化的译码器分析代码实现Testbench结果2.参数化的编码器分析代码Testbench结果3.4位格雷码计数器分析代码Testbench结果1.参......
  • <Verilog学习>Verilog设计“111”检测器与“01110”检测器并测试所有情况
    使用Quartus+modelsim完成本次设计目录1."111"检测器分析代码实现Testbench结果2."01110"检测器分析代码实现Testbench结果1."111"检测器分析分析题目,得到其有限状......
  • Java学习笔记10
    1.抽象类1.1概述​ 没有方法体的方法称为抽象方法。Java语法规定,包含抽象方法的类就是抽象类。抽象方法:没有方法体的方法。抽象类:包含抽象方法的类。1.2abstract......
  • 圆方树学习笔记
    部分内容参照了OI-wiki定义对于这样的一个无向图,左侧的\({1,2,3}\)和右侧的\({3,4,5}\)分别构成一个点双联通分量。中间的\(3\)号节点就是一个割点。不难发现,点双......