机器学习之特征提取（二）——字典类型特征提取（特征离散化）

时间：2022-10-20 15:56:33浏览次数：57

字典类型和CountVectorizer文本类型的特征基本相同，不同的是输出的结果类型，字典直接返回的键值对。

以下代码用jupyter分块运行

运行结果含义参考上一篇：https://www.cnblogs.com/future-panda/p/16809957.html

 1 from sklearn.feature_extraction import DictVectorizer
 2 
 3 dic_data = [
 4     {'星期一': '面条', '味道':100},
 5     {'星期二': '包子', '味道':99},
 6     {'星期三': '牛奶', '味道':101},
 7 ]
 8 
 9 dic_transfer = DictVectorizer(sparse=False)
10 new_dic_data = dic_transfer.fit_transform(dic_data)
11 
12 new_dic_data
13 dic_transfer.get_feature_names_out()

标签：transfer,dic,离散,类型,特征提取,data,字典
From： https://www.cnblogs.com/future-panda/p/16810131.html

机器学习之特征提取（一）—— CountVectorizer文本特征提取
CountVectorizer是文本特征提取的一种方式：本文为稀疏矩阵具体含义其中new_data所输出的值用toarray()可以转化为稀疏矩阵new_data.shape():输出的是稀疏矩阵的维度（列表长......
基于SIFT特征提取的图像拼接算法matlab仿真
目录一、理论基础二、核心MATLAB程序三、MATLAB仿真测试结果一、理论基础SIFT算法得到了图像中的特征点以及相应的特征描述，如何把两张图像中的特征点匹配起来呢？一般的......
hdu 1979 DFS + 字典树剪枝
http://acm.hdu.edu.cn/showproblem.php?pid=1979FilltheblanksTimeLimit:3000/1000MS(Java/Others) MemoryLimit:32768/32768K(Java/Others)Tota......
离散型制造业如何做生产质量管控和智能追溯?
离散型制造业做生产质量管控和智能追溯应该做到完善的质量追踪体系和生产过程中的防错防呆来保证质量。首先质量管理应该建立完善的质量跟踪体系，建立产品的全生命周期的管......
【Python】判断列表或字典中是否存在key值
第一种in方法，即列出所有key值查询是否在里面a={"name":"1","value":"2"}if"name"ina.keys():print("存在")else:print("不存......
python对列表里的元组，列表，字典进行排序
python对列表里的元组，列表，字典进行排序其实很简单就是利用列表对象自带的sort方法和方法内的key关键字参数和lambda匿名函数搭配即可。若有:L=[('b',6),('a',1),('c',3)......
8、深入Python字典和集合
字典和集合字典是一系列无序元素的组合，其长度大小可变，元素可以任意地删减和改变。不过要注意，这里的元素，是一对键（key）和值（value）相比于列表和元组，字典的性能更优，特别是对于......
魔道书字典炼金入门
高级用法魔道书字典炼金入门基于AUTOMATIC1111(https://github.com/AUTOMATIC1111)/stable-diffusion-webuiAttention/emphasis注意/强调使用()在提示中增加模型对内......
使用剪贴板（字典）自动回复消息
#!python3#mclip.py--使用多剪贴板自动回复消息"""脚本运行属实大费周章：因为本身电脑base是py3.10miniconda下载时默认基带py3.9而我的包基本都是在自......
python基础-字典常用操作
1.通过key获取value dict={key1:value1,key2:value2} dict['key1']可获取到key1对应的value1 person={'name':'tt','age':13}print(person['age'])......

机器学习之特征提取（二）——字典类型特征提取（特征离散化）

相关文章

赞助商

阅读排行