字典类型和CountVectorizer文本类型的特征基本相同,不同的是输出的结果类型,字典直接返回的键值对。
以下代码用jupyter分块运行
运行结果含义参考上一篇:https://www.cnblogs.com/future-panda/p/16809957.html
1 from sklearn.feature_extraction import DictVectorizer 2 3 dic_data = [ 4 {'星期一': '面条', '味道':100}, 5 {'星期二': '包子', '味道':99}, 6 {'星期三': '牛奶', '味道':101}, 7 ] 8 9 dic_transfer = DictVectorizer(sparse=False) 10 new_dic_data = dic_transfer.fit_transform(dic_data) 11 12 new_dic_data 13 dic_transfer.get_feature_names_out()
标签:transfer,dic,离散,类型,特征提取,data,字典 From: https://www.cnblogs.com/future-panda/p/16810131.html