词云图是一种适用于文本数据的可视化图表类型。在词云中,关键词的字号大小或颜色深浅代表了这些词的重要程度。因此它是一种非常直观且美观地呈现文本数据词频分析结果的图表工具。
制作词云是我的一项小组作业,现在我来向大家展示我们(和小伙伴:@红豆粥粥_)的成果。
我们组选择的文本是《红楼梦》首先给大家看我们做出的最终效果。
接下来,是我们的代码部分。
其实代码是比较简短的,下面我将给大家讲解代码的主要部分。首先,制作图云最重要的就是导入必要的库,我们导入了jieba库、wordcloud库、imageio库以及matplotlib库来实现词云的生成。然后就是准备文本数据,我们摘取了《红楼梦》的目录作为文本放在txt文本文档中,并进行相应的读取操作。随后我们利用jieba对文本进行分词操作,并将停用词文件中的词读入到列表stopwords中。筛选关键词,去掉长度为1和在停用词文件中的以及指代同一个人的不同称呼。其次就是设置词云图的参数,最后生成词云完成对词云的展示。下面是我们摘取有关《红楼梦》的文本以上就是我展示的全部内容,感谢大家的观看!
标签:jieba,展示,红楼梦,词云,文本,制作,我们 From: https://blog.csdn.net/2402_89617807/article/details/144396752