jieba分词——西游记相关的分词，出现次数最高的20个

时间：2023-12-19 18:47:16浏览次数：39

 1 import  jieba
 2 
 3 txt = open("D:\Python project\Python123作业\西游记.txt", "r", encoding='utf-8').read()
 4 words = jieba.lcut(txt)     # 使用精确模式对文本进行分词
 5 counts = {}     # 通过键值对的形式存储词语及其出现的次数
 6 
 7 for word in words:
 8     if len(word) == 1:
 9         continue
10     elif word == "大圣" or word=="老孙" or word=="行者" or word=="孙大圣" or word=="孙行者" or word=="猴王" or word=="悟空" or word=="齐天大圣" or word=="猴子":
11         rword = "孙悟空"
12     elif word == "师父" or word == "三藏" or word=="圣僧":
13         rword = "唐僧"
14     elif word == "呆子" or word=="八戒" or word=="老猪":
15         rword = "猪八戒"
16     elif word=="沙和尚":
17         rword="沙僧"
18     elif word == "妖精" or word=="妖魔" or word=="妖道":
19         rword = "妖怪"
20     elif word=="佛祖":
21         rword="如来"
22     elif word=="三太子":
23         rword="白马"
24     else:
25         rword = word
26     counts[rword] = counts.get(rword,0) + 1
27 
28 items = list(counts.items())#将键值对转换成列表
29 items.sort(key=lambda x: x[1], reverse=True)    # 根据词语出现的次数进行从大到小排序
30 
31 for i in range(20):
32     word, count = items[i]
33     print("{0:<10}{1:>5}".format(word, count))

输出结果：

标签：jieba,rword,word,elif,20,分词
From： https://www.cnblogs.com/kfcvme50/p/17914417.html

2023-2024第一学期第十二周助教总结
本次总结所属课程2023-2024第一学期计算机基础与程序设计本次作业要求作业要求作业提交情况提交情况一、作业提交情况：本周大部分同学可以做到按时提交作业，只有一小部分同学在作业截止时间内未能按时提交，希望这些同学可以重视每老师布置的作业，认真完成并按时提......
【笔记】2023.12.19：题目选讲
笔记2023.12.19：题目选讲不会的题目没在这里展现。一共14道题。gym103371IOrganizingColoredSheets猜结论：两个同一行的sharp的间隙的\(\min\)是\(W\)上界，同一列的sharp的间隙的\(\min\)是\(H\)上界，然后相乘。这是假的，是答案上界，过不去样例二。每个\(H\)对......
CMO 2023 p6 省流版
题解题目中要求,位置\(i\)上的数要运动到位置\(u_i=(p_i+k)\bmodn\),其中\(k\)可以任选.假设位置\(i\)上的数运动过程中,它总共以逆时针方向运动了\(x_i\)个单位(可为负数).把全部的\(x_i\)均加上一个常数，仍然会是合法的.通过调整法可证,存在一种最优移动......
[NOI2023] 桂花树
[NOI2023]桂花树题目描述小B八年前看到的桂花树是一棵\(n\)个节点的树\(T\)，保证\(T\)的非根结点的父亲的编号小于自己。给定整数\(k\)，称一棵\((n+m)\)个节点的有根树\(T^{\prime}\)是繁荣的，当且仅当以下所有条件满足：对于任意满足\(1\lei,j\len\)的\((i,j)......
你牛什么牛 (女汉子版) - 唐古发行时间:2014年12月25日
唐古演唱的歌曲《你牛什么牛》是甜心才女唐古为微电影《我们都是女汉子》演唱的主题曲。发行时间:2014年12月25日你牛什么牛(女汉子版)-唐古词：师立宅曲：李风持编曲：南少东后期：王路遥总监制：刘晓洪出品人：石太锋你牛你牛你牛你呀牛什么牛你牛你牛你牛你呀牛什......
打工笔记--------------------winform程序报错CLR20r3签名System.I0.IOException
先看问题编写了一个程序在我本机运行没有问题，放到别人电脑上就有可能报这种错误System.I0.IOException 首先我问了一下ChatPgt:他说：CLR20r3是一个通用的错误代码，表示在.NETFramework中发生了未处理的异常。System.IO.IOException是与输入/输出操作相关的一个常见......
20231219
j使用final框架时localhost打不开的界面由于网络协议的问题原文参考win10localhost解析为::1的解决办法-CSDN博客......
jieba 分词
西游记相关的分词，出现次数最高的20个输入：1importjieba2excludes={"一个","我们","怎么","那里","不知","不是","只见","两个","不敢","这个","如何","原来","甚......
2024年软考报名条件有哪些?有学历限制吗？
不少考生开始准备报名2024年软件水平考试，那么报名软考有没有学历、专业以及工作经验等方面的限制呢?今天小编就给大家详细来介绍一下。软考报名条件如下： 1、凡遵守中华人民共和国宪法和各项法律，恪守职业道德，具有一定计算机技术应用能力的人员，均可根据本人情况，报名参加相应专业类......
【2023潇湘夜雨】WIN11_Pro_Canary_26016.1000软件选装纯净版12.19
【系统简介】=============================================================1.本次更新母盘来自WIN11_Pro_Canary_26016.1000。2.增加部分优化方案，手工精简部分较多，干掉右下角水印。3.OS版本号为26016.1000。精简系统只是为部分用户安装，个别要求高的去MSDN下。4.集成《DrvCeo-2.1......

jieba分词——西游记相关的分词，出现次数最高的20个

相关文章

赞助商

阅读排行