首页 > 其他分享 >Hamlet 词频统计

Hamlet 词频统计

时间:2023-02-20 15:22:05浏览次数:31  
标签:word items Hamlet 词频 counts txt 统计

 1 def getText():
 2     txt = open('I:\Hamlet_-Prince-of-Denmark_哈姆雷特_.txt','r').read()
 3     txt = txt.lower()
 4     for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':
 5         txt = txt.replace(ch, " ")
 6     return txt
 7 
 8 hamletTxt = getText()
 9 words = hamletTxt.split()
10 counts = {}
11 for word in words:
12     counts[word] = counts.get(word,0) + 1
13 items = list(counts.items())
14 items.sort(key=lambda x:x[1], reverse=True)
15 for i in range(10):
16     word, count = items[i]
17     print("{0:<10} {1:>5}".format(word,count))

 

标签:word,items,Hamlet,词频,counts,txt,统计
From: https://www.cnblogs.com/T-2187803607/p/17137589.html

相关文章

  • SQL216 统计各个部门的工资记录数
    题目描述有一个部门表departments,有一个,部门员工关系表dept_emp,有一个薪水表salaries,请你统计各个部门的工资记录数,给出部门编码dept_no、部门名称dept_name以及部门......
  • PAT-basic-1021 个位数统计 java
    一、题目给定一个 k 位整数 N=dk−1​10k−1+⋯+d1​101+d0​ (0≤di​≤9, i=0,⋯,k−1, dk−1​>0),请编写程序统计每种不同的个位数字出现的次数。例如:给定 N=1......
  • c语言填空:统计输入的字符中所有大写字母的个数
    #include<stdio.h>//用来统计输入的字符中所有大写字母的个数,用#结束输入main(){inta[26],i;charch;for(i=0;i<26;i++)a[i]=【1】;ch=ge......
  • 统计信息
    原文:https://www.cnblogs.com/klb561/p/11343440.html一、什么是统计信息统计信息主要是描述数据库中表,索引的大小,规模,数据分布状况等的一类信息。例如,表的行数,块数,平均......
  • 统计学——复习笔记
    目录算数平均数计算加权算术平均数调和平均数(倒数平均数)加权调和平均数几何平均数在组距数列中确定中位数在组距数组中确定众数在组距数组中确定四分位数极差(全距)四分位差(......
  • 统计lvm 超分情况
    #!/usr/bin/python3'''统计lvm超分比例'''importosimportsocketh=socket.getfqdn()a='''lvs--nohead--unitsk|awk'$3~"^Vw"{sum[$5]+=$4};END{for(i......
  • Pytest-html报告优化+增加错误截图,获取统计数据
    1、在我们实际工作中,环境信息不一定要在报告中详细提现,可以增减2、用例信息,默认展示的是用例的model名::用例名称,并不直观,所以我们可以增加一个用例描述,直观描述用例的测......
  • 分组统计加强
    --增强groupby的使用--显示每种岗位的雇员总数、平均工资SELECTCOUNT(*)ASSUM,AVG(sal),jobFROMempGROUPBYjob--显示雇员总数,以及获得补助的雇员数--......
  • 校帮教培管理系统课时记录系统划课系统课消提醒记课时刷卡消课指纹消课上课提醒课时统
     1、主要用于教培机构的课消管理,课消提醒功能,以及学员管理,教师管理,教师的提成自动计算等。2、这样做的好处就是免去教培机构用纸值的方式去记录课时,而且系统还可以自动......
  • 3603、统计好三元组
    给你一个整数数组arr,以及a、b、c三个整数。请你统计其中好三元组的数量。如果三元组(arr[i],arr[j],arr[k])满足下列全部条件,则认为它是一个好三元组。0<=i<......