Requests
jieba 分词应用:使用 jieba 分词对一个文本进行分词,将分词结果保存于文件“fc.txt”中,注意结果只保存有效词语,单字不保存。并统计在文章中出现次数最多的前五个词语(一个字的不算词语)。(问题来源:旺财的python作业)
Text
董卓进京后,废立皇帝,残害百姓,荒淫暴虐,激起群臣共愤。一日,司徒王允假借庆寿,约请几位旧臣到他府中叙谈。当他谈到:“社稷旦夕难保”时,情不自禁,掩面哭泣。骁骑校尉曹操自告奋勇,愿行刺董卓。他向王允借来七星宝刀,来到董卓相府,伺机行刺。董卓正在园中小阁休息,他问曹操:“何故来迟?”曹操说因马太瘦弱。董卓便命吕布为曹操挑选一匹好马,吕布出阁而去。
董卓因感困乏,倒身而卧,当他面朝里翻过身去时,曹操急忙拔出宝刀,刚要行刺,不料董卓从铜镜中看见曹操拔刀的身影,急忙回身问操,此时吕布已经牵马来到小阁,曹操急中生智,立即捧刀跪下说:“操近得七宝刀一口,献上恩相。”董卓接过宝刀,很是喜爱,便让操出阁去看马,曹操将马牵出相府,飞身上马,逃出洛阳。
董卓察觉事有蹊跷,知是曹操行刺,便命各地画影图形,捉拿曹操。曹操欲回乡,途经中牟县,被县令陈宫认出。陈宫得知曹操要号召天下诸侯,兴兵共讨董卓,被他的壮志打动,便弃了官职,追随曹操。一天,他们借宿在曹操故友吕伯奢家中,吕伯奢往邻村买酒款待二人。
曹操听到吕家厨房杀猪时的刀声和人语,疑心吕家要加害于他,误杀了吕伯奢全家。为了避免留下后患,在路上又杀死了买酒回来的吕伯奢。陈宫责怪曹操不该“明知而故杀”。曹操却冷笑道:“宁教我负天下人,休教天下人负我。”
陈宫不愿跟随这样不仁不义的人,弃操而去。
曹操逃回陈留之后,尽散家财,招兵买马,准备联络袁绍等人共讨董卓。”
Process
用jieba分词的话要先下载第三方库——jieba,命令符窗口中输入下载命令:pip install jieba -i https://pypi.doubanio.com/simple/
,用的是豆瓣源的下载,个人觉得豆瓣是最快的,不接受反驳,谢谢hhh。
Code
import jieba
fR = open('a.txt', 'r', encoding='gb2312')
result={}
sent = fR.read()
sent_list = jieba.lcut(sent)
for i in sent_list:
if len(i)<2:
sent_list.remove(i)
else:
temp=result.get(i,"none")
if temp=="none":
result[i]=1
else:
result[i]+=1
d_order = sorted(result.items(), key=lambda x: x[1], reverse=True)
for i in range(len(d_order)):
if i<5:
print(d_order[i][0])
fR.close()
Result