首页 > 其他分享 >政府工作报告词云

政府工作报告词云

时间:2023-05-25 17:02:51浏览次数:40  
标签:政府 return 报告 url 词云 E4% path txt root


学了嵩天老师的爬虫和python语言程序设计,就把语言程序设计里的一个实例结合了爬虫来写~

import requests
import os
import wordcloud
import jieba
def DownlodaTxt(root, url):
    path = root + str(url.split('/')[-1])[-10:]
    try:
        if not os.path.exists(root):
           os.mkdir(root)
        if not os.path.exists(path):
            r = requests.get(url)
            with open(path, 'wb') as f:
                f.write(r.content)
                f.close()
                print("文件保存成功")
        else:
            print("文件已存在")
        return path
    except:
        print("爬取失败")
        return ""
def GetTxt(path):
    try:
        f = open(path, "r", encoding = "utf-8")
        t = f.read()
        f.close()
        ls = jieba.lcut(t)
        txt = " ".join(ls)
        return txt
    except:
        print("打开文件失败")
        return ""
def DoWorlCloud(txt, root):
    w = wordcloud.WordCloud(font_path = "msyh.ttc", width = 1000, height = 700, background_color = "white")
    w.generate(txt)
    path = root + "grwordcloud1.png"
    w.to_file(path)
def main():
    url = "https://python123.io/resources/pye/%E6%96%B0%E6%97%B6%E4%BB%A3%E4%B8%AD%E5%9B%BD%E7%89%B9%E8%89%B2%E7%A4%BE%E4%BC%9A%E4%B8%BB%E4%B9%89.txt"
    root = "F://Sophomore//The_Second_Term//Python//Code//"
    path = DownlodaTxt(root, url)
    txt = GetTxt(path)
    DoWorlCloud(txt, root)
main()



标签:政府,return,报告,url,词云,E4%,path,txt,root
From: https://blog.51cto.com/u_16129621/6350083

相关文章

  • 行业报告 | 2023中国机器人产业发展增长报告
    文|BFT机器人012023中国机器人产业发展增长报告2022世界机器人大会上发布的《中国机器人产业发展报告》预计,2022年中国机器人市场规模将达174亿美元,2017年至2022年年均增长率达22%。其中,2022年工业机器人市场规模有望达87亿美元,服务机器人市场规模有望达65亿美元,特种机器人市场规......
  • 行业报告 | 腾讯研究所:2023金融科技十大趋势
    文|BFT机器人近期,国家印发《数字中国建设整体布局规划》,提出建设数字中国是推进中国式现代化的重要引擎,要求强化数字中国的关键能力。党的二十大报告提出,“加快发展数字经济,促进数字经济和实体经济深度融合”,标志着未来金融科技将迈入高质量发展的新阶段。在数字中国的建设中,金......
  • 主要功能实现-项目报告
    主要功能基本完成,以下为今日努力成功。一:实现了调用相册,将地址提取二:实现了图片提取加分类三:实现了添加后更新四:结果展示五:项目问题以及可能出现bug一:实现了调用相册,将地址提取具体更改的这个方法:完整代码来自《第一行代码》调用相册和使用相机。更改后调用的相册可以将照......
  • 题目集1-3总结报告
    前言:一 第一次题目集所涉及的知识点有1.从键盘读取数值并参与运算。2.if句和if-else句的判断。3.数值类型的转换。4.数组的创建。5.for语句的循环。6.switch语句的运用。.运用String中的substring方法获取子字符串和equalsIgnoreCase方法比较字符串。8.数组的简单处理。题量......
  • 电子科技大学实验报告4 文件状态测试
    ##Monitorforfilestatus#cleartest_count=0change_count=0echo-n"Inputfilename:"readFILENAMEif[-f"$FILENAME"];thenFILESIZE=`ls-l${FILENAME}|cut-d""-f5`echo"filesizeis$FILESIZE"......
  • Exp8 Web安全 实验报告—20201229赵斌
    一、实践目标(1)Web前端HTML能正常安装、启停Apache。理解HTML,理解表单,理解GET与POST方法,编写一个含有表单的HTML。(2)Web前端javascipt理解JavaScript的基本功能,理解DOM。在(1)的基础上,编写JavaScript验证用户名、密码的规则。在用户点击登陆按钮后回显“欢迎+输入的用户名......
  • 「解题报告」LOJ561 「LibreOJ Round #9」CommonAnts 的调和数
    模拟赛考的题,但是模拟赛没有打,哈哈,摆烂。考场上想到大致做法了,没继续推,去打GPofTokyo了。首先发现操作都在查询前面,所以我们只需要预处理出答案即可。我们先记\(b_i\)表示对\(i\)进行的操作的总和,那么容易写出\(a_i\)的式子:\[a_i=\sum_{j|i}b_j\cdot\frac{i......
  • HTML与CSS综合设计报告
    【项目描述】最近来自国产的独立像素游戏《风来之国》发售,借此做一个相关的游戏介绍网页来介绍这款游戏,并收集感兴趣玩家的信息反馈,以此改进游戏,吸引玩家的加入。  图1主页预览图【涉及知识点】1、 HTML布局2、 文本属性3、 图片的插入4、 css链入式的使用......
  • 「解题报告」XXI Open Cup, Grand Prix of Tokyo
    猜猜为什么四五天没更博了?攒了个大的。非常好OpenCup,10个998244353,爱来自陶瓷❤快写死我了,终于写完了。十道题里只有三道题是自己做出来的。我好废物。CodeforcesGym官方题解A.AscendingMatrix开幕雷击。首先考虑没有限制怎么做。由于优秀的单调性,我们可以对于每......
  • 坚持了十年的德国慕尼黑城市政府将抛弃Linux回归Windows?
    德国慕尼黑城市政府正在考虑回归到微软Windows系统的怀抱。慕尼黑行政管理局和人事委员会建议将Linux系统转换成Win10系统。根据报告显示,之所以做出此决定是因为德国慕尼黑城市政府目前所面临的软件兼容性问题:行政管理局和人事委员会本周对慕尼黑IT设置组织做了长久期盼的建议,......