首页 > 编程语言 >Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求

Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求

时间:2023-06-10 14:01:50浏览次数:43  
标签:专业 Python 招生 2024 选考 普通高校 科目


任务描述:

使用Python语言编写网络爬虫程序,采集山东省考试院发布的2024年普通高校招生专业(专业类)选考科目要求,然后统计不同要求的本科专业数量和专科专业数量。

Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求_网络

Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求_网络_02

网页源代码分析与爬虫程序原理请参考:

赋分规则与计算方法请参考:

爬虫程序代码,需要安装扩展库openpyxl:

Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求_python_03

采集到的数据保存至Excel文件中,内容格式如下(可以后台发送消息“20220102”下载Excel文件):

Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求_人工智能_04

Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求_编程语言_05

这样的数据分析相对来说比较简单,一般就是是查询不同高校和专业对选考科目的要求,主要使用数据筛选和过滤技术,下面的代码统计了不同选考科目要求的专业数量,大家可以参考思路自由发挥和改写代码。

Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求_编程语言_06

运行结果:

Python爬取并简单分析2024年普通高校招生专业(专业类)选考科目要求_python_07

公众号“Python小屋”

标签:专业,Python,招生,2024,选考,普通高校,科目
From: https://blog.51cto.com/u_9653244/6454511

相关文章

  • Python逐块执行另一个Python程序中的代码观察运行过程
    任务描述:给定一个Python程序,编写程序逐块执行其中的代码,单行代码作为一个块来执行,选择结构、循环结构、异常处理结构、函数定义、类定义作为一个块来执行,每个块之间间隔1秒,以便观察执行过程。以Python+pywin32操作Excel文件常用功能(268行代码+注释)一文中的代码为例,编写程序逐块执行......
  • 使用Python检查实验教学大纲(Word文件)中前后信息是否一致
    问题描述:应选用教材的老师们要求,整理了一份与教材《Python程序设计(第3版)》配套的实验教学大纲,共45页72个实验项目。需要的老师可以联系董老师获取这个文件。在实验教学大纲中,核心内容有两块,一个是实验项目信息汇总表,部分内容如下图所示,实验教学大纲中第二个核心内容是每个实验项目......
  • Python实现汉字人名按拼音或笔画顺序排序
    任务描述:编写Python程序,对给定的多个人名按笔画多少或拼音排序。主要思路:把每个汉字对应的笔画数量按Unicode编码顺序存入文本文件以便重复利用,内容如下图,所有数字存为一行,相邻数字使用英文半角逗号分隔。可以后台发送消息“汉字笔画”下载这个文件。对于给定的汉字获取Unicode编码......
  • python爬虫——爬取前程无忧网站招聘信息
    项目概要网络爬虫通常被称为爬虫,是搜索引擎的重要组成部分。随着信息技术的飞速进步,作为搜索引擎的一个组成部分,爬虫一直是研究的热点,它为大数据时代提供了数据支撑。而数据分析正是利用爬取的数据进行分析得到有益结论,通常的手段便是进行可视化分析。本项目爬取前程无忧网站,选取......
  • 微课--25分钟学会使用Python群发电子邮件
    例5-3 编写程序,登录126邮箱或QQ邮箱自动群发电子邮件。首先需要对邮箱进行设置,开启POP3/SMTP服务,然后运行下面的程序并输入邮箱地址、授权码和收件人电子邮箱地址,即可自动群发电子邮件。视频讲解:参考代码:公众号“Python小屋”......
  • Python使用pdfminer3k提取PDF文件中的文本
    任务描述:编写Python程序,提取PDF文件中的文本内容,生成与原PDF文件同名的文本文件。准备工作:安装扩展库pdfminer3k。参考代码:公众号“Python小屋”......
  • Python 3.10新增软关键字实现真正意义上的多分支选择结构
    程序控制结构一般来说包括顺序结构、选择结构、循环结构和异常处理结构,选择结构包括单分支选择结构、双分支选择结构、多分支选择结构和嵌套的选择结构。通常把if...elif...elif...else看作多分支选择结构,但严格来说它属于嵌套的选择结构。例如,下面两种结构在功能上是等价的:在Pytho......
  • python爬虫——深圳市租房信息数据分析
    一、选题背景因为深圳经济非常不错,想必想要去深圳工作的人也不少。衣食住行是生活的基本需求。衣和食好解决,不喜欢的衣服可以买新的,不好吃的食物可以换一家吃。可是在住宿上,买房和租房的置换成本都相对较高,因此房源选择尤为慎重。作为目前买不起房的人自然是以租房为主,但是租房我......
  • python基础语法
    编码python3源码文件以utf-8编码,所有的字符去都是unicode。可以为源码指定不同的编码标识符第一个字符必须是字母或者下划线,不能是数字标识符的其他部分由字母、数字和下划线组成标识符首字母区分大小写标识符不能用python的保留字什么是标识符?标识符是用......
  • python3的数据类型
    赋值python中没有声明变量,只有赋值变量,每个变量在使用前都需要赋值,变量只有被赋值了才会被创建多个变量赋值a=b=c=1a,b,c=1,2,3标准的数据类型常见的数据类型有number(数字)string(字符串)dictionary(字典)tuple(元组)list(列表)set(集合)不可变类型:number(数字)......