首页 > 其他分享 >go语言抓取研招网硕士专业目录

go语言抓取研招网硕士专业目录

时间:2023-05-29 11:55:20浏览次数:35  
标签:major VARCHAR 研招网 INT 抓取 40 go NULL id

最近在学go语言,不知道何从下手。突然想到了硕士专业目录,可以用来练习数据库操作,并且具有实际意义。

于是就开始和bing一起编程。想做什么,提问就好了。搜索效率比自己搜索,然后看一些重复无用的博客好多了。

整个过程就是研招网查询,抓包分析,编码,数据库建表,最后抓取所有数据进行保存。

项目地址

研招网查询

研招网专业

image-20230529112729252

ssdm	省市
yjxkdm	专业领域
zymc	专业名称
xxfs	学习方式
mldm	门类类别
这是点击查询后,post里面需要修改的数据。基本上只需要秀应该省市和专业名称。
下拉选择框的时候,也会有一些get请求。自己使用fiddler抓取分析即可。不过我已经保存了相关的请求和响应包在gitee项目里面。有需要直接看gitee项目即可。

编码

编码,我问bing,它回答,再进行修改即可。需要什么功能,就问什么,然后返回示例代码,进行修改。

image-20230529113316973

数据库建表

image-20230529113401338

CREATE TABLE major (
  id INT NOT NULL AUTO_INCREMENT,
  code INT NOT NULL,
  school VARCHAR(40) NOT NULL,
  college VARCHAR(40) NOT NULL,
  major VARCHAR(40) NOT NULL,
  num	INT NOT NULL,
  full	INT NOT NULL default 1,
  tongkao	INT NOT NULL default 0,
  PRIMARY KEY (id)
);

CREATE TABLE exam (
  id INT NOT NULL AUTO_INCREMENT,
  first VARCHAR(40) NOT NULL,
  second VARCHAR(40) NOT NULL,
  third VARCHAR(40) NOT NULL,
  forth VARCHAR(40) NOT NULL,
  PRIMARY KEY (id)
);

CREATE TABLE major_exam (
  major_id INT NOT NULL,
  exam_id INT NOT NULL,
  FOREIGN KEY (major_id) REFERENCES major(id),
  FOREIGN KEY (exam_id) REFERENCES exam(id)
);
读者应根据需要自行修改。

最后进行请求数据,进行处理,然后保存

image-20230529113505419

image-20230529113514471

image-20230529113401338

可以看见,计算机专硕大概有不到3000个选择。major表的行数,就是所有大学所有学院相关专业以及研究方向的数量。至于招生人数,也是可以自己统计的。

标签:major,VARCHAR,研招网,INT,抓取,40,go,NULL,id
From: https://www.cnblogs.com/dayq/p/17440054.html

相关文章

  • mongo查询
    导入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-mongodb</artifactId></dependency>注入对象@ResourceprivateMongoTemplatemongoTemplate;   构造查询Stringsta......
  • Go:build模式和options模式
    build模式和options模式packagemainimport"fmt"//Server初始化可选参数的typeServerstruct{urlstringportstringprotocolstringoptionstring}//定义函数类型typeModOptionfunc(option*Server)//将函数类型传入,然后再内部调用func......
  • centos下安装go环境两种方法
    centos下安装go环境有两种方式,一个是yum,一个是直接到官网下载tar.包1.yum方式安装yum-yinstallgolang1然后就可以使用go语言了,这种方式有着明显的缺点,因为都是yum自己处理的依赖,不方便管理。下载tar包手动安装标准官网:https://golang.org/需要墙镜像官网:https://golang.goo......
  • Django用户认证组件 (auth模块)
    1、导入auth模块#认证模块fromdjango.contribimportauth#对应数据库用户表,可以继承扩展fromdjango.contrib.auth.modelsimportUser2、创建用户对象create():创建一个普通用户,密码是明文的。create_user():创建一个普通用户,密码是密文的。create_superu......
  • Golang入门笔记
    第一个Go程序packagemain //包,表明代码所在的模块(包)import"fmt" //引入代码依赖//功能实现funcmain(){ fmt.Println("HelloWorld");}编译执行➜go-examplegit:(master)✗cdsrc/example/main➜maingit:(master)✗lshello_world.go➜maingit:......
  • Spider理论系列--MongoDB(二)
    NoSQLMongodb下载mongodb的版本,两点注意根据业界规则,偶数为稳定版,如1.6.X,奇数为开发版,如1.7.X32bit的mongodb最大只能存放2G的数据,64bit就没有限制性能BSON格式的编码和解码都是非常快速的。它使用了C风格的数据表现形式,这样在各种语言中都可以高效地使用。NoSQL(NoSQL=NotOnly......
  • 首个大规模使用工具的大模型来了:伯克利发布Gorilla
    前言 OneAItorulethemall.本文转载自机器之心欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指导班、基础入门班、论文指导班全面上线!!大型语言模型......
  • wireshark 结合 go 对每个请求进行 https tls tcp 内容解密
    众所周知,wireshark是一款流行的抓包软件,我们可以很方便地查看每个TCP包的具体信息。对于HTTP协议的数据,还可以查看每个协议层具体信息内容。但是对于HTTPS的数据,我们只能查看IP层以下的数据,TLS及以上的数据都是被加密过的,如下图所示。 在某些特殊的场景下,我们想查......
  • django多表关联实战
    定义模型类:fromdjango.dbimportmodelsfromdjango.contrib.auth.modelsimportUser'''----------Django-ORM多表关联----------''''''需要创建的表:1.书籍表2.出版社表3.作者表4.作者详情表'''�......
  • WEB漏洞—SQL注入之Oracle,MongoDB等注入
     1.明确注入数据库类型、权限2.明确提交方法、参数类型等高权限可以执行文件读取,低权限就老老实实获取数据,最终目的都是获取网站权限 常见数据库类型mysql,access,mssql,mongoDB,postgresql,sqlite,oracle,sybase等1、Access注入Access与mysql结构,除access之外,其他数据库结......