首页 > 编程语言 >Python学习之爬虫简单例子

Python学习之爬虫简单例子

时间:2024-06-21 16:34:39浏览次数:10  
标签:__ Python request html urllib 爬虫 url 例子 print

import BeautifulSoup import pandas as pd import urllib.request, urllib.error
def requestUrl(url):     headers = {         'User-Agent': "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36",       }     request = urllib.request.Request(url, headers= headers)     html=""     try:         response = urllib.request.urlopen(request)         html = response.read().decode("utf-8")     except urllib.error.URLError as e:         if hasattr(e, "reason"):             print(e.reason)         if hasattr(e, "code"):             print(e.code)     return html
def getData(requestData):     pass     soup = BeautifulSoup(requestData, "html.parser")     tbls = soup.find_all("div", id="league_table")     print(tbls)
def main():     url = "网页地址"     html = requestUrl(url)     getData(html)

if __name__ == "__main__":     main()     print("execute over")

标签:__,Python,request,html,urllib,爬虫,url,例子,print
From: https://www.cnblogs.com/michaelShao/p/18260783

相关文章

  • 【python数据可视化】利用Python爬取天气数据并实现数据可视化,绘制天气轮播图
    用Python爬虫抓取全年天气数据并绘制天气轮播图一、运行结果:二、代码展示:由csv文件生成↓接下来是绘制天气轮播图运行结果:完整代码请看这里↓......
  • 我一直看不明白:“C++会被java/python等这些语言替代”
    在开始前刚好我有一些资料,是我根据网友给的问题精心整理了一份「C++的资料从专业入门到高级教程」,点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!!有些程序,是既可以用c++编写,也可以用java/python编写。如果这类程序以前主要是由c++编写,后来逐渐变成主要......
  • python pta 7-43 密码强度
    本题目要求根据输入密码字符串(字符串长度大于6),密码只能由大写字母、小写字母、数字及下划线四种类型组成,其密码强度为包含类型的数量,例如包含大小写则密码强度为2,四种类型全包含则为4.若包含其他类型的字符则输出IllegalPassword.输入样例1:在这里给出一组输入。例如:123456......
  • python pta 7-44 计算时间间隔
    输入两个日期,以hh:mm的格式输入,两者之间以空格分割。输出二者的时间间隔,同样以hh:mm的格式输出。其中,hh代表小时,mm代表分钟。若时间非法则输出IllegalTime.提示一:若不希望Python代码继续执行可调用exit()函数退出。提示二:为避免歧义,小时数限定为[0,24);分钟数限定为[0,60)......
  • python学习第二天之基本数据类型及其方法
    python的基本数据类型1.数字int2.字符串str3.布尔型bool4.列表list5.元组tuple6.字典dict一个一个来看,分别梳理各自的方法。一、数字int1.bit_length--得到指定数值的二进制的长度a=10print(a.bit_length)输出:4因为a=10,而10的二进制数是1010,刚好......
  • python 趣味习题_递归函数(炸弹迷宫的走法)
    @[toc]python学习中,常会遇到一些百思不得其解的难题,但有时“灵光一现”找准方法,难题便会迎刃而解。本专栏旨在记录本人解决问题的思考方法,及实现过程。有更好方法或对程序执行有疑问的伙伴,可在评论区留言,共同讨论。题目要求题目描述:在一串连续的迷宫(房间编号为1-11的......
  • vscode python编程入门与插件推荐
    使用背景作者是一名ai测开工程师,工作环境中通常会使用到pythonshellpostgresql数据库jupyter,shh工具git版本控制等,因此向选用一个适合自己的文本编辑软件,经过长时间磨合,最终选择VScode作为我的工作软件优点内存占用率低,集成度高,开源免费插件推荐AI助手:codegeex此插件......
  • Red Hat系列的Linux发行版中如何安装python3.9
    该发行版使用yum或dnf作为包管理器:首先更新你的系统和已有的包。在终端输入以下命令:sudoyum-yupdate 安装依赖项:sudoyum-ygroupinstall"DevelopmentTools"sudoyum-yinstallopenssl-develbzip2-devellibffi-devel 下载Python3.9的源代码:wget......
  • 一个简单的python脚本,把latex项目的调用资源放在同一级,以便arxiv
    据说上传arxiv时所有资源需要在同一目录,也就是不能有文件夹(只是据说,有人说有文件夹也行,我没试过),所以写了一个简单的小脚本把latex项目的资源(主要是图片)放在和.tex一个路径下:importosimportshutiltex_file='main.tex'img_folder='imgs'encoding_type='utf-8'withopen......
  • Python梯度提升决策树的方法示例
    梯度提升决策树(GradientBoostingDecisionTree,简称GBDT)是一种基于集成学习的算法,它通过构建多个决策树模型,并将它们组合在一起来实现更好的预测性能。GBDT的核心思想是在每轮迭代中,根据当前模型的残差(真实值与预测值之差)来训练一个新的决策树,然后将这个新树添加到模型中,以不断减......