爬虫入门

爬虫入门

时间：2024-04-13 18:12:41浏览次数：33

标签：head 入门 price 爬虫 537.36 print requests response

爬豆瓣

import requests
head={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.139 Safari/537.36"}#修改请求头，伪装成浏览器
#response =requests.get("http://books.toscrape.com/",headers=head) #这是个练习爬虫的网站
response =requests.get("https://movie.douban.com/top250",headers=head)
if response.ok:
    print(response.text)
else:
    print("请求失败")
    print(response.status_code)

爬价格和书名

from bs4 import BeautifulSoup
import requests
head={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.139 Safari/537.36"}#修改请求头，伪装成浏览器
response =requests.get("http://books.toscrape.com/",headers=head) #这是个练习爬虫的网站
content=response.text
soup=BeautifulSoup(content,"html.parser")#BeautifulSoup用来解析，html.parser指定解析的是html

#输出所有价格
allPrices=soup.findAll("p",attrs={"class":"price_color"})#p是选择的标签，attrs指定要选class是price_color的标签
for price in allPrices:
    print(price.string)
#输出书名
all_titles=soup.findAll("h3")
for title in all_titles:
    all_links=title.findAll("a")
    for link in all_links:
        print(link.string)

标签：head,入门,price,爬虫,537.36,print,requests,response
From： https://www.cnblogs.com/wljss/p/18133155

CTFshow-Web入门模块-爆破
CTFshow-Web入门模块-爆破by故人叹、web21考察点：burpsuite使用、自定义迭代器使用题目提供了字典，要求登录并提示了爆破，使用burpsuite抓包并操作：（1）用户名一般为admin，密码随意输，抓包并发送给爆破模块。可以看到Basic后有一段base64编码，解码得到用户名:密码的格式，证明我们之......
CTFshow-Web入门模块-信息搜集writeip
CTFshow-Web入门模块-信息搜集writeipby故人叹、信息搜集web1考察点：查看源码题目提示：”开发注释未及时删除“，页面源代码中可能有东西，查看页面源代码发现flag。总结查看源码的几种方式：F12打开源代码快捷键Ctrl+u在url前面加上view-source:浏览器右上角选项中的Web开......
RabbitMQ 入门：我的思维导图总结
刚看完尚硅谷的RabbitMQ入门教程，感觉自己对知识点的理解还有些混乱，看完相关面试题后整理了一份简单的思维导图，仅供参考，如有错误，欢迎指正！视频教程：尚硅谷RabbitMQ教程丨快速掌握MQ消息中间件rabbitmq_哔哩哔哩_bilibili1.概览2.具体细节2.1基本概念常见面试题：什......
MySQL入门
相关概念数据；描述数据特征的符号记录：事物一系列典型的特征表：文件库：文件夹数据库管理软件：mysql，oracle，db2，SQLserver数据库服务器：运行数据库管理软件的计算机统一字符编码统一客户端，服务端，mysqld的字符编码为utf8SQL语句操作文件夹（库）增：createdatabasedb1charset......
gRPC入门学习之旅（六）
gRPC入门学习之旅（一）gRPC入门学习之旅（二）gRPC入门学习之旅（三）gRPC入门学习之旅（四）gRPC入门学习之旅（五） 3.3、客户端编译生成GRPC类1.在“解决方案资源管理器”中，使用鼠标左键选中项目名称“Demo.Grpc.Cmd”，然后单击鼠标右键，在弹出的快捷菜单中选择“重新生成”......
搭建一个免费的，无限流量的Blog----github Pages和Jekyll入门
喜欢写Blog的人，会经历三个阶段。第一阶段，刚接触Blog，觉得很新鲜，试着选择一个免费空间来写。第二阶段，发现免费空间限制太多，就自己购买域名和空间，搭建独立博客。第三阶段，觉得独立博客的管理太麻烦，最好在保留控制权的前提下，让别人来管，自己只负责写文章。大多数Blog作......
flask之ssti模版注入从零到入门
前言在学习ssti模版注入的时候，发现国内文章对于都是基于python基础之上的，对于基础代码讲的较少，而对于一些从事安全的新手师傅们，可能python只停留在写脚本上，所以上手的时候可能有点难度，毕竟不是搞pythonflask开发。就本人学习ssti而言，入手有点难度，所以特写此文，对于一些不需要深......
SQL SERVER 从入门到精通第5版第三篇高级应用第10章存储过程读书笔记
第10章存储过程 >.存储过程概述存储过程(storedprocedure)是预编译SQL语句的集合,这些语句存储在一个名称下并作为一个单元来处理.存储过程取代了传统的逐条执行SQL语句的方式.一个存储过程中可以包含增删改查等一系列SQL语句,当这个存储过程被调用时,这些操作也......
.NET Emit 入门教程：第六部分：IL 指令：7：详解 ILGenerator 指令方法：分支条件指令
前言：经过前面几篇的学习，我们了解到指令的大概分类，如：参数加载指令，该加载指令以 Ld开头，将参数加载到栈中，以便于后续执行操作命令。参数存储指令，其指令以St开头，将栈中的数据，存储到指定的变量中，以方便后续使用。创建实例指令，其指令以New开头，用于在运行时动态生成并初始化对......
系统入门课后习题1
4.Redhat7/centos7操作系统安装图形界面文档1.安装一下XWINDOWSyumgroupinstall"XWindowSystem"2.输入图形界面安装命令yumgroupinstall-y"GNOMEDesktop"3.检查图形界面是否安装成功yumgrouplist5.CentOS、RedHat之间的区别CentosRedHat免费商业收费......

相关文章

赞助商

阅读排行