爬虫小程序

爬虫小程序

时间：2023-02-05 13:11:15浏览次数：26

标签：info name tags res 程序爬虫 book print

豆瓣静态爬取

点击查看代码

# 导入 requests 库
import requests
# 从 bs4 库导入 BeautifulSoup
from bs4 import BeautifulSoup

# 定制消息头
headers = {
  'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36'
}
# 向 https://book.douban.com/top250/ 发送带消息头的请求
# 并将响应结果储存到 res 变量中
res = requests.get('https://book.douban.com/top250/', headers =headers)
#print(res)
# 将响应结果的文本内容解析为 BeautifulSoup 对象
# 并保存到变量 soup 中
#print(res.text)
soup = BeautifulSoup(res.text, 'html.parser')

# 所有书名所在元素
book_name_tags = soup.select('div.pl2 a')
#print(book_name_tags)
# 所有书籍信息所在元素
book_info_tags = soup.select('p.pl')
#print(book_info_tags)
# 遍历每本图书
for i in range(len(book_name_tags)):
  # 通过元素 title 属性提取书名
  name = book_name_tags[i]['title']
  # 获取书籍信息
  info = book_info_tags[i].text
  # 按“ / ”分割字符串
  info_list = info.split('/')
  # 结果列表中第一项为作者信息
  author = info_list[0]
  # 倒数第三项为出版社信息
  publisher = info_list[-3]
  # 打印书名、作者、出版社信息
  print(name, author, publisher)

标签：info,name,tags,res,程序,爬虫,book,print
From： https://www.cnblogs.com/v9193/p/17093227.html

lazarus 编译的程序在linux运行时出现：Failed to create OS basic event with name ""
lazarus编译的程序在linux运行时出现如果出现这个错误提示：FailedtocreateOSbasiceventwithname""，建议检查一下project是否开启开线程，如没就添加红色代码就可以。......
C程序设计语言第2版新版电子书 pdf
作者:[美]BrianW.Kernighan/[美]DennisM.Ritchie出版社:机械工业出版社出品方:华章科技原作名:TheCProgrammingLanguage译者:徐宝文/李志译/尤晋元审......
【19-01-22至19-04-19】小程序开发过程中遇到的坑
小程序部分界面展示2019-02-02【微信小程序错误】Error:ERR_GET_SESSION_KEY{“code”:5100,“message”:"(-1)服务内部错误，请稍后重试或联系客服人员解决。"2019-......
5.2【微信小程序全栈开发课程】首页完善（二）--读取当前分数
上一节实现了点击加减分的按钮，在数据库会插入一条数据。但是点击编译按钮（在微信开发者工具的右上角），总分又变成了0。这是因为虽然在数据库中添加的记录，但是当前总分并没有读......
5.4【微信小程序全栈开发课程】首页完善（四）--清零功能
点击清零按钮，出现提示框，提示是否确认清零确认的话，请求后端，在数据库records表中增加一条新的记录，这条记录的分数字段mark为0取消的话，不进行任何操作清零功能不删除历史记录1......
5.3【微信小程序全栈开发课程】首页完善（三）--下拉刷新、分享功能
如果服务器出现错误，用户可以自己下拉刷新页面来获取当前分数下拉刷新的函数是onPullDownRefresh这节我们来实现下拉刷新的功能1、创建文件在src/pages/index文件夹下面创建m......
5.5【微信小程序全栈开发课程】首页完善（五）--撤销功能
点击撤销按钮，撤销上一步的操作记录也就是删除records数据表中的最后一条数据1、添加撤销方法编辑index.vue文件的script部分，在methods函数中添加撤销方法recallasyncrecall......
6.3【微信小程序全栈开发课程】记录页面（三）--记录数据组件初始化
1、功能介绍在记录页面对记录数据进行展示，每条记录数据后面都有编辑按钮，点击编辑按钮，出现修改文本框，点击修改按钮后，文本框会自动收起2、创建组件在src/components文件夹下面......
6.1【微信小程序全栈开发课程】记录页面（一）--添加记录页面
这一章，将在首页生成的记录，也就是将records数据表中的数据显示出来1、创建记录页面文件夹（1）在src/pages文件夹下面新建一个命名为record的文件夹，并且在文件夹下创建record.vue......
6.2【微信小程序全栈开发课程】记录页面（二）--获取记录数据
1、添加data变量添加records变量，用来保存记录数据data(){return{show_record:false,userinfo:{},records:[],}},2、引入get工具函数//参考代码，无需粘贴/......

相关文章

赞助商

阅读排行