首页 > 其他分享 >bs4 模块

bs4 模块

时间:2023-01-05 17:46:30浏览次数:51  
标签:bs4 标签 拿到 soup 模块 find

爬虫之bs4模块

我们在编写一些业务时需要从html页面上获取到用户输入的内容。比如说文章内容。

其实底层是在编写html代码,用户输入的时候看着是字其实是标签里包含输入的文本

我们如果直接保存到表里会把标签一起存起来了。这时候就需要一些工具帮助我们筛选或匹配。

from bs4 import BeautifulSoup
soup = BeautifulSoup('文本','解释器')
soup.find('标签')  # 拿到标签
soup.find_all('标签') # 拿到所有指定标签
soup.find('标签').text  # 拿到指定标签的文本内容
soup.find('a').get('href') # 拿到a标签内的href

标签:bs4,标签,拿到,soup,模块,find
From: https://www.cnblogs.com/LiaJi/p/17028376.html

相关文章

  • zabbix添加二华设备光模块收发光功率
    在zabbix服务器中执行:snmpwalk-v2c-cro字符串设备ip1.3.6.1.4.1.25506.2.70.1.1.1.12 |more 将列出所有端口的收光功率,获得的数值需要除以100才是在设备上disp......
  • 基于OpenCV DNN模块给黑白老照片上色(附Python/C++源码)
    导读本文给大家分享一个用OpenCVDNN模块给黑白老照片上色的实例,并给出Python和C++版本源码。 背景介绍    这个项目是基于在加利福尼亚大学,伯克利,RichardZhang,Phil......
  • 在3568开发板上开发外设模块——竟如此简单!
    为满足客户的多元化需求,迅为在原有ov5695摄像头和5G通信模块的基础上,新增了以下选配模块。 针对这些模块,我们编写了9个实验做成了《itop-3568开发板驱动实验手册》,从实验原......
  • webpack 中import 引入umd模块module
    在webpack项目中引入一个umd模块,如果你的项目是由create-react-app搭建的,很大概率会遇到importerror。这很大概率是由于babel-loader重复编译导致的,因为umd模块一般是经......
  • ThinkPHP多语言模块文件包含RCE复现详细教程
    漏洞描述:ThinkPHP在开启多语言功能的情况下存在文件包含漏洞,攻击者可以通过get、header、cookie等位置传入参数,实现目录穿越+文件包含,通过pearcmd文件包含这个trick即可实......
  • 河北稳控科技振弦采集模块多通道专用寄存器
    河北稳控科技振弦采集模块多通道专用寄存器 多通道频率、温度值寄存器51~58(0x33~0x3A)位符号值描述默认值bit15:0频率/温度值0单通道模块时,寄存器51内为频率......
  • Day 06 模块加载机制
    模块加载机制一、优先从缓存中加载模块在第一次加载后会被缓存,多次调用require()不会导致模块的代码被执行多次不论内置模块、自定义模块、第三方模块都会从缓存中加载......
  • Git - 子模块
    工作中会遇到这样的问题,当你在一个项目上时,你需要在其中使用另外一个项目,这个项目也许是一个第三方开发的库或者是你独立开发 合并在多个项目中使用的。这样就会产生一个......
  • 极客编程python入门-内建模块datetime
    datetimedatetime是Python处理日期和时间的标准库。获取当前日期和时间>>>fromdatetimeimportdatetime>>>now=datetime.now()#获取当前datetime>>>print(now)2015......
  • git子模块的使用
    1.在项目中添加子模块命令: gitsubmoduleadd<url>例子: gitsubmoduleaddhttps://github.com/chaconinc/DbConnector此命令在当前工作目录添加了一个名为"DbConne......