无敌爬虫之无头浏览器

时间：2023-03-28 12:01:47浏览次数：54

标签：浏览器 Chrome driver 爬虫无敌 re print import options

驱动下载

https://sites.google.com/a/chromium.org/chromedriver/downloads

import bs4

import requests
from selenium import webdriver
import time


# 启动Chrome无头浏览器
options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--disable-gpu')
# 指定驱动
driver = webdriver.Chrome(executable_path=r'C:\Program Files\Google\Chrome\Application\chromedriver.exe',options=options)

# 获得页面
driver.get("https://12345678912345789")

# 打印数据内容
time.sleep(10)
re_date = driver.page_source
# 打出页面渲染后的代码
print(re_date)
soup = bs4.BeautifulSoup(re_date, "html.parser")
# 打印出网站标题
print(driver.title)
# 查出所有p标签中的内容
for p in soup.find_all('p'):
    with open('123456789.txt','a+', encoding='utf-8') as f:
        f.write(p.text)
        print("正在写入------------------->", p.text)

driver.quit()

标签：浏览器,Chrome,driver,爬虫,无敌,re,print,import,options
From： https://www.cnblogs.com/vip136510786/p/17264621.html

获取浏览器参数值或者地址
获取浏览器地址1、window.location.href(设置或获取整个URL为字符串)vartest=window.location.href;alert(test);返回：http://i.cnblogs.com/EditPosts.aspx?opt=12......
Python 爬虫模拟手机爬取听力资料
Python爬虫模拟手机爬取听力资料目录Python爬虫模拟手机爬取听力资料需求思路1使用Pyppeteer参考实现1测试模拟手机效果2爬取资源首页资源列表详情与音频以cha......
web自动化中浏览器实例化优化及关联
在一个测试案例py文件中，可能会有多个测试案例，比如登录，会有登录成功和登录失败的情况，执行测试用例后，就会打开两个网页。为了解决这个问题，需要进行优化来解决浏览器重复打开......
推出浏览器即可解决Facebook移动化问题？
编者按：本文作者为HamishMcKenzie，他称Facebook要解决移动化问题，最好的办法是将市场已有的各个浏览器的优点结合起来推出自己的移动浏览器。让我们来看看作者的YY是否有......
ie9浏览器：对象未定义
1.情景展示写的js代码在谷歌浏览器下面运行没有问题，但是，在IE9浏览器无法运行。报错信息如下：applyIndex是我new创建的一个对象变量名称，但在IE9当中拿不到这个对象。这......
解决前端设置滚动条的宽度后滚动条消失的问题（解决ie浏览器样式无效的问题）
.op{flex:1;width:90%;flex-direction:column;overflow:auto;height:90%;padding-right:5px;}.op::-webkit-scrollbar{width:5px;}.op::......
python+playwright 学习-37.如何在已经打开的浏览器上继续操作，绕过登录验证码
前言有些网站的安全级别比较高，你可能想绕过登录验证，先手工打开浏览器操作登录，让playwright继续在你已经打开的浏览器上操作。selenium是可以做到这点，那么playwright也可......
Postman抓包浏览器请求数据步骤-傻瓜式操作
1、安装chrome插件（postmanInterceptor插件，在任意插件网站都可搜到，下载安装到浏览器即可），该插件可协助postman捕获https请求 2、安装postmanpostman安装步骤，自行......
浏览器对象属性 window.innerWidth 和 window.outerWidth 这两个宽度属性有何区别？
window.innerWidth和window.outerWidth是两个浏览器对象属性，分别代表浏览器窗口的内部宽度和外部宽度。它们的区别如下：window.innerWidth:表示浏览器窗口的内部宽度......
如何构建只需要浏览器就可访问企业内网资源 Web VPN
我们企业员工出差，移动办公，分公司都需要防问企业内网应用需求，传统方案，基本上是采用VPN来满足，但部署传统VPN需要消耗大量人力成本，带来复杂的IT运营压力，且不稳定，易掉线；同时容易......

无敌爬虫之无头浏览器

相关文章

赞助商

阅读排行