首页 > 编程语言 >学习python 爬虫之pyppteer

学习python 爬虫之pyppteer

时间:2023-01-16 09:11:49浏览次数:56  
标签:浏览器 pyppteer python await 爬虫 chrome page browser

1、安装 pyppteer库

   pip install pyppteer 

如果安装出错,使用国内镜像安装 

  pip install pyppeteer -i https://pypi.douban.com/simple

2、下载chromium浏览器

  https://npm.taobao.org/mirrors/chromium-browser-snapshots/

  下载解压后即可使用(记住解压的地址,在下面例子中要指定浏览器的路径;)

    # 启动chrome的路径
        "executablePath": r"C:\app\chrome-win32\chrome.exe",

3、例子

#!/usr/bin/python
# -*- coding: UTF-8 -*-

import asyncio
from pyppeteer import launch


async def main():
    # 浏览器 启动参数
    start_parm = {
        # 启动chrome的路径
        "executablePath": r"C:\app\chrome-win32\chrome.exe",
        # 关闭无头浏览器 默认是无头启动的
        "headless": False,
    }
    # 创建浏览器对象,可以传入 字典形式参数
    browser = await launch(**start_parm)

    # 创建一个页面对象, 页面操作在该对象上执行
    page = await browser.newPage()

    await page.goto('https://www.baidu.com/')  # 页面跳转
    page_text = await page.content()  # 页面内容
    print(page_text)
    await browser.close()  # 关闭浏览器对象

 

标签:浏览器,pyppteer,python,await,爬虫,chrome,page,browser
From: https://www.cnblogs.com/lrzy/p/17054674.html

相关文章

  • Python 量化交易编程技巧积累
    1.计算股票中的16个常用指标-stockstatus。地址:https://blog.csdn.net/freewebsys/article/details/785785482.获得全世界所有市场的交易日历-exchange_calendar。地址:ht......
  • 尝试python 爬虫新工具playwright
    1、安装playwright库pipinstallplaywright 2、安装浏览器驱动文件(安装过程稍微有点慢)python-mplaywrightinstall......
  • 【801】Python绘制机器学习特征相关性热力图
    参考:python特征相关性热力图怎么画_如何在python中绘制热地图(实例)参考:seaborn.heatmap参考:Choosingcolorpalettes根据具体的特征数据集,计算不同特征之间的相关性,然后......
  • AirSim 自动驾驶仿真 (2-3) python控制无人机 win10
    1首先搭建好环境参考 2python控制https://blog.csdn.net/Zhaoxi_Li/article/details/108002544官方代码位置 自己pythonj教程https://www.cnblogs.com/gooutlo......
  • python django学生选课系统
    pythondjango学生选课系统后端:Pythondjango数据库:MySQL前端:htmlcssjs实现功能:登录、注册、查看自己信息、修改自己信息等学生:看课、选课、查学分老师:创建课程、......
  • python利用subprocess执行shell命令
    subprocess以及常用的封装函数运行python的时候,我们都是在创建并运行一个进程。像Linux进程那样,一个进程可以fork一个子进程,并让这个子进程exec另外一个程序。在Python中,......
  • Python django 公寓管理系统
    Pythondjango公寓管理系统django公寓租房系统django酒店订购系统django公寓订购系统技术:Pythondjango数据库:MySQL前端:htmlcssjs涉及到的功能:登录、注册、......
  • Python django 会议室管理系统
    Pythondjango会议室管理系统django会议室申请系统django会议室系统技术:Pythondjango数据库:MySQL涉及功能:登录、注册、登出、管理员登录、管理用户信息等添加会......
  • Python django 图书馆管理系统
    Pythondjango图书馆管理系统技术:Python  django数据库:sqlite3(或MySQL)前段:html css  js 功能:注册,注销,改密码,添加图书,添加图书照片,查看图书,普通用户只能查看......
  • python之pyserial模块
    pyserial模块封装了对串口的访问,兼容各种平台(Windows、Linux、MACOS等)。其支持的特性如下:所有平台基于类的接口相同端口可以通过python来设置支持不同数据长度、停止......