首页 > 其他分享 >使用 selenium 自动化抓取百度案例

使用 selenium 自动化抓取百度案例

时间:2023-04-11 18:26:35浏览次数:38  
标签:webdriver selenium 抓取 sleep time import 百度 browser

# 1.导入
from selenium.webdriver.chrome.service import Service
from selenium import webdriver
from selenium.webdriver.common.by import By
import time

# 下面是阻止闪退的
# from selenium.webdriver.chrome.options import Options
# options = Options()

# 2. 创建浏览器操作对象
path = Service('chromedriver.exe')
browser = webdriver.Chrome(service=path)

# 3 访问网站
url = 'https://www.baidu.com'

browser.get(url)
time.sleep(2)
inputSearch = browser.find_element(By.CSS_SELECTOR,'#kw')  #通过css选择器来查找 我喜欢用这个
inputBtn = browser.find_element(By.CSS_SELECTOR,'#su')  #按钮
inputSearch.send_keys("周杰伦帅吗")  #输入动作
time.sleep(2)
inputBtn.click() #点击动作
time.sleep(2)

#滑到底部
js_bottom = 'document.documentElement.scrollTop = 100000'
browser.execute_script(js_bottom)

time.sleep(2)

nextPage = browser.find_element(By.CSS_SELECTOR,'.n')
nextPage.click() #点击下一页动作

time.sleep(2) #前进
browser.back()

time.sleep(2) #后退
browser.forward()

print(inputSearch)
input('input阻止浏览器退出')

 

标签:webdriver,selenium,抓取,sleep,time,import,百度,browser
From: https://www.cnblogs.com/xm666/p/17307186.html

相关文章

  • selenium 常用的选择器
    新版本Selenium代码需要引入:fromselenium.webdriver.common.byimportBy选择器也变了,而后做如下修改#inputTag=driver.find_element_by_id("value")#利用ID查找#改为:inputTag=driver.find_element(By.ID,"value")#inputTags=driver.find_element_by_cla......
  • 安装 selenium
    安装 selenium查看谷歌版本  Chrome驱动下载地址(跟谷歌版本一定要对上):  http://chromedriver.storage.googleapis.com/index.html    下载好以后   放入项目的根目录  创建文件并安装引入selenium  打开浏览器百度网站案例#1.导入froms......
  • selenium驱动未随浏览器更新而同步更新的问题
    基于selenium模拟谷歌浏览器登录时,依赖chromedriver.exe版本信息。但谷歌浏览器升级后,之前创建的脚本可能会出现因驱动版本过低,使得之前创建的脚本运行失败的问题。下面针对该问题进行探索和解决。selenium版本importseleniumselenium.__version__#'4.7.2'获取谷歌浏览......
  • python+selenium写自动化脚本遇到的坑
    1.定位不到元素网速不好定位的元素还没有刷新出来使用等待有三种强制等待,显式等待,隐式等待动态ID不要复制xpath,要手写。判断是动态ID的方法,多次关闭浏览器再打开网址,查看ID是否会发生变化下拉框,文件无法定位还没有解决......
  • 百度松果菁英班--oj赛(第一次)
    目录一、甜品配置二、第k小的距离三、MT2091竹鼠发瓜子(二)四、水温调节五、摘果子六、能量供应七、小码哥的跳棋游戏新编八、sort九、名次并列十、逆序对一、甜品配置题目:小码哥的上司是一个爱吃甜品的人,他给了小码哥v的经费,去购买m个甜品,这些甜品有bi的价格,和ai的甜度,上司希望......
  • python抓取星巴克图片案例
    importrequestsfrombs4importBeautifulSoupr=requests.get('https://www.starbucks.com.cn')soup=BeautifulSoup(r.text,'lxml')imgs=soup.select('.padded-2>aimg[src]')num=0forimginimgs:num+=1#......
  • ios的百度网盘web版本视频播放器的字幕插件功能
    详情见https://coding.net/u/qidizi/p/pan.baidu.com.srt.plugin/git这里放一张效果图。......
  • 百度高德地图JS-API学习手记:地图基本设置与省市区数据加载
    无论是百度还是高德地图开发,还是高德地图开发。官方的给的案例启示很多,copy再修改下,就完成了https://lbs.amap.com/api/javascript-api/summary  http://lbsyun.baidu.com/index.php?title=jspopular3.0这个大致看一下,我想。有点GIS基础都能完成地图开发。个人认为百度的文档......
  • 百度高德地图行政区域边界GeoJSON数据获取并绘制行政区域
    highcharts是提供地图数据包的:https://www.highcharts.com/docs/maps/map-collectionechart矢量地图或者地图绘制矢量图层,GeoJSON哪里提供呢?dataV提供数据下载,http://datav.aliyun.com/tools/atlas/#&lat=30.332329214580188&lng=106.75386074913891&zoom=4.5这些数据也是从高......
  • 调用百度云api实现人脸库注册代码展示
    #encoding:utf-8importbase64importrequestsdefgetToken():ak='B7E2OqVuDAyDs7OsuGPuKa4y'sk='idObOz6jqA2GdU49L2VG4VPVhgmiidvD'host=f'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&cli......