学习selenium

时间：2024-03-20 19:56:09浏览次数：27

标签：url selenium driver 学习 item result import

import requests
import bs4
from selenium.webdriver.common.by import By
import pandas as pd
driverPath = "C:\Program Files (x86)\Microsoft\Edge\Application\msedgedriver.exe"
url = 'https://so.gushiwen.cn/'
url2 = 'gushi/tangshi.aspx'

msg = requests.get(url=url + url2)
soup = bs4.BeautifulSoup(msg.text, "html.parser")

titles = soup.find_all(class_='typecont')

result = []
from selenium import webdriver
driver = webdriver.Edge(driverPath)

for title in titles:
    list_name = title.find_all('a')
    for item in list_name:
        driver.get(url + item['href'])

        a = driver.find_element(By.CLASS_NAME,'contson').text

        result.append((item.text,a))
driver.quit()

result = pd.DataFrame(result,columns=['诗名','诗词'])
print(result)

有个唐诗三百首的爬取任务，而人家的是script动态加载，普通的request.get无法支持，因此引入selenium库，模拟浏览器访问，但是由于需要浏览器访问，大大增加了运行时间

标签：url,selenium,driver,学习,item,result,import
From： https://www.cnblogs.com/cocotun/p/18085945

芒果YOLOv5改进86：上采样Dysample：顶会ICCV2023，轻量级图像增采样器，通过学习采样来学习上
......
（day 13）JavaScript学习笔记（对象1）
概述这是我的学习笔记，记录了JavaScript的学习过程。在写博客的时候我会尽量详尽的记录每个知识点。如果你完全没接触过JavaScript，那么这一系列的学习笔记可能会对你有所帮助。今天学习对象，主要是创建对象、对象属性、省略key、遍历对象属性、删......
Blazor学习记录三
11.自定义组件与消费端变量之间实现双向绑定这也实现了从子组件到父组件的状态传递。1.定义一个数据类型为T的参数。2.再定义一个参数名+[Changed]为名称，EventCallback结构类型的参数。注意T类型要和第一步中的参数数据类型T相同。3.定义一个被用于元素中的C#事件触发的事件......
CCS5.5帮助文档Help学习
技巧：纯英文文档，用微信扫一扫翻译。主要看以下三个，按下面顺序：C/C++DevelopmentUserGuide：新建一个项目并运行的demo界面流程，依据操作一遍。【建个小demo，从头到尾操作一遍。3h。】CodeComposerStudioHelp：界面图标认识，用到再查也行。【5分钟大概瞄一眼】C6000CompilerVers......
【机器学习】科学库使用第2篇：机器学习概述,学习目标【附代码文档】
机器学习（科学计算库）完整教程（附代码资料）主要内容讲述：机器学习（常用科学计算库的使用）基础定位、目标，机器学习概述定位,目标,学习目标,学习目标。机器学习概述，1.3人工智能主要分支学习目标,学习目标,1主要分支介绍,2小结。机器学习概述，1.5机器学习算法分类学习目标,学习目标,1监......
Vue学习笔记54--动画效果+过度效果
动画效果示例一：Test.vue——主要代码文件<template><div><button@click="isShow=!isShow">显示.隐藏</button><!--<h2v-show="isShow"class="come">你......
深度学习500问——Chapter03：深度学习基础（3）
文章目录3.5BatchSize3.5.1为什么需要Batchsize3.5.2BatchSize值的选择3.5.3在合理范围内，增大BatchSize有何好处3.5.4盲目增大BatchSize有何坏处3.5.5调节BatchSize对训练效果影响到底如何3.6归一化3.6.1归一化含义3.6.2为什么要归一化3.6.3为什......
OSPF-1类Router LSA学习
前面我们又复习了一遍OSPF概述，在OSPF建立关系后有几种交互报文，通过LSU类型报文包含LSA信息实现路由信息传递，常见了1、2、3、4、5、7类LSA，分别对应不同功能使用。这里先看下1类LSA-RouterLSA。一、LSA概述LSA，全称为LinkStateAdvertisement，即链路状态通告，是OSPF（OpenSho......
【嵌入式学习笔记】---- OLED屏幕工作原理
1驱动芯片SSD1603简介1.1SSD1603芯片图SSD1603是一款点阵显示屏控制器，可嵌入在屏幕中，用于执行接收数据、显示存储、扫描刷新等任务驱动接口：128个SEG引脚和64个COM引脚，对应\(128\times64\)像素点阵显示屏内置显示存储器（GDDRAM）：\(128\times64Bit（或128\times64Byte）SRAM\)......
关于衍射光波导设计中的K阈（k-domain）分析的一些学习
对于衍射光波导的设计来说，不能简单利用几何光的方法对光线的传播路径进行描述。因此可以基于K空间波矢的矢量运算来进行描述。在阈值分析中，衍射光波导的光线传播遵循二个引导条件，分别为全内反射条件和引导模式条件。如图所示。 ......

学习selenium

相关文章

赞助商

阅读排行