首页 > 其他分享 >获取百度回收网址

获取百度回收网址

时间:2023-05-31 10:56:48浏览次数:39  
标签:url driver 回收 网址 second zy import com 百度

import random
import time
from selenium import webdriver
import requests
from lxml import etree
from selenium.webdriver.common.by import By


def request_zy(url):
    response = requests.get(url=url)
    return response.url


driver = webdriver.Chrome()
url='https://www.baidu.com/s?wd=site%3Awww.china-mcc.com&pn=10&oq=site%3Awww.china-mcc.com&ct=2097152&tn=baiduhome_pg&ie=utf-8&si=www.china-mcc.com&rsv_idx=2&rsv_pq=b12974be0001e1e7&rsv_t=0ec8iP0K%2B50KOidEPlwNMg4d5yDJA8wmDCnRC3C2o8p3fd5Ts70J7kpf0GI3EDJPK5N8&gpc=stf%3D1684080000%2C1685462400%7Cstftype%3D2&tfflag=1&bs=site%3Awww.china-mcc.com&rsv_jmp=fail'

for i in range(2, 10000):
    time.sleep(random.randint(5, 8))
    driver.get(url)
    html = driver.page_source
    tree = etree.HTML(html)
    second_list = tree.xpath('//div[@id="content_left"]//h3//a//@href')
    for second in second_list:
        zy = request_zy(second)
        open('有色技术.txt', 'a').write(zy + '\n')
        print(f'{zy}正在写入中')
    print('写入完成')
    print(f'第{i}页----------')
    driver.find_element(by=By.XPATH, value='//a[@class="n"][2]').click()
    time.sleep(random.randint(5, 8))
driver.close()
driver.quit()

 

标签:url,driver,回收,网址,second,zy,import,com,百度
From: https://www.cnblogs.com/wolvies/p/17445395.html

相关文章

  • 2019 年百度之星·程序设计大赛 - 初赛三[1-3]
    题目链接:http://bestcoder.hdu.edu.cn/contests/contest_show.php?cid=863 A.#include<bits/stdc++.h>usingnamespacestd;constintmx=2e5+10;constintmod=1e9+7;typedeflonglongll;intmain(){intt;scanf("%d",&t);wh......
  • 2.6. Java内存管理与垃圾回收
    2.6.1.Java内存模型在Java中,内存被划分为以下几个区域:堆(Heap):存储对象实例和数组,是垃圾回收的主要区域。栈(Stack):存储局部变量和方法调用。每个线程有自己的栈。方法区(MethodArea):存储类信息,如类的结构、方法、字段等。本地方法栈(NativeMethodStack):存储本地方法(如JNI)的调用......
  • 百度飞桨(PaddlePaddle) - PP-OCRv3 文字检测识别系统 基于 Paddle Serving快速使用(服
    百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统预测部署简介与总览百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统PaddleInference模型推理(离线部署)百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统基于PaddleServing快速使用(服务化部署)PaddleServing......
  • 百度飞桨(PaddlePaddle) - PP-OCRv3 文字检测识别系统 预测部署简介与总览
    百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统预测部署简介与总览百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统PaddleInference模型推理(离线部署)百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统基于PaddleServing快速使用(服务化部署)1.预测部署简介......
  • Vivado2019.2下载(官网&百度云)与安装(手把手)
    龙芯杯对于vivado版本的要求:VivadoDesignSuiteHLWebPACK™版是革命性设计套件的免费版本。我们用它,能满足龙芯杯的需要,而且不用license区别如下:下载地址记得创建xilinx账号或者登陆!!!第一个是指下载一个exe之后,点击这个exe进行在线安装第二个是指把20几G的软件全部下到本地......
  • JVM垃圾回收机制
    判断一个对象是否存活的方法:(1)引用计数法:给每个对象设置一个引用计数器,对象被引用时就+1,引用失效时就-1,当对象的引用为0时,该对象就被视为垃圾对象,等待垃圾回收。但是该方法不能解决循环引用问题。例如:A引用B,B应用A。现在的虚拟机一般不用这种方法。(2)可达性分析法:沿着GCRoots对象......
  • 百度松果菁英班--oj赛(第五次)
    目录百度松果菁英班--oj赛(第五次)一、附庸的附庸二、采蜜三、暧昧团四、上楼梯五、上楼梯2六、大厨小码哥七、纸带八、围栏木桩九、最长字段和十、旅费百度松果菁英班--oj赛(第五次)一、附庸的附庸题目:蒙德城的旧贵族们存在着附庸的关系。欧洲有一位伟人说过,我的附庸的附庸不是我......
  • 2023-05-26:golang关于垃圾回收和析构函数的选择题,多数人会选错。
    2023-05-26:golang关于垃圾回收和析构的选择题,代码如下:packagemainimport( "fmt" "runtime" "time")typeListNodestruct{ Valint Next*ListNode}funcmain0(){ a:=&ListNode{Val:1} b:=&ListNode{Val:2} runtime.SetFi......
  • js百度地图计算两经纬度坐标点的距离
    百度地图提供现成的方法,直接调用就可以了Map类getDistance(start:Point,end:Point)Number返回两点之间的距离,单位是米。(自1.1新增)varmap=newBMap.Map("container");varpoint1=newBMap.Point(lng1,lat1);varpoint2=newBMap.Point(lng2,lat2);vardistanc......
  • 深度解析 slab 内存池回收内存以及销毁全流程
    在上篇文章《深入理解slabcache内存分配全链路实现》中,笔者详细地为大家介绍了slabcache进行内存分配的整个链路实现,本文我们就来到了slabcache最后的一部分内容了,当申请的内存使用完毕之后,下面就该释放内存了。在接下来的内容中,笔者为大家介绍一下内核是如何将内存......