批量获取title

时间：2023-02-06 18:36:08浏览次数：44

标签：writer 批量 title URL futures 获取 url import

 1 import requests
 2 from bs4 import BeautifulSoup
 3 import pandas as pd
 4 from openpyxl import Workbook
 5 import concurrent.futures
 6 
 7 # 读取 .txt 文件中的 URL
 8 with open("urls.txt", "r") as file:
 9     urls = file.read().splitlines()
10 
11 # 存储 URL 和 title
12 data = []
13 
14 def fetch_title(url):
15     response = requests.get(url)
16     soup = BeautifulSoup(response.text, "html.parser")
17     title = soup.find("title").text
18     return (url, title)
19 
20 with concurrent.futures.ThreadPoolExecutor(max_workers=20) as executor:
21     futures = [executor.submit(fetch_title, url) for url in urls]
22 
23     for future in concurrent.futures.as_completed(futures):
24         result = future.result()
25         data.append(result)
26 
27 # 将 URL 和 title 写入 Excel 文件
28 df = pd.DataFrame(data, columns=["URL", "Title"])
29 
30 book = Workbook()
31 writer = pd.ExcelWriter("titles.xlsx", engine="openpyxl")
32 writer.book = book
33 
34 df.to_excel(writer, index=False)
35 
36 writer.save()
37 　　由于是最后一起写入到excel，所以单次URL获取不宜过多

标签：writer,批量,title,URL,futures,获取,url,import
From： https://www.cnblogs.com/BreakLAC/p/17096362.html

JVM 如何获取当前容器的资源限制？
作者：卜比最近同事说到Java的ParallelGCThreads 参数，我翻了下jdk8的代码，发现 ParallelGCThreads的参数默认值如下：如果cpu核心数目少于等于8，则GC线程数量和......
获取安卓内存状态
packagecom.itheiima28.memorydemo;importjava.io.File;importandroid.app.Activity;importandroid.os.Bundle;importandroid.os.Environment;importandroid.os.Stat......
python怎么获取向量中非零元素的行号
假设A为向量：行向量的时候,需要转化为列向量 A.TA为列向量的时候,不需要转化了解下numpy中的nonzero()函数np.nonzero(arrayormmatrix)返回非零的行标，和列标......
获取接口数据，根据固定对象，获取接口数据没有的对象
data是接口返回的数据，例如：['交流500kV','交流220kV']letnewData=[];letnewData2=[];constmap={交流500kV:"500kV",交流......
获取屏幕上正在显示的activity
用过ActivityManager的童鞋估计都知道，可以从ActivityManager里面可以获取到当前运行的所有任务，所有进程和所有服务，这是任务管理器的核心。那么，从里......
利用sshpass批量实现基于key验证脚本
实现基于key验证的脚本1：[root@centos7~]#vim/etc/ssh/ssh_config#免应答known_hostsStrictHostKeyCheckingno[root@centos7~]#cathosts.list192.168.1.21019......
为什么要使用computed而不是data获取vuex中的state
最近在学习vuex时，照着官网最基本的Vuex记数应用示例敲的时候遇到了这样一个问题想实现的效果：[img]http://dl2.iteye.com/upload/attachment/0130......
PCB丝印字体比例以及批量修改丝印大小设置
1丝印宽高比例为保证PCB的丝印呈现一个比较好的显示效果，建议使用丝印比例为6:1,即H:30mil，W：5mil2批量修改丝印步骤（Aultium）2.1右键查找相似对象（Findsimilarobject）......
百度地图 PHP根据地址获取经纬度
/***[getLoLadescription]*@Author:XuXianGang*@Method:根据地址获取经纬度*@DateTime:2023-02-06T16:01:45+0800*@param......
批量通过模板打印
模版表名Templatesheet25数据列表名sheet1打印程序SubPrintLabel()WithThisWorkbook.Sheets("Sheet1")limitmax=.Range("B10000").End(xlUp).Row......

批量获取title

相关文章

赞助商

阅读排行