python爬取网站指定数据并存入excel

时间：2023-02-06 15:57:42浏览次数：50

标签：python excel 存入爬取 import div data

1：安装库

pip install beautifulsoup4
pip install pandas

2：爬取数据

我们拿 https://cuiqingcai.com/archives/ 网站为例子，来进行爬取文章标题

import requests
from bs4 import BeautifulSoup
import pandas as pd
import openpyxl

# 请求网页数据
res = requests.get("https://cuiqingcai.com/archives/")
soup = BeautifulSoup(res.text, "html.parser")

# 爬取数据
data = []
for div in soup.find_all("div", class_="post-title"):
    data.append(div.text)

# 存入Excel
df = pd.DataFrame(data, columns=["Data"])
df.to_excel("data.xlsx", index=False)

标签：python,excel,存入,爬取,import,div,data
From： https://www.cnblogs.com/xlei/p/17095623.html

python之路64 drf从入门到成神 9个视图子类视图集、ModelViewSet、ReadOnlyModelV
视图视图View两个视图基类：APIViewGenericAPIViewAPIView执行流程：新的reqeust，三大认证，全局异常重写了as_view，dispatch类属性：p......
python新手常见问题一：乱用表达式
在函数参数中乱用表达式作为默认值Python允许给一个函数的某个参数设置默认值以使该参数成为一个可选参数。尽管这是这门语言很棒的一个功能，但是这当这个默认值是可变对象（mu......
Python新手常见问题二：不正确的使用类变量
不正确的使用类变量看下面一个例子：>>>classA(object):...x=1...>>>classB(A):...pass...>>>classC(A):...pass...>>>printA.x,B.x,C.x111看起......
Python新手常见问题三：在异常处理时错误的使用参数
在异常处理时错误的使用参数假设你有如下的代码：>>>try:...l=["a","b"]...int(l[2])...exceptValueError,IndexError:#想捕捉两个异常...pass...Tr......
Python实现的简易FTP
Python版本实现了比之前的xxftp更多更完善的功能1、继续支持多用户2、继续支持虚拟目录3、增加支持用户根目录以及映射虚拟目录的权限设置4、增加支持限制用户根目录或者虚......
Python中and、or用法实例
Python中and、or是Python中的逻辑运算符，它们的用法如何呢？and:在Python中，and和or执行布尔逻辑演算，如你所期待的一样，但是它们并不返回布尔值；而是，返回它们实际进行比较的值......
Servlet导出Excel,Json
最近温故了下Servlet知识，以下做一些导出Excel,返回Json的演示以下的这些返回原理其实都是在控制返回的的ContentType，告诉客户端我返回的内容，返回xml等其他思路大同小异返......
Python工具箱系列(二十五)
Redis是一个开源的使用ANSIC语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。从2010年3月15日起，Redis的开发工作由VMware主持。从......
Python工具箱系列(二十四)
不管多少人黑微软，微软出品的大多数产品都能够深入人心，成为精品。在数据库领域，微软为专业人士提供SQLServer（简称mssql)。为日常办公人士提供Access与Excel这两款数据存储与......
OpenCV-Python快速入门（十二）：轮廓拟合
OpenCV-Python快速入门（十二）：轮廓拟合前言前提条件实验环境轮廓拟合矩形包围框（cv2.boundingRect()）最小包围矩形框（cv2.minAreaRe......

python爬取网站指定数据并存入excel

1：安装库

2：爬取数据

相关文章

赞助商

阅读排行