首页 > 编程语言 >python之简单页面爬取

python之简单页面爬取

时间:2023-07-19 23:55:24浏览次数:42  
标签:python tr value replace 爬取 print td data 页面

import requests
import re
import bs4
import pandas as pd
import csv

a = []


url = "http://www.tianqihoubao.com/lishi/shijiazhuang/month/202004.html"

r = requests.get(url)

soup = bs4.BeautifulSoup(r.text,"html.parser")

datas_tr = soup.find_all("tr")

head = 0
for data_tr in datas_tr:
    b = []
    if head == 0:
        datas_b = data_tr.find_all("b")
        for data_b in datas_b:
            print(data_b.string)
            b.append(data_b.string)
            head=head+1

        print(b)
        print("*"*20)
    else:
        i = 0
        datas_td = data_tr.find_all("td")
        for data_td in datas_td:
            if i == 0:
                print(data_td.find("a").text)
                i=i+1
                value=data_td.find("a").text
                value=value.replace("\n","")
                value=value.replace("\r","")
                value=value.replace(" ","")
                b.append(value)
            else:
                print(data_td.string)
                value=data_td.string
                value=value.replace("\n","")
                value=value.replace("\r","")
                value=value.replace(" ","")
                b.append(value)

        print(b)
        print("*"*20)
    a.append(b)
    b=None
print(a)
print("爬取完毕,向csv输入ing")

with open('D:\\test.csv',"w",newline='') as csvfile: 
    writer = csv.writer(csvfile)
    for i in a:
        print(i[0]+i[1]+i[2]+i[3])
        writer.writerow([i[0],i[1],i[2],i[3]])

 

标签:python,tr,value,replace,爬取,print,td,data,页面
From: https://www.cnblogs.com/cocotun/p/17567122.html

相关文章

  • python安装pip的一种方式亲测有效
    要安装pip,我们首先需要获取get-pip.py文件。这个文件是pip安装程序的脚本,我们可以通过以下步骤来获取:打开浏览器,前往https://pip.pypa.io/en/stable/installing/。在该页面中,找到并点击"get-pip.py"链接,下载这个文件。下载完成后,我们可以使用以下命令来安装pip:pythonget-p......
  • python爬取网页图片脚本
    使用python编写网页图片的爬取脚本环境搭建:首先搭建一个web服务器安装phpstudy访问phpstudy的IP显示探针即为搭建成功把网站放到phpstudy的默认目录WWW下,给默认文件l.php修改名字访问网页即可看到spider网页,页面内有图片编写图片爬取到本地的python脚本通过python脚......
  • python解释器安装:
     python3.8安装下载python软件wgethttps://www.python.org/ftp/python/3.8.2/Python-3.8.2.tgz 创建目录mkdir-p/usr/local/python3解压tar-zxvfPython-3.8.2.tgzyuminstall gcc-yyum-yinstallzlib-develbzip2-developenssl-develncurses-develsqlit......
  • python系列教程210——嵌套lambda
    声明:在人工智能技术教学期间,不少学生向我提一些python相关的问题,所以为了让同学们掌握更多扩展知识更好地理解AI技术,我让助理负责分享这套python系列教程,希望能帮到大家!由于这套python教程不是由我所写,所以不如我的AI技术教学风趣幽默,学起来比较枯燥;但它的知识点还是讲到位的了,也值......
  • Python——并发编程
     1.系统知识     操作系统是计算机系统的核心软件之一,负责管理和控制计算机的硬件资源,以及提供各种功能和服务。操作系统包括硬件管理和资源分配等方面的功能,同时由五个主要的子系统组成:文件系统、进程调度、内存管理、网络接口和进程通信。    1.1五个子系统 ......
  • 管理员中怎么弄python
    管理员中怎么弄Python在管理员中使用Python可以带来很多便利和效率提升。管理员是一种操作系统或网络设备中的特权账户,拥有更高的权限,可以执行系统级别的任务。在管理员中使用Python可以自动化一些繁琐的操作、监控和管理系统状态、处理大量数据等。下面将介绍如何在管理员中使用P......
  • 关于Python数据可视化的直播分享主题有哪些
    Python数据可视化的直播分享主题数据可视化在数据分析和数据科学中起着重要的作用。Python是一种强大的编程语言,拥有丰富的数据可视化工具和库。在本文中,我们将介绍一些关于Python数据可视化的直播分享主题,并提供相应的代码示例。1.数据可视化基础在开始之前,让我们先了解一些数......
  • 工控的要不要学python
    工控的要不要学Python引言工业控制(Industrialcontrol)是一门涉及到控制系统、自动化和机械工程的学科。工业控制系统是用于监控和控制生产过程的系统,其中包括传感器、执行器、控制器和人机界面等组件。在过去的几十年中,工业控制系统一直采用传统的编程语言,如C、C++和ladderlog......
  • 高斯消去法python代码
    高斯消去法实现多元线性方程组求解1.流程概述高斯消去法(GaussianElimination)是一种用于求解多元线性方程组的常用方法。它通过将方程组表示为增广矩阵的形式,然后进行一系列的行变换,将增广矩阵转化为上三角矩阵,最后利用回代法求解方程组。以下是高斯消去法的流程:步骤操作......
  • 返回主页 python代码
    返回主页Python代码实现作为一名经验丰富的开发者,我非常乐意教会刚入行的小白如何实现“返回主页”的功能。在这篇文章中,我将为你详细介绍整个实现过程,并提供相关的代码示例和注释。实现步骤首先,让我们来总结一下实现“返回主页”的流程,并用表格形式展示每个步骤需要做什么。......