首页 > 编程语言 >python爬取一些文字信息并保存到表格

python爬取一些文字信息并保存到表格

时间:2023-06-23 20:01:17浏览次数:35  
标签:write 表格 python money workers 爬取 moneys sheet1 import

# coding:utf-8

'''
获取验证码自动登录
'''
import openpyxl
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import Select
import time
import re
import random
import pandas as pd
from openpyxl import load_workbook
import xlsxwriter as xw
import numpy as np
import xlwt
###填写需要爬取文字的url
url=''

brower=webdriver.Chrome()
brower.get(url)
time.sleep(5)
elements=brower.find_elements(by=By.XPATH,value="//a[@class='el']/div/span[1]")
money=brower.find_elements(by=By.XPATH,value="//p[@class='info']/span[1]")
workers=[]
moneys=[]
for i in elements:
  worker=i.text
  workers.append(worker)
for j in money:
   money=j.text
   moneys.append(money)
shuju=dict(zip(workers,moneys))
####方法一:保存到表格中
file=xlwt.Workbook('encoding=utf-8')
sheet1=file.add_sheet('sheet1',cell_overwrite_ok=True)
sheet1.write(0,0,"序号")
sheet1.write(0,1,"工作")
sheet1.write(0,2,"月薪")
for i in range(len(workers)):
     sheet1.write(i+1,0,i)
     sheet1.write(i+1,1,workers[i])
     sheet1.write(i+1,2,moneys[i])
file.save(r'C:\Users\Administrator\Desktop\data1.xlsx')
#####方法二:保存到表格中
dic={"worker":workers,"mone":moneys}
df=pd.DataFrame(dic)
print(df)
df.to_excel(r'C:\Users\Administrator\Desktop\data1.xlsx')

标签:write,表格,python,money,workers,爬取,moneys,sheet1,import
From: https://blog.51cto.com/u_16056808/6538945

相关文章

  • python批量调整docx段落格式
    平时使用WechatDownload保存了很多技术文章,格式比较乱。比如很多空白行、英文乱码、页面左右缩进太多等问题,今天一并解决一下安装python-docxfromdocximportDocumentfromdocx.sharedimportCmimportosrootdir=r'E:\vxWEB\GIS'forfilesinos.listdir(rootdir):......
  • 使用python简单的爬取图片
    importrefrombs4importBeautifulSoupimportrequestsheaders={'User-agent':'Mozilla/5.0(Linux:Android6.0;Nexus5Build/MRA58M)''ApplewebKit/537.36(KHTML,likeGecko)''Chrome/104.0.5112.81'}url=''#......
  • python+音频数字信号处理
    一、在网上下载了一个wav文件,周杰伦的《告白气球》网址:https://www.xmwav.com/ 二、一些参数说明针对一个音频信号:2.1、通道数是在采集声音时用几个通道去录制声音,单声道和双声道的音频文件较为常见。例如在声源的不同位置放置通道去录制,则可以获得多通道的音频数据。以双......
  • 用python写一个保存文本到文件的函数
    用python写一个保存文本到文件的函数━━━━━━━━━━━━━━━━━━━━━━━━━可以通过Python的文件操作来实现保存文本到文件的功能。下面是一个保存文本到文件的函数的示例:defsave_text_to_file(text,file_path):try:withopen(file_path,'w')a......
  • 记WinForm DataGridView 表格显示的不同风格
    第一种风格:1///<summary>2///第一种样式3///</summary>4publicvoidDgvStyle1(DataGridViewdgv)5{6//奇数行的背景色7dgv.AlternatingRowsDefaultCellStyle.BackColor=S......
  • Python播放GIF图片(ChatGPT代码参考)
    在网上找了好几个方法,最后还是出现各种问题,解决不了播放GIF的功能。最后,通过ChatGPT给出了简单明了的方案(使用第三方库imageio和matplotlib.animation来实现),调试直接通过。但有小瑕疵,就是显示gif时隐藏掉坐标轴的功能无效,于是再做了一下优化。 [最终代码]显示GIF动画:imp......
  • 基于Python+QT5+Dialog开发的舆情可视化分析系统
    基于Python+QT5开发的舆情可视化分析系统项目介绍......
  • 花朵识别系统Python+TensorFlow+Django+卷积神经网络算法实现
    一、背景花朵识别系统,基于Python实现,深度学习卷积神经网络,通过TensorFlow搭建卷积神经网络算法模型,并对数据集进行训练最后得到训练好的模型文件,并基于Django搭建可视化操作平台。在当今信息化社会,图像识别技术在各种领域都展现出了重要的应用价值,包括医学影像分析、自动驾驶、......
  • 文本识别分类系统python,基于深度学习的CNN卷积神经网络算法
    一、介绍文本分类系统,使用Python作为主要开发语言,通过TensorFlow搭建CNN卷积神经网络对十余种不同种类的文本数据集进行训练,最后得到一个h5格式的本地模型文件,然后采用Django开发网页界面,实现用户在界面中输入一段文字,识别其所属的文本种类。在我们的日常生活和工作中,文本数据无......
  • 解放计算力:使用并行处理提升python for循环速度
    Python是一门功能强大的编程语言,但在处理大规模数据或复杂计算任务时,性能可能成为一个瓶颈。幸运的是,Python提供了多种方法来提升性能,其中之一是利用并行处理来加速循环操作。本文将介绍如何使用并行处理技术来优化for循环,从而提高Python程序的执行速度。我们将讨论并行处......