首页 > 数据库 >python爬虫案列11:爬取双色球历史开奖记录并存储到mysql

python爬虫案列11:爬取双色球历史开奖记录并存储到mysql

时间:2023-04-11 16:14:18浏览次数:48  
标签:11 blue xpath python text tr 案列 data red

开始之前要先在MySQL创建一个名为spider的数据库,在里面创建一个名caipiao的表,表里面三个字段,data,red,blue

点击查看代码
import requests
import pymysql
from lxml import etree
# 连接数据库
conn = pymysql.connect(
    host='localhost', port=3306, user='root', password='root', database='spider'
)
# 创建游标
cursor = conn.cursor()
url = 'http://datachart.500.com/ssq/'
resp = requests.get(url).text
# 解析数据
tree = etree.HTML(resp)
trs = tree.xpath('//*[@id="tdata"]/tr')
for tr in trs:
    if len(tr) != 1:  # 判断是否为空
        # 拿到想要的数据
        data = tr.xpath('./td[@align="center"]/text()')[0].strip()
        red = '_'.join(tr.xpath('./td[@class="chartBall01"]/text()'))
        blue = tr.xpath('./td[@class="chartBall02"]/text()')[0]
        # 执行sql语句
        sql = "insert into caipiao(data, red, blue) values(%s, %s, %s)"
        cursor.execute(sql, (data, red, blue))
        print("OK!")
# 关闭数据库连接
conn.close()
![image](/i/l/?n=23&i=blog/2626672/202304/2626672-20230411155918169-1248093250.png)

标签:11,blue,xpath,python,text,tr,案列,data,red
From: https://www.cnblogs.com/shuxi/p/17306547.html

相关文章

  • 爬虫案列10:python 连接mysql
    importpymysql#打开数据库连接db=pymysql.connect(host='localhost',user='root',password='root',database='pikachu',port=3306......
  • python 判断文件是否传输完成
    思路,判断文件大小是否有改变(绝大多数情况可以)defis_completed(self,file_path):file_size=-1whilefile_size!=os.path.getsize(file_path):file_size=os.path.getsize(file_path)time.sleep(1)todo(file_path)......
  • Python的安装
    Python官网下载地址:https://www.python.org/downloads/  开始安装:最下方红色框打钩 自定义安装路径:  验证: ......
  • 2023.04.11 定时测试随笔 T1
    T1数列分段SectionII传送门:洛谷P1182题意:把\(n\)个数分成\(m\)段,使\(m\)段和的最大值最小,求这个值;题解:因为题目要求最大值的最小值,很明显的一道二分答案的板子题,我们二分这个最大值,因为是区间和,我们用前缀和来维护,二分区间就是[\(sum[1]\),\(sum[n]\)]:......
  • (KMP 1.1)hdu 1711 Number Sequence(KMP的简单应用——求pattern在text中第一次出现的
    题目:NumberSequenceTimeLimit:10000/5000MS(Java/Others)    MemoryLimit:32768/32768K(Java/Others)TotalSubmission(s):12902    AcceptedSubmission(s):5845ProblemDescriptionGiventwosequencesofnumbers:a[1],a[2],......,a[N],andb[1......
  • 事实胜于雄辩,苹果MacOs能不能玩儿机器/深度(ml/dl)学习(Python3.10/Tensorflow2)
    坊间有传MacOs系统不适合机器(ml)学习和深度(dl)学习,这是板上钉钉的刻板印象,就好像有人说女生不适合编程一样的离谱。现而今,无论是Pytorch框架的MPS模式,还是最新的Tensorflow2框架,都已经可以在M1/M2芯片的Mac系统中毫无桎梏地使用GPU显卡设备,本次我们来分享如何在苹果MacOS系统上......
  • 标 题: 让 Python 拥有 C/C++ 一样的速度,编译神器 Codon 发布!
    发信人:mseer(mseer),信区:Python标题:让Python拥有C/C++一样的速度,编译神器Codon发布!发信站:水木社区(TueMar1423:52:022023),站内https://mp.weixin.qq.com/s/n5LRxftQiiP8FO6nvyL3-g为了解决这一难题,麻省理工学院的计算机科学家出手了,他们共同研发了一......
  • Python 链接数据库,快速操作数据库类。让你操作数据库so so 的
    importpymysqlclassDatabaseHandler:def__init__(self):self.db=pymysql.connect(host='127.0.0.1',user='root',db='test')#创建游标对象self.cursor=self.db.cursor()#def__del__(self):......
  • Python 如何相对于工程目录指定文件
    在Python中,可以使用相对路径来指定文件,相对路径是相对于当前工作目录的路径。如果要相对于工程目录指定文件,可以使用以下代码获取当前工作目录,并使用相对路径来指定文件:importos#获取当前工作目录current_dir=os.path.dirname(os.path.abspath(__file__))#使用相对路径......
  • 力扣1107(MySQL)-每日新用户统计(中等)
    题目:Traffic表:该表没有主键,它可能有重复的行。activity列是ENUM类型,可能取(‘login’,‘logout’,‘jobs’,‘groups’,‘homepage’)几个值之一。问题编写一个SQL查询,以查询从今天起最多90天内,每个日期该日期首次登录的用户数。假设今天是2019-06-30.示例Tr......