首页 > 数据库 >python爬虫数据存进mysql数据库

python爬虫数据存进mysql数据库

时间:2024-10-22 11:46:46浏览次数:9  
标签:count name get python 数据库 存进 mysql data

一、安装mysql和mysql workbench

我已经在电脑上安装了最新的mysql8.2.0,配置好环境变量,在命令提示符中以管理员的身份初始化并成功启动mysql数据库。

前期因为以前的mysql没有卸载干净,导致mysql一直无法启动服务。所以一定要保证以前的mysql卸载干净才能重新安装,以前没有安装过的忽略。

二、记好mysql用户名、密码和端口号

三、连接pycharm和mysql数据库

安装pymysql:文件----设置----python解释器----“+”----搜索“pymysql”----安装

四、我这里是选择爬取迪丽热巴的微博名字,关注量和粉丝量为例。

import json
import requests
import time
import pymysql

def get_html(url):
    headers = {
        "User-Agent": "************************",  #开发者模式查询info?uid=1669879400就会出来user-agen
        "Referer": "https://weibo.com"
    }
    cookies = {
       "cookie": "你的微博cookie"
    }
    response = requests.get(url, headers=headers, cookies=cookies)
    time.sleep(3)   # 加上3s 的延时防止被反爬
    return response.text


def get_data(id):
    url1 = "https://weibo.com/ajax/profile/info?uid={}".format(id)
    html1 = get_html(url1)
    responses1 = json.loads(html1) #将json数据解析成python对象
    data1 = responses1['data']['user']
    data = {}   # 新建个字典用来存数据
    data['screen_name'] = data1['screen_name']  # 名字
    data['followers_count'] = data1['followers_count']  # 粉丝数量
    data['friends_count'] = data1['friends_count']  # 关注数量
    save_data(data)

# 连接到数据库
def save_data(data):
    conn = pymysql.connect(
        host='localhost',
        port=3306,   #mysql占用的端口号
        user='你的用户名',    #安装时关注自己的用户名
        password='**********',   #mysql服务登录密码,安装mysql时记得关注
        database='test1'   #在mysql中已经建立好的数据库名称
    )
    cursor = conn.cursor()   #创建游标
    sql = 'INSERT INTO Dear_dilireba(screen_name, followers_count, friends_count) VALUES (%s,%s,%s)'  #Dear_dilireba是数据表,第一个括号是表中字段,第二个括号是数据属性
    cursor.execute(sql, (data['screen_name'],data['followers_count'],data['friends_count']))


    # 关闭
    cursor.close()
    # 提交事务
    conn.commit()
    # 关闭数据库连接
    conn.close()
    print('插入操作成功!')


if __name__ == '__main__':
    uid = ['1669879400']
    for id in uid:
        get_data(id)

五、mysql数据库查询

标签:count,name,get,python,数据库,存进,mysql,data
From: https://blog.csdn.net/GR001009/article/details/143147066

相关文章

  • MySQL - [20] 事务
    题记部分 一、什么是ACID(1)Atomicity原子性某个操作,要么全部执行完毕,要么全部回滚。(2)Consistency一致性数据库中的数据全都符合现实世界中的约束,则这些数据就符合一致性。比如性别的约束男or女,人民币勉之不能为负数,出生地址不能为null,参与转账的账户总余额不变;等等。(3......
  • actix-web连接mysql并返回json
    toml[dependencies]actix-web="4"mysql="25.0.0"chrono="0.4"serde={version="1.0",features=["derive"]}rsuseactix_web::{get,post,web,App,HttpServer,Responder,HttpResponse,Error};......
  • mysql的执行逻辑
    本篇章为构建mysql在执行过程中简单的业务流程,为后续的代码优化和面试构建基础。1、首先一条sql在执行时sql会通过网络传送给mysql2、在Mysql收到sql语句后会先在分析器中先判断一下SQL语句有没有语法错误。3、判断完语法之后语法无误,优化器会根据你写的sql判断执行什么索引。(......
  • 信创之达梦数据库(二)mysql迁移
    迁移前准备一、数据库工具在开始目录中可以看到安装后达梦数据库工具  二、创建用户和表空间打开上图的DM管理工具,在输入SYSDBA的口令后,展开如下画面2.1创建索引表空间在表空间右键选择【新建表空间】,填写表空间名和文件路径2.2创建表空间同上。两个表空间有什么......
  • 在Python中使用连接池
    在数据库操作中,频繁地打开和关闭连接会消耗大量的资源和时间,在一些需要高并发的场景,我们就需要连接池技术优化这一问题。本文以Python中的SQLite数据库为例,介绍如何使用连接池来提升数据操作的效率。对于使用SQLite这样的轻量级数据库,虽然连接的开销相对较小,但在高并发......
  • 这些Python代码加速工具,你都用过吗?
    优化代码的工具会让代码变得更简洁,或者更迅速!一起来了解了解吧。NumPy、SciPy、Sage和Pandas先说NumPy,它的核心是一个多维数字数组的实现。除了这个数据结构之外,还实现了若干个函数和运算符,可以高效地进行数组运算。并且对于被调用的次数进行了精简。它可以被用来进行极......
  • Python语法探索:解锁编程艺术的大门
    Python,一种被广泛赞誉为“优雅”、“明确”及“简单”的高级编程语言,自1991年由GuidovanRossum创造以来,已经从一门小众脚本语言成长为全球范围内应用于网页开发、数据分析、人工智能等多个领域的强大工具。本文旨在为初学者和进阶开发者提供一份详尽的Python语法指南,通过实例解......
  • 利用 Python 进行地理空间数据处理的工具
    本文将介绍九个常用的地理空间数据处理工具,包括GeoPandas、Fiona、Rasterio、Shapely、Pyproj、Descartes、Rtree、Geopy和Folium。这些工具覆盖了从地理空间数据读写、几何操作、坐标转换到地图绘制等多个方面,是地理信息系统(GIS)领域不可或缺的技术栈。1.GeoPandas:地理数据......
  • 11种经典时间序列预测方法:理论、Python实现与应用
    时间序列分析和预测在现代数据科学中扮演着关键角色,广泛应用于金融、经济、气象学和工程等领域。本文将总结11种经典的时间序列预测方法,并提供它们在Python中的实现示例。这些方法包括:自回归(AR)移动平均(MA)自回归移动平均(ARMA)自回归积分移动平均(ARIMA)季节性自回归积分......
  • 2024常用 gui [转] Java Python C++ C# JavaScript Go Dart Swift
    下面就介绍一下热门编程语言对应的gui框架。JavaSwing:Java的基础GUI工具包,虽然年代较久,但仍然被广泛使用。JavaFX:现代的JavaGUI工具包,用于替代Swing,提供了更丰富的界面设计和动画效果支持。ApachePivot:一个开源的富互联网应用(RIA)框架,使用Java和XML来构建桌面和Web应用程序的......