DataFrame通过JDBC读写数据读写到数据mysql

时间：2023-10-08 17:26:44浏览次数：40

标签：__ JDBC option 读写 mysql DataFrame add sql import

# coding:utf8
import time

from pyspark.sql import SparkSession
from pyspark.sql.types import StructType, StringType, IntegerType
import pandas as pd
from pyspark.sql import functions as F


if __name__ == '__main__':
    # 0. 构建执行环境入口对象SparkSession
    spark = SparkSession.builder.\
        appName("test").\
        master("local[*]").\
        config("spark.sql.shuffle.partitions", 2).\
        getOrCreate()
    sc = spark.sparkContext

    # 1. 读取数据集
    schema = StructType().add("user_id", StringType(), nullable=True). \
        add("movie_id", IntegerType(), nullable=True). \
        add("rank", IntegerType(), nullable=True). \
        add("ts", StringType(), nullable=True)
    df = spark.read.format("csv"). \
        option("sep", "\t"). \
        option("header", False). \
        option("encoding", "utf-8"). \
        schema(schema=schema). \
        load("../data/input/sql/u.data")

    # # 1. 写出df到mysql数据库中
    df.write.mode("overwrite").\
        format("jdbc").\
        option("url", "jdbc:mysql://node1:3306/db_msg?useSSL=false&useUnicode=true").\
        option("dbtable", "movie_data").\
        option("user", "root").\
        option("password", "123456").\
        save()

标签：__,JDBC,option,读写,mysql,DataFrame,add,sql,import
From： https://www.cnblogs.com/daitu66/p/17749644.html

磁盘读写测试
在Linux环境中，了解存储/磁盘I/O性能对于评估系统性能和优化存储子系统非常重要。通过测试存储/磁盘I/O性能，我们可以确定磁盘的读写速度、延迟和吞吐量等指标。本文将介绍几种常用的方法来方法一：使用dd命令dd命令是一个用于复制文件和数据的常用工具，也可以用于测试存储/磁......
sharding-jdbc分库分表
数据库分片思想垂直切分按照业务拆分的方式称为垂直分片，又称为纵向拆分，它的核心理念是专库专用。水平切分水平分片又称为横向拆分。相对于垂直分片，它不再将数据根据业务逻辑分类，而是通过某个字段（或某几个字段），根据某种规则将数据分散至多个库或表中，每个分片仅包含数据的一部分。例......
Sharding-JDBC教程：Spring Boot整合Sharding-JDBC实现分库分表+读写分离
在工程的application中做sharding-jdbc的分库分表配置，代码如下：sharding.jdbc.datasource.names=ds-master-0,ds-master-1,ds-master-0-slave-0,ds-master-0-slave-1,ds-master-1-slave-0,ds-master-1-slave-1sharding.jdbc.datasource.ds-master-0.type=com.alibaba.dr......
Sharding-JDBC 简介
在介绍Sharding-JDBC之前，有必要先介绍下Sharding-JDBC的大家族ShardingSphere。在介绍ShardingSphere之后，相信大家会对ShardingSphere的整体架构以及Sharding-JDBC扮演的角色会有更深的了解。ShardingSphere是一套开源的分布式数据库中间件解决方案组成的生态圈，它由Sharding-JDBC、......
Sharding-JDBC
一、什么是Sharding-JDBCSharding-JDBC定位为轻量级Java框架，在Java的JDBC层提供的额外服务。它使用客户端直连数据库，以jar包形式提供服务，无需额外部署和依赖，可理解为增强版的JDBC驱动，完全兼容JDBC和各种ORM框架。二、Sharding-JDBC能做什么分库&分表读写分离分布式主键分布式事务......
使用Sharding-JDBC 分库分表
当mysql单表数据量比较大时往往需要分库分表，Sharding-JDBC是当当网开源的数据库分库分表中间件。Sharding-JDBC定位为轻量级java框架，使用客户端直连数据库，以jar包形式提供服务，无proxy代理层，无需额外部署，无其他依赖，DBA也无需改变原有的运维方式。本文主要讲述该框架与spring+mybatis......
springboot -- 整合 sharding-jdbc 读写分离+分库分表配置（进阶）
sharding-jdbc说明：1、分库分表不能中途更改，取模算法的id会出错2、不支持特殊sql，包括去重,子sql,聚合等3、查询会给所有表发查询sql,带上分库,分表的字段的查询只发一条，4、查询数据要注意使用，尽量带上分库或分表字段来查询，避免多表查询sql过多取模算法假设2个表，test_0，test_1，分......
零基础尝试mybatis-plus读写分离
看了好几篇博友写的文章，关于spring-boot整合mybatis-plus实现读写分离，不过都是缺这少那的，跑不起来，所以自己实操了一次，做个记录实现方式为使用Aop切面1、增加数据库枚举类/***数据库类型*/publicenumDBTypeEnum{/***主节点*/MASTER,......
【访问控制】cgroup限制磁盘读写
一、前言参考链接：Cgroup-Linux的IO资源隔离用cgroups管理进程磁盘io二、blkio配置blkio是cgroup中的一个子系统，可以用于限制及监控磁盘读写ioblkio控制子系统可以限制进程读写的IOPS和吞吐量，但它只能对DirectI/O的文件读写进行限速，对BufferedI/O的文件读......
jdbc-批量插入mssql数据库-原
packagecom.swift.aaa;importjava.sql.Connection;importjava.sql.DriverManager;importjava.sql.PreparedStatement;importjava.sql.SQLException;importjava.text.SimpleDateFormat;importjava.util.Date;publicclassTest2{//staticintcount=......

DataFrame通过JDBC读写数据读写到数据mysql

相关文章

赞助商

阅读排行