pyspark list[dict]转pyspark df

时间：2023-04-25 10:25:47浏览次数：45

标签：__ name pyspark df self dict spark

数据处理把 list嵌套字段转成 pyspark dataframe

# coding=utf-8
from pyspark.sql import SparkSession
from pyspark.sql.types import *
import pandas as pd
from pyspark.sql import Row


class SparkContext:
    def __init__(self, name="cleaner"):
        self.spark = (
            SparkSession.builder.appName(name)
                .config("hive.exec.dynamic.partition", True)
                .config("hive.exec.dynamic.partition.mode", "nonstrict")
                .enableHiveSupport()
                .getOrCreate()
        )
        self.spark.sparkContext.setLogLevel("ERROR")

    def __enter__(self):
        return self.spark

    def __exit__(self, exc_type, exc_val, exc_tb):
        self.spark.stop()


def main():
    data = [{'ent_name': '百度', 'credit_code': '1234567890'},
            {'ent_name': 'abc', 'credit_code': '121212222'}
            ]
    row_data = [Row(**row) for row in data]
    with SparkContext('test_df') as spark:
        df = spark.createDataFrame(row_data)
        df.show()


if __name__ == '__main__':
    main()

标签：__,name,pyspark,df,self,dict,spark
From： https://www.cnblogs.com/zzay/p/17351824.html

POJ - 3764 XOR&&dfs 01字典树
Inanedge-weightedtree,thexor-lengthofapathpisdefinedasthexorsumoftheweightsofedgesonp:{xor}length§=\oplus{e\inp}w(e)⊕isthexoroperator.Wesayapaththexor-longestpathifithasthelargestxor-length.Givenanedge-weigh......
ACM International Collegiate Programming Contest 2014 A dfs 好题
GREAT+SWERC=PORTOWewanttohaveagreatSWERCatPortothisyearandweapproachedthischallengeinseveralways.Weevenframeditasawordadditionproblem,similartotheclassicSEND+MORE=MONEY,whereeachletterstandsforasingledigit(......
web前端pdf.js预览pdf实例创建报错：Array. prototype` contains unexpected enumerable
使用pdf.min.js是预览pdf文件，但是在实例化时异常报错，下面是实例化的代码varloadingTask=window.pdfjsLib.getDocument(url);console.log(loadingTask);this.pageNum=1;this.pageRendering=false;this.pageNumPending=null;loadingTask.promise.then((pdfDoc_)=>......
pydictor —— 一个强大实用的黑客暴力破解字典建立工具
pydictor下载环境kalihttps://github.com/LandGrey/pydictor/下载玩解压，然后在pydictor文件夹下打开终端即可。他可以帮助我们快速的生成普通爆破字典、基于网站内容的自定义字典、社会工程学字典等等一系列高级字典还可以使用内置工具，对字典进行安全删除、合并、去重、合并并......
vue移动端使用(pdfh5) 组件预览PDF
1、安装插件npmipdfh52、在页面内引入组件importPdfh5from"pdfh5";import"pdfh5/css/pdfh5.css";3、写一个展示pdf文件的容器 <divid="pdfType"></div>4、封装在事件中 initPdf(){ this.pdfh5='' this.pdfh......
Qt 将 widget 打印到 pdf
一开始直接render到QPrinter里发现渲染出的图很小，原因是没有把两者的尺寸对齐到一致这里我们按printer和widget的比例缩放:defexportToPDF(w:QWidget,file_name):printer=QPrinter()printer.setPageSize(QPrinter.A4)printer.setOutputFormat(......
C#开发的免费PDF转换、压缩、拆分、合并助手
《骑士科技星火计划》现推出首款产品—《工程人PDF助手》，为工程人打造属于自己的PDF功能助手，具有PDF转换、压缩、拆分及合并等功能。《工程人PDF助手》为《骑士科技星火计划》首款产品，安装步骤简单，操作便捷，供各位工程人免费使用！获取方式欢迎关注公众号《工程人的编程课堂》，后......
团队博客 --PDF智能简历识别
到今天为止，我们的项目已经完成，这里我将对这一阶段的进行总结。在第一阶段我们的团队罗列了开发这一项目的问题，按照复杂问题流程化，划分出来了许多小的问题，大体上分为前端界面开发，后端业务逻辑以及数据库设计。在这一阶段，我们的队长为我们每一个人划分了明确的任务第二阶段就是......
C# Mysql The given key '12599' was not present in the dictionary.
如果查询语句没有问题数据库连接字符串也没有问题，可能是Mysql.Data引用与当前安装的Mysql数据库版本不兼容的问题。我本地安装的mysql版本是8.30，在VS里使用Nuget程序包下载的Mysql.Data引用是其他更低的版本，将程序里用的Mysql.Data也更新到8.30就好了。版本保持一致。 ......
【专题】展望人工智能银行：当银行遇到AI报告PDF合集分享（附原数据表）
报告链接：http://tecdat.cn/?p=32210原文出处：拓端数据公众号在2016年，AlphaGo机器人打败了18届世界棋王李世石，成为了世界棋坛上最伟大的人物。围棋是一种非常复杂的棋类，它要求有很强的直觉，想像力和策略性的思考，而这一切在很长一段时间里都被认为是人类的天赋。如今，人工智能技术已......

pyspark list[dict]转pyspark df

相关文章

赞助商

阅读排行