首页 > 其他分享 >pyspark list[dict]转pyspark df

pyspark list[dict]转pyspark df

时间:2023-04-25 10:25:47浏览次数:38  
标签:__ name pyspark df self dict spark

数据处理把 list嵌套字段转成 pyspark dataframe 

# coding=utf-8
from pyspark.sql import SparkSession
from pyspark.sql.types import *
import pandas as pd
from pyspark.sql import Row


class SparkContext:
    def __init__(self, name="cleaner"):
        self.spark = (
            SparkSession.builder.appName(name)
                .config("hive.exec.dynamic.partition", True)
                .config("hive.exec.dynamic.partition.mode", "nonstrict")
                .enableHiveSupport()
                .getOrCreate()
        )
        self.spark.sparkContext.setLogLevel("ERROR")

    def __enter__(self):
        return self.spark

    def __exit__(self, exc_type, exc_val, exc_tb):
        self.spark.stop()


def main():
    data = [{'ent_name': '百度', 'credit_code': '1234567890'},
            {'ent_name': 'abc', 'credit_code': '121212222'}
            ]
    row_data = [Row(**row) for row in data]
    with SparkContext('test_df') as spark:
        df = spark.createDataFrame(row_data)
        df.show()


if __name__ == '__main__':
    main()

  

标签:__,name,pyspark,df,self,dict,spark
From: https://www.cnblogs.com/zzay/p/17351824.html

相关文章

  • POJ - 3764 XOR&&dfs 01字典树
    Inanedge-weightedtree,thexor-lengthofapathpisdefinedasthexorsumoftheweightsofedgesonp:{xor}length§=\oplus{e\inp}w(e)⊕isthexoroperator.Wesayapaththexor-longestpathifithasthelargestxor-length.Givenanedge-weigh......
  • ACM International Collegiate Programming Contest 2014 A dfs 好题
    GREAT+SWERC=PORTOWewanttohaveagreatSWERCatPortothisyearandweapproachedthischallengeinseveralways.Weevenframeditasawordadditionproblem,similartotheclassicSEND+MORE=MONEY,whereeachletterstandsforasingledigit(......
  • web前端pdf.js预览pdf实例创建报错:Array. prototype` contains unexpected enumerable
    使用pdf.min.js是预览pdf文件,但是在实例化时异常报错,下面是实例化的代码varloadingTask=window.pdfjsLib.getDocument(url);console.log(loadingTask);this.pageNum=1;this.pageRendering=false;this.pageNumPending=null;loadingTask.promise.then((pdfDoc_)=>......
  • pydictor —— 一个强大实用的黑客暴力破解字典建立工具
    pydictor下载环境kalihttps://github.com/LandGrey/pydictor/下载玩解压,然后在pydictor文件夹下打开终端即可。他可以帮助我们快速的生成普通爆破字典、基于网站内容的自定义字典、社会工程学字典等等一系列高级字典还可以使用内置工具,对字典进行安全删除、合并、去重、合并并......
  • vue移动端使用(pdfh5) 组件预览PDF
    1、安装插件npmipdfh52、在页面内引入组件importPdfh5from"pdfh5";import"pdfh5/css/pdfh5.css";3、写一个展示pdf文件的容器  <divid="pdfType"></div>4、封装在事件中 initPdf(){      this.pdfh5=''      this.pdfh......
  • Qt 将 widget 打印到 pdf
    一开始直接render到QPrinter里发现渲染出的图很小,原因是没有把两者的尺寸对齐到一致这里我们按printer和widget的比例缩放:defexportToPDF(w:QWidget,file_name):printer=QPrinter()printer.setPageSize(QPrinter.A4)printer.setOutputFormat(......
  • C#开发的免费PDF转换、压缩、拆分、合并助手
    《骑士科技星火计划》现推出首款产品—《工程人PDF助手》,为工程人打造属于自己的PDF功能助手,具有PDF转换、压缩、拆分及合并等功能。《工程人PDF助手》为《骑士科技星火计划》首款产品,安装步骤简单,操作便捷,供各位工程人免费使用! 获取方式欢迎关注公众号《工程人的编程课堂》,后......
  • 团队博客 --PDF智能简历识别
    到今天为止,我们的项目已经完成,这里我将对这一阶段的进行总结。在第一阶段我们的团队罗列了开发这一项目的问题,按照复杂问题流程化,划分出来了许多小的问题,大体上分为前端界面开发,后端业务逻辑以及数据库设计。在这一阶段,我们的队长为我们每一个人划分了明确的任务 第二阶段就是......
  • C# Mysql The given key '12599' was not present in the dictionary.
    如果查询语句没有问题数据库连接字符串也没有问题,可能是Mysql.Data引用与当前安装的Mysql数据库版本不兼容的问题。我本地安装的mysql版本是8.30,在VS里使用Nuget程序包下载的Mysql.Data引用是其他更低的版本,将程序里用的Mysql.Data也更新到8.30就好了。版本保持一致。 ......
  • 【专题】展望人工智能银行:当银行遇到AI报告PDF合集分享(附原数据表)
    报告链接:http://tecdat.cn/?p=32210原文出处:拓端数据公众号在2016年,AlphaGo机器人打败了18届世界棋王李世石,成为了世界棋坛上最伟大的人物。围棋是一种非常复杂的棋类,它要求有很强的直觉,想像力和策略性的思考,而这一切在很长一段时间里都被认为是人类的天赋。如今,人工智能技术已......