2018 年长沙天气情况气象数据分析与可视化(Scala 版)

时间：2022-09-07 15:36:32浏览次数：70

标签：plt String val Scala 天气情况 RDD 可视化 2018 data

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>hnkjzy.cn</groupId>
    <artifactId>weather15</artifactId>
    <version>1.0-SNAPSHOT</version>

    <dependencies>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.11</artifactId>
            <version>2.4.5</version>
        </dependency>
    </dependencies>

</project>

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Weather15 {
  def main(args: Array[String]): Unit = {
    //指定hadoop的目录
    //    System.setProperty("hadoop.home.dir","E:\\junior\\Hadoop\\hadoop-2.6.4")
    //1.创建SparkConf对象，设置appName和Master地址
    //spark-shell --master local[2]
    val sparkconf=new SparkConf().setAppName("Weather15").setMaster("local[1]")   //在本机Windows上运行
    //2.创建SparkContext对象，它是所有任务计算的源头，它会创建DAGScheduler和TaskScheduler
    val sparkContext=new SparkContext(sparkconf)
    //3.读取数据文件，RDD可以简单的理解为是一个集合，集合中存放的元素是String类型
    //.textFile("")
    val data:RDD[String]=sparkContext.textFile("E:\\inputweather")
    //4.切分每一行，获取所有的单词
    val words:RDD[Array[String]]=data.map(_.split("  "))
    val words2:RDD[String]=words.map(x=>{   //"阴/小雨"--->"阴"
      if (x(1).indexOf("/")>0)
        x(1).substring(0,x(1).indexOf("/"))
      else
        x(1)
    })
    //5.每种天气情况记为1，转换为（单词，1）
    val wordAndOne:RDD[(String,Int)]=words2.map(x=>(x,1))
    //6.相同天气情况汇总，前一个下划线表示累加数据，后一个下划线表示新数据
    val result:RDD[(String,Int)]=wordAndOne.reduceByKey(_+_)
    //7.收集打印结果数据
    //    val finalResult:Array[(String,Int)]=result.collect()
    //    println(finalResult.toBuffer)
    //保存为文本文件
    result.coalesce(1,true).saveAsTextFile("E:\\output15")

    //8.关闭sparkContext对象
    sparkContext.stop()
  }

}

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt

matplotlib.rcParams['font.family']='SimHei'   
matplotlib.rcParams['font.sans-serif'] = ['SimHei']

data=pd.read_csv(r"E:\output15\part-00000",delimiter=',',header=None)
data.columns=['天气情况','天数']
data['天气情况']=data['天气情况'].map(lambda x: x.split('(',1)).str[1]
data['天数']=data['天数'].map(lambda x: x.split(')',1)).str[0]
data.head()

plt.figure(figsize=(10,8))
plt.pie(data['天数'],labels=data['天气情况'],autopct='%1.2f%%')
plt.title("2018年长沙全年各种类型天气占比数量图")
plt.legend(loc='upper right',bbox_to_anchor=(1.7,1.05),fontsize=10,borderaxespad=0.3)
plt.show()

标签：plt,String,val,Scala,天气情况,RDD,可视化,2018,data
From： https://www.cnblogs.com/modikasi/p/16665601.html

一个关于算法与数据结构的可视化平台
旧金山大学官网的数据可视化（算法与数据结构）：数据结构可视化(usfca.edu)......
数智加油站 | 智慧加油站数字孪生三维可视化监控管理系统解决方案
智慧加油站建设背景当前，在全球能源体系中，化石能源依然占据主导地位。以石油为例，其作为“工业的血液”，贯穿我们的整个生活，大到国家的工业、农业、交通、国防，小到每个人的衣......
React 中的数据可视化与 D3.js
React中的数据可视化与D3.js当我想在Web应用程序上可视化数据时，我首选的环境是在React应用程序中使用d3.js。但这两种技术很难结合起来。原因是他们都想处理DOM......
Vue3拖拽式可视化低代码数据可视化平台
简介......
webgl(three.js)实现室内三维定位,3D定位,3D楼宇bim、实时定位三维可视化解决方案——
序：还是要抽出时间看书的，迷上了豆豆的作品，最近在看《天幕红尘》，书中主人公的人生价值观以及修为都是让我惊为叹止。很想成为那样的人，但是再看看自己每天干的事，与时间的......
数据可视化——清晰地传达您的结果
数据可视化——清晰地传达您的结果在本文中，我将讨论数据可视化并重点介绍Python中可用的工具，因为它是该主题上拥有最多种类库的语言。PhotobyKOBU代理商on不飞......
新能源发电 | 智慧光伏电站三维可视化物联网智能运维系统
智慧光伏建设背景在“双碳”战略提出后，光伏行业因其突出的低碳环保属性迎来了发展的黄金时期。据统计，2021年，我国分布式光伏年度新增规模约2900万千瓦，突破新增光伏发电装......
细数那些值得推荐的可视化工具
数据可视化大屏包含了丰富的组件信息，仅用一张屏幕就能够囊括多张数据表格的诸多讯息，且画面色彩丰富，不时穿插动态组件，方便人们理解。也不怪人们越来越喜欢用可视化大屏进行......
[ROS学习]16. 常用可视化工具的使用（完结）
笔记参考：【ROS学习笔记】16.常用可视化工具的使用内容参考：B站ROS公开课：【古月居】古月·ROS入门21讲本节说明这节是最后一节，介绍一些常用可视化工具的使用。在课的一开始......
Revit2018二次开发——外部工具不显示
安装包下找到D:\aaa\Revit_2018_G1_Win_64bit_dlm\Utilities\SDK\SoftwareDevelopmentKit中的RevitSDK.exe也可以直接通过安装解压这个东西。找到一个addin文件......

2018 年长沙天气情况气象数据分析与可视化(Scala 版)

相关文章

赞助商

阅读排行