猫眼电影网站电影数分析与可视化

时间：2022-08-31 09:57:35浏览次数：43

标签：电影 hadoop job 可视化 io org apache import 猫眼

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.Writable;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

//keyin:行号 , valuein:Text,
public class maoyanMapper extends Mapper<LongWritable,Text,Text, IntWritable> {
    public static String spiltRtoL(String s) {

        StringBuffer sb = new StringBuffer();
        int length = s.length();
        char[] c = new char[length];
        for (int i = 0; i < length; i++) {
            c[i] = s.charAt(i);
        }
        for (int i = length - 1; i >= 0; i--) {
            sb.append(c[i]);
        }

        return sb.toString();
    }

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        //supper.map(key,value,context);
        //一行一行读，然后将每一行文本转成字符串
        String line=value.toString();
        //分割每一行
        String l = spiltRtoL(line);
        String y=l.substring(0,4);
        String year = spiltRtoL(y);

        context.write(new Text(year),new IntWritable(1));

    }
}

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class maoyanReducer extends Reducer<Text,IntWritable,Text,IntWritable> {

    @Override
    protected void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        //super.reduce(key, values, context);
        int sum=0;   //是每个地区的岗位数量和
        for(IntWritable i :values){
            sum+=i.get();   //i.get()是把IntWritable转成int
        }
        context.write(key,new IntWritable(sum));  //reducer的输出结果
    }
}

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.FileOutputStream;
import java.io.IOException;

public class maoyanRunner {
    public static  void  main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        Configuration conf=new Configuration();
        //创建job
        Job job= Job.getInstance(conf,"movie6");
        //设置输入输出路径
        FileInputFormat.addInputPath(job,new Path(args[0]));
        FileOutputFormat.setOutputPath(job,new Path(args[1]));
        //设置运行类
        job.setJarByClass(maoyanRunner.class);
        job.setMapperClass(maoyanMapper.class);
        job.setReducerClass(maoyanReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        System.exit(job.waitForCompletion(true)?0:1);

    }
}

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt

matplotlib.rcParams['font.family']='SimHei'   
matplotlib.rcParams['font.sans-serif'] = ['SimHei']

data=pd.read_csv(r"E:\output6\part-r-00000",sep='\t',header=None)
data.columns=['年份','电影数目']
data.head()

plt.figure(figsize=(9,6))
y=data['电影数目']
plt.plot(y,label='年份')
plt.xlabel('时间（年）')
plt.ylabel("上映数量")
plt.legend()
plt.title("电影年份对应的上映电影数目趋势表")
plt.show()

标签：电影,hadoop,job,可视化,io,org,apache,import,猫眼
From： https://www.cnblogs.com/modikasi/p/16641932.html

51JOB网站地区_平均薪资_数据分析与可视化
importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.Text;importorg.apache.hadoop.mapreduce.Mapper;importorg.apache.hadoop.mapreduce.Reduc......
城市防汛可视化系统解决方案
在我国频繁发生的自然灾害中，气象灾害占据绝大部分。汛期是指河水在一年中有规律显著上涨的时期。虽说汛期不等于水灾，但是水灾一般都在汛期。我国各地由于降雨时间的差异，汛......
在 GraphXR 中可视化 Jira
在GraphXR中可视化Jira作为一家完全远程、分布在全球的公司，我对同事的日常活动的了解有限。他们现在在做什么？谁在支持哪些客户？我们能否找到针对特定问题的合作集群？在各......
JMeter+Grafana+Influxdb搭建可视化性能测试监控平台
====docker容器下安装1.influxdb安装并运行（选择2.0以下版本）dockerrun-itd--nameinfluxdb-p8086:8086influxdb:1.8.3复制进入容器dockerexec-itinfluxdb......
60 个复古模拟漏光覆盖层电影质感光影高清图片素材
今天给大家分享的是60个复古模拟漏光覆盖，只需简单将素材图片图层叠加，适当调整混合模式透明度灯即可获得令人惊叹的复古效果。此包包含60个专业手工制作的漏光图片素材，特......
强大的可视化利器 Chrome Trace Viewer 使用详解
Limboy强大的可视化利器ChromeTraceViewer使用详解2020-03-21最近研究了下Chrome自带的TraceViewer，发现功能还挺强大的，用来做PerformanceProfil......
机器学习算法在 IRIS 数据集上的可视化与应用
机器学习算法在IRIS数据集上的可视化与应用五eri集由3种鸢尾花（IrisSetosa、IrisVirginia、IrisVersicolar）组成，每个品种有50个样本，共有150个数据。该数据集......
APICloud 可视化编程 - 拖拉拽实现专业级源码
低代码开发平台是无需编码(0代码或⽆代码)或通过少量代码就可以快速生成应用程序的开发平台。它的强⼤之处在于，允许终端⽤户使⽤易于理解的可视化⼯具开发自己的应用程......
业务流程可视化-让你的流程图"Run"起来(7.运行状态持久化&轻量工作流支持)
前言感谢大家阅读本项目系列文章和对项目的支持。分享一下我对这个项目的新的改进。之前项目做到了流程设计可视化和流程运行结果可视化。本期发布的版本中实现了中间的......
RedisInsight ：Redis 官方可视化工具
RedisInsight是Redis官方出品的可视化管理工具，可用于设计、开发、优化你的Redis应用。支持深色和浅色两种主题，界面非常炫酷。可支持String、Hash、Set、List、JSON等多种......

猫眼电影网站电影数分析与可视化

相关文章

赞助商

阅读排行