数据可视化之Zeppelin

时间：2023-06-03 09:12:56浏览次数：50

标签：jdbc default 9090 hive 可视化 Zeppelin 使用数据 zeppelin

前言

数据可视化这块不是项目的重点，不过为了让大家能有一个更加直观的感受，我们可以选择一些现成的数据可视化工具实现。
我们前面分析过，想要查询hive中的数据可以使用hue，不过hue无法自动生成图表。

所以我们可以考虑使用Zeppelin，Zeppelin是一个Apache的孵化项目.一个基于web的笔记本，支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。(类似于ipython notebook，可以直接在浏览器中写代码、笔记并共享)

针对一些复杂的图表，可以选择定制开发，使用echarts等组件实现

安装部署

下载

注意：不要使用Zeppelin0.8.2版本，这个版本有bug，无法使用图形展现数据。这里我们使用zeppelin-0.9.0-preview1这个版本

下载地址，安装包比较大，1.5G左右，这里我们使用阿里云镜像。

修改配置

mv zeppelin-env.sh.template zeppelin-env.sh
mv zeppelin-site.xml.template zeppelin-site.xml
vim zeppelin-site.xml

将默认的127.0.0.1改为0.0.0.0 否则默认情况下只能在本机访问zeppline，监听端口默认8080，如果已经被使用了，修改为其他端口，这里我们修改为9090。

<property>
 <name>zeppelin.server.addr</name>
 <value>0.0.0.0</value>
 <description>Server binding address</description>
</property>
<property>
 <name>zeppelin.server.port</name>
 <value>9090</value>
</property>

增加Hive依赖jar包

由于我们需要使用Zepplien连接hive，它里面默认没有集成Hive的依赖jar包，所以最简单的方式就是将Hive的lib目录中的所有jar包全复制到Zeppline中的interpreter/jdbc目录中

启动

bin/zeppelin-daemon.sh start

停止

bin/zeppelin-daemon.sh stop

界面参数配置

Zepplin启动之后可以通过9090端口进行访问 http://bigdata01:9090/

在使用之前需要先配置hive的基本信息

修改这四项的内容即可，这里的内容其实就是我们之前学习hive的jdbc操作时指定的参数

参数                   值                         解释
default.url           jdbc:hive2://ip:10000      里面的ip是启动hiveserver2服务的机器ip
default.user          root
default.password      any                        注意：密码随便填即可
default.driver        org.apache.hive.jdbc.HiveDriver

注意：需要在服务器上启动hiveserver2服务，否则在zeppline中连不上hive

bin/hiveserver2

Zepplin的使用

创建一个note，类似于工作台的概念

此时就可以在里面写SQL了。

如果想以图形的形式展示结果，点击对应图形的图标即可。

标签：jdbc,default,9090,hive,可视化,Zeppelin,使用,数据,zeppelin
From： https://www.cnblogs.com/strongmore/p/17369152.html

Vue——属性指令、style和class、条件渲染、列表渲染、事件处理、数据双向绑定、过滤
vm对象<body><divid="app"><h1>{{name}}</h1><button@click="handleClick">点我</button></div></body><script>//1写在data或method中的属性或方法，从vm中直接可以点出来//2method的函数中，如......
R语言GARCH族模型：正态分布、t、GED分布EGARCH、TGARCH的VaR分析股票指数|附代码数据
全文链接：http://tecdat.cn/?p=31023最近我们被客户要求撰写关于GARCH族模型的研究报告，包括一些图形和统计输出。如何构建合适的模型以恰当的方法对风险进行测量是当前金融研究领域的一个热门话题（点击文末“阅读原文”获取完整代码数据******** ）。VaR方法作为当前业内比较......
NLP自然语言处理—主题模型LDA案例：挖掘人民网留言板文本数据|附代码数据
全文链接：http://tecdat.cn/?p=2155最近我们被客户要求撰写关于NLP自然语言处理的研究报告，包括一些图形和统计输出。随着网民规模的不断扩大，互联网不仅是传统媒体和生活方式的补充，也是民意凸显的地带。领导干部参与网络问政的制度化正在成为一种发展趋势，这种趋势与互联网发展的时......
MATLAB偏最小二乘回归（PLSR）和主成分回归（PCR）分析光谱数据|附代码数据
全文链接：http://tecdat.cn/?p=2655最近我们被客户要求撰写关于偏最小二乘回归的研究报告，包括一些图形和统计输出。此示例显示如何在matlab中应用偏最小二乘回归（PLSR）和主成分回归（PCR），并讨论这两种方法的有效性（点击文末“阅读原文”获取完整代码数据******** ）。当存在大量......
2023年06月数据库流行度最新排名
点击查看最新数据库流行度最新排名（每月更新）2023年06月数据库流行度最新排名TOPDB顶级数据库索引是通过分析在谷歌上搜索数据库名称的频率来创建的一个数据库被搜索的次数越多，这个数据库就被认为越受欢迎。这是一个领先指标。原始数据来自谷歌Trends如果您相信集体智慧，那么TOP......
Python金融时间序列模型ARIMA 和GARCH 在股票市场预测应用|附代码数据
原文链接：http://tecdat.cn/?p=24407最近我们被客户要求撰写关于金融时间序列模型的研究报告，包括一些图形和统计输出。这篇文章讨论了自回归综合移动平均模型(ARIMA)和自回归条件异方差模型(GARCH)及其在股票市场预测中的应用（点击文末“阅读原文”获取完整代码数据******......
树莓派和esp8266在局域网下使用UDP通信，esp8266采集adc数据传递给树莓派，树莓派在web上
树莓派和esp8266需要在同一局域网下esp8266使用arduino开发：接入一个电容土壤湿度传感器，采集湿度需要使用adc#include<ESP8266WiFi.h>#include<WiFiUdp.h>constchar*ssid="litianmenzhenbu";constchar*password="LT12345678";constchar*serverIp="192.......
初级数据结构--双链表、循环链表
双链表结构体内含有两个指针域。相比单链表，双链表每个节点多了一个存储前一节点的指针。对节点的增加、删除操作比单链表便捷，不用独立指针记录前一节点voidInitDNodeList(DNode**D){ *D=(DNode*)malloc(sizeof(DNode)); if(!*D) return; (*D)->front=NULL; (*D)->nex......
基于JAVA的springboot篮球论坛系统，附源码+数据库+论文+PPT
1、项目介绍考虑到实际生活中在篮球论坛方面的需要以及对该系统认真的分析,将系统权限按管理员和用户这两类涉及用户划分。(a)管理员；管理员使用本系统涉到的功能主要有：首页、个人中心、用户管理、篮球论坛、系统管理等功能。管理员用例图如图3-1所示。(b)用户；用户使用本系统......
MAP 最大后验——利用经验数据获得对未观测量的点态估计
Map（最大后验）在贝叶斯统计学中，最大后验（MaximumAPosteriori，MAP）估计可以利用经验数据获得对未观测量的点态估计。它与Fisher的最大似然估计（MaximumLikelihood，ML）方法相近，不同的是它扩充了优化的目标函数，其中融合了预估计量的先验分布信息，所以最大后验估计可以看作是正则化（regularize......

数据可视化之Zeppelin

前言

安装部署

下载

修改配置

启动

停止

界面参数配置

Zepplin的使用

相关文章

赞助商

阅读排行