首页 > 其他分享 >hadoop pig 之 开发调试命令

hadoop pig 之 开发调试命令

时间:2023-04-20 16:08:53浏览次数:35  
标签:脚本 输出 name hadoop param pig file 调试 illustrate


 

<!--[if !supportLists]-->1.1     <!--[endif]-->describe

描述:输出关系的结构

语法:describe alais

<!--[if !supportLists]-->1.2     <!--[endif]-->dump

描述:输出关系数据

语法:dump alais

<!--[if !supportLists]-->1.3     <!--[endif]-->explain

描述:使用explain可以输出脚本的计划

语法:EXPLAIN [–script pigscript] [–out path] [–brief] [–dot]

[–param param_name = param_value] [–param_file file_name] alias; 

序号

脚本代码

功能描述

1

script

运行的脚本

2

out

计划输出的路径

3

brief

标示不输出脚本嵌套的内部计划

4

dot 

标示是否图形化输出

5

param param_name = param_value

设定脚本中的变量 $data

6

param_file file_name

设定脚本中的文件变量

7

Alias

关系名

Explain的调试结果:

<!--[if !supportLists]-->1.4     <!--[endif]-->illustrate

描述:使用illustrate可以深入脚本,查看pig脚本是如何运行的

语法:ILLUSTRATE {alias | -script scriptfile}; 

序号

脚本代码

功能描述

1

Alias

关系名

2

Script

运行脚本名称,其中不能包括脚本illustrate

使用illustrate可以缩短debug周期,进行小数据测试,提高测试效率

Illustrate的调试结果

<!--[if !supportLists]-->1.5     <!--[endif]-->debugger功能实现

利用日志捕获功能,结合illustrate命令实现少量数据的预处理,这样一旦出现错误,就利用pigLogger捕获日志,并显现在页面。

此种debugger存在一个问题,就是:少量数据可能debugger正确,但是当大量数据的时候仍然会出现某些难以预知的错误。

 

标签:脚本,输出,name,hadoop,param,pig,file,调试,illustrate
From: https://blog.51cto.com/u_2465818/6209745

相关文章

  • 【调试】Valgrind内存泄漏内存越界|运行时间|调用|cache命中率|多线程竞态|堆栈分析..
    目录即看即用详细简介Valgrind工具详解安装使用检测内存泄漏其他内存问题memcheck工具的常用选型其他选项附录其他类似工具实例分析:03.使用未初始化的内存04.使用野指针05.动态内存越界访问06.分配空间后没有释放07.不匹配使用delete或者free08.两次......
  • Hadoop集群手动主备切换
     查看节点状态#查看节点状态[root@hadoop1bin]#hdfshaadmin-getServiceStatenn1standby[root@hadoop1bin]#hdfshaadmin-getServiceStatenn2active[root@hadoop1bin]#pwd/root/tools/hadoop/tools/hadoop/bin将NN2切换为Standby备用节点hdfshaadmin......
  • 【valgrind】软件调试工具-valgrind内存调试工具
    valgrind工具安装Ubuntu环境安装sudoaptinstallvalgrind源码编译1.源码下载http://valgrind.org/downloads/valgrind-3.12.0.tar.bz22.valgrind编译安装tar-jxvfvalgrind-3.12.0.tar.bz2cdvalgrind-3.12.0./configuremakesudomakeinstallvalgrind运行分析程......
  • 关于PythonNet与TensorFlow的调试技巧
    1.使用TensorFlow2.x版本训练的模型,在导入时容易报错,不要跨版本训练或者调用模型。报错内容通常定位到restore方法。2.PythonNet调用py文件报错时,右键该文件执行后报错内容会一闪而过,可以右键使用Python编译器(Idel)打开,错误会详细显示,且内容与编辑器一样。3.TensorFlow1.9最......
  • gdb 调试技巧:定位程序卡死问题
     gdb调试技巧:定位程序卡死问题 最近遇到一个程序卡死的问题,借助gdb轻松定位,供大家参考。遇到程序卡死不退处,可能不知道卡死在什么地方,如果程序非常简单,也许printf大法就可以很快定位。但是对于大型程序,尤其是一些框架程序,printf大法可能就力不从心了。实际的程序......
  • stm32文件系统读写操作调试总结
    一问题最近使用到了文件系统的读写,中间遇到了一些问题值得深思。 二源码解析创建文件:FRESULTres;do{sprintf(filename,"/sensor_signal/sensor_%d.bin",file_num++);mprintf("filenameis:%s\n\r",filename);res=f_open(&file,fi......
  • Hadoop的生态体系,HDFS和MapReduce等的具体介绍
    Hadoop的两大核心就是HDFS和MapReduce,而整个Hadoop的体系结构主要是通过HDFS的分布式存储作为底层数据支持的。并且会通过MapReduce来进行计算分析。Hadoop1.x的核心:HadoopCommonHadoopDistributedFileSystem(HDFS)HadoopMapReduceHadoop2.x的核心:HadoopCommonHadoopDistribu......
  • 基于ads1299的可穿戴脑电信号采集之性能调试总结
    一前言问题背景:最近做项目,遇到了一个问题,就是采集的信号有噪声,在这里做了很多尝试。 二测试步骤A内部方波信号质量,通过测试发现内部方波信号质量特别好。这个说明了软件和存储这块,没啥问题的,还有干扰,那就是前端的硬件引入的干扰了。 B这个是空采的......
  • Java环境与Eclipse SDK安装涉及的环境变量调试,java环境配置
    资源包请自己下载。文本太大,我传到百度了。https://pan.baidu.com/s/1p6aFDOeXWULnK8STdQkwmw  这是地址资源地址小白师从高中老班长祯淮大哥,偷师于网页中的他人经验,因此,先说声谢谢他人的经验分享,为了记录学习过程,方便整理知识,做了以下学习分享。有错请大神指出。 这是我装好的......
  • Apifox 更新 | WebSocket 接口调试功能上线!
    Apifox 新版本上线啦!欢迎升级使用:界面右上角【设置】-> 【关于Apifox】->【检查更新】看看本次版本更新主要涵盖的重点内容,有没有你所关注的功能特性:支持WebSocketAPI;自动化测试功能升级;Web端新增部分功能快捷键;支持自定义设置版本更新及安装提醒。01支持WebSocketAPI最新......