首页 > 其他分享 >Hadoop 学习

Hadoop 学习

时间:2024-05-26 12:04:48浏览次数:12  
标签:HDFS fs word hdfs Hadoop hadoop 学习 txt

Hadoop 三种运行模式:

1.本地模式(学习)

1.没有HDFS,使用当前系统下的文件系统

2.没有YARN,使用的是Linux中的资源

3.使用了 Map-Reduce Framework

2.伪分布式模式(学习)

1.只有单台机器

2.使用HDFS、Yarn、MapReduce

3.分布式模式(企业级)

1.多台服务器

2.集群模式,包含整个Hadoop组件

HDFS SHELL:

1.两种命令模式

1.1 hadoop fs

1.2 hdfs dfs

2.上传文件

-put:

hadoop fs -put ./word.txt  /input

-copyFromLocal

hadoop fs -copyFromLocal ./

3.下载文件:

-get

hadoop fs -get /input/word_2.txt  ./word_3.txt

-copyToLocal

hadoop fs -copyToLocal /input/word_2.txt  ./word_4.txt

4.查看HDFS文件信息:

-ls

  hdfs dfs -ls /

      -df -h

      hdfs dfs -df -h / # 查看HDFS根目录中空间使用情况

      -du -h

      hdfs dfs -du -h / # 查看指定目录下的文件大小

    5.赋予文件权限

     -chmod

     hdfs dfs -chmod u+x 路径 #表示对指定路径或文件赋予执行使用者权限

    6.创建文件夹

     -mkdir

     -p :表示迭代创建多级目录

    7.移动文件或文件夹

     -mv

    8.设置副本数

     -setrep

     hadoop fs -setrep 副本数 多个路径

    9.查看文件内容

    -tail

    hadoop fs -tail /re/word_2.txt

    -f:

    hadoop fs -tail -f /re/word_2.txt # 表示追踪文件的内容

    -cat

    hadoop fs -cat /re/word_2.txt

yarn application 常用命令

-list:表示展示当前Yarn中正在执行的 Application任务(注意,一旦完成则不展示)

样例:  yarn application  -list

-appStates: 通常和-list搭配使用 可以配置如下参数

ALL,NEW,NEW_SAVING,SUBMITTED,ACCEPTED,RUNNING,FINISHED,FAILED,KILLED

样例: yarn application -list -appStates FINISHED

-kill: 表示根据应用的ID 强制关闭一个 Application

样例:yarn application -kill application_1649398269758_0005

-status: 根据ID查看当前任务的状态

   

标签:HDFS,fs,word,hdfs,Hadoop,hadoop,学习,txt
From: https://blog.csdn.net/a_black03/article/details/139212780

相关文章

  • 从零开始学习 Python 3 - 玩转字符串 2:字符串格式化高阶玩法
    玩转字符串2:字符串格式化高阶玩法前言回顾:字符串格式化的三种方式高阶玩法:让你的字符串格式化更上一层楼1.格式规格迷你语言:精细控制输出格式2.自定义格式化:`__format__()`魔法方法3.格式化字符串字面值:`f"..."`的灵活运用总结公众号:人生只不过是一场投资温......
  • 【从0到1学习Redis】数据类型 — String
    首先要先启动好服务,使用redis-cli进入到客户端。自增、自减和相加减操作自增1INCR自减1DECR步长i+=INCRBY字符串范围range截取GETRANGE替换SETRANGE是否存在设置过期时间setex(setwithexpire)不存在时再设置(在分布式锁中常常会使用!)setnx(set......
  • 【Java学习】第39节:基础数据结构(二):链表
    目录1. 链表1)概述2)单向链表3)单向链表(带哨兵)4)双向链表(带哨兵)5)环形链表(带哨兵)习题E01.反转单向链表-Leetcode206E02.根据值删除节点-Leetcode203E03.删除倒数节点-Leetcode19E04.有序链表去重-Leetcode83E05.有序链表去重-Leetcode82E06.合......
  • 页表的再学习
    页表的再学习背景昨天研究了一下不使用大页内存可能会导致宕机的场景但是一些数据自己还是没有太弄明白所以早上在小区走路的时候又看了下页表和页的关系感觉多少理解了一些.所以想着在尝试总结一下.关于页的来源现代操作系统基本上都是段页式的内存管理段主要是区......
  • Z 算法 学习笔记
    问题引入寻找字符串\(T\)在字符串\(S\)中的出现位置。暴力算法暴力枚举\(S\)的每一位作为开头,向后匹配,若能将\(T\)匹配完毕就为\(T\)在\(S\)中的一次出现。记\(S\)的长度为\(n\),\(T\)的长度为\(m\),则时间复杂度最劣为\(O(nm)\)。优化上面的算法有很多冗......
  • 基于Kaggle学习MONAI(三)2D-Segmentation例程代码详解1
    1简介         MONAI网站提供了2D分类/分割、3D分类/分割等例程代码如下图所示,通过学习例程代码,初学者能够尽快掌握MONAI框架,但是由于开源框架软件版本更新较快、各模块功能难以协调等原因,这些例程往往无法在Kaggle平台直接运行。本文对MONAI官网第二个例程,即2D分割......
  • 机器学习 - toad库
    toad是一个Python库,用于数据预处理和特征工程,特别是在金融风控和信用评分建模中应用广泛。以下是toad库中主要函数的详细说明,包括它们的参数和作用:数据转换与预处理1.toad.transformer.WOETransformer作用:将分类变量转换为WOE(WeightofEvidence)值,以便更好地用于模......
  • 关于对于Java中Entity以及VO,以及DTO中Request对象序列化的学习
    关于Serializable的探讨前提引入是由于软件测试上有同学提到说,什么该字段在程序刚运行时,导致jvm激增,所以吸引了我的注意回顾代码MybatisPlusGenerator自动生成的entity中就经常带有这个,而且我在开发代码的时候VO,以及DTO常常是直接复制对应的entity,所以也保不齐我对应......
  • 【python】requests库学习
    一、GET请求1、当使用requests.get(url)方法发送GET请求时,它会向指定的URL发送一个HTTPGET请求,并返回一个包含服务器响应的Response对象。例如:​url="https://api.example.com/data"response=requests.get(url)2、添加URL参数:可以通过将参数作为字典传递给params参数......
  • 视差背景,GODOT游戏引擎学习笔记(五)
    背景图片资源今天周六玩了一天,现在晚上来更新一下帖子。前面几节我们学习了创建一个人物精灵节点使其移动。这节我们来学习创建背景。会用到三个图片文件。我已经上传到csdn了,链接如下:https://download.csdn.net/download/weixin_66990397/89356894?spm=1001.2014.3001.5501......