首页 > 数据库 >大型数据库实验二

大型数据库实验二

时间:2023-11-08 15:34:35浏览次数:31  
标签:文件 删除 HDFS 数据库 指定 实验 txt 大型 目录

实验二--熟悉常用的HDFS操作

1、向hdfs中上传任意文本文件,如果文件已经存在,由用户指定是追加文件内容还是覆盖文件内容(准备了两个文件-wordcount.txt和local.txt)

我这里定义的是在wordcount.txt文件末尾追加local.txt里面的内容:

这里定义的是用local.txt的文件内容覆盖掉原来的wordcount.txt的文件内容:

2、从HDFS中下载指定文件,如果本地文件与要下载的文件名称相同,则自动重命名

3、将HDFS中指定的内容输出到终端中

4、显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息;如果文件是目录,那么就递归输出该目录下所有文件相关信息

5、提供一个HDFS内的文件路径,对该文件进行创建和删除操作,如果文件目录不存在,那么就自动创建目录

6、提供一个HDFS的目录路径,对该目录进行创建和删除操作,如果对应目录不存在,则自动创建目录;删除操作时,如果目录不为空,由用户指定是否删除该目录

创建目录操作如上图;

删除目录操作如上图;

7、向HDFS中的文件追加内容,由用户指定是追加到开头还是结尾
追加到文件末尾:

追加到文件开头:

8、删除HDFS中指定的文件

9、在HDFS中,将目录从源路径移动到指定路径

10、编程实现一个类“MyFSDataInputSt”,该类继承“org.apache.hadoop.fs.FSDataInputStream”,要求如下:实现按行读取HDFS中指定文件的方法“readLine()”,如果读到文件末尾,则返回空,否则返回文件一行的文本(努力中)

11、查看Java帮助手册或其它资料,用”java.net.URL”和“org.apache.hadoop.fs.FsURLStreamHandlerFactory”编程完成输出HDFS中指定文件的文本到终端中(努力中)

标签:文件,删除,HDFS,数据库,指定,实验,txt,大型,目录
From: https://www.cnblogs.com/liuzijin/p/17815121.html

相关文章

  • 大型企业是否有必要进行数字化转型?_数据治理平台_光点科技
    数字化转型是大型企业在现代商业环境中保持竞争力的关键。一开始我们要明确数字化转型指的是利用数字技术来改变企业的业务模式和企业文化,以提高效率和效益。对于大型企业而言,进行数字化转型有着多重必要性。1.数字化转型可以帮助企业优化内部流程,提高运营效率。通过自动化和数据分......
  • 有效降低数据库存储成本方案与实践
    背景随着平台的不断壮大,业务的不断发展,后端系统的数据量、存储所使用的硬件成本也逐年递增。从发展的眼光看,业务与系统要想健康的发展,成本增加的问题必须重视起来。目前业界普遍认同开源节流大方向,很多企业部门也针对数据库存储降低成本进行了尝试,有的删数据、有的删索引、有的做......
  • mysql 远端数据库的数据备份与恢复
    备份基本语法mysqldump-u[用户名]-p[密码]-h[主机IP]-P[端口号][数据库名称]>/home/username/备份文件.sql例如mysqldump-uroot-p123456-h192.168.1.100-P3306mydb>mydb_backup.sql恢复基本语法mysql-u[用户名]-p[密码]-h[主机IP]-P[端口号][数据库名......
  • 运行Springboot测试类查询数据库数据显示白网页
    问题运行Springboot测试类时,查询数据库里面数据显示如下白网页程序报如下错误 解决方案 SpringBoot应用未能启动的原因是它没有找到合适的数据库配置具体来说,它需要一个数据源(DataSource),但未能在你的配置中找出,也没有找到任何嵌入式数据库(H2,HSQL或Derby)以下是几个......
  • RDS for Mysql 到云数据库GaussDB
    前言该实验旨在指导用户使用DRS将RDSMySQL上的数据迁移到GaussDB中。本实验涉及数据复制服务DRS(DataReplicationService)、关系型数据库服务RDS(RelationalDatabaseService)、GaussDB、数据管理服务DAS(DataAdminService)、VPC(虚拟私有云)、公网IP(EIP)等华为云服务。 说明1)、......
  • 2008秋-计算机软件基础-实验三 参考源程序
    实验三参考源程序//软件基础教材79页习题6答案//EmanLee#include<stdio.h>#include<stdlib.h>#definem5//队列容量//定义队列的结构structqueue{intseq[m];//队列元素intquelen;//队列中元素个数intrear;//队列尾指针};//初始化队列......
  • 2008秋-计算机软件基础- 实验二 参考源程序
    实验二参考源程序/*Author:EmanLee,计算机软件基础教材P79,ex4设有一头为head的带头结点的单链表,其数据域为整形数据且递增有序。试写一算法,将元素插入链表适当的位置,以保持链表的有序性。*/#include<stdio.h>#include<stdlib.h>typedefintDataType;struc......
  • 网络数据库练习题
    练习一1  简述什么是网络数据库。 2  SQLServer2000的常见版本有哪些。 3  解释以下若干名词术语:关系,元组,属性,主键。 4  简述SQLServer2000中的4个系统数据库的主要用途。 5  简述SQLServer2000中的一些常用数据类型(datetime,int,float,money)的用法或......
  • mes 数据库 python sqlite
    importsqlite3fromsqlite3importErrordefcreate_connection():conn=None;try:conn=sqlite3.connect(':memory:')#创建一个内存数据库。对于文件数据库,您可以使用文件路径。print(f'successfulconnectionwithsqliteversion{sqlite3.......
  • 2008秋-计算机软件基础-实验内容
    ------------------------------------------------------------------题目:实验C语言综合复习目的:掌握函数,结构体,指针的使用,预习线性表的顺序存储(顺序表)实验内容:1看PPT, 函数,结构体,指针章节。要求: -----------------------------------------------------------......