• 2024-03-06Hive - 表的存储格式
     Hive的文件存储格式包括:textfile、sequence、rcfile、orc、parquet textfile(简介)默认的文件格式,基于行存储。建表时不指定存储格式即为textfile,导入数据时把数据文件拷贝到hdfs不进行处理。(优点)便于和其他工具(pig,grep,sed,awk)共享数据,便于查看和编辑,加载较快。(缺点)耗费存储
  • 2023-05-31HDFS 文件格式——SequenceFile RCFile
    HDFS块内行存储的例子HDFS块内列存储的例子HDFS块内RCFile方式存储的例子
  • 2022-12-07001- hive文件存储格式
    1.文件存储格式TextFileSequeceFileRCFileORCFilePARQuet2.说明其中TEXTFILE为默认格式,导入数据时会直接把数据文件拷贝到hdfs上不进行处理;SequenceFile,RCF
  • 2022-11-15(转)hive中NULL值问题
    原文:https://blog.csdn.net/jiguanglong/article/details/106427078问题描述源端数据oracle数据库,通过cdm迁移工具将数据迁移到目标端hive。在oracle中的NULL值迁移到hive
  • 2022-08-14Hive存储格式之RCFile详解,RCFile的过去现在和未来
    我在整理Hive的存储格式和压缩格式,本来打算一篇发出来,结果其中一小节就有很多内容,于是打算写成Hive存储格式和压缩格式系列。本节主要讲一下Hive存储格式最早的典型的列式