• 2024-03-26「Go开源包」snappy:google开源的快速、无损压缩包
    大家好,我是渔夫子。今天给大家推荐的是一个google开源的快速、无损的压缩包:snappy。snappy算法是google开源的。该包是google使用go语言来实现的。项目地址如下:项目地址:https://github.com/golang/snappy星标:1.4k使用者:97.7k简介该包的目标并不是最大化的压缩比例,也不是和
  • 2024-03-13Hbase常见面试题
    major和minorcompaction区别:1.minor操作:达到TTL(记录保留时间)会被移除,删除和更新的数据仅仅只是做了标记,并没有物理移除,这种合并的触发频率很高。小合并不做数据删除,因为发生频率比较高,消耗性能小。2.major操作:是对region下的hstore下的所有storefile执行合并操作,最终的
  • 2024-03-05snappy压缩格式下使用数字与字符串不等于比较,hiveSQL和sparkSQL表现不一致的行为记录。
    Hive版本:2.3.4Spark版本:2.4.0当时用Snappy格式对表进行压缩时,时用<>符号将字符串与数字进行比较会产生不一致的结果。SparkSQL结果并非预期结果。DROPTABLEIFEXISTStest.zero_test;CREATETABLEtest.zero_testTBLPROPERTIES("orc.compress"="SNAPPY")ASSELECT
  • 2023-12-21在laravel中使用wkhtmltopdf
    在平时的项目中,可能会遇到把报表生成pdf或jpg图片的需求,使用wkhtmltopdf能方便的生成pdf和jpg图片。1、安装:ubunut:sudoaptinstallwkhtmltopdf(或者下载安装指定版本:https://wkhtmltopdf.org/downloads.html),记住安装的目录,命令名称:wkhtmltoimage和wkhtmltopdf2、laravel
  • 2023-12-02cmake构建项目,缺少库文件
    问题概述使用vscode,用cmake进行项目构建是,缺少库文件,出现findapackageconfigurefileprovidedby"Snappy",butCmakedidnotfindone错误;操作系统ubuntu22.04错误如下图所示:解决方案此处以上图中的“Snappy”为例缺少相应的库文件,即去github上找到相应的库文件,下
  • 2023-09-05第02章-存储和压缩格式
    目录第02章存储和压缩格式22.1存储和压缩格式对比22.2查询效果测试32.3查询效果测试带shuffle3第02章存储和压缩格式存储和压缩格式简介SparkSQL表存储的数据量都特别大,因此存储格式要考虑查询性能写入性能和存储成本。而orc存储格式是一种列式存储,在查询写入时比较快,而
  • 2023-05-11使用laravel-snappy生成pdf
    laravel-snappy基于wkhtmltopdf工具,可以比较完美的将web页面转成pdf格式。顺便把laravel及laravel-snappy安装过程记录下composerconfig-grepo.packagistcomposerhttps://mirrors.aliyun.com/composer/composercreate-projectlaravel/laravelexample-appcomposerr
  • 2023-05-10Java使用wkhtmltopdf实现HTML转pdf
    wkhtmltopdf设置全屏:wkhtmltopdf--disable-smart-shrinking--page-sizeA4-B0-L0-R0-T0test.htmloutput.pdf-B-T-R-L是有效果的,$snappy->setOption('margin-top','0mm');$snappy->setOption('margin-left','0mm'
  • 2023-05-06Hive表 Parquet压缩 , Gzip,Snappy,uncompressed 效果对比
     创建两张表,通过一种是parquet,一种使用parquetsnappy压缩创建表使用snappyCREATEEXTERNALTABLEIFNOTEXISTStableName(xxxstring)partitionedby(pt_xvcstring)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\001'STOREDASPARQUETTBLPROPERTIES('parquet.compre
  • 2022-12-28Hadoop IO
       1.数据在存储和传输过程中出现数据的不完整性,数据传输量越大出错的概论就越高。2.通过校验的方法可以知道数据是不完整的。3.检测的思路是通过校验和,在传输之前计算一
  • 2022-10-19Dinky的使用——snappy2mysql
    需求:将压缩文件snappy的数据同步到mysql数据库snappy可以作为orc文件的压缩格式存在,所以在添加依赖包的时候,直接添加orc的依赖包就可以了还有一点注意的是,在创建hive表的
  • 2022-10-040632-6.2-通过Hive生成的Snappy表Impala无法访问异常分析
    温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。Fayson的github:​​https://github.com/fayson/cdhproject​​提示:代码块部分可