Impala Parquet相关代码
https://github.com/cloudera/Impala/search?l=cpp&q=parquet&ref=cmdform
没有可重用的库接口,需要在代码里去看,提取出来,直接使用源码。
调用关系如下(自右向左调用):
HdfsParquetTableWriter(HdfsTableWriter)<-HdfsTableSink<-DataSink<-PlanFragmentExecutor<-ImpalaServer::FragmentExecState
<-ImpalaServer::ExecPlanFragment<-Impala-main
Coordinator::EcecRemoteFragment<-Coordinator::Exec
hdfs-table-writer.h
写文件步骤(具体详见文件说明):
1. Init()
2. InitNewFile()
3. AppendRowBatch()
4. Finalize()
某些类,结构定义在源码中找不到,需要先编译源码,
编译成功后在./
标签:文件,调用,编译,源码,Parquet,Impala From: https://blog.csdn.net/Shinobi_Jack/article/details/140223818