采集项目&数据仓库项目(是企业中数据管理平台中的两个核心管理模块)
采集项目:数据采集,传输为主(flume, kafka, datax, maxwell)
数据仓库:以计算为主,同时存储数据(mysql, HDFS, Spark, Flink , MR, Hive)
数据库&数据仓库
数据库database
来源:企业中基础核心的业务数据
存储:查找数据。行式存储,索引,不能存海量数据(查询速度)。
数据仓库:data warehouse
来源:数据库中的数据
存储:统计分析数据。列式存储。存储海量数据(准确性)
标签:商数,存储,数据库,数据仓库,笔记,6.0,数据 From: https://www.cnblogs.com/funblogs12152023/p/17977720