kafka或kinesis 做数据收集
S3+redshift 做数仓
EMR做计算
RDS做数据市场
AWS Glue / AWS Data Pipeline 做数据集成
这些组件配合起来,几乎可以做各种方式的数据分析
kinesis还是比较推荐,延迟时间可以配置的算是实时的,而且功能会多一点,聚合、过滤什么的都可以
kafka或kinesis 做数据收集
S3+redshift 做数仓
EMR做计算
RDS做数据市场
AWS Glue / AWS Data Pipeline 做数据集成
这些组件配合起来,几乎可以做各种方式的数据分析
kinesis还是比较推荐,延迟时间可以配置的算是实时的,而且功能会多一点,聚合、过滤什么的都可以