首页 > 其他分享 >湖仓一体化

湖仓一体化

时间:2023-09-27 13:31:48浏览次数:32  
标签:存储 实现 数据源 一体化 hive 湖仓 数据

基于flink+hudi湖仓一体技术架构,实现在线视频行业的实时数据处理与分析。

项目采用流处理计算引擎Flink,实时处理千万条数据量的视频数据,基于FlinkCDC完成MYSQL等数据源的数据采集,通过hudi on hive 建构湖仓一体架构,解决数据湖的局限性。(数据湖虽然适合存储数据,但缺少一些关键功能:它们不支持事务处理,不保证数据质量,并且缺乏一致性/隔离性,从而几乎无法实现混合追加和读取数据,以及完成批处理和流式作业。)用于数据湖的低成本存储上实现数据管理功能。

湖仓一体化_flink

项目采用hive实现离线数据计算,FlinkSQL实现实时数据计算,使用流行OLAP的clickHouse进行海量多维分析,最终实现在线视频实时分析指标体系的构建。

湖仓一体化_flink_02

项目数据源包括:流量日志,行为日志,业务数据

数据传输:kafka,flume,sqoop,canal

存储层:hadoop HDFS UCloud对象存储US3

计算层:YARN分布式资源调度集群 spark,flink,mr,hive

资源基于云平台



标签:存储,实现,数据源,一体化,hive,湖仓,数据
From: https://blog.51cto.com/u_16200504/7623719

相关文章

  • 深耕业财一体化,激活企业全面预算管理新动能
    预算是一个企业财务管理的重要组成部分。随着信息技术、云计算、互联网等新兴科技的持续普及,我国企业的发展也随之步入了大数据时代,全面预算管理系统成为了企业财务数字化转型的中流砥柱。如何提升企业运营效率、降本增效,成为各行各业未来很长一段时间的主旋律。这也对企业预算管理......
  • "强大的在线客服系统解决方案,网站客服源码下载,微信客服一键接入,私有部署可定制,在线客
    在线客服系统的重要性及推荐使用Gofly.v1kf.com在现代商务环境中,提供高质量的客户服务是企业获得成功的关键之一。随着互联网的快速发展,越来越多的企业认识到,拥有一个高效的在线客服系统对于与客户进行快速、便捷的沟通和解决问题至关重要。在选择适合自己企业的在线客服系统时,需......
  • 亿信华辰|汽车行业数据治理解决方案,助力企业数字化转型数据一体化
    随着数字技术的不断革新和应用,汽车行业已转向大数据、新技术寻求生产力突破,以电动化、网联化、智能化、共享化为标志的“汽车新四化”,为汽车行业带来了翻天覆地的变化。如何抓住“新四化”的机会,在汽车产业变革中赢得先机,数据的智能化应用是关键。然而原生态的汽车行业大数据多且杂......
  • 智慧工地平台:劳务实名制、视频监控、扬尘监测、起重机械安全监测、安全帽监测等功能一
    伴随着技术的不断发展,信息化手段、移动技术、智能穿戴及工具在工程施工阶段的应用不断提升,智慧工地概念应运而生,智慧工地平台围绕施工现场管理,构建全方位的智能监控防范体系弥补传统方法和技术在监管中的缺陷,形成安全、质量、进度、人员、机械、绿色施工六大针对性解决方案。智慧......
  • 一体化研发协作赋能平台:Apipost
    作为一款专为程序员打造的API管理工具,Apipost也成为开发人员圈子里的一款热门工具。Apipost拥有强大的功能和便捷操作性,这也让许多开发者爱不释手。那么,Apipost到底有哪些吸引人的特点呢?本文将为您详细介绍。统一API管理Apipost提供了统一的API管理平台,支持多种数据格式和API文档,让......
  • 一体化研发协作赋能平台:Apipost
    作为一款专为程序员打造的API管理工具,Apipost也成为开发人员圈子里的一款热门工具。Apipost拥有强大的功能和便捷操作性,这也让许多开发者爱不释手。那么,Apipost到底有哪些吸引人的特点呢?本文将为您详细介绍。 统一API管理Apipost提供了统一的API管理平台,支持多种数据格式和AP......
  • 南凌科技“云网安”一体化解决方案 赋能零售行业新增长
    8月10日,“2023第六届中国零售消费者体验峰会”在上海举行,南凌科技受邀参会并发表主题演讲,同时凭借“零售行业‘云网安’一体化解决方案”荣获“最佳零售行业网络安全解决方案奖”,受到全场瞩目。“数字化转型成为零售行业的重要挑战和新增长路径据国家统计局数据,2023年上半年中国社......
  • 南凌科技“云网安”一体化解决方案 赋能零售行业新增长
    7月12日,「2023算网融合产业发展峰会」在北京盛大开幕。百位领域专家、大咖紧跟时代趋势,围绕SD-WAN、IPv6+、边缘计算、零信任等热点技术,共同探讨算网融合发展模式,进一步凝聚算网融合发展共识,加速算网融合发展进程。南凌科技产品与市场总监殷格受邀参会,并在主论坛发表题为“南凌科......
  • 基于物联网技术的开源工业固体废物一体化智能监控平台
    ​ 一、项目背景    “十四五”时期,我国将开启全面建设社会主义现代化国家新征程,围绕推动高质量发展主题,全面提高资源利用效率的任务更加迫切。受资源禀赋、能源结构、发展阶段等因素影响,未来我国大宗固废仍面临产生强度高、利用不充分、综合利用产品附加值低的严峻形势......
  • 智慧园区安防互联网直播应用:RTSP流媒体服务器EasyNVR云边端一体化协同解决方案
    近期有用户询问,在5G边缘计算这一背景下,边缘计算是不是可以替代云计算了?边缘计算和云计算在智慧园区等场景中是相互补充的关系,能够共同发挥作用。边缘计算注重将计算能力推向靠近终端设备的边缘位置,使数据在本地进行处理和分析,从而减少了数据传输延迟和网络带宽的压力。边缘计算适合......