首页 > 其他分享 >无惧百万级并发,GaussDB(for Cassandra)让华为推送服务更快触达

无惧百万级并发,GaussDB(for Cassandra)让华为推送服务更快触达

时间:2023-04-23 14:38:23浏览次数:49  
标签:GaussDB 触达 消息 Push 推送 数据库 Cassandra

摘要:推送服务(Push Kit)是华为提供的消息推送平台,建立了从云端到终端的消息推送通道。通过集成推送服务,您可以向客户端应用实时推送消息,让应用更精准触达用户,是开发者提升用户感知度和活跃度的一件利器。

本文分享自华为云社区《无惧百万级并发,GaussDB(for Cassandra)让华为Push推送服务更快触达》,作者:GaussDB 数据库。

推送服务(Push Kit)是华为提供的消息推送平台,建立了从云端到终端的消息推送通道。通过集成推送服务,您可以向客户端应用实时推送消息,让应用更精准触达用户,是开发者提升用户感知度和活跃度的一件利器。

无惧百万级并发,GaussDB(for Cassandra)让华为推送服务更快触达_并发

华为云GaussDB(for Cassandra) 是一款基于计算存储分离架构的分布式数据库,致力于提供稳定可靠、超高并发,兼容Cassandra生态、弹性伸缩、一键部署、快速恢复、监控告警的分布式数据库服务,在Push业务的高效架构建设中,起到了关键的作用。

业务挑战

Push服务能够协助开发者快速触达用户,其提供的系统级通道推送速度每秒最高可达百万级,消息量每日百亿级,并且支持实时消息回执。如此高到达率的背后,是因为Push使用了大量分布式架构、高性能队列、大数据分析、数据库、AI等技术,用来支撑实时推送、精准送达业务的高效开展。

Push的主要业务链路是发送上行消息和下行消息,接下来我们从发送下行消息流程来了解业务在哪些场景上用到了数据库,以及对数据库的要求有哪些?

下行消息交互图如下所示:

无惧百万级并发,GaussDB(for Cassandra)让华为推送服务更快触达_Push_02

当用户设备网络条件良好且不拥堵的情况下,华为Push服务器在收到消息后,会先将消息存入高性能队列中,然后队列消费消息发送给用户设备。但是当用户设备处于弱网、网络异常,或不在线、熄屏状态时,消息无法到达设备,或此时发送消息价值较低。Push业务为了保障消息不丢失,以及提升消息的有效率,利用数据库为底座,来支持离线消息缓存能力。

离线消息缓存是指当消息到达华为Push平台后,如果设备不在线,华为Push平台会将消息缓存起来,等到设备上线后,华为Push平台会将缓存的消息再次推送给用户。如果用户很长时间不在线,这些缓存的消息默认保存24小时,最长保存15天,超期的消息会被Push平台丢弃。

此时,在数据库的选型上就需要考虑以下几个问题:

  1. 推送速度每秒百万级,极端场景下,大部分写入数据库,会有每秒百万写入请求,数据库需要具备超高的写入能力;
  2. 当设备恢复正常状态时,消息会从数据库中读出发送给用户,消息的实时性会直接影响到消息的价值,此时就要求数据库的读时延低且长尾时延稳定;
  3. 推送的消息中,多与时事热点相关,容易引发流量突增,且不可预知,这就要求数据库具有快速弹性伸缩的能力;
  4. 为达成AI智能推送的能力,可能需要对数据库中的数据进行数据挖掘和分析,从而实施智能推送策略,数据库需支持与主流大数据引擎兼容的接口和解决方案。

为什么选择GaussDB(for Cassandra)?

基于以上挑战,Push业务经过一系列技术选型,最终选择了GaussDB(for Cassandra)数据库。GaussDB(for Cassandra)凭借丰富强大的特性,可以帮助Push业务很好地应对消息缓存的挑战:

  1. 从请求量上看,GaussDB(for Cassandra)轻松支持千万级并发访问,高并发不在话下;
  2. 从时延上看,GaussDB(for Cassandra)除了本身具备超低时延的能力外,在并发量大的情况下,可通过扩容和规格变更,增加分区和负载均衡保证业务时延基本无变化;
  3. 从弹性伸缩上看,GaussDB(for Cassandra)基于存算分离架构,支持秒级存储扩容,分钟级计算扩容,轻松应对流量高峰;
  4. 从兼容能力看,GaussDB(for Cassandra)支持CQL语法和灵活的数据定义,同时兼容主流的批式/流式处理引擎(Spark/Flink等),且提供动态增量+全量的解决方案,供大数据分析引擎接入,充分满足不同类型数据的接入需求。

如何利用GaussDB(for Cassandra)提升消息缓存体验

下面,我们将从具体的几个技术改进来聊聊,GaussDB(for Cassandra)是如何帮助Push业务获得更好的消息缓存体验。

降本增效

  • 降低Push集群对数据库请求量:
  • 表结构设计时,将同一用户设备的多条信息存入同一partition中
  • 在读取时,可使用范围查询将同一用户设备的多条信息批量查出,且时延较低
  • 在写入时,使用Batch写入,降低客户端与数据库的交互次数
  • 降低存储使用量:业务科通过TTL、范围删除、单行删除等多种手段,根据业务情况灵活使用达到数据消亡的目的,降低存储用量。

弹性伸缩,热点无忧

每当出现重大新闻,各大应用均产生了海量的推送消息,Push业务收到消息后,流量激增,集群规模难以支撑巨大的流量。但依靠GaussDB(for Cassandra)的快速扩容能力,Push业务实现了分钟级别的计算扩容,业务不受影响,而且当流量回归正常后,可以进行缩容降低成本。

超强可靠性,底座无忧

GaussDB(for Cassandra)不仅在读写性能上表现优异,在数据可靠性上也表现突出。因为采用多节点分布式架构,当任意盘或节点出现故障,读写操作会自动切换至其他节点,理论上可以达到N-1个节点故障容忍,即集群任一节点存活即可提供完整服务。同时还支持异地双活,实现业务恢复和故障恢复解耦,Region级高可用。

综上所述,GaussDB(for Cassandra) 为Push业务提供了高效、稳定、安全的数据库底座,助力Push业务实现了离线消息缓存架构。我们相信,借助GaussDB(for Cassandra), Push业务在消息推送领域,会为开发者提供更优质的服务和工具,助力企业提升业务价值和用户体验。


点击关注,第一时间了解华为云新鲜技术~

标签:GaussDB,触达,消息,Push,推送,数据库,Cassandra
From: https://blog.51cto.com/u_15214399/6217567

相关文章

  • 华为云GaussDB支撑华为MetaERP系统全面替换
    摘要:目前MetaERP已经覆盖了华为公司100%的业务场景和80%的业务量。本文分享自华为云社区《强渡大渡河!华为云GaussDB支撑华为MetaERP系统全面替换》,作者:华为云头条。近日,在“英雄强渡大渡河”MetaERP表彰会上,华为宣布实现自主可控的MetaERP研发,并完成对旧ERP系统的替换,目前MetaE......
  • 再获殊荣!华为云GaussDB喜提“科技进步一等奖”
    摘要:近日,中国电子学会科学技术奖励大会颁发了2021-2022年度中国电子学会科学技术奖获奖项目,华为云主导的“GaussDB智能云原生分布式数据库”项目荣获“科技进步一等奖”。本文分享自华为云社区《再获殊荣!华为云GaussDB喜提“科技进步一等奖”》,作者:GaussDB数据库。近日,中国电......
  • 详解GaussDB(DWS)的query_band负载识别与应用
    摘要:query_band是一个会话级别(session)的GUC参数,本身是字符串类型,支持任意形式字符组合。本文分享自华为云社区《GaussDB(DWS)的query_band负载识别与应用》,作者:门前一棵葡萄树。query_band概述GaussDB(DWS)实现了基于query_band的负载识别和优先级调度,一方面提供了更为灵活......
  • MongoDB、Redis、HBase、Cassandra、Elasticsearch、ClickHouse等NoSQL数据库简介及优
    MongoDBMongoDB是一个基于文档的NoSQL数据库,它使用BSON(二进制JSON)格式存储数据。MongoDB支持动态查询,可以轻松地处理非结构化数据。它还支持水平扩展,可以在多个节点上分布数据。优点:灵活性高,支持非结构化数据存储。支持水平扩展,可以在多个节点上分布数据。支持动态查询,可......
  • GaussDB(DWS)集群中寻找节点CPU占用高的语句
    摘要:本文主要通过实例讲解如何通过gs_cpuwatcher.sh脚本寻找CPU占用高语句。本文分享自华为云社区《GaussDB(DWS)gs_cpuwatcher.sh脚本如何寻找CPU占用高语句》,作者:fighttingman。【工具名称】gs_cpuwatcher【功能描述】1.寻找集群内节点占用CPU高的语句【使用场景】CPUsys使用......
  • GaussDB(DWS)集群中寻找节点CPU占用高的语句
    摘要:本文主要通过实例讲解如何通过gs_cpuwatcher.sh脚本寻找CPU占用高语句。本文分享自华为云社区《GaussDB(DWS)gs_cpuwatcher.sh脚本如何寻找CPU占用高语句》,作者:fighttingman。【工具名称】gs_cpuwatcher【功能描述】1.寻找集群内节点占用CPU高的语句【使用场景】CP......
  • GaussDB(DWS)云原生数仓技术解析
    摘要:本文主要介绍GaussDB(DWS)云原生数仓架构、产品能力,帮助开发者快速了解GaussDB(DWS)云原生数仓相关信息与能力。本文分享自华为云社区《直播回顾|GaussDB(DWS)云原生数仓技术解析》,作者:胡辣汤。在本期《GaussDB(DWS)云原生数仓技术解析》的主题直播中,我们邀请到华为云EID......
  • GaussDB(DWS)网络调度与隔离管控能力
    摘要:调度算法是调度器的核心,设计调度算法要充分考虑业务场景和用户需求,没有万能的调度算法,只有合适的调度算法。本文分享自华为云社区《GaussDB(DWS)网络调度与隔离管控能力》,作者:门前一棵葡萄树。一、常见的调度算法QoS(QualityofService)即服务质量,是一种调度控制机制,是网络设计......
  • Cassandra一个节点到底应该存放多大数据
    在Cassandra2.x版本及更早版本的时候,我经常建议用户单节点规模数据不要超过1T,到Cassandra3.x之后我又建议用户单节点规模不要超过4T。为什么会有这些变化,其实是跟基础设施的发展有关系的。一方面是随着SSD硬盘的越来越廉价,大部分用户使用SSD替换了机械硬盘提升了磁盘随机读写能......
  • Cassandra 数据模型
    Cassandra数据模型Cassandra的数据模型与我们通常在关系型数据库中看到的有很大不同。本文概述了Cassandra如何存储其数据。ClusterCassandra数据库分布在多台一起运行的机器上。最外面的容器称为集群。对于故障处理,每个节点都包含一个副本,如果发生故障,副本将负责。Cassa......