首页 > 其他分享 >TiDB上百T数据拆分实践

TiDB上百T数据拆分实践

时间:2022-12-29 22:56:06浏览次数:73  
标签:上百 同步 备份 TiDB drainer 集群 拆分 tidb

背景

提高TiDB可用性,需要把多点已有上百T TiDB集群拆分出2套

挑战

  • 1、现有需要拆分的12套TiDB集群的版本多(4.0.9、5.1.1、5.1.2都有),每个版本拆分方法存在不一样
  • 2、其中5套TiDB,数据量均超过10T、最大的TiDB集群目前数据量62T、单TiDB集群备份集大,消耗大量磁盘空间和带宽资源

空间最大3套集群

2c0ce8198-15a7-4bc8-ba6e-85de6549f456.png

  • 3、tidb使用方式多样(每种方式拆分方法不同),有直接读写tidb,也有mysql->tidb汇总分析查询,也有tidb->cdc->下游hive
  • 4、全量备份TiDB在业务高峰期是否会产生性能影响
  • 5、大数据量的拆分数据的一致性保证

方案

目前TiDB官方提供的同步工具有:

  • DM全量+增量(该方法无法用于tidb->tidb,适用于MySQL->TiDB)
  • BR全量物理备份+CDC增量同步(CDC同步在tidb、tikv节点OOM后修复成本高https://github.com/pingcap/tiflow/issues/3061)
  • BR全量物理备份+binlog增量(类似于MySQL记录所有变更的binlog日志,TiDB binlog由Pump(记录变更日志)+Drainer(回放变更日志)组成,我们采用该方法进行全量+增量同步拆分)

3image.png

4image.png

备份与恢复工具 BR

TiDB Binlog

因TiDB拆分BR全量物理备份+binlog增量涉及周期长,我们分为4个阶段进行

第一阶段

1、清理现有TiDB集群无用数据

按月分表tidb库有无用的表,如3个月前的xxxx 日志表

2、升级GZ现有15套TiDB集群(12套TiDB集群需要1分为2)版本至5.1.2

趁这次拆分统一GZ tidb版本,解决挑战1

set @@global.tidb_analyze_version = 1;

#tidb_analyze_version为2时出现OOM几率大,5.4版本开始该默认值从2改为1

https://github.com/pingcap/tidb/issues/31748

第二阶段

1、新机器部署好相同版本5.1.2TiDB集群

set @@global.tidb_analyze_version = 1;

2、目的端,源端所有tikv tiflash挂载好NFS,pd节点上安装好BR

Exteral storge采用腾讯云NFS网盘,保障tikv备份目的端和还原全量来源端都能在同一目录,NFS网盘空间自动动态增加+限速备份以应对挑战2

3、独立3台机器部署好12套TiDB集群pump收集binlog(端口区分不同TiDB集群)

pump,drainer采用独立16C, 32G机器保障增量同步最大性能

注意:为保障tidb计算节点的可用性,需设置ignore-errorbinlog关键参数

server_configs:

  tidb:

    binlog.enable: true

    binlog.ignore-error: true

4、修改pump组件 GC时间为7天

binlog保留7天保障全量备份->到增量同步过程能接上

pump_servers:

  - host: xxxxx

    config:

      gc: 7

#需reload重启tidb节点使记录binlog生效

5、备份TiDB集群全量数据至NFS Backup & Restore 常见问题

注意:每个TiDB集群在同一个NFS建不同备份目录

注意:源老TiDB集群分别限速(备份前后对读写延迟时间基本无影响)进行错峰全量备份(存在之前多个TiDB集群同时备份把NFS 3Gbps网络带宽打满情况)以减轻对现有TiDB读写、NFS的压力以应对挑战2

mkdir -p /tidbbr/0110_dfp

chown -R tidb.tidb /tidbbr/0110_dfp

#限速进行全业务应用库备份

./br backup          full \

    --pd "xxxx:2379" \

    --storage "local:///tidbbr/0110_dfp" \

    --ratelimit 80 \

    --log-file /data/dbatemp/0110_backupdfp.log

#限速进行指定库备份

 ./br backup db \

    --pd "xxxx:2379" \

    --db db_name \

    --storage "local:///tidbbr/0110_dfp" \

    --ratelimit 80 \

    --log-file /data/dbatemp/0110_backupdfp.log

    

12.30号45T TiDB集群全量备份耗时19h,占用空间12T

[2021/12/30 09:33:23.768 +08:00] [INFO] [collector.go:66] ["Full backup success summary"] [total-ranges=1596156] [ranges-succeed=1596156] [ranges-failed=0] [backup-checksum=3h55m39.743147403s] [backup-fast-checksum=409.352223ms] [backup-total-ranges=3137] [total-take=19h12m22.227906678s] [total-kv-size=65.13TB] [average-speed=941.9MB/s] ["backup data size(after compressed)"=12.46TB] [BackupTS=430115090997182553] [total-kv=337461300978]

6、每个新建TiDB集群单独同步老TiDB集群用户密码信息

注意:BR全量备份不备份tidb mysql系统库,应用、管理员用户密码信息可用开源pt-toolkit工具包pt-show-grants导出

7、恢复NFS全量备份至新TiDB集群

注意:新TiDB集群磁盘空间需充裕,全量备份还原后新TiDB集群占用空间比老TiDB集群多几个T,和官方人员沟通是由于还原时生成sst的算法是lz4,导致压缩率没有老TiDB集群高

注意:tidb_enable_clustered_index,sql_mode 新老TiDB集群这2参数必须一致

50e895f86-bb7b-4b5a-a5f3-53ac880d5a36.png

8、tiup扩容drainer进行增量同步

扩容前确认下游checkpoint信息不存在或已清理

如果下游之前接过drainer,相关位点在目标端tidb_binlog.checkpoint表中,重做的时候需要清理

注意:因源最大TiDB集群长期平均写入TPS在6k左右,在增大worker-count回放线程数后,尽管目的端域名解析到3个tidb节点,单个drainer增量还是无法追上延迟(回放速度最高在3k TPS),后和TiDB官方沟通改成按3个drainer(不同drainer同步不同库名)并行增量同步延迟追上(3个drainer增量让“漏斗”没有堆积,源流入端数据能及时到达目标流出端)

6182bcbb0-69cb-4978-a5f4-aefd49885ce3.png

注意:多个drainer并行增量必须指定目的端checkpoint.schema为不同库 drainer配置说明



#从备份文件中获取全量备份开始时的位点TSO

grep "BackupTS=" /data/dbatemp/0110_backupdfp.log

430388153465177629



#第一次一个drainer进行增量同步关键配置

drainer_servers:

  - host: xxxxxx

    commit_ts: 430388153465177629      

    deploy_dir: "/data/tidb-deploy/drainer-8249"

    config:

      syncer.db-type: "tidb"

      syncer.to.host: "xxxdmall.db.com"

      syncer.worker-count: 550



      

#第二次多个drainer进行并行增量同步

drainer_servers:

  - host: xxxxxx

    commit_ts: 430505424238936397  #该位点TSO为从第一次1个drainer增量停止后目的端checkpoint表中的Commit_Ts

    config:

      syncer.replicate-do-db: [db1,db2,....]

      syncer.db-type: "tidb"

      syncer.to.host: "xxxdmall.db.com"

      syncer.worker-count: 550

      syncer.to.checkpoint.schema: "tidb_binlog2"

      

1个drainer进行增量延迟越来越大

727369104-131a-4d15-87aa-570f0875404e.png

3个drainer进行并行增量同步最慢一条增量链路:9h追了近1天数据

8.png

3个drainer并行同步目的端写入1.2w TPS > 源端6k写入TPS

9.png

9、配置新建tidb grafana&dashboard 域名

建grafana、dashboard的域名指向生产nginx代理,由nginx代理grafana 端口,dashboard 端口

10.png

第三阶段

1、check新老TiDB集群数据同步一致性情况

TiDB在全量和增量时会自行进行数据一致性校验,我们主要关注增量同步延迟情况,并随机count(*)源目的端表



#延迟检查方法一:在源端TiDB drainer状态中获取最新已经回复TSO再通过pd获取延迟情况

mysql> show drainer status;

+-------------------+-------------------+--------+--------------------+---------------------+

| NodeID            | Address           | State  | Max_Commit_Ts      | Update_Time         |

+-------------------+-------------------+--------+--------------------+---------------------+

| xxxxxx:8249   | xxxxxx:8249   | online | 430547587152216733 | 2022-01-21 16:50:58 |





tiup ctl:v5.1.2 pd -u http://xxxxxx:2379 -i

» tso 430547587152216733;

system:  2022-01-17 16:38:23.431 +0800 CST

logic:   669





#延迟检查方法二:在grafana drainer监控中观察

tidb-Binlog->drainer->Pump Handle TSO中current值和当前实际时间做延迟比较

曲线越陡,增量同步速率越快

2、tiflash表建立&CDC同步在新TiDB集群建立&新mysql->tidb汇总同步链路闭环(DRC-TIDB)

tiflash

源端tidb生成目的端 新建tiflash语句



SELECT * FROM information_schema.tiflash_replica WHERE TABLE_SCHEMA = '<db_name>' and TABLE_NAME = '<table_name>'

SELECT concat('alter table ',table_schema,'.',table_name,' set tiflash replica 1;') FROM information_schema.tiflash_replica where table_schema like 'dfp%';

CDC链路闭环

在老TiDB CDC同步中选取1个TSO位点在新TiDB中建立CDC至kafka topic同步

11.png

DRC-TIDB链路闭环(自研mysql->tidb合库合表同步工具)

12.png上图左右为DRC-TIDB拆分前后状态

1、左老drc-tidb同步规则copy到右新drc-tidb,不启动drc-tidb同步(记录当前时间T1)

2、drainer同步现有TiDB数据至新建TiDB链路启用安全模式replace(syncer.safe-mode: true)插入

3、修改左drc-tidb同步源目的地址为闭环,并启动drc-tidb(记录当前时间T2)

4、右tidb grafana drainer监控中check当前同步时间checkpoint是否>=T2(类似于tikv follower-read),若没有则等待延迟追上

5、右tidb集群增量同步修改edit-config drainer配置文件,去掉mysql-tidb同步的库名(所有库同步增加指定库名同步)并reload drainer节点

 commit_ts: 431809362388058219

  config:

    syncer.db-type: tidb

    syncer.replicate-do-db:

    - dmall_db1 该DB为直接读写

    - dmall_db2 该DB为从mysql同步而来,需去掉

6、修改右drc-tidb同步源目的地址为闭环,并启动右drc-tidb(drc-tidb采用幂等同步,会重复消费copy同步规则T1时间到现在now的mysql binlog)

3、每个新TiDB集群ANALYZE TABLE 更新表统计信息

不是必须,更新统计信息为最新可以避免查询sql索引选择走错

第四阶段

1、左tidb集群应用域名解析至新建tidb计算节点

13.png

2、批量kill右TiDB集群左应用的连接

存在脚本多次批量kill tidb pid;在右tidb节点依然有大量左应用的连接,因此左应用滚动重启后右tidb节点左应用连接释放

3、移除老TiDB集群->新TiDB集群增量同步drainer链路

注意:因多个TiDB集群共用的1台高配drainer机器,node_exporter(采集机器监控agent)也是多个TiDB集群共用,当A TiDB集群停止drainer链路,B C TiDB集群会报node_exporter不存活告警

总结

  • 不同TiDB版本的升级统一版本很有必要,一是拆分方法的通用,减少拆分的复杂度,二是享受新版本的特性,减低运维管理成本
  • 目标TiDB集群磁盘空间需足够充裕
  • 在源TiDB写入压力大时增量同步binlog到目的端的延迟保障需要drainer按库名进行并发增量同步
  • TiDB拆分涉及步骤多,能提前做的步骤就提前错,真正总拆分的时间窗口很短
  • 感谢TiDB官方社区对我们的技术支持,路漫漫其修远兮,我们将上下而求索

标签:上百,同步,备份,TiDB,drainer,集群,拆分,tidb
From: https://www.cnblogs.com/YangJiaXin/p/17013731.html

相关文章

  • oracle 根据逗号拆分字符串一行转多行
    SELECT A.*, REGEXP_SUBSTR(A.PRODUCTNUMS,'[^,]+',1,L)ASPRODUCTNUM,LFROM LG_ZJQH_PRODUCTVALUES_WWDGXA, (SELECTLEVELLFROMDUALCONNECTBYLEVEL<=10......
  • word vba 操作表格, 设置表格的单元格(拆分合并单元格)
    设置单元格的边距和间距、设置合并单元格合拆分单元格。一、单元格的边距和间距Sub设置单元格边距()WithActiveDocument.Tables(1)'返回或设置表格中所有单元......
  • sql查询将id用逗号拆分查出名称
    1、博客表  标签表  每个博客可能对应多个标签,比如一篇博客中用到的技术有springboot、mybatis等  现在根据标签的id,查出对应的标签的名称:  查询......
  • Mysql到TiDB迁移,双写数据库兜底方案
    作者:京东零售石磊TiDB作为开源NewSQL数据库的典型代表之一,同样支持SQL,支持事务ACID特性。在通讯协议上,TiDB选择与MySQL完全兼容,并尽可能兼容MySQL的语法。因......
  • Mysql到TiDB迁移,双写数据库兜底方案
    作者:京东零售石磊TiDB作为开源NewSQL数据库的典型代表之一,同样支持SQL,支持事务ACID特性。在通讯协议上,TiDB选择与MySQL完全兼容,并尽可能兼容MySQL的语法。因此,......
  • C#/VB.NET 如何在Word表格中拆分或合并单元格?​​
    我们在使用Word制作表格时,由于表格较为复杂,只是简单的插入行、列并不能满足我们的需要。要做一个完整的表格,很多时候需要将单元格进行拆分或者合并,才能达到我们想要的效果......
  • 在WPF/C#中使用分布类对VM进行拆分
    摘要C#的分部关键字(partial)能够拆分一个类、一个结构、一个接口或一个方法为两个或更多个的文件,分部的每个文件都可以包含自己的类型和方法,程序编译时会将同类的分部内容......
  • js-将数组拆分为指定长度
    场景数组:[1,2,3,4,5,6,7,8,9,10]目标:[[1,2],[3,4],[5,6],[7,8],[9,10]]思路分析借助splice方法或者slice方法,一直对数组进行指定位数的删除,并将返回的数组push到一个......
  • TiSpark 原理之下推丨TiDB 工具分享
    TiSpark是PingCAP为解决用户复杂OLAP需求而推出的产品。它通过Spark提供的拓展机制与内置的TiKVClientJava,在Spark之上直连TiKV进行读写,具有事务性读取、事务......
  • 我和TiDB的故事 | 遇上你是我的缘
    作者:h5n1**【初闻】**      作为一名一直混迹于传统行业的oracleDBA(毫无前途),开源的数据库接触较多可能也就MySQL,对于国产数据库的的态度:都是说的好,也就拿开源的......