• 2024-07-04job测试检查点
    定时任务测试分享:job测试方案的介绍:需求澄清明确业务需求:与业务、产品、开发了解需求背景,用户的数量,用户场景等信息。明确测试范围:与产品、开发共同评估,具体对应的场景,具体涉及的接口和表,数据量,被调用关联方链路,了解是否使用Redis和mq等。明确测试目的:评估数量为性能测试提
  • 2024-07-01Diffusers代码学习:加载适配器
    有几种用于个性化扩散模型以生成特定主题的图像或特定风格的图像的训练技术。每种训练方法都会产生不同类型的适配器。一些适配器生成一个全新的模型,而其他适配器只修改一组较小的嵌入或权重。这意味着每个适配器的加载过程也不同。DreamBooth仅在一个主题的几个图像上微调整
  • 2024-06-17Flink - [07] 容错机制
    题记部分 一、一致性检查点  Flink故障恢复机制的核心,就是应用状态的一致性检查点。有状态流应用的一致性检查点,其实就是所有任务的状态,在某个时间点的一份拷贝(一份快照);这个时间点,应该是所有任务都恰好处理完一个相同的输入数据的时候。 二、从检查点恢复状态  在
  • 2024-06-15gbase8s数据库阻塞检查点和非阻塞检查点的执行机制
    1.检查点的描述为了便于数据库系统的复原和逻辑恢复,数据库服务器生成的一致性标志点,称为检查点,其是建立在数据库系统的已知和一致状态时日志中的某个时间点检查点的目的在于定期将逻辑日志中的重新启动点向前移动如果存在检查点,数据库只需要完成检查点之后的逻辑日志的恢复
  • 2024-06-15Flink有状态流处理 未对齐barrier性能好
    有状态流处理#什么是状态?#虽然数据流中的许多操作只是查看一个个体一次事件(例如事件解析器),有些操作会记住多个事件的信息(例如窗口操作符)。这些操作被称为宏伟威严的.有状态操作的一些例子:当应用程序搜索某些事件模式时,状态将存储到目前为止遇到的事件序列。当聚合每分钟
  • 2024-06-12Arcee’s MergeKit: A Toolkit for Merging Large Language Models
    本文是LLM系列文章,针对《Arcee’sMergeKit:AToolkitforMergingLargeLanguageModels》的翻译。Arcee的MergeKit:一个用于合并大型语言模型的工具包摘要1引言2背景和相关工作3库设计:关键设计原则4MergeKit的可扩展性5MergeKit的普及性和有效性6结论和
  • 2024-06-07一口气搞懂Flink Metrics监控指标和性能优化,全靠这33张图和7千字
    https://www.51cto.com/article/684249.html flink中值得监控的几个指标背景为了维持flink的正常运行,对flink的日常监控就变得很重要,本文我们就来看一下flink中要监控的几个重要的指标重要的监控指标1.算子的处理速度的指标:numRecordsInPerSecond/numRecordsOutPerSecond,
  • 2024-05-30可靠性和预写日志
    可靠性可靠性是任何严肃的数据库系统的重要属性,而PostgreSQL尽一切可能保证可靠操作。可靠操作的一个方面是,已提交事务记录的所有数据都应存储在非易失性区域中,该区域不会受到断电、操作系统故障和硬件故障的影响(当然,非易失性区域本身的故障除外)。成功地将数据写入计算机的永久存
  • 2024-04-30openGauss 扩展FDW与其他openGauss特性
    扩展FDW与其他openGauss特性openGauss基于PostgreSQL,而PostgreSQL没有内置存储引擎适配器,如MySQL的handlerton。为了使MOT存储引擎能够集成到openGauss中,我们利用并扩展了现有的FDW机制。随着FDW引入PostgreSQL9.1,现在可以将这些外表和数据源呈现为统一、本地可访问的关系来访问
  • 2024-04-29openGauss MOT检查点概念
    MOT检查点概念在openGauss中,检查点是事务序列中一个点的快照,在该点上,可以保证堆和索引数据文件已经同步了检查点之前写入的所有信息。在执行检查点时,所有脏数据页都会刷新到磁盘,并将一个特殊的检查点记录写入日志文件。数据直接存储在内存中。MOT没有像openGauss那样存储数据,因
  • 2024-04-29openGauss MOT恢复
    MOT恢复MOT恢复的主要目标是在有计划停机(例如维护)或计划外崩溃(例如电源故障后)后,将数据和MOT引擎恢复到一致状态。MOT恢复是随着openGauss数据库其余部分的恢复而自动执行的,并且完全集成到openGauss恢复过程(也称为冷启动)。MOT恢复包括两个阶段:检查点恢复:必须通过将数据加载到内
  • 2024-04-29openGauss MOT恢复概念
    MOT恢复概念MOT恢复模块提供了恢复MOT表数据所需的所有功能。恢复模块的主要目标是在计划(例如维护)关闭或计划外(例如电源故障)崩溃后,将数据和MOT引擎恢复到一致的状态。openGauss数据库恢复(有时也称为冷启动)包括MOT表,并且随着数据库其余部分的恢复而自动执行。MOT恢复模块无缝、全
  • 2024-04-29openGauss MOT持久性概念
    MOT持久性概念持久性是指长期的数据保护(也称为磁盘持久性)。持久性意味着存储的数据不会遭受任何形式的退化或破坏,因此数据不会丢失或损坏。持久性可确保在有计划停机(例如维护)或计划外崩溃(例如电源故障)后数据和MOT引擎恢复到一致状态。内存存储是易失的,需要电源来维护所存储的信
  • 2024-04-29openGauss MOT外部支持工具
    MOT外部支持工具为了支持MOT,修改了以下外部openGauss工具。请确保使用的工具是最新版本。下面将介绍与MOT相关的用法。有关这些工具及其使用方法的完整说明,请参阅《工具与命令参考》。gs_ctl(全量和增量)此工具用于从主服务器创建备服务器,以及当服务器的时间线偏离后,将服务器与其
  • 2024-04-29openGauss MOT内存和存储规划
    MOT内存和存储规划本节描述了为满足特定应用程序需求,在评估、估计和规划内存和存储容量数量时,需要注意的事项和准则,以及影响所需内存数量的各种数据,例如计划表的数据和索引大小、维持事务管理的内存以及数据增长的速度。MOT内存规划MOT是一种内存数据库存储引擎(IMDB),其中所有表
  • 2024-04-28openGauss MOT持久性概念
    MOT持久性概念持久性是指长期的数据保护(也称为磁盘持久性)。持久性意味着存储的数据不会遭受任何形式的退化或破坏,因此数据不会丢失或损坏。持久性可确保在有计划停机(例如维护)或计划外崩溃(例如电源故障)后数据和MOT引擎恢复到一致状态。内存存储是易失的,需要电源来维护所存储的信
  • 2024-04-2723.pg_wal浅析01
    1.PG_WAL?WAL是一套保证数据完整性的标准。简要地说,WAL中心概念是数据文件(这里涉及到表和索引)修改必须在这些动作被记录之后,即描述这些修改操作的日志记录被刷到永久存储中。如果我们遵循这个过程,我们不需要在每次事务提交时刷数据页到磁盘,因我我们知道一旦发生崩溃,我们可以
  • 2024-04-25在flink消费一段时间kafka后,kafka-group的offset被重置了是怎么回事?
    一、背景腾讯Flink使用KafkaSourceAPI创建source端,源码中默认开启了checkpoint的时候提交offset到kafka-broker。读取kafka数据写入到iceberg目前发现一个问题,就是消费数据的时候,消费一段时间后,kafka-group的offset就重置了,看起来像重置到earliest了,导致消费数据激增二
  • 2024-03-30MegaScale:字节万卡集群
    随着训练集群扩展到超过数万个GPU,软件和硬件故障几乎不可避免。字节引入了一个健壮的训练框架,实现了自动故障识别和快速恢复,在最少的人为干预下实现了容错,并且对正在进行的训练任务的影响可以忽略不计。1.训练流程分配资源:在接收到提交的训练任务后,driver进程会与自定义的K
  • 2024-03-29KingbaseES 避免wal日志占用大量磁盘空间
    背景wal日志一直增长很快,查看归档目录也在执行归档,归档无异常,是归档执行太慢的原因吗?还是wal日志生成的太快了的原因呢?现场环境wal日志的磁盘空间比较小。分析首先我们分析可否加速归档速度呢,因为如果能加快归档速度就可以缓解wal日志所在磁盘空间紧张的问题,答案是不可以。arc
  • 2024-03-26RDD缓存 检查点 共享变量 累加器
    1.缓存的基本介绍   缓存介绍:       1.当一个RDD的产生过程(计算过程),是比较昂贵的(生成RDD整个计算流程比较复杂),并且这个RDD可能会被多方(RDD会被重复使用)进行使用,      2.此时为了提升计算效率,可以将RDD的结果设置为缓存,这样后续在使
  • 2024-03-24Spark重温笔记(三):Spark在企业中为什么能这么强?——持久化、Checkpoint机制、共享变量与内核调度原理全攻略“
    Spark学习笔记前言:今天是温习Spark的第3天啦!主要梳理了Spark核心数据结构:RDD(弹性分布式数据集),包括RDD持久化,checkpoint机制,spark两种共享变量以及spark内核调度原理,希望对大家有帮助!Tips:"分享是快乐的源泉
  • 2024-03-19Locust 断言的实现?
    一、检查点的方式有哪些:主要是python内置的assert断言(自动断言)还有locust中的catch_response断言(手动断言);那么这两者之间有什么区别呢?其实主要区别在与生成locust报告上面,手动断言失败,我们在locust上面可以清楚的看到报错信息,如果通过内置断言,即使断言失败我们也看不到错
  • 2024-03-13【快捷部署】002_Flink
    Flink一键安装(本地模式)install-flink.sh脚本内容#!/bin/bash####变量###执行脚本的当前目录mydir=$(cd"$(dirname"$0")";pwd)echo$mydir#flink安装目录flink=/flink#检查点目录cp=$flink/checkpoints/#保留点目录sp=$flink/savepoints/#tasknumber数量ta
  • 2024-02-27禅道编写测试用例规范
    1、标题规范格式2、用例标题需要概述出期望结果3、用例步骤不能超出10个步骤4、预期结果检查点不超过3个检查点5、描述需简洁扼要6、前置条件完整不冗余