首页 > 数据库 >【YashanDB数据库】数据库运行正常,日志出现大量错误metadata changed

【YashanDB数据库】数据库运行正常,日志出现大量错误metadata changed

时间:2024-08-06 15:18:49浏览次数:15  
标签:文件 YashanDB inotify 数据库 changed 文件系统 事件 日志 属性

问题现象

客户在麒麟kylin v10 sp1环境上部署YashanDB,运行正常, 但是在巡检中发现run.log中有大量错误日志文件metadata changed,需要排查原因

问题单:前置机大量错误日志文件metadata changed,需要排查原因

问题的风险及影响

客户环境为准生产环境,担心影响业务执行。

问题影响的版本

YashanDB版本:22.2.11.100

问题发生原因

YashanDB利用操作系统linotify相关接口做文件设备的监控,范围是:数据文件、redo文件、控制文件、归档日志。

inotify_add_watch() 函数在部分麒麟(kylin v10 sp1)环境上执行结果和CentOS等其他环境不一致,在文件正常的情况下会返回大量的属性变更事件,导致大量错误日志,新版本(22.2.13.100之后)做了防洪规避,避免日志过多掩盖其他信息。

解决方法及规避方式

1、检查相应文件是否有异常。

2、升级到22.2.13.100之后版本。

问题分析和处理过程

检查参数DIAG_ADR_ENABLED,值为TRUE

该参数开启会启动HEATH_MONITOR线程, 做健康检查:

分析日志产生的原因

inotify_add_watch() 是 Linux 系统编程中用于监控文件系统事件的一个系统调用函数,它属于 inotify(Input/Output Notifier)接口的一部分。inotify 是 Linux 内核提供的一种高效、实时的文件系统事件监控机制,允许用户空间程序监控文件或目录的各种变化,如文件创建、删除、修改、移动等。

使用 inotify_add_watch() 监视某个文件或目录,并接收到属性变更(IN_ATTRIB)事件,但查看文件权限时并未发现明显的变化,可能有以下几种情况:

1、隐式属性变更:除了明显的权限(如读、写、执行)变更外,文件属性还包括其他一些可能被修改的元数据,如文件的拥有者、所属组、修改时间、访问时间、扩展属性(xattrs)等。这些属性的变更也可能触发 IN_ATTRIB 事件。请检查这些元数据是否发生了变化。

2、文件系统内部操作:有时,文件系统或底层存储设备可能会进行内部维护操作,如元数据刷新、缓存同步等,这些操作可能导致文件属性看似未变但实际上发生了内部变更,从而触发 IN_ATTRIB 事件。这种情况通常难以从用户层面察觉,但确实会导致事件通知。

3、文件系统挂载选项:如果文件系统是以特定挂载选项挂载的,某些属性变更可能不会立即反映到用户空间。例如,某些网络文件系统(如 NFS)或加密文件系统可能具有缓存属性或延迟写入特性。在这种情况下,虽然内核已经感知到属性变更并触发了 IN_ATTRIB 事件,但在用户空间观察时可能尚未看到变化。您可以尝试刷新文件系统缓存(如使用 sync 或 fsync),或者等待一段时间看属性是否会最终更新。

4、软件或服务干预:某些软件或服务(如备份工具、文件同步服务、权限管理工具等)可能在后台默默地修改文件属性,导致 IN_ATTRIB 事件的发生。检查是否有此类软件或服务正在运行,并确认它们是否可能影响到您监视的文件或目录。

5、编程错误或工具误报:如果您使用的是自编写的代码或第三方工具来检查文件权限,可能存在编程错误或工具本身的误报问题。请确保检查代码逻辑的正确性,或者使用可靠的命令行工具(如 ls -l 或 stat)来验证权限是否确实未变。

6、并发修改:如果多个进程或线程同时对文件进行操作,可能导致属性变更事件与您观察到的权限状态之间存在时间差。确保在接收到事件通知后立即检查权限,以减少并发修改带来的影响。

如果文件属性发生变化, 会触发IN_ATTRIB事件,输出错误日志

inotify_add_watch() 函数在部分麒麟(kylin v10 sp1)环境上执行结果和CentOS等其他环境不一致,在文件正常的情况下会返回大量的属性变更事件,导致大量错误日志。

检查数据库正常,该错误信息可忽略

客户确认数据库运行正常,inotify_add_watch是内核函数,其返回结果和其他系统不一致,新版本做了防洪规避,避免日志过多掩盖其他信息,可升级到新版本。

经验总结

1、YashanDB利用操作系统linotify相关接口做文件设备的监控,范围是:数据文件、redo文件、控制文件、归档日志。

2、inotify_add_watch() 函数在部分麒麟(kylin v10 sp1)环境上执行结果和CentOS等其他环境不一致,在文件正常的情况下会返回大量的属性变更事件,导致大量错误日志,新版本(22.2.13.100之后)做了防洪规避,避免日志过多掩盖其他信息。

标签:文件,YashanDB,inotify,数据库,changed,文件系统,事件,日志,属性
From: https://www.cnblogs.com/YashanDB/p/18345200

相关文章

  • Navicat Premium(数据库管理) v17 中文授权版
    Navicat17全新升级,软件增强了数据库管理和数据分析的功能体验。其中包括模型设计与同步、数据字典、数据分析(dataprofiling)、用户体验、查询优化、BI功能集成MongoDB/Snowflake、专注模式、Redis哨兵模式与平台扩展LinuxARM等。此次升级让用户在数据库的创建、管理、......
  • 【YashanDB数据库】VMware虚拟机使用默认安装,在掉电之后数据库无法启动
    问题现象客户使用VMware虚拟机使用默认安装,部署YashanDB个人版,在掉电之后无法启动操作系统:Virtualization:VMwareOperatingSystem:CentOSLinux7(Core)CPEOSName:cpe:/o:centos:centos:7Kernel:Linux3.10.0-1160.el7.x86_64Architecture:x86-64[yashan@localho......
  • 【YashanDB数据库】大事务回滚导致其他操作无法执行,报错YAS-02016 no free undo block
    问题现象客户将一个100G的表的数据插入到另一个表中,使用insertintoselect插入数据。从第一天下午2点开始执行,到第二天上午10点,一直未执行完毕。由于需要实施下一步操作,客户kill重启了数据库,之后数据库一直回滚中,导致后续执行其他操作都报错YAS-02016nofreeundoblocks问题......
  • Navicat 连接瀚高数据库(炒鸡简单)
    刚接到的项目领导让我去数据库建几张表,打开配置文件一看用的是国产的瀚高数据库:url:jdbc:highgo://192.168.8.4:5866/sdss_ns_bussiness?currentSchema=sdss_base这下就慌了,没用过啊!!用什么连接工具都不知道!!打开百度,csdn一阵搜索,不是不管用,让下载JDBC驱动,就是要......
  • 数据库复习
    绪论1、数据库(DB):长期存储在计算机内、有组织、可共享的大量数据的集合。数据库中的数据按照一定的数据模型组织、描述和存储,具有娇小的冗余度、交稿的数据独立性和易扩展性,并可为各种用户共享。2、数据库管理系统(DBMS):位于用户和操作系统间的数据管理系统的一层数据管理软件......
  • 后端MyBatis连接Mysql数据库时常见报错
     目录报错情况报错情况一:​编辑报错情况二:解决步骤一、解决命名问题1.mapper层的id是否和Dao层的方法名字相同2.检查namespace与Dao层的文件地址相同二、解决注解问题1.检查Controller层的注解是否正确和完整2.Dao层或者Mapper层的注解3.pojo层:实体类层Data注解(用......
  • A087-基于SpringBoot+Vue实现的超市管理系统(源码+数据库+部署文档+部署演示视频)
    (======查看博主个人介绍,有源码获取联系方式========)这里提供的系统介绍和演示视频,展示了一个基于SpringBoot和Vue实现的超市管理系统,采用了前后端分离的架构方式。系统设计包括管理员和员工两种角色,涵盖了销售管理、人事管理、个人中心、库存管理、会员管理、系统管理和商品管......
  • SqlDbx客户端连接服务器Oracle数据库
    查了很多文章,介绍的不对,走了好多弯路,最后整理一下,供参考一、下载Oracle客户端1、SqlDbx如果是32位的,客户端也要下载32位的2、Oracle客户端版本要和服务端版本一致(本例用的是12.1.0.2.0)3、32位客户端下载地址:https://www.oracle.com/database/technologies/instant-client/mic......
  • 【YashanDB数据库】statement级别的触发器在jdbc接口调用executeBatch时被多次触发
    问题现象某客户使用jdbc接口向yashandb的表A插入数据。表A上有一个语句级触发器,其内容为在触发时执行altersequence操作;另外还有一个insert时的行级触发器,其内容为将每行的部分列赋给新值,这些新值要么来自sequence.nextval,要么来自于current_timestamp。客户向表A插入90万条数......
  • Python Telegram Bot 从数据库获取数据时出错
    我正在开发用于管理企业用途任务的电报机器人。团队负责人注册他的公司并获得唯一的ID,然后可以分配任务。问题是,当团队负责人分配任务时,他可以使用/viewtasks访问它们。但是,当员工尝试查看任务时,它会打印出“错误。您尚未注册”。似乎无法检索与用户关联的company_id,即使......