RocksDB代码分析——LogAndApply

时间：2024-09-28 13:39:11浏览次数：6

标签：RocksDB 队首代码 writer manifest writers ready LogAndApply first

这里我们主要分析VersionSet::LogAndApply是怎么管理writer队列的。

参数里的edit_lists是需要被apply的改动。每个传入的column family data对应edit_lists里的一个edit list，即autovector<VersionEdit*>。

接下来把每个edit list打包成一个ManifestWriter，放进std::deque<ManifestWriter> writers里。此外，由于对manifest的修改必须逐个进行，因此VersionSet里还维护了一个MenifestWriter的队列：manifest_writers_。因此还需要把打包好的ManifestWriter的指针放进manifest_writers_里。

然后把要执行的第一个writer拿出来：ManifestWriter& first_writer = writers.front();

等待它成为队首或者完成：

  while (!first_writer.done && &first_writer != manifest_writers_.front()) {
    first_writer.cv.Wait();
  }

如果它完成了，由于我们是一次性把所有writer都推入队列的，说明其他的也完成了，所以可以直接返回：

  if (first_writer.done) {
    return first_writer.status;
  }

否则它就是队首。

由于我们是持有了DB mutex的，因此writers中的ManifestWriter在队列manifest_writers_中也是贴在一起的。这样，如果writers中的第一个writer变成了队列的队首，那么writers中其他的writer就紧贴其后，这样我们就可以正式开始逐个执行这些writer了。

进入VersionSet::ProcessManifestWrites。

然后逐个去执行队列manifest_writers_里的writer，last_writer是最后一个被执行了的writer。

然后后面又有一大堆操作，具体没看，但是其中会释放并重新申请DB mutex。因此到这个函数的末尾时，writers里的所有writer肯定都已经执行完毕了，但是last_writer不一定是队列manifest_writers_里的最后一个writer。

  while (true) {
    // 遍历已经执行完成的writer
    ManifestWriter* ready = manifest_writers_.front();
    manifest_writers_.pop_front();
    bool need_signal = true;
    // 如果它在writers里，就不用发信号了，因为它们都归我们管
    // 如果它不在writers里，说明可能有另一个线程在等待它变成队首，这时就要发信号
    for (const auto& w : writers) {
      if (&w == ready) {
        need_signal = false;
        break;
      }
    }
    ready->status = s;
    ready->done = true;
    if (ready->manifest_write_callback) {
      (ready->manifest_write_callback)(s);
    }
    if (need_signal) {
      ready->cv.Signal();
    }
    if (ready == last_writer) {
      break;
    }
  }
  // 因为last_writer不一定是manifest_writers_里的最后一个，所以给新的队首发送信号。
  if (!manifest_writers_.empty()) {
    manifest_writers_.front()->cv.Signal();
  }

但我有一个问题，在等待first_writer变成队首的时候，并没有unlock DB mutex，而后面给新队首发信号的时候也是hold DB mutex的，那这两者应该不能同时发生才对。

标签：RocksDB,队首,代码,writer,manifest,writers,ready,LogAndApply,first
From： https://www.cnblogs.com/searchstar/p/18437454

RocksDB代码分析——Flush流程
这里从DBImpl::MaybeScheduleFlushOrCompaction开始讲起。DBImpl::MaybeScheduleFlushOrCompaction可能会scheduleDBImpl::BGWorkFlush和DBImpl::BGWorkCompaction。这里主要看Flush。Compaction部分见：{%post_linkStorage/'RocksDB代码分析——Compaction流程'%}DBImpl::BGWo......
RocksDB代码分析——Compaction的输入文件的选择
这里主要分析LevelCompactionBuilder::PickCompaction是如何选择输入文件的。SetupInitialFiles();找一个需要compact到下层的SSTfile。只会在score>=1的level里找。score的计算见VersionStorageInfo::ComputeCompactionScore（{%post_linkStorage/'RocksDB代码分析——Compa......
RocksDB代码分析——Compaction流程
这里从DBImpl::MaybeScheduleFlushOrCompaction开始讲起。DBImpl::MaybeScheduleFlushOrCompaction可能会scheduleDBImpl::BGWorkFlush和DBImpl::BGWorkCompaction。这里主要看Compaction。Flush部分见{%post_linkStorage/'RocksDB代码分析——Flush流程'%}DBImpl::BGWorkCo......
《 C++ 修炼全景指南：十三》为什么你的代码不够快？全面掌控 unordered_set 和 unordere
摘要本文深入探讨了C++标准库中的两大无序容器——unordered_set和unordered_map，从底层实现、核心操作、性能优化、实际应用等多个方面进行了全面分析。首先，文章介绍了这两种容器的基本概念，说明了它们基于哈希表实现的特点，尤其是在查找、插入和删除操作上具备常数时间......
Zernike 多项式在圆形、六边形、椭圆形、矩形或环形瞳孔上应用（Matlab代码实现）
......
【电磁学，向量场理论和Maxwell方程】二维FDTD（有限差分时域）解决完全电导体边界条件问题
......
PointNet++论文介绍和代码实现
一、PointNet++论文详细介绍1.背景与动机点云数据的重要性：在3D计算机视觉和图形学中，点云是一种常见的数据表示方式，广泛应用于3D扫描、自动驾驶、机器人导航等领域。PointNet的局限性：PointNet是处理点云的开创性工作，但由于其直接对全局点集进行特征学习，无法有效捕捉局部特征，......
利用表格布局和表单编写简单代码
利用表格布局编写程序设计“登录界面”代码如下：<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><title>登录界面</title></head><body><form><fieldsetstyle="width:300px;......
【分布式能源选址与定容】光伏、储能双层优化配置接入配电网研究（Matlab代码实现）
......
【风光不确定】基于多时间尺度滚动优化算法的主动配电网研究【IEEE33节点】（Matlab代码
目录......

RocksDB代码分析——LogAndApply

相关文章

赞助商

阅读排行