Vulkan中的同步与缓存控制

标签：缓存 Fence fence VK signaled 同步 submitInfo semaphore Vulkan

1.Introduction

Vulkan 提供显式的同步结构，允许 CPU 与 GPU 同步命令的执行。并且还可以控制 GPU 中命令的执行顺序。所有执行的 Vulkan 命令都将进入队列，并以某种未定义的顺序“不间断”执行。

有时，我们明确希望在执行新操作之前确保某些操作已完成。在编写vulkan应用时，虽然对给定 VkQueue 的操作是线性发生的，但如果我们有多个VkQueue，则无法保证顺序。为此，以及为了与 CPU 的通信，我们需要控制资源的访问同步。

对于同一个资源的访问之间的同步是vulkan应负责的内容之一，vulkan中一共提供了如下四种同步机制：

Fence
Semaphore
Event
Barrier

用以同步host/device之间，queues之间，queue submissions之间，以及一个单独的command buffer的commands之间的同步。

2.Fence

2.1Fence概述

首先我们介绍最简单的Fence。一句话总结，Fence提供了一种粗粒度的，从Device向Host单向传递信息的机制，即GPU -> CPU。

Host可以使用Fence来查询通过vkQueueSubmit/vkQueueBindSparse所提交的操作是否完成。简言之，在vkQueueSubmit/vkQueueBindSparse的时候，可以附加带上一个Fence对象。之后就可以使用这个对象来查询之前提交的状态了。

example:

VkResult vkQueueSubmit(
    VkQueue                                     queue,
    uint32_t                                    submitCount,
    const VkSubmitInfo*                         pSubmits,
    VkFence                                     fence);

其中，最后一个参数可以是一个有效的fence对象，当然，也可以指定为VK_NULL_HANDLE，标明不需要Fence。有趣的是，在vkQueueSubmit的时候，如果给定一个有效的fence对象，但是不提交任何信息，即submitCount为0，那么同样也可以算作一次成功的提交，等待之前所有提交到queue的任务都完成后，这个fence也就signaled了。这种使用方式提供了一种机制，可以让我们查询一个queue现在到底忙不忙(即提交后直接查询这个fence的状态，如果是signaled，证明不忙；如果unsignaled，证明之前提交的任务还没有完成)。

Fence本身只有两种状态，unsignaled或者signaled，大致可以认为fence是触发态还是未触发态。当使用vkCreateFence创建fence对象的时候，如果在标志位上填充了VkFenceCreateFlagBits的VK_FENCE_CREATE_SIGNALED_BIT，那么创建出来的fence就是signaled状态，否则都是unsignaled状态的。销毁一个fence对象需要使用vkDestroyFence。

伴随着vkQueueSubmit/vkQueueBindSparse一起提交的fence对象，可以使用vkGetFenceStatus来查询fence的状态。注意vkGetFenceStatus是非阻塞的，如果fence处于signaled状态，这个API返回VK_SUCCESS，否则，立即返回VK_NOT_READY。

当然，fence被触发到signaled状态，必须存在一种方法，将之转回到unsignaled状态，这个功能由vkResetFences完成，这个API一次可以将多个fence对象转到unsignaled状态。这个API结合VK_FENCE_CREATE_SIGNALED_BIT位，可以达到一种类似于C中do {} while;的效果，即loop的代码有着一致的表现：loop开始之前，所有的fence都创建位signaled状态，每次loop开始的时候，所用到的fence都由这个API转到unsignaled状态，伴随着submit提交过去。

等待一个fence，除了使用vkGetFenceStatus轮询之外，还有一个API vkWaitForFences提供了阻塞式地查询方法。这个API可以等待一组fence对象，直到其中至少一个，或者所有的fence都处于signaled状态，或者超时（时间限制由参数给出），才会返回。如果超时的时间设置为0，则这个API简单地看一下是否满足前两个条件，然后根据情况选择返回VK_SUCCESS，或者（虽然没有任何等待）VK_TIMEOUT。

简而言之，对于一个fence对象，Device会将其从unsignaled转到signaled状态，告诉Host一些工作已经完成。所以fence使用在Host/Device之间的，且是一种比较粗粒度的同步机制。

2.2.Fence实例

void executeQueue( VkCommandBuffer cmd )
{
    const VkCommandBuffer cmds[] = { cmd };
    VkFenceCreateInfo fenceInfo;
    VkFence drawFence;
    fenceInfo.sType = VK_STRUCTURE_TYPE_FENCE_CREATE_INFO;
    fenceInfo.pNext = nullptr;
    fenceInfo.flags = 0;
    vkCreateFence( gDevice, &fenceInfo, nullptr, &drawFence );

    VkPipelineStageFlags pipeStageFlags = VK_PIPELINE_STAGE_BOTTOM_OF_PIPE_BIT;
    VkSubmitInfo submitInfo[1] = {};
    submitInfo[0].sType = VK_STRUCTURE_TYPE_SUBMIT_INFO;
    submitInfo[0].pNext = nullptr;
    submitInfo[0].waitSemaphoreCount = 0;
    submitInfo[0].pWaitSemaphores = nullptr;
    submitInfo[0].pWaitDstStageMask = &pipeStageFlags;
    submitInfo[0].commandBufferCount = 1;
    submitInfo[0].pCommandBuffers = cmds;
    submitInfo[0].signalSemaphoreCount = 0;
    submitInfo[0].pSignalSemaphores = nullptr;

    HR( vkQueueSubmit( gQueue, 1, submitInfo, drawFence ) );

    VkResult res;
    do {
        res = vkWaitForFences( gDevice, 1, &drawFence, VK_TRUE, 100000000 );
    } while( res == VK_TIMEOUT );

    vkDestroyFence( gDevice, drawFence, nullptr );
}

3.Semaphore

3.1.VkSemaphore概述

VkSemaphore用以同步不同的queue之间，或者同一个queue不同的submission之间的执行顺序。即GPU -> GPU。

类似于fence，semaphore也有signaled和unsignaled的状态之分。然而由于在queue之间或者内部做同步都是device自己控制，所以一个semaphore的初始状态也就不重要了。所以，vkCreateSemaphore(3)就简单地不用任何额外参数创建一个semaphore对象，然后vkDestroySemaphore(3)可以用来销毁一个semaphore对象。不同于fence,没有重置或者等待semaphore的api，因为semaphore只对device有效。

在device上使用semaphore的最典型的场景，就是通过vkQueueSubmit提交command buffer时候，所需要的参数由VkSubmitInfo()提交

typedef struct VkSubmitInfo {
    VkStructureType                sType;
    const void*                    pNext;
    uint32_t                       waitSemaphoreCount;
    const VkSemaphore*             pWaitSemaphores;
    const VkPipelineStageFlags*    pWaitDstStageMask;
    uint32_t                       commandBufferCount;
    const VkCommandBuffer*         pCommandBuffers;
    uint32_t                       signalSemaphoreCount;
    const VkSemaphore*             pSignalSemaphores;
} VkSubmitInfo;

通过不同的参数搭配，可以达到如下效果：所提交的command buffer将在执行到每个semaphore等待阶段时候，检查并等待每个对应的wait semaphore数组中的semaphore是否被signal, 且等到command buffer执行完毕以后，将所有signal semaphore数组中的semaphore都signal起来。

通过这种方式，实际上提供了一种非常灵活的同步queue之间或者queue内部不同command buffer之间的方法，通过组合使用semaphore，AP可以显式地指明不同command buffer之间的资源依赖关系，从而可以让driver在遵守这个依赖关系的前提下，最大程度地并行化，以提高GPU的利用效率。

基本逻辑：

一些 Vulkan 操作（如 VkQueueSubmit）支持 Signal 或 Wait 信标。

如果将其设置为 Signal a semaphore，这意味着该操作将在执行时立即“锁定”该信标，并在执行完成后解锁。

如果将其设置为 Wait on a semaphore，则表示操作将等到该信标解锁后才开始执行。

3.2.VkSemaphore实例

伪代码：

VkSemaphore Task1Semaphore;
VkSemaphore Task2Semaphore;

VkOperationInfo OpAlphaInfo;
// Operation Alpha will signal the semaphore 1
OpAlphaInfo.signalSemaphore = Task1Semaphore;

VkDoSomething(OpAlphaInfo);

VkOperationInfo OpBetaInfo;

// Operation Beta signals semaphore 2, and waits on semaphore 1
OpBetaInfo.signalSemaphore = Task2Semaphore;
OpBetaInfo.waitSemaphore = Task1Semaphore;

VkDoSomething(OpBetaInfo);

VkOperationInfo OpGammaInfo;
//Operation gamma waits on semaphore 2
OpGammaInfo.waitSemaphore = Task2Semaphore;

VkDoSomething(OpGammaInfo);

参考链接

Vulkan Guide学习（1.5）: https://zhuanlan.zhihu.com/p/451194569
vulkan中的同步和缓存控制之一，fence和semaphore: https://zhuanlan.zhihu.com/p/24817959
C++ (Cpp) vkCreateFence示例: https://cpp.hotexamples.com/zh/examples/-/-/vkCreateFence/cpp-vkcreatefence-function-examples.html

标签：缓存,Fence,fence,VK,signaled,同步,submitInfo,semaphore,Vulkan
From： https://www.cnblogs.com/ArsenalfanInECNU/p/18019451