• 2024-06-01PatchEmbed
    PatchEmbed是用于计算机视觉任务的神经网络层,特别是在VisionTransformer(ViT)模型中使用。它负责将输入的图像分割成固定大小的图像块(patches),并将这些图像块线性嵌入到高维空间中。这是VisionTransformer处理图像的方式,它不像传统的卷积神经网络那样使用卷积层,而是通过