首页 > 其他分享 >基于Gan的穿搭变换模型

基于Gan的穿搭变换模型

时间:2023-11-29 18:32:22浏览次数:32  
标签:input 变换 模型 jacc Gan 图像 output image

摘要:


  1. 模型介绍
  2. 工作细节
  3. 测试
  4. 总结


一、模型介绍

Neural-Texture-Extraction-Distribution是一种用于可控人物图像合成的神经纹理提取和分布操作。它可以用于控制参考图像的姿势和外观,从而实现对人物图像的精细控制。该方法使用了一种称为“分布式纹理表示”的技术,可以将人物图像分解为多个部分,并对每个部分进行纹理提取和分布操作。这种方法可以在保留人物图像细节的同时,实现对图像的高度可控性。该方法已经在CVPR2022会议上发表的论文中进行了详细介绍,并在多个可控人物图像合成任务中取得了令人印象深刻的结果。

Neural-Texture采用UNet设计,具有下采样、瓶颈和上采样路径以及跳过连接。它用DenseNet体系结构中的Dense块取代了卷积层和最大池化层。密集块包含像ResNet中一样的残差连接,只是它们连接而不是求和先前的特征图。

这就能够看出他的优越性,不会重复利用相同的特征,减少了资源的占用和模型的参数。

对于模型参数,下图可以看到,模型除了一个Layer之外,其他两个层则是该模型的创新之处了,首先是一个Transition Down也就是TD层,以及最后一个TU层,通过这么一些参数便构成了我们模型的核心。

基于Gan的穿搭变换模型_图像合成


二、工作细节

1.核心训练输出

运行源代码文件中的训练代码,可以得到部分的输出如下,我们可以看到各个评估模型优劣的指标
Epoch 0 took 83+24 sec. loss = 7.43885 | jacc = 0.24205 | acc = 0.55149 || loss = 6.79203 | jacc = 0.25670 | acc = 0.56315 (BEST)
Epoch 1 took 84+25 sec. loss = 6.46792 | jacc = 0.29577 | acc = 0.64026 || loss = 6.33115 | jacc = 0.30504 | acc = 0.64557 (BEST)

2.损失函数设计

基于Gan的穿搭变换模型_图像合成_02


第二个比较关键的就是该模型的损失函数设计,我选用的是交叉熵作为损失函数,该模型训练800次的模型损失曲线如图所示

三、测试

可以看到,通过一个参考的图片,我们可以生成新的人穿上这件衣服的样子,并且还可以通过简单绘制肢体来调整pose


四、总结


基于Gan的穿搭变换模型_图像合成_03


上图是第一次跑出来的结果,我非常的激动。

在模型训练和测试过程中,我遇到过很多困难,但是随着自己的不断思考和不断学习他人先进的经验,我逐渐的走出了属于自己的一条路。非常感谢这一次宝贵的经验,我不仅仅构建了Neural-Texture模型,更是构建了我今后的学习深度学习的道路。


当然其中也少不了Intel公司的支持,我在比赛中使用了:


Intel® oneAPI Base Toolkit:这个工具包是 oneAPI 其他产品的基础,包含了几个在 Parallel Studio中常用的软件以及 icc 编译器、MPI、DPCPP 等。


使用实例:

import torch

from intel_extension import IntelAPI

from neural_texture_extraction import NeuralTextureExtractionModel


# 创建NeuralTextureExtractionModel实例

model = NeuralTextureExtractionModel()


# 创建IntelAPI实例

intel_api = IntelAPI()


# 加载预训练模型权重

model.load_state_dict(torch.load('pretrained_model.pth'))


# 设置输入图像

input_image = torch.randn(1, 3, 256, 256) # 以示例为目的,使用随机生成的输入图像


# 使用Intel API进行加速

input_image = intel_api.preprocess(input_image)


# 使用模型进行推理

output_image = model(input_image)


# 使用Intel API进行后处理

output_image = intel_api.postprocess(output_image)


# 处理输出图像,例如保存或显示

output_image.save('output_image.jpg')


对于我模型的构建和训练有莫大的帮助。再次表示感谢。



标签:input,变换,模型,jacc,Gan,图像,output,image
From: https://blog.51cto.com/u_16130710/8619855

相关文章

  • 多表操作之模型创建
    1图书表:book,作者表:author,作者详情表:authordetail,出版社表:publish,(第三张中间表)2作者跟作者详情:是一对一,关联字段写在哪一方都可以3图书跟出版社:是一对多,一对多关系一旦确立,关联字段写在多的一方4图书和作者:是多对多,多对多的关系需要建立第三张表(可以自动生成)5models.py中......
  • 大模型在docker中运行(个人电脑)
    1、环境搭建windows需要安装docker参见:WindowsDocker安装|菜鸟教程(runoob.com)windows需要开启WSL2、并安装 为了开启gpus加速,参见: win10DockerDesktop使用GPU_windowsdocker使用gpu_刘丶小歪的博客-CSDN博客设置docker启动容器的内存,设置为12G,参见: 修改WSL2......
  • 解锁AIGC大模型,打造你的专属虚拟女友
    什么是AIGC大模型?AIGC大模型是一种基于人工智能技术的生成式模型,它可以根据用户的输入和偏好,生成具有高度真实感和个性化的虚拟人物。这些虚拟人物不仅拥有独特的外貌、声音和性格,还可以与用户进行智能互动,为用户提供陪伴、娱乐和情感支持。如何打造专属虚拟女友?想要打造一位专......
  • 网络参考模型
    先上图,我们慢慢讲,如下:TCP/IP标准模型OSI参考模型TCP/IP对等模型协议应用层 应用层应用层 Telnet23FTP20/21TFTP69SNMP表示层HTTP80SMTPDNSDHCP会话层 主机到主机层传输层传输层TCPUDP......
  • SAP集成技术(八)成熟度模型
    成熟度模型的目的在于使用模型和标准来评估当前的集成能力,并确定必须建立哪些能力,以达到期望的成熟度级别。成熟度级别描述了一个特定主题复杂性对于某种方法或模型的成熟度。基于定义的需求和标准的分类,得出不同的成熟度级别。要达到某个成熟度级别,必须能证明实现了相应级别描述......
  • LLM模型参数助力多模态大模型高效训练
    随着人工智能技术的快速发展,多模态大模型在各种应用领域展现出了巨大的潜力。然而,其训练过程存在着计算资源消耗大、训练时间漫长等问题,这限制了其在实际场景中的应用。为了解决这些问题,salesforce提出了一个新的训练方法,即基于冻结视觉编码器和LLM模型参数的高效训练多模态大模型(B......
  • 开源大模型驱动的编程能力测试
    随着人工智能技术的不断发展,开源大模型已经成为了一个备受关注的话题。在这些开源大模型中,WizardCoder和WizardLM是两个备受瞩目的项目。本文将重点介绍这两个模型的特点和优势,并探讨它们在写代码能力测试中的应用。一、开源大模型WizardCoderWizardCoder是一个基于Python的......
  • 游戏中模型动画的几种实现方式
    游戏内动画的实现方式一般有这几种:骨骼动画顶点动画材质动画CPU蒙皮动画骨骼动画骨骼动画是一种基于骨骼系统的动画技术,它通过对骨骼进行变换来控制模型的姿态和动作。在骨骼动画中,模型通常被分解成多个部分,每个部分都与一个或多个骨骼相连,通过对骨骼进行旋转、平移、缩放等变换,可......
  • fc大语言模型部署+本地知识库
      FCInvokeStartRequestId:930989fb-8910-400d-b981-1de87e89a3e3Info:@serverless-cd/engine:0.0.51,linux-x64,node-v14.19.2plugin@serverless-cd/checkouthasbeeninstalledplugin@serverless-cd/s-setuphasbeeninstalledplugin@serverless-cd/s-deplo......
  • r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据
    原文链接:http://tecdat.cn/?p=23825最近我们被客户要求撰写关于有限正态混合模型EM算法的研究报告,包括一些图形和统计输出。简介本文介绍了基于有限正态混合模型在r软件中的实现,用于基于模型的聚类、分类和密度估计。提供了通过EM算法对具有各种协方差结构的正态混合模型进行参......