首页 > 其他分享 >经典永不过时!GAN再次发光

经典永不过时!GAN再次发光

时间:2023-11-20 14:32:56浏览次数:32  
标签:loss cur 永不 itrs vis GAN score 过时 opts

问题描述: Intel架构在中国汉字生成领域发挥着重要作用。随着人工智能技术的快速发展,汉字生成成为了一项具有挑战性的任务。Intel架构的强大计算能力和优化的算法使得汉字生成变得更加高效和精确。通过利用Intel架构的优势,研究人员和开发者能够更好地实现汉字的自动生成,为中文信息处理和文化传承提供了有力支持。未来,随着Intel架构不断演进和创新,中国汉字生成领域将迎来更加广阔的发展前景。

而我希望在这次比赛中,利用主办方提供的Openvino架构,对我们一些古文化的中国汉字生成加速。

  1. 模型介绍。
  2. GAN的主要结构,包括一个生成器G(Generator)和一个判别器D(Discriminator),整个训练过程,便是二者的对抗博弈。希望学习出G、D使得 ,以至于D无法对二者进行正确分辨。
  3. 为什么可以用GAN 在训练过程中,生成器试图生成更逼真的样本以欺骗判别器,而判别器则努力区分真实样本和生成样本。通过这种对抗性的训练,GAN能够逐渐学习到数据分布的特征,并生成与真实数据相似的新样本。

GAN在图像生成、图像修复、图像转换等领域取得了显著的成果。它也被广泛应用于自然语言处理、音频处理等任务中。通过不断改进和优化GAN模型的结构和训练算法,研究者们正在不断推动其在各个领域的应用和发展。

  1. 学习收获 百分之七十几的精力基本上都花费在了数据集的处理上面,因为数据集的标签以及标注特别的多,相较于传统的分类图像来说,分割更复杂

由于Intel架构的使用,我的模型惊人的提升了百分之58.7%的性能,今后我一定也会继续使用,能够让我的模型更加的牛。 最终的模型测试效果能够在63.2%的测试集上有较好的分割效果,除去一些特殊的光照和阴影,其他的识别效果也还可以。

在这次比赛中,我通过自己不断的尝试和优化,尤其是数据处理和模型构建中,遇到了不少的困难。但是我通过不断在网络上查询资料以及思考,终于做出了自己的第一个可以实际运用的模型!

  1. 核心工作 while True:
model.train()
 cur_epochs += 1
 for (images, labels) in train_loader:
     cur_itrs += 1

     images = images.to(device, dtype=torch.float32)
     labels = labels.to(device, dtype=torch.long)

     optimizer.zero_grad()
     outputs = model(images)
     loss = criterion(outputs, labels)
     loss.backward()
     optimizer.step()

     np_loss = loss.detach().cpu().numpy()
     interval_loss += np_loss
     if vis is not None:
         vis.vis_scalar('Loss', cur_itrs, np_loss)

     if (cur_itrs) % 10 == 0:
         interval_loss = interval_loss / 10
         print("Epoch %d, Itrs %d/%d, Loss=%f" %
               (cur_epochs, cur_itrs, opts.total_itrs, interval_loss))
         interval_loss = 0.0

     if (cur_itrs) % opts.val_interval == 0:
         save_ckpt('checkpoints/latest_%s_%s_os%d.pth' %
                   (opts.model, opts.dataset, opts.output_stride))
         print("validation...")
         model.eval()
         val_score, ret_samples = validate(
             opts=opts, model=model, loader=val_loader, device=device, metrics=metrics,
             ret_samples_ids=vis_sample_id)
         print(metrics.to_str(val_score))
         if val_score['Mean IoU'] > best_score:  
             best_score = val_score['Mean IoU']
             save_ckpt('checkpoints/best_%s_%s_os%d.pth' %
                       (opts.model, opts.dataset, opts.output_stride))

         if vis is not None:  
             vis.vis_scalar("[Val] Overall Acc", cur_itrs, val_score['Overall Acc'])
             vis.vis_scalar("[Val] Mean IoU", cur_itrs, val_score['Mean IoU'])
             vis.vis_table("[Val] Class IoU", val_score['Class IoU'])

             for k, (img, target, lbl) in enumerate(ret_samples):
                 img = (denorm(img) * 255).astype(np.uint8)
                 target = train_dst.decode_target(target).transpose(2, 0, 1).astype(np.uint8)
                 lbl = train_dst.decode_target(lbl).transpose(2, 0, 1).astype(np.uint8)
                 concat_img = np.concatenate((img, target, lbl), axis=2)  
                 vis.vis_image('Sample %d' % k, concat_img)
         model.train()
     scheduler.step()

     if cur_itrs >= opts.total_itrs:
         return

其中对于Intel架构的使用,我采取了:

使用Intel VTune Profiler等工具对Attention U-Net模型进行性能分析和调优,找出性能瓶颈并进行优化。

在使用Attention U-Net模型进行图像分割时,使用Intel OpenCV等库来加速图像处理过程,提高分割速度和效率。

  1. 总结 GAN是一个经典的生成式网络,虽然说能够做很多领域的任务也能够取得较好的效果。在这次Intel的比赛中,也能够取得一个看起来效果较好的结果,但是今后也要尝试更多优秀的模型,来对不同的任务做不同的事情。

标签:loss,cur,永不,itrs,vis,GAN,score,过时,opts
From: https://blog.51cto.com/u_15834184/8488667

相关文章

  • 通过时序和上下文对比学习时间序列表征《Time-Series Representation Learning via Te
    现在是2023年11月14日的22:15,肝不动了,要不先回寝室吧,明天把这篇看了,然后把文档写了。OK,明天的ToDoList.现在是2023年11月15日的10:35,继续。论文:Time-SeriesRepresentationLearningviaTemporalandContextualContrasting(IJCAI官网版本PDF)或者是:Time-SeriesRepresenta......
  • subject organization is not system:nodes 问题解决
    在下面的issues找到了答案:https://github.com/kubernetes/kubernetes/issues/99504┌──[root@vms100.liruilongs.github.io]-[~]└─$kubectlgetcsrNAMEAGESIGNERNAMEREQUESTORREQU......
  • 【Python&图像超分】Real-ESRGAN图像超分模型(超分辨率重建)详细安装和使用教程
    ​1前言        图像超分是一种图像处理技术,旨在提高图像的分辨率,使其具有更高的清晰度和细节。这一技术通常用于图像重建、图像恢复、图像增强等领域,可以帮助我们更好地理解和利用图像信息。图像超分技术可以通过多种方法实现,包括插值算法、深度学习等。其中,深度学习......
  • 机器学习——通过时间反响传播
    我们在 4.7节中描述了多层感知机中的前向与反向传播及相关的计算图。循环神经网络中的前向传播相对简单。 通过时间反向传播(backpropagationthroughtime,BPTT) (Werbos,1990)实际上是循环神经网络中反向传播技术的一个特定应用。它要求我们将循环神经网络的计算图一次展开......
  • go中标记一个模块内容为过时
    今天在使用标准库ioutil时发现已经过时,是通过在注释上添加实现的。例如://WsHandlerFuncislikeHandleFuncinGin.////Deprecated:Notsupport.typeWsHandlerFuncfunc(*websocket.Conn)在goland中调用时就会提示已废弃。......
  • [论文阅读] [SAGAN] Self-Attention Generative Adversarial Networks
    Self-AttentionGenerativeAdversarialNetworks(mlr.press)ZhangH,GoodfellowI,MetaxasD,etal.Self-attentiongenerativeadversarialnetworks[C]//Internationalconferenceonmachinelearning.PMLR,2019:7354-7363.引用:4501原作者代码:brain-research/self-......
  • [论文阅读] Dist-GAN: An Improved GAN using Distance Constraints
    [1803.08887]Dist-GAN:AnImprovedGANusingDistanceConstraints(arxiv.org)TranNT,BuiTA,CheungNM.Dist-gan:Animprovedganusingdistanceconstraints[C]//ProceedingsoftheEuropeanconferenceoncomputervision(ECCV).2018:370-385.引用:102原......
  • Pytorch 实现 GAN 网络
    Pytorch实现GAN网络原理GAN的基本原理其实非常简单,假设我们有两个网络,G(Generator)和D(Discriminator)。它们的功能分别是:G是一个生成网络,它接收一个随机的噪声z,通过这个噪声生成伪造数据,记做G(z)。D是一个判别网络,判别数据是不是“真实的”。它的输入参数是x,输出记为D(x)......
  • [论文阅读] [SNGAN] Spectral Normalization for Generative Adversarial Networks
    1802.05957.pdf(arxiv.org)MiyatoT,KataokaT,KoyamaM,etal.Spectralnormalizationforgenerativeadversarialnetworks[J].arXivpreprintarXiv:1802.05957,2018.生成式对抗网络的频谱归一化,相比于WGAN-GP在激进的学习率和β1&β2下表现更好引用:4453代码:https:......
  • [论文阅读] [WGAN-GP] Improved Training of Wasserstein GANs
    [1704.00028]ImprovedTrainingofWassersteinGANs(arxiv.org)GulrajaniI,AhmedF,ArjovskyM,etal.Improvedtrainingofwassersteingans[J].Advancesinneuralinformationprocessingsystems,2017,30.代码:igul222/improved_wgan_training:Codeforrepr......