首页 > 其他分享 >General Guide

General Guide

时间:2024-02-27 16:25:37浏览次数:28  
标签:training 20 56 General optimization model data Guide

发现结果不好时,可以按下图顺序来调整

先考虑Loss on training data,如果large,考虑model bias和optimization

 Model Bias

model太简单,导致最优解不在空间里,只能找到小空间的最优解,犹如大海捞针,针却不在大海

这时我们要redesign一下model,更复杂一些,更大的弹性,增加输入的feature,可以用deep learning

Optimization

可能卡在局部最优解,而不是全局最优解,犹如大海捞针,针确实在大海,但捞不上

 那么如何判断是model bisa还是optimization出了问题

在testing data中,20层好于50层,不能说明它是过拟合。在training data中,20层好于56层,说明是optimization不好,而不是弹性不够的原因,20层能做到的事56层一定能做到,如果56层optimization成功的话,得到的结果比20层是要好的。

 

接下来考虑loss on training data小但loss on testing data大的问题,可能是遇到了overfitting(可以通过增加训练集数据来解决)

可以用data augmentation方法,即通过自己对问题的理解来创造一些资料,但是不能随便做(如把影像倒置),要有道理

或者限制一下model的弹性:比如确定了就是二次曲线;或者在深度学习中可以使用以下的方法

 把training data分为training set和validation set时候,可以使用如下方法

 

标签:training,20,56,General,optimization,model,data,Guide
From: https://www.cnblogs.com/ybx-tih/p/18037093

相关文章

  • Material Design In XAML Toolkit 5.0.0 Migration Guide
    MaterialDesignInXamlToolkit5.0有破坏性的更新,下面的连接可以用于4.x升级到5.0的一个手册。仅供参考,欢迎升级5.0时使用。https://github.com/MaterialDesignInXAML/MaterialDesignInXamlToolkit/issues/2435破坏性更新https://github.com/MaterialDesignInXAML/MaterialDesig......
  • Gartner® Market Guide for Email Security——Gartner对邮件安全市场的洞察
    https://www.gartner.com/doc/reprints?id=1-2DVHQRLR&ct=230531&st=sb看最关键的,邮件安全厂商,三大类:Acompaniontoolisalsoavailablethatincludesalargersetof42representativevendorsandtheircapabilities(see Tool:VendorIdentificationforEmailSecur......
  • mysql创建数据库排序规则utf8_general_ci和utf8_unicode_ci区别
    在编程语言中,通常用unicode对中文字符做处理,防止出现乱码,那么在MySQL里,为什么大家都使用utf8_general_ci而不是utf8_unicode_ci呢?ci是caseinsensitive,即"大小写不敏感",a和A会在字符判断中会被当做一样的;bin是二进制,a和A会别区别对待。例如你运行:SELECT*FR......
  • OpenIM (Open-Source Instant Messaging) Mac Deployment Guide
    Thisguideprovidesstep-by-stepinstructionsfordeployingOpenIMonaMac,includingbothsourcecodeandDockerdeploymentmethods.##PreliminaryEnvironmentSetupEnsureacleanworkingenvironment:1.**CreateaNewDirectory**:Startinanewdirec......
  • 2024AAAI_SGNet Structure Guided Network via Gradient-Frequency Awareness for Dep
    1.任务描述: 给定输入LR深度图和HRRGB图像,引导DSR目的是在ground-truth深度图监督的条件下,预测HR深度图2.Network本文提出的SGNet主要包括两部分,即梯度校准模块(GCM)和频率感知模块(FAM)。首先将RGB图像和上采样后的LR深度图送入到GCM,利用RGB丰富的梯度信息在梯度域中......
  • OpenIM Open Source Instant Messaging Project Docker Compose Deployment Guide
    ThedeploymentofOpenIMinvolvesmultiplecomponentsandsupportsvariousmethodsincludingsourcecode,Docker,andKubernetes.Thisrequiresensuringcompatibilitybetweendifferentdeploymentmethodsandeffectivelymanagingdifferencesbetweenversio......
  • OpenIM Open Source Instant Messaging Project Docker Compose Deployment Guide
    ThedeploymentofOpenIMinvolvesmultiplecomponentsandsupportsvariousmethodsincludingsourcecode,Docker,andKubernetes.Thisrequiresensuringcompatibilitybetweendifferentdeploymentmethodsandeffectivelymanagingdifferencesbetweenversio......
  • [论文阅读] Progressive Domain Expansion Network for Single Domain Generalization
    ProgressiveDomainExpansionNetworkforSingleDomainGeneralization3.Method本文提出的PDEN用于单域泛化。假设源域为\(\mathcal{S}=\left\{x_i,y_i\right\}_{i=1}^{N_S}\),目标域为\(\mathcal{T}=\left\{x_i,y_i\right\}_{i=1}^{N_T}\),其中\(x_i,y_i\)分别表示第......
  • JavaGuide 设计模式
    JavaGuide设计模式1.软件设计原则设计原则名称简单定义开闭原则对扩展开放,对修改关闭单一职责原则一个类只负责一个功能领域中的相应职责里氏替换原则所有引用基类的地方必须能透明地使用其子类的对象依赖倒置原则依赖于抽象,不能依赖于具体实现接......
  • [论文于都] SelfReg: Self-supervised Contrastive Regularization for Domain Genera
    SelfReg:Self-supervisedContrastiveRegularizationforDomainGeneralization采用了自监督对比学习的方法,提出了IndividualizedIn-batchDissimilarityLoss和HeterogeneousIn-batchDissimilarityLoss。IndividualizedIn-batchDissimilarityLoss关注于在训练过程......