• 2024-06-13实操教程|PyTorch实现断点继续训练
    作者丨HUST小菜鸡(已授权)编辑丨极市平台最近在尝试用CIFAR10训练分类问题的时候,由于数据集体量比较大,训练的过程中时间比较长,有时候想给停下来,但是停下来了之后就得重新训练,之前师兄让我们学习断点继续训练及继续训练的时候注意epoch的改变等,今天上午给大致整理了一下,不全面
  • 2024-05-16SciTech-BigDataAIML-Tensorflow-模型的训练与评估: tf.keras.losses + tf.keras.optimizer + tf.keras.metrics
    模型的训练:tf.keras.losses和tf.keras.optimizer定义一些模型超参数:num_epochs=5batch_size=50learning_rate=0.001实例化模型和数据读取类,并实例化一个tf.keras.optimizer的优化器(这里使用常用的Adam优化器):model=MLP()data_loader=MNISTLoader()optimiz
  • 2024-05-15SciTech-BigDataAIML-Tensorflow-Optimizer:优化器
    https://keras.io/api/optimizers/OptimizersAvailableoptimizers:SGDRMSpropAdamAdamWAdadeltaAdagradAdamaxAdafactorNadamFtrlLionLossScaleOptimizerUsagewithcompile()&fit()Anoptimizerisoneofthetwoargumentsrequiredforcompilin
  • 2024-05-11SciTech-BigDataAIML-TensorFlow-Model的编译:设置(LossFunction+Optimizer+Metrics)与编译
    机器学习|model.compile()用法model.compile()的作用:为经过设计的Model(神经网络模型)设置好:loss损失函数、optimizer优化器、metrics准确性评价函数。并且进行编译;Optimizers优化器:Optimizer的主要功能是作用在GD(梯度下降)的过程,使得Gradient(梯度)更快(快速
  • 2024-04-23PyTorch中的优化器
    SDG优化器参数说明:(引用:https://developer.baidu.com/article/detail.html?id=2705103)学习率(LearningRate):学习率决定了模型权重更新的步长。较大的学习率可能导致模型训练不稳定,而较小的学习率可能导致训练速度缓慢。通常,你可以通过尝试不同的学习率来找到最佳值。默认情况下,学
  • 2024-04-18训练时的显存优化
    总览HuggingFace的这篇文章总结了一系列节约显存的方法,非常全面。训练时显存占用的组成:模型参数优化器状态输入张量和其他临时张量激活值梯度通信缓冲“激活值”可能有点难理解。这是指像是dropout的mask、LayerNorm的\(\mu\\sigma^2\)等,不是梯度但参加到梯
  • 2024-04-06FJSP:蜣螂优化算法( Dung beetle optimizer, DBO)求解柔性作业车间调度问题(FJSP),提供MATLAB代码
    一、柔性作业车间调度问题柔性作业车间调度问题(FlexibleJobShopSchedulingProblem,FJSP),是一种经典的组合优化问题。在FJSP问题中,有多个作业需要在多个机器上进行加工,每个作业由一系列工序组成,每个工序需要在特定的机器上完成。同时,每个机器一次只能处理一个工序,且每个工
  • 2024-03-29train_transforms,Normalize,CrossEntropyLoss,optimizer,前向传播进行特征提取,反向传播优化,SGD,Adam
    目录train_transforms:变换Normalize(mean=127.5,std=127.5) :缩放到[-1,1]
  • 2024-03-18Optimizer: SGD, SGD with Momentum, Adagrad, RMSProp, Adam, AdamW
  • 2024-03-18Optimizer: SGD, SGD with Momentum, Adagrad, RMSProp, Adam, AdamW
  • 2024-01-24脚本exlpain结果与optimizer_trace结果不一致
    先说结论:表数据量太少,使用索引的效率不如全表扫描。表信息:CREATETABLE`w_map_cell`(`id`int(11)NOTNULLAUTO_INCREMENTCOMMENT'主键',`shelf_id`bigint(11)DEFAULTNULLCOMMENT'货架id',`cell_no`varchar(50)DEFAULTNULLCOMMENT'储位编号',`cell_name
  • 2023-12-06torch反向传播backward()函数解析
    参考网址:https://blog.csdn.net/weixin_44179269/article/details/124573992?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170167791616800197042802%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=170167791616800197042802&a
  • 2023-11-29[翻译]——How the MySQL Optimizer Calculates the Cost of a Query (Doc ID 1327497.1)
    本文是对这篇文章HowtheMySQLOptimizerCalculatestheCostofaQuery(DocID1327497.1)[1]的翻译,翻译如有不当的地方,敬请谅解,请尊重原创和翻译劳动成果,转载的时候请注明出处。谢谢!适用于:MySQL4.0及后续更高的版本本文档中的内容适用于任何平台。目标了解MySQL优化器如
  • 2023-11-06[翻译]——How the MySQL Optimizer Calculates the Cost of a Query (Doc ID 1327497.1)
    本文是对这篇文章HowtheMySQLOptimizerCalculatestheCostofaQuery(DocID1327497.1)的翻译,翻译如有不当的地方,敬请谅解,请尊重原创和翻译劳动成果,转载的时候请注明出处。谢谢!适用于:MySQL4.0及后续更高的版本本文档中的内容适用于任何平台。目标了解MySQL优化
  • 2023-09-24C#开源、功能强大、免费的Windows系统优化工具 - Optimizer
    前言今天给大家推荐一款由C#开源、功能强大、免费的Windows系统优化工具-Optimizer。工具介绍Optimizer是一款功能强大的Windows系统优化工具,可帮助用户提高计算机性能、加强隐私和安全保护。该工具支持22种语言,同时提供了许多实用的功能,如关闭不必要的Windows服务、停止Wind
  • 2023-07-29oracle 参数建议和详解
    隐藏参数_optimizer_adaptive_cursor_sharing建议关闭隐藏参数_optimizer_adaptive_cursor_sharing只有在开启了_optim_peek_user_binds后才有意义,它可以防止不合理的执行计划,但是在实际生产环境中,_optimizer_adaptive_cursor_sharing会带来各种问题,产生bug,因此建议关闭该参
  • 2023-06-16模型训练
    1.bert为什么attention除以根号下d原因:因为点积的数量级增长很大,因此将softmax函数推向了梯度极小的区域。案例:在没有除以根号d时,raw_tensor=torch.tensor([[2.1,3.3,0.5,-2.7]])torch.softmax(raw_tensor,dim=1)的结果是:tensor([[0.2207,0.7329,0.0446,0.0018
  • 2023-05-17bayesian优化demo运行
    bayesian优化demo运行参考链接:贝叶斯优化准备工作在所使用的python版本下,应有一个bayes_opt目录如下:如果没有这个目录,可以用pipinstallbayesian-optimization命令下载demo代码新建一个python文件basic_bayesian.py,其中代码如下:defblack_box_function(x,y):"""Fun
  • 2023-04-2306期:使用 OPTIMIZER_TRACE 窥探 MySQL 索引选择的秘密
    这里记录的是学习分享内容,文章维护在Github:studeyang/leanrning-share。优化查询语句的性能是MySQL数据库管理中的一个重要方面。在优化查询性能时,选择正确的索引对于减少查询的响应时间和提高系统性能至关重要。但是,如何确定MySQL的索引选择策略?MySQL的优化器是如何选择索
  • 2023-04-13MegEngine 使用小技巧:使用 Optimizer 优化参数
    神经网络的学习的目的是找到使损失函数的值尽可能小的参数。这是寻找最优参数的问题,解决这个问题的过程称为优化(optimization)。而由于参数空间复杂、参数数量庞大等原因,使得神经网络的优化问题非常难。MegEngine的optimizer模块中实现了大量的优化算法,其中Optimizer是所有优
  • 2023-04-13MegEngine 使用小技巧:使用 Optimizer 优化参数
    神经网络的学习的目的是找到使损失函数的值尽可能小的参数。这是寻找最优参数的问题,解决这个问题的过程称为优化(optimization)。而由于参数空间复杂、参数数量庞大等原因,使得神经网络的优化问题非常难。MegEngine的optimizer模块中实现了大量的优化算法,其中Optimizer是所有
  • 2023-03-26一般怎么分析一个sql
    explain语句进行分析。还需要进一步分析的话可以进行optimizer_trace,一共prepare、optimizer、execute阶段,主要关注optimizer阶段。key实际使用的索引。key_len使用的
  • 2023-03-23zeRO-Offload代码实践
    https://mp.weixin.qq.com/s/VOgNPEcDhmhMuDdy_HL0BAfromdeepspeed.ops.zero_offloadimportFP16ZeROOffloadEngine#InitializetheZeRO-Offloadenginezero_offlo
  • 2023-03-19tensorflow解决回归问题简单案列
    1待拟合函数noise服从均值为0,方差为15的正太分布,即noise~N(0,15)。2基于模型的训练根据散点图分布特点,猜测原始数据是一个二次函数模型,如下:其中,a,b,c为待训练参
  • 2023-03-13模型训练慢和显存不够怎么办?GPU加速混合精度训练
    目录​​混合精度训练​​​​理论原理​​​​三大深度学习框架的打开方式​​​​Pytorch​​​​Tensorflow​​​​PaddlePaddle​​混合精度训练一切还要从2018年ICLR