首页 > 编程语言 >2.优化算法

2.优化算法

时间:2025-01-21 19:57:49浏览次数:3  
标签:加权 梯度 下降 小批量 算法 学习 优化

2.1 小批量梯度下降

应用:深度学习处理大数据集的时候会选用小批量梯度下降算法

深度学习在大数据领域应用广泛,但是海量数据的训练又涉及速度问题,所以选择算法就尤其重要。

批量梯度下降:可以同时处理整个训练集(完整的训练集X,Y)

举例:把一个500w的训练集分成1000份,每份5000个训练集。

小批量梯度下降:

每次只处理一个mini batch,X{t},Y{t},而不是一次处理完整的训练集XY

2.2 理解小批量梯度下降

使用小批量梯度下降:必须要指定minibatch-size,它是一个超参数

minibatch大小的确认。如果训练集小于2000,可以直接用批量梯度下降。

 minibatch size是一个超参数,不知道咋选的时候就在下面几个里头实验。找一个能让梯度下降最有效率的值。

2.3 指数加权平均

概念:这个公式就是指数加权平均

2.4 理解指数加权平均

每天得到的theta值 =β*(前一天的theta)+(1-β)*当天的Vtheta的值,

优势:只需要一行代码

缺点:如果保存所有最近的温度数据,和过去 10 天的总和,必须占用更多的内存,执行更加复杂

2.5 指数加权平均的偏差修正

后期β的影响几乎被消除,所以使用之前的指数加权平均公式即可。

2.6 动量梯度下降法

还有一种算法叫做 Momentum ,或者叫做动量梯度下降法,运行速度几乎总是快于标 准的梯度下降算法,简而言之,基本的想法就是计算梯度的指数加权平均数,并利用该梯度 更新你的权重, 我们希望在垂直方向减慢速度。在水平方向所有导数指向右边,并且移动更快。(削减前往最小值的路径上的震荡) 所以你有两个超参数,学习率

标签:加权,梯度,下降,小批量,算法,学习,优化
From: https://blog.csdn.net/ldp1653/article/details/145247762

相关文章

  • 2025牛客寒假算法基础集训营1
    A.茕茕孑立之影题意:给你\(n\)个数,你要找一个数使得这个数和数组的任意一个数都不成倍数关系。如果数组里有\(1\)肯定不行,\(1\)是所有数的因子。其他情况我们只需要找一个大质数就行,因为值域只有\(1e9\),可以输出\(1e9+7\)。点击查看代码voidsolve(){ intn; std::cin>>......
  • 2025牛客寒假算法基础集训营1 ptlks的题解
    A.茕茕孑立之影题意:给定序列,找出一个数x,满足x和数组中任意一个元素都互不为倍数关系思路x范围为1e18以内,序列元素范围为1e9以内,选大于1e9的质数即可,特判序列中有1的情况。代码点击查看代码voidsolve(){ intn; cin>>n; intf=1; for(inti=1;i<=n;i++){ cin>>a[......
  • 头歌实训作业 算法设计与分析-贪心算法(第2关:最优装载问题)
    任务描述有一批集装箱要装上一艘载重量为C的轮船,共有n个集装箱,其中集装箱i的重量为Wi。最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。测试说明输入和输出说明:第1行为集装箱数目n和载重限制C第2行~第n+1行为n个集装箱的重量输出最优装载......
  • [Deep Learning] 使用keras创建多层感知机神经网络模型并添加dropout正则化策略优化银
    内容实现概述本文主要讲述使用keras库内置的Sequential(序列)模型,实现银行客户流失率预测,它属于一个二分类问题(因为针对单个客户来说,他要么已流失要么未流失)。具体实现过程如下:导入所需库:预先导入nump、pandas、sklearn以及keras库导入数据:使用pandas库的文件解析方法read_csv(......
  • linux kernel端口耗尽优化
     bind()源ip之后,分配端口会有端口耗尽问题。 linuxkernel如何bind()VRF端口上的源IPperf看到如下图:   在bind的时候因为还没有目的ip和port,所以可用端口会很少。socketopt IP_BIND_ADDRESS_NO_PORT 会把分配端口延后至connect阶段,如下图内核代码:/net/ipv4/af_in......
  • 【金融资产组合模型进化论】5. 马科维茨资产组合模型+AI金融智能体(qwen-max)+政策信
    目录0.承前1.AI金融智能体1.1WhatisAI金融智能体1.2WhyisAI金融智能体1.3HowtoAI金融智能体2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4因子构建与预期收益率计算2.5协方差矩阵计算2.6投资组合优化2.7持仓筛选2.8AI金融智......
  • 分治优化DP
    分治优化DPLink\(\text{Para.1}\hspace{0.2cm}\)四边形不等式对于形如\(\text{dp}[i][j]=\min_{k<j}{\text{dp}[i-1][k]+\text{cost}[k+1][j]}\)的形式,若\(\text{cost}\)满足\(\text{cost}[a][c]+\text{cost}[b][d]\leq\text{cost}[a][d]+\text{cost}[b......
  • 将机器学习算法移植到低端MCU上的实用指南
    将机器学习算法移植到低端MCU上的实用指南在物联网(IoT)和边缘计算迅猛发展的今天,将智能功能嵌入到资源有限的低端单片机(MicrocontrollerUnit,MCU)上,已经成为许多开发者和工程师追求的目标。然而,这一过程充满挑战,但只要掌握正确的方法,也能在低端MCU上实现高效的机器学习应用。......
  • 元强化学习算法—— EMCL —— 《Adapting to Dynamic LEO B5G Systems Meta-Critic L
    原文地址:https://orbilu.uni.lu/bitstream/10993/52996/1/Adapting_to_Dynamic_LEO-B5G_Systems_Meta-Critic_Learning_Based_Efficient_Resource_Scheduling.pdfPS:大概距离这个论文是fake的,无法做验证,其中对引用的算法的描述也是错的,基于一堆错误的东西能搞错对的东......
  • 【轻松掌握数据结构与算法】动态规划
    引言在本章中,我们将尝试解决那些使用其他技术(例如分治法和贪心法)未能得到最优解的问题。动态规划(DP)是一种简单的技术,但掌握起来可能比较困难。识别和解决DP问题的一个简单方法就是尽可能多地解决各种问题。“编程”一词与编码无关,而是源自文献,意思是填充表格,类似于线性规划。......