- 2024-11-19内点、外点、相对内点、边界点
- 2024-11-165. ε-greedy 探索
在DDPG(DeepDeterministicPolicyGradient)中加入ε-greedy探索也是一种增加智能体探索性的策略,尽管ε-greedy策略通常更适用于离散动作空间。然而,在DDPG的连续动作空间中,也可以通过ε-greedy策略实现探索。以下是如何将ε-greedy应用于DDPG的方法及其原因。
- 2024-11-09活下去了
本文是《应用随机过程》一节课半节课的笔记。设$$\gamma\approx4.311$$为\((2e/\gamma)^\gamma=e\)的解。我们证明:若\(c>\gamma,H=c\logn\),高\(\geH\)的概率为0as\(n\to\infty\)。若\(c<\gamma,H=c\logn\),高\(\leH\)的概率为0as\(n\to\infty\)。这里的\(
- 2024-11-03现代谱分析方法——ARMA过程详解
现代谱分析方法——ARMA(AutoregressiveMovingAverageprocess)过程详解目录简介ARMA过程的基本概念ARMA的定义AR与MA的区别ARMA过程的数学模型自回归模型(AR模型)移动平均模型(MA模型)ARMA模型的参数估计最小二乘法最大似然估计ARMA模型的性质平稳性白噪声ARMA模型的
- 2024-11-01python 计算 sin 值
概述当角(弧度描述)x足够小时,sin(x)约等于x,而已知三角等式sin(x)=3sin(x/3)-4sin^3(x/3),用python语言计算任意大的弧度角的sin值实现可以利用给定的三角恒等式[\sin(x)=3\sin\left(\frac{x}{3}\right)-4\sin^3\left(\frac{x}{3}\right)]来递归地计算任意弧度
- 2024-10-30计量经济学(十五)的理论基础——时间序列分解定理
时间序列分析是数据科学中的一个重要分支,旨在探索和理解随着时间变化的数据背后的模式和结构。无论是在金融市场预测、经济政策分析、环境监测还是医学研究中,时间序列数据的广泛应用证明了其在预测未来趋势、制定决策和风险管理方面的重要性。然而,时间序列数据的复杂性和多样性使
- 2024-10-30正则表达式
正则表达式 \(L=\{a\{a,b\}*\{\epsilon\}^*(\epsilon|(.|_)(a|b)(a|b*))\)正则表达式可以由较小的正则表达式按照特定规则递归地构建.每个正则表达式$r$定义(表示)一个语言,记为\(L(r)\).这个语言也是根据\(r\)的子表达式所表示的语言递归定义的.\(\epsilon
- 2024-10-23热力学与统计力学
统计力学泊松分布\[P(k,\lambda)=\frac{\lambdae^{-k}}{k!}\]其中\(\lambda\)是期望的事件数,k是观测到的事件数。玻尔兹曼分布\[P_i=\frac{e^{-\betaE_i}}{Z}\]其中\(P_i\)是状态i的概率,\(\beta=\frac{1}{KT}\)Z是配分函数\(Z=\sum_je^{-\betaE_j}\)麦克斯韦-玻尔兹曼
- 2024-10-22ABF第一章
布尔函数的傅里叶展开我们先来看几个例子。考虑几个简单的定义在\(f:\{-1,1\}^n\rightarrow\{-1,1\}\)的函数。\(n=2\),\(f\)定义为向量的最大值。那么\(f=\frac{1}{2}+\frac{1}{2}x_1+\frac{1}{2}x_2-\frac{1}{2}x_1x_2\)。其实我感觉这个展开方式更泰勒一点......\(n=3\),\(f
- 2024-10-10Ewald求和在分子静电势能计算中的应用
技术背景分子动力学模拟中,计算周期性边界条件的静电势常被视作计算的瓶颈之一。形式上是比较容易的,例如不考虑周期性边界条件的话,静电势能就是:\[E=\frac{1}{4\pi\epsilon_0}\sum_{i=0}^{N-2}\sum_{j=i+1}^{N-1}\frac{q_iq_j}{r_{ij}}\]如果考虑周期性边界条件,那么静电势能变为:
- 2024-10-09塑性力学 主要公式
塑性力学是固体力学的一个重要分支,它研究材料在超过弹性极限后的行为。以下是一些塑性力学中的主要公式及其推导:1.屈服准则VonMises屈服准则用于金属材料的屈服准则,假设材料在等效应力达到某个临界值时开始发生塑性变形。\[\[\sigma_{eq}=\sqrt{\frac{1}{2}\left(\si
- 2024-10-08[论文阅读报告] Fast 2-Approximate All-Pairs Shortest Paths, SODA '24
本篇文章介绍\(\tildeO(n^{2.032})\)的无向无权图全源最短路stretch2近似算法和\(\tildeO(n^{\frac94})\)的组合算法,以及\(\tildeO(n^{2.214}(1/\epsilon)^{O(1)}\logW)\)的非负整数边权stretch\((2+\epsilon)\)近似算法。其中\((1/\epsilon)^{O(1)}\)
- 2024-10-05[论文阅读报告] All pairs shortest paths using bridging sets and rectangular matrix multiplication, FOCS
本篇文章介绍整数边权下\((\min,+)\)矩阵乘、APSP等问题的一些做法。若每个元素的权值在\([-M,M]\cap\mathbbZ\)中,\(n\timesn^r\)和\(n^r\timesn\)的\((\min,+)\)矩阵乘可做到\(\tildeO(Mn^{\omega(r)})\);有向图APSP可做到\(\tildeO(n^{2+\mu(t)})\),
- 2024-10-02学习笔记:A Introduction to inertial navigation
3.2MEMS陀螺的误差特性本节我们分析MEMS陀螺中存在的误差,以及它们对积分后的信号(也就是旋转)的影响。3.2.1常量零偏角速度陀螺的零偏是它在不忍受任何转动时的平均输出,单位度每小时。如果对一个\(\epsilon\)大小的常量零偏进行积分,会导致一个随时间线性增长的角度误差:\(\theta
- 2024-09-19Java中的自适应学习率方法:如何提高训练稳定性
Java中的自适应学习率方法:如何提高训练稳定性大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!在机器学习和深度学习模型训练过程中,学习率是一个至关重要的超参数。不同的学习率会直接影响模型的收敛速度和性能。然而,固定的学习率往往难以应对复杂的
- 2024-09-19EPSILON环境配置和本地测试
文章目录一、环境配置1.1拉取镜像构建容器1.2在容器中安装常用的包1.3安装依赖1.4安装OOQP1.4.1安装blas1.4.2安装ma271.4.3安装OOQP1.5安装Protobuf二、本地编译测试2.1拉取源码并编译2.2X11转发docker图形化界面2.3测试一个小例子三、镜像一、环境配
- 2024-09-17浮点数的比较
浮点数与"零值"精度损失:浮点值与实际值不等,可能偏大可能偏小,都属于精度损失验证浮点数是否存在精度损失验证浮点数的差值是否存在精度损失浮点数直接比较验证结论:浮点数在进行比较时,绝对不能使用双等号==来进行比较.浮点数本身有精度损失,进而导致结果可能有细
- 2024-09-13L1损失和L2损失
L1损失和L2损失是两种常用的损失函数,用于衡量模型的预测值与真实值之间的误差。它们的主要区别在于对误差的处理方式不同,导致它们的性质和应用场景有所不同。1.L1损失(绝对值损失,MAE)L1损失计算的是预测值与真实值之间绝对误差的总和:[L_{\text{L1}}=|\mathbf{\epsi
- 2024-09-06杜教筛入门
其实是因为莫反的题非常非常要用这个所以才来学。有些莫反甚至要求灵活运用,而不只是求\(\sum\mu(n)\)和\(\sum\phi(n)\)前置的芝士狄利克雷卷积对于两个数论函数\(f,g\),他们两个函数的前\(n\)项的狄利克雷卷积表示为\((f*g)(n)\),\((f*g)(n)=\displaystyle\sum_{d|n}f(d)g(\fra
- 2024-08-27一些习题
裴礼文的一些练习没有答案,自己做的,不知道对不对,暂且收集一下想法,毕竟草稿纸不好找斜体的是不确定的,有时间再回来看Chapter4一元函数积分学4.1积分与极限第一问,分成两个区间,\([a,\pi/2-\epsilon/2],[\pi/2-\epsilon/2]\)第二问没什么好说的第三问,控制收敛定理,然后积分换
- 2024-08-22【Python脚本】刚度矩阵格式转换
对于1-2-3坐标系:应力矩阵如下:\[\left.[\sigma]=\left[\begin{array}{ccc}\sigma_{11}&\sigma_{12}&\sigma_{13}\\\sigma_{12}&\sigma_{22}&\sigma_{23}\\\sigma_{13}&\sigma_{23}&\sigma_{33}\end{array}\right.\right]\]张量应变矩阵如下:
- 2024-08-13极限学习笔记
这个人太菜了,轻喷。数列极限定义数列的概念自变量为正整数的函数\(u_n=f(n)\),其中\(n=1,2,3\cdots\),将其函数值按自变量从小到大排成一列数\(u_1,u_2\cdotsu_n\cdots\),称为数列,将其简记为\(\{u_n\}\)。其中\(u_n\)称为数列的通项或者一般项。、数列极限的定义(\(\eps
- 2024-08-12积性函数和狄利克雷卷积学习笔记
积性函数和狄利克雷卷积学习笔记积性函数定义若函数\(f(x)\)满足\(f(ab)=f(a)f(b)\),其中\(a,b\)互质,我们称这个函数是积性函数。若\(a,b\)不互质则是完全积性函数。常见积性函数狄利克雷卷积定义也叫狄利克雷乘积。形如下式:\[h(n)=\sum_{ab=n,a>0,b>0}f(a)g(b)\]
- 2024-08-03编程实现模重复平方法的算法
模重复平方法(又称为平方法)是一种用于求解非线性方程的迭代算法。算法的基本思路是通过不断迭代替换变量的方式,将非线性方程转化为线性方程,从而求解方程的根。以下是一个编程实现模重复平方法的算法的示例:```pythondeffixed_point_iteration(f,x0,epsilon,max_iterations)
- 2024-07-17强化学习——多臂老虎机问题(MAB)【附python代码】
文章目录一、问题描述1.1问题定义1.2形式化描述1.3累积懊悔1.4估计期望奖励二、解决方法2.1ϵ-贪婪算法2.2上置信界算法2.3汤普森采样算法2.4小结一、问题描述1.1问题定义 有一个用于K根拉杆的老虎机,每一根拉杆都对应一个关于奖励的概率分布R。每