- 2024-11-21RL 基础 | 如何复现 PPO,以及一些踩坑经历
最近在复现PPO跑MiniGrid,记录一下…这里跑的环境是Empty-5x5和8x8,都是简单环境,主要验证PPO实现是否正确。01ProximalpolicyOptimization(PPO)(参考:知乎|ProximalPolicyOptimization(PPO)算法理解:从策略梯度开始)首先,策略梯度方法的梯度形式是\[\nabla_\theta
- 2024-11-20轨迹数据强化学习整理
在轨迹数据中结合联邦学习、强化学习和课程学习进行训练,可以有效地保留用户隐私,同时通过强化学习策略学习轨迹数据的时空特征,并利用课程学习优化训练过程。以下是一个整合这些方法的框架和步骤,突出时间和空间特征的处理:1.联邦学习(FederatedLearning)框架目标:在多个分布式
- 2024-11-20PI发布rest,json接口
PI接口的开发分成两个部分,第一个部分是ESB(EnterpriseServicesBuilder)部分,这里注意做数据结构定义,接口导入,字段关系映射,定义接口等。 第二部分是IB(IntegrationBuilder)部分,这里主要做管道定义,服务
- 2024-11-19「模拟赛」多校 A 层冲刺 NOIP 24
A.选取字符串KMP、字符串好题因为所有字符串都是大字符串的前缀,所以一旦我们每个字符串的前缀后缀的长度确定了,那么前缀后缀长什么样也就确定了设\(f_i\)为所有相同前缀后缀长度可以为\(i\)的字符串的个数我们枚举\(i\in[1,n]\),每次钦定两个串\(p、q\)里必须有一个是
- 2024-11-16永磁同步电机负载估计--降阶龙贝格观测器
一、原理介绍本文采用降阶龙贝格负载转矩观测器观测负载扰动并前馈至电流环,改善PI调节器的抗负载扰动能力降阶龙贝格负载转矩观测器的状态方程为二、仿真模型在MATLAB/simulink(软件版本为2024A)里面验证所提算法,搭建仿真。采用和实验中一致的控制周期1e-4,电机部分计算周期
- 2024-11-16pico-sdk(零)
pico-sdk(零)项目概述license相关文档依赖三方库链接项目概述RaspberryPiPicoSDK(以下简称SDK)提供了为RP系列微控制器设备(如RaspberryPiPico或RaspberryPiPico2)编写C、C++或汇编语言程序所需的头文件、库和构建系统。SDK旨在为非嵌入式C开发人员和
- 2024-11-15python的decimal默认精度为28
python的decimal的精度可以修改的计算pi使用莱布尼茨级数计算圆周率fromdecimalimportDecimal,getcontext#设置全局精度为100位getcontext().prec=100#使用莱布尼茨级数计算圆周率pi=Decimal(0)forkinrange(1000000):pi+=(Decimal(-1)**k)/(
- 2024-11-14数据结构 ——— 利用前序序列重建链式二叉树
目录题目要求链式二叉树示意图编辑代码实现 题目要求读入用户输入的一串前序遍历的字符串,根据此字符串建立一个链式二叉树例如前序遍历的字符串为:ABC##DE#G##F###;其中"#"表示空树链式二叉树示意图以此图的链式二叉树为例子那么此链式二叉树前序遍历转换为字符
- 2024-11-14WGS84坐标 转 GCJ02坐标 / BD09坐标
/*具体实现方法*/namespaceWGS84PositionConversion{publicclassCoordinateConverter{//PI值privateconstdoublePI=3.1415926535897932384626;//长半轴privateconstdoubleA=6378245.0;//扁率
- 2024-11-12Recursive Algorithm for Sliding Signal Processing
目录概滑动窗口上的快速算法Farhang-BoroujenyB.andGazorS.Generalizedslidingfftanditsapplicationtoimplementationofblocklmsadaptivefilters.TSP,1994JacobsenE.andLyonsR.TheslidingDFT.SPM,2003.JacobsenE.andLyonsR.Anupdateto
- 2024-11-12BuildRoot 中编译 opencpn 总结
目录1:升级cmake版本3.24.0-rc52:设置交互编译环境变量3:编译wxWidgets-3.2.64:编译opencpn需要依赖的lib 5:编译opencpn1:升级cmake版本3.24.0-rc5sudobashcmake-3.22.1-linux-x86_64.sh--prefix=/usr--skip-license更改PATH路径corey@fcyswrd-15:~/opencpn/
- 2024-11-12强化学习理论-第3课-贝尔曼最优公式
1.贝尔曼最优公式:1.1定义:第2课介绍了贝尔曼公式,里面的\(\pi(a|s)\)策略是固定的,这里我们想求得一个最优的策略,使得statevalue最好1.2matrix-vectorform:2.求解贝尔曼公式:公式中,v是一个未知量,\(\pi\)也是要求解的最优策略。假设a有5个action,2.1Contractionmap
- 2024-11-11Matlab常用的图像属性
线型、标记和颜色线型、标记和颜色,指定为包含符号的字符串或字符向量。符号可以按任意顺序显示。不需要同时指定所有三个特征(线型、标记和颜色)。例如,如果忽略线型,只指定标记,则绘图只显示标记,不显示线条。以下是MATLAB在许多类型的绘图中使用的默认颜色的RGB三元组和十六
- 2024-11-10旋转矢量合成,两个圆圈
importnumpyasnpimportmatplotlib.pyplotaspltfrommatplotlib.patchesimportCircle,FancyArrowPatchfrommatplotlib.animationimportFuncAnimation#创建一个新图和两个坐标轴fig,(ax1,ax2)=plt.subplots(1,2,figsize=(12,6))#设置坐标轴的等比例,确
- 2024-11-09AMC2024 12A 题目笔记
题目编号按照AoPS。√√√√√√√××√.×√√√√.√√√.....P6对啦!首先注意到答案应该是一个正的加两个负的。暴力枚举所有合法的三元组,算得\(10-6-1=\boxed{\mathbf{(B)}\3}\)。☆经验:枚举一个数\(n\)的分解\(x\timesy\timesz\)是可以接受的。A
- 2024-11-09强化学习理论-第二课-贝尔曼公式
1.return和贝尔曼上图说明从不同状态出发得到的return,依赖于从其他状态出发的returnv是return,将第一张图写成矩阵的形式,r代表immediatereward,是已知的,矩阵P是策略加上statetransition,也是已知的,求解v这个公式实际上就是贝尔曼公式在\(S_t\)采用什么样的动作\(A_t\),是有
- 2024-11-08KMP学习笔记
复习了一下KMP。与其说是复习,不如说是重学了一遍。学习KMP实际上就是学习了前缀函数。下文大抵把OI-Wiki上关于前缀函数和KMP的部分内容说了一下。前缀函数定义给定一字符串,对于它的每个前缀\(s[0,i-1]\),存在该子串的真前缀与真后缀相同,其中最大的一对前后缀的长度,记作:\[\lar
- 2024-11-08树莓派创建开机自启动任务
一、编写需要开机启动的后台任务毕竟为了醋才能包饺子嘛~简单写一个输出x.hello的demo用于测试后续的配置是否成功。importtime#文件路径file_path="/home/pi/Desktop/output.txt"#根据具体情况修改defwrite_hello():count=1try:whileTru
- 2024-11-07一道数分题
请证明:级数\(\sum_{n=1}^{\infty}\sin\frac{1}{n^p}\)仅当\(p>1\)时收敛。题解引理:若\(f\left(x\right)\simx^p\),则\(f\left(x+1\right)-f\left(x\right)\simx^{p-1}\)证:由牛顿二项式定理,当\(x\to\infty\)时\(\left(1+\frac{1}{x}\right)^{p-1}=\s
- 2024-11-07高等数学,但用我的话来说(三角学二三事)
高等数学,但用我的话来说(三角学二三事)目录目录高等数学,但用我的话来说(三角学二三事)目录论弧度和度,三角函数弧度和度三角函数扩展三角函数定义域四象限ASTC方法\([0,2\pi]\)以外的三角函数,周期启动三角函数的图像三角恒等式正余切串门记角的和与倍角公式论弧度和
- 2024-11-07高等数学,但用我的话来说(三角学二三事)
高等数学,但用我的话来说(三角学二三事)目录目录高等数学,但用我的话来说(三角学二三事)目录论弧度和度,三角函数弧度和度三角函数扩展三角函数定义域四象限ASTC方法\([0,2\pi]\)以外的三角函数,周期启动三角函数的图像三角恒等式正余切串门记角的和与倍角公式论弧度和
- 2024-11-07高等数学,但用我的话来说(三角学二三事)
高等数学,但用我的话来说(三角学二三事)目录目录高等数学,但用我的话来说(三角学二三事)目录论弧度和度,三角函数弧度和度三角函数扩展三角函数定义域四象限ASTC方法\([0,2\pi]\)以外的三角函数,周期启动三角函数的图像三角恒等式正余切串门记角的和与倍角公式论弧度和
- 2024-11-07文心一言 VS 讯飞星火 VS chatgpt (385)-- 算法导论24.5 5题
五、设G=(V,E)
- 2024-11-06正态分布
正态分布1标准正态分布1.1概率密度函数\[f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\]1.2累计分布函数\[F(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{t^2}{2}}dt\]2(一般)正态分布2.1概率密度函数\[f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{
- 2024-11-05高级宏定义
宏定义定义符号常量#define[]#undefPI约定为大写,编译器不检查宏定义,不加分号;类似sed流,带参数必须与宏名()紧密连接,否则是替换功能三大预处理功能之一的本质--机械替换不智能///C:宏定义定义符号常量#include<stdio.h>//宏定义替换所有PI#definePI3.14