• 2024-11-20PbRL | Christiano 2017 年的开山之作,以及 Preference PPO / PrefPPO
    PrefPPO首次(?)出现在PEBBLE,作为pebble的一个baseline,是用PPO复现Christianoetal.(2017)的PbRL算法。Forevaluation,wecomparetoChristianoetal.(2017),whichisthecurrentstate-of-the-artapproachusingthesametypeoffeedback.Theprimarydif
  • 2024-11-17习题7.10(3)
    1.代码实现点击查看代码importnumpyasnpimportpylabaspltfromscipy.optimizeimportcurve_fit#原始数据点x0=np.array([-2,-1.7,-1.4,-1.1,-0.8,-0.5,-0.2,0.1,0.4,0.7,1,1.3,1.6,1.9,2.2,2.5,2.8,3.1,3.4,3.7,4,4.3,4.6,4.9])y0=np.
  • 2024-11-16PCA 原理推导
    针对高维数据的降维问题,PCA的基本思路如下:首先将需要降维的数据的各个变量标准化(规范化)为均值为0,方差为1的数据集,然后对标准化后的数据进行正交变换,将原来的数据转换为若干个线性无关向量表示的新数据:这些新向量表示的数据不仅要求相互线性无关,而且需要所包含的信息量最
  • 2024-11-13AtCoder Beginner Contest 353 - VP 记录
    Preface这次比赛蛮简单的,就是黄题有点多,少了区分度。而且SigmaProblemAnotherSigmaProblemYetAnotherSigmaProblem是什么奇妙的题目名称?SigmaProblemAnotherSigmaProblemYetAnotherSigmaProblem\(\texttt{\scriptsizeYet\footnotesizeA
  • 2024-11-11sigma有限的预测度的扩张是唯一的
    [T241109]若\(\mu\)是代数\(\mathscrF_0\)上的\(\sigma-\)有限的预测度,则\(\mu\)的扩张是唯一的.Proof:设\(\mu\)的Carathéodory扩张还用\(\mu\)表示,任取\(\mu\)的一个扩张\(\mu'\),只需证明\(\mu\)和\(\mu'\)在\(\mathscrF=\sigma(\mathsc
  • 2024-11-0711.06
    发现自己对于一些不用动脑子的数据结构题还是有微弱的冲击力的。A.BZOJ3722为什么想不到????????????????????????先不考虑\(0\)跑一遍,每个非叶结点取其子结点中\(-1,-2\)的众数,若相等则为\(0\)。此时若根节点为\(-1\),那么其有偶数个值为\(0\)的儿子,对于每个\(0\)第一个对它子树中为\(0\)
  • 2024-11-06正态分布
    正态分布1标准正态分布1.1概率密度函数\[f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\]1.2累计分布函数\[F(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{t^2}{2}}dt\]2(一般)正态分布2.1概率密度函数\[f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{
  • 2024-11-012 The Statistics of Price Changes
    金融市场的RandomWalkModel以及stylizedfacts.阅读Trades,QuotesandPrices的第二章。数学,统计学,机器学习,人们总是用各种各样的办法研究金融市场。OriginallyPostedat:https://clouder0.com/zh-cn/posts/price-change-statistics/TheRandomWalkModel一个相当
  • 2024-10-26流体力学Euler方程(笛卡尔坐标、柱坐标、球坐标)
    \[\begin{align}&\frac{\partial\rho}{\partialt}+\left[\frac{\partial\left(\rho{{v}_{1}}\right)}{\partial{{x}_{1}}}+\frac{\partial\left(\rho{{v}_{2}}\right)}{\partial{{x}_{2}}}+\frac{\partial\left(\rho{{v}_{3}
  • 2024-10-23CogVideo---CogVideoX-微调代码源码解析-十-
    CogVideo&CogVideoX微调代码源码解析(十).\cogvideo-finetune\sat\sgm\modules\diffusionmodules\sampling.py#部分移植自https://github.com/crowsonkb/k-diffusion/blob/master/k_diffusion/sampling.py"""#从类型提示模块导入字典和联合类型fromtypingimportDict
  • 2024-10-23CogVideo---CogVideoX-微调代码源码解析-八-
    CogVideo&CogVideoX微调代码源码解析(八).\cogvideo-finetune\sat\sgm\modules\autoencoding\vqvae\movq_enc_3d.py#pytorch_diffusion+derivedencoderdecoderimportmath#导入数学库,提供数学函数importtorch#导入PyTorch库,用于深度学习importtorch.nnasnn
  • 2024-10-23CogView3---CogView-3Plus-微调代码源码解析-三-
    CogView3&CogView-3Plus微调代码源码解析(三).\cogview3-finetune\sat\sgm\modules\diffusionmodules\guiders.py#导入logging模块,用于记录日志信息importlogging#从abc模块导入ABC类和abstractmethod装饰器,用于定义抽象基类和抽象方法fromabcimportABC,abst
  • 2024-10-23CogView3---CogView-3Plus-微调代码源码解析-二-
    CogView3&CogView-3Plus微调代码源码解析(二).\cogview3-finetune\sat\sgm\models\__init__.py#从同一模块导入AutoencodingEngine类,用于后续的自动编码器操作from.autoencoderimportAutoencodingEngine#注释文本(可能是无关信息或标识符)#XuDwndGaCFo.\cogview3-fi
  • 2024-10-21《微分几何讲义(陈省身)》读书笔记 第二章 多重线性代数
    第二章多重线性代数Note:本文默认了基本的向量空间和矩阵的相关知识。本文中所有的向量空间默认是有限维的,且定义在一个域\(\mathbb{F}\)上。本文采用Einstein求和约定。§1张量积[Def1.1]对于向量空间\(V_1,\cdots,V_r\)和\(Z\),若映射\(f:V_1\times\cdots\timesV
  • 2024-10-21RBFN
    下面我们详细讲解这个实现径向基函数神经网络(RBFN)的代码,并结合数学公式来说明每个部分的作用。一、RBFN简介径向基函数神经网络(RBFN)是一种前馈神经网络,通常包含三层:输入层:直接将输入数据传递到隐藏层。隐藏层:由一组径向基函数组成,每个函数都有一个中心(centers)和宽度(sigma)。
  • 2024-10-21蒙特卡洛:数学建模中的“幸运之星”!
    让我们来聊聊蒙特卡洛:数学建模中的“幸运之星”!引言在数学建模的神秘世界中,蒙特卡洛模拟犹如一道闪亮的星星,指引着我们在复杂数据的海洋中寻找解决方案。今天,我们将深入探讨蒙特卡洛方法的奇妙之处,穿插一些幽默的例子和MATLAB代码,以便让你在学习的过程中捧腹大笑。准备好
  • 2024-10-17卡尔曼滤波
    目录系统状态与测量观测1.系统方程2.过程噪声3.观测向量4.测量噪声参考文献系统状态与测量观测1.系统方程线性离散系统的状态方程(带噪声)\[x_{[k]}=Ax_{[k-1]}+Bu_{[k-1]}+w_{[k-1]}\\\]\(x_{[k]}\)为为\(n\times1\)​状态向量,A为\(n\timesn\)状态矩阵,$u_{[k-1]}$为
  • 2024-10-10Ewald求和在分子静电势能计算中的应用
    技术背景分子动力学模拟中,计算周期性边界条件的静电势常被视作计算的瓶颈之一。形式上是比较容易的,例如不考虑周期性边界条件的话,静电势能就是:\[E=\frac{1}{4\pi\epsilon_0}\sum_{i=0}^{N-2}\sum_{j=i+1}^{N-1}\frac{q_iq_j}{r_{ij}}\]如果考虑周期性边界条件,那么静电势能变为:
  • 2024-10-10Diffusion系列 - DDIM 公式推导 + 代码 -(三)
    DENOISINGDIFFUSIONIMPLICITMODELS(DDIM)从DDPM中我们知道,其扩散过程(前向过程、或加噪过程)被定义为一个马尔可夫过程,其去噪过程(也有叫逆向过程)也是一个马尔可夫过程。对马尔可夫假设的依赖,导致重建每一步都需要依赖上一步的状态,所以推理需要较多的步长。\[q(x_t|x_{t-1}
  • 2024-10-09塑性力学 主要公式
    塑性力学是固体力学的一个重要分支,它研究材料在超过弹性极限后的行为。以下是一些塑性力学中的主要公式及其推导:1.屈服准则VonMises屈服准则用于金属材料的屈服准则,假设材料在等效应力达到某个临界值时开始发生塑性变形。\[\[\sigma_{eq}=\sqrt{\frac{1}{2}\left(\si
  • 2024-10-07统计学(十三)——相关分析
    相关分析是用于研究多个变量之间相互关系的统计方法,最早由英国统计学家卡尔·皮尔逊(KarlPearson)于1896年提出。皮尔逊通过对变量间线性关系的深入研究,提出了“皮尔逊相关系数”(PearsonCorrelationCoefficient),标志着相关分析方法的诞生。随着统计学的发展,相关分析逐渐扩展,形成
  • 2024-10-07abc371E I Hate Sigma Problems
    给定长度为N的数组A[i],记f(l,r)表示区间[l,r]内不同A[i]的个数,求所有子区间f(i,j)之和。1<=N<=2E5,1<=A[i]<=N分析:贡献法,为了方便统计,区间中重复的数字以最左边出现的数为准,保证不重不漏。对于A[i],假设其上一次出现的位置为p,那么包含该数字的左端点可以是p+1,p+2,...,i,右端点可
  • 2024-10-06扩散模型中的后验分布方差推导
    扩散模型(DiffusionModels)中的后验分布通常涉及对潜在变量的条件分布进行推导。以下是推导扩散模型中后验分布方差的详细步骤。我们假设扩散过程是逐步添加噪声的过程,每一步根据高斯分布进行采样。扩散模型基于概率扩散过程,它将数据从原始分布逐步转换为噪声分布,然后再通过逆向过
  • 2024-10-03CF1246F
    考虑怎么较容易地表示\(\operatorname{dist}(u,v)\)。注意到对于每个点\(v\),\(\leq1\)步能到\(v\)的点形成一段区间,记为\([l_v,r_v]\)。考虑枚举终点\(x\)和最短路长度\(d\),动态维护所有\(\operatorname{dist}(u,v)\leqd\)的所有点\(u\),这些\(u\)显然也是一段区间