EPSILON

2025-01-07强化学习在Atari游戏中的应用
强化学习在Atari游戏中的应用强化学习（ReinforcementLearning,RL）是一种通过与环境交互来学习策略的机器学习方法。在计算机科学领域，深度强化学习（DeepReinforcementLearning,DRL）结合了深度学习和强化学习的优点，使得算法能够处理高维度的问题，如图像数据。经典的DRL算法如
2025-01-06函数连续性误区
一元函数连续性定义的问题：遇到一道题，问题是：若函数$f$在$x=a$处连续，则在a的某个去心邻域内，$f(x)$连续，是否正确。这是一个乍一看好像正确的结论。函数在某点连续，则该点附近的函数值都与他相近，这些点连起来就连续了。但是，这个结论是错误的。重新回顾函数在某点连续的定义：
2025-01-05Training Deep Neural Networks with 8-bit Floating Point Numbers
目录概主要内容WangN.,ChoiJ.,BrandD.,ChenC.andGopalakrishnanK.Trainingdeepneuralnetworkswith8-bitfloatingpointnumbers.NeurIPS,2018.概本文提出了一种8-bit的训练方式.主要内容本文想要实现8-bit的训练,作者认为主要挑战是两个向量的
2024-12-24SUMO-RL环境
你提供的文件共同构建了一个基于SUMO（交通模拟平台）的交通信号控制模拟环境。以下是每个模块的主要功能和作用：1.Q学习智能体(ql_agent.py)这个文件实现了一个Q学习智能体类（QLAgent），它与SUMO环境交互。智能体使用Q表（Q-Table）进行决策，并根据状态、奖励和执行的动作动态更新策略。
2024-12-19python 悬臂梁的有限元分析
依赖包fenics是一种用于有限元计算的动态面向对象库，它提供了一种专用的数学语言UFL来表述变分形式，并自动生成底层C++代码。fenics名称释义：fe：finiteelement的简写cs：computationalsoftware的简写ni：有了fe和cs后，由于最初fenics软件是在芝加哥大学(简称为phoenix）编译的，故而在
2024-12-17守护数据隐私：构建基于差分隐私的MySQL安全共享机制
在当今数字化时代，随着互联网和大数据技术的发展，数据的价值愈发凸显。然而，随之而来的个人隐私泄露风险也日益增加，成为社会广泛关注的问题之一。特别是在医疗、金融等领域，如何既能充分利用海量数据资源推动行业发展，又能有效保护用户隐私不被侵犯，成为了亟待解决的重要课题。本
2024-12-06大学物理期末复习
电场1.公式静电力计算：库伦定律$\vec{F}=\dfrac{q_1q_2}{4\pi\epsilon_0r^2}\vec{e_r}$电场强度：$\vec{E}=\dfrac{\vec{F}}{q_0}=\dfrac{q}{4\pi\epsilon_0r^2}\vec{e_r}$电通量：$\Phi_e=\vec{E}\cdot\vec{S}$，规定穿出闭合曲面为正，穿入闭合曲面为负高斯定理：通过封
2024-12-04数列极限的证明方法（一）
这里写目录标题一、用定义证明极限1、ϵ−N\epsilon-N
2024-12-01降维方法主成分分析和因子分析
初次发布于我的个人文档。（每次都是个人文档优先发布哦）本文简要介绍一下主成分分析和因子分析的原理，但是不涉及具体代码实现。这是因为现在已经有很多现成的软件或库实现了这两个算法，读者只需要一两句简单的命令就可以使用了，所以没有必要在这里讲解。而且你可能会在PythonR
2024-11-29泛函和变分法
泛函和变分法本文主要记录研究中用到的与泛函和变分法相关的知识点，推导过程不会严谨考虑所有特殊情况，重在直觉理解。泛函（Functional）泛函数（Functional，简称泛函）$J$是以函数为自变量的函数，它将一个定义在某函数空间$Y$中的自变量函数映射到实数域$\mathcal{R}$或复数域
2024-11-27CS3231 Theory of Computation 错题集归档
埃癸斯(Aegis)虽然是高性能的反暗影压制兵装(Anti-ShadowSuppressionWeapon)，但她在逻辑推理方面并未得到特殊强化。在辰巳人工岛的月光馆学园插班入学后，埃癸斯常常感觉自己跟不上课程进度。埃癸斯尤其不擅的学科是计算理论(TheoryofComputation)；她认为，作为人工智慧的自己
2024-11-27CS3231 Theory of Computation 归档
计算理论(TheoryofComputation)当之无愧是计算机科学王冠上的明珠；考虑到我贫瘠的智商，以后估计不会朝TCS方向来走；但对这些优雅的理论有一个最基本的了解应当是CS学生的素养。讽刺的是，你坑近二十年前就没有开设这门课了[1]，只得留待交换来上。老师是印度人，口音很重，我听完整
2024-11-26[ECCV2024]GLAD Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for U
在工业异常检测任务中，引入并改进扩散模型，通过重建比较实现异常检测。Background异常检测（anomalydetection，AD）旨在检测和定位工业产品物体的异常模式，然而：在某些情况下，为所有异常类型收集足够的异常样本具有挑战性。由于产品设计和生产流程不断变化，不可能提前收集所有异常。
2024-11-25多臂老虎机（强化学习中的探索与利用）
文章目录一、多臂老虎机问题介绍1.1问题定义1.2形式化表述1.3累积懊悔1.4估计期望奖励二、探索与利用的平衡三、ϵ-贪心算法四、上置信界算法五、汤普森采样算法多臂老虎机问题，可以被看作简化版的强化学习问题。与强化学习不同，多臂老虎机不存在状态信息，只有
2024-11-24泛函和变分法
本文主要记录研究中用到的与泛函和变分法相关的知识点，推导过程不会严谨考虑所有特殊情况，重在直觉理解。泛函（Functional）泛函数（Functional，简称泛函）$J$是以函数为自变量的函数，它将一个定义在某函数空间$Y$中的自变量函数映射到实数域$\mathcal{R}$或复数域$\mathcal{C}$，即$
2024-12-11win7系统如何一键切换ip？轻松实现技巧分享
在Windows7系统中，有时我们需要根据实际需求或网络环境来更改IP地址。本文将简要介绍在windows7怎么切换IP的多种方法，其中包括便捷的一键切换技巧。方法一：通过控制面板手动切换IP1、打开网络和共享中心‌：点击电脑右下角的网络图标，选择“打开网络和共享中心”‌。‌2、选择
2024-12-08关于 YOLOv8 和 YOLOv11 的 Detect 的大坑问题 | 科研人一定注意
问题这篇文章写于2024年12月2日，主要讨论YOLO11的变化，以及这些变化对模型性能和兼容性的影响。首先，YOLO11已经发布了两个月，对于这次更新的主要改动，我不再赘述。概括来说，新加入了两个模块：C3k2和C2PSA。此外，还有一个容易被忽略的变化，就是Detect模块的更新。这个改动
2024-12-01node.js毕设乐昌教育局信息管理系统程序+论文
本系统（程序+源码+数据库+调试部署+开发环境）带文档lw万字以上，文末可获取源码系统程序文件列表开题报告内容一、选题背景在当今数字化时代，信息管理系统在各个领域都发挥着至关重要的作用。在教育领域，信息管理系统有助于提高教育管理的效率和质量。关于教育局信息管理系统的
2024-11-24树的遍历顺序及其应用
树的遍历顺序及其应用一、DFS序DFS序就是以DFS的方式，记录每一个节点第一次被访问的顺序，这种顺序形成一个形成一个长度为$n$的序列。主要被用来维护子树信息。有以下特点：对于任意一个点来说，其子树里所有点的DFS序是连续的，具体来讲，$x$的子树的所有结点的DFS序