SAC
  • 2024-10-10一个连续动作空间的SAC的例子
    """MySACcontinuousdemo"""importargparseimportcopyimportgymimportnumpyasnpimporttorchimporttorch.nn.functionalasFfromtorchimportnnfromtorch.distributionsimportNormaldefparse_args()->argpar
  • 2024-04-07强化学习算法性能表现
    各算法在不同环境中的表现:来自天寿基准测试https://tianshou.org/en/stable/01_tutorials/06_benchmark.html1.HalfCheetah-v3SAC>DDPG>TD3>PPO>TRPO>NPG>ACKTR>A2C>REINFORCE2.蚂蚁v3SAC>TD3>A2C>PPO>
  • 2024-03-30SAC-IA+ICP配准
             SAC-IA(SampleConsensusInitialAlignment)和ICP(IterativeClosestPoint)是点云配准中常用的两个算法,可以使用 SAC-IA进行粗配准结合ICP进行精配准。1.核心思想SAC-IA:作用:SAC-IA用于粗配准,估计两个点云之间的初始变换矩阵。流程:随机选择源点云中
  • 2024-03-30RANSAC(提取FPFH特征)+ICP配准
            RANSAC(RandomSampleConsensus)和ICP(IterativeClosestPoint)是点云配准中常用的两个算法,可以使用RANSAC进行粗配准结合ICP进行精配准。1.FPFH特征FPFH特征:定义:FPFH是一种点云特征描述子,用于表示点云中每个点的局部特征。计算过程:对于每个点,计算其法
  • 2023-08-12Striving for Simplicity and Performance in Off-Policy DRL: Output Normalization and Non-Uniform Samp
    发表时间:2020(ICML2020)文章要点:这篇文章基于SAC做简单并且有效的改进来提升效果。作者首先认为SAC里面的entropy是为了解决actionsaturationduetotheboundednatureoftheactionspaces,这个意思就是说动作空间假如约束到[0-1],动作通常会在0和1两个端点处,而加了entropy可
  • 2022-12-15强化学习调参技巧二:DDPG、TD3、SAC算法为例:
    1.训练环境如何正确编写强化学习里的env.reset()env.step()就是训练环境。其编写流程如下:1.1初始阶段:先写一个简化版的训练环境。把任务难度降到最低,确保一定能正常
  • 2022-11-20 强化学习代码实战-09 SAC 算法
    离线学习算法:A3C,PPO,TRPO在线学习算法:DDPG,训练不稳定,容易陷入局部最优SAC:离线策略,随机策略,最大化累积奖励的同时最大化策略的熵(更好地探索环境,熵值越高,策略越随机,目
  • 2022-10-07递归特征金字塔+可切换空洞卷积提升目标检测性能(附框架源码)
    “计算机视觉研究院”计算机视觉研究院专栏作者:Edison_G许多现代的目标检测器通过两次look和think的机制表现出优异的性能。 今天分享的是在目标检测的主干设计中探讨了这