首页 > 编程语言 >强化学习算法性能表现

强化学习算法性能表现

时间:2024-04-07 16:15:28浏览次数:30  
标签:TRPO SAC 性能 PPO 算法 v3 TD3 强化 DDPG

各算法在不同环境中的表现:
来自天寿基准测试 https://tianshou.org/en/stable/01_tutorials/06_benchmark.html
1. HalfCheetah-v3 SAC > DDPG > TD3 > PPO > TRPO > NPG > ACKTR > A2C > REINFORCE
2. 蚂蚁v3 SAC > TD3 > A2C > PPO > TRPO > NPG > ACKTR > REINFORCE > DDPG
3. Hopper v3 SAC > TD3 > PPO > DDPG > NPG > ACKTR > REINFORCE
4. Humanoid v3 SAC > TD3 > A2C
5. 倒立双摆v2 DDPG > SAC > PPO > TRPO
6. Reacher v2 SAC > TD3 > DDPG > PPO > TRPO > A2C > NPG > REINFORCE
7. Swimmer v3 DDPG > ACKTR > TD3 > PPO > TRPO > NPG
8. Walker2d-v3 SAC > PPO > TD3 > TRPO > NPG > DDPG > ACKTR

标签:TRPO,SAC,性能,PPO,算法,v3,TD3,强化,DDPG
From: https://www.cnblogs.com/ai-ldj/p/18119239

相关文章

  • 人工智能,应该如何测试?(三)数据构造与性能测试篇
    前言人工智能场景中的性能测试与我们在互联网中创建到的有很大的不同,因为它需要模拟更复杂的情况。当然它也有相似的地方,只不过今天我们主要介绍它们不同的地方。产品分类首先我们需要澄清一下,从AI产品的类型来划分的话,我们可以分成两个大的类别:人工智能的业务类产品:AI就......
  • NodeJs进阶开发、性能优化指南
    相信对于前端同学而言,我们去开发一个自己的简单后端程序可以借助很多的nodeJs的框架去进行快速搭建,但是从前端面向后端之后,我们会在很多方面会稍显的有些陌生,比如性能分析,性能测试,内存管理,内存查看,使用C++插件,子进程,多线程,Cluster模块,进程守护管理等等NodeJs后端的知识,在这里为大......
  • jmeter压力测试性能场景
    +压力测试场景  +压力测试:长时间    +29\*20%  =6    +29\*80% =24    +时间      +普通线程组      +阶梯线程组 ......
  • 大模型存储实践:性能、成本与多云
    大模型应用领域的迅猛发展,也推动着基础技术领域持续探索和进步。文件存储服务在AI基础设施中成为不可或缺的重要部分。在过去18个月的时间里,JuiceFS 团队与MiniMax,阶跃星辰,智谱AI,面壁智能,零一万物等大模型团队展开了交流与合作,已经支持了多家客户生产环境中数千卡的训练任......
  • 因为算法不同,客户端与服务器无法通信。”的解决方法
    因为算法不同,客户端与服务器无法通信。”的解决方法sqlserver客户端远程sqlserver服务器 或是mstsc 最后根据微软文档的说明,改动注册表就成功了:传输层安全性(TLS)注册表设置|MicrosoftDocs在注册表编辑器,找到以下注册表项/文件夹:HKEY_LOCAL_MACHINE\SYSTEM\Curren......
  • Python算法学
    Python算法学习平台有很多,它们提供了丰富的资源和工具,帮助学习者从基础到高级的算法知识。以下是一些流行的Python算法学习平台:1.**LeetCode**:-网址:[https://leetcode.com/](https://leetcode.com/)-特点:LeetCode是一个非常受欢迎的在线编程平台,提供了大量的编程挑战,主......
  • CS202 WeensyOS 内存分配算法
    CS202:实验室4:WeensyOSCS202:实验室4:WeensyOS介绍在这个实验室中,您将在一个(但却是真实的!)操作系统,名为WeensyOS。这将向您介绍虚拟内存,并强化我们已经介绍过的一些概念学期WeensyOS内核在x86-64CPU上运行。因为操作系统内核运行在“裸”硬件上,所以调试内核代码可能很难:如果一个......
  • 常见的排序算法——插入排序
    本文记述了插入排序的基本思想和一份参考实现代码,并在说明了算法的性能后用实验进行了验证。◆思想将第一个元素之后的所有元素作为待排序范围,将前面的所有元素作为已排序范围。通过一一比较,逐个交换已排序范围内比第二个元素大的所有元素,使第二个元素被插入到了正确的位置。然......
  • ACTL5105人工智能算法
    ACTL5105分配到期时间:2024年4月15日星期日下午5点这是一项个人课业。总分为100分,占总分的20%球场标记。工作分配任务作为一名人寿精算师,你的任务是完成以下两项任务。任务I(25分)创建列出Ax、¨Ax、,2Ax、(IA)x和(IA¨)x假设excel文件“A-population-2020”中人群的年利率为5%。(说明:您......
  • 18天【代码随想录算法训练营34期】● 513.找树左下角的值 ● 112. 路径总和 113.路径
    513.找树左下角的值#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:deffindBottomLeftValue(self......