问题:
在强化学习算法性能测试时使用训练好的模型运行游戏,此时如何控制实时游戏画面的帧数?
========================================
看到很多训练好的模型与游戏交互时控制游戏画面帧数的方法,但一直也没有一个让我比较满意的方法,最近看代码发现了一种还不错的方法,这里记录一下。
代码:
FPS = 60
total_reward = 0.0
obs = env.reset()
while True:
start_ts = time.time()
if args.vis:
env.render()
action = agent.play(obs)
obs, reward, is_done, info = env.step(action)
total_reward += reward
if done:
break
if args.vis:
delta = 1/FPS - (time.time() - start_ts)
if delta > 0:
time.sleep(delta)
这种控制游戏实时帧数的方法,其实就是计算预先设定的每帧画面间隔时间与实时运行时每帧画面间隔时间的差距,如果此时的实时游戏交互速度要快于预设的速度,那么就会根据计算出的间隔时间差距进行sleep睡眠操作,从而使实时游戏速度达到预期。但是如果游戏实时速度慢于预设速度,该方法没有任何作用,也就是说上面代码只可以对实时游戏进行减速而不能加速。
================================================
标签:游戏,实时,画面,算法,time,reward,obs From: https://blog.51cto.com/u_15642578/5729296