Deep Q Network

时间：2022-10-13 20:33:35浏览次数：78

标签：target Deep state replay memory action Network

DQN论文简介

两篇内容大致相同，可直接看第二篇，更详细

DQN 神经网络部分模型结构

整体结构

伪代码

代码解释

初始化 replay memory D 和它的大小 N
初始化 Q 函数和Policy Network神经网络参数（权重等）
初始化target network神经网络参数
for episode 一个回合 1-->M
预处理数据得到input S (state
for t (每一步step) 1-->T
epsilon-greedy 选择action
执行action 获得reward和 image
S(t+1)=St，at,X(t+1)
预处理image获得next state
将（state，action，reward，next state）存到replay memory
从replay memory均匀随机抽取一批数据minibatch作为input
计算loss即target network和policy netword的Q value
用梯度下降降低loss
每走 c 步，将policy的参数赋值给target
end for
end for

参考文献
https://www.bilibili.com/video/BV1Rq4y1b7ML/?spm_id_from=333.788&vd_source=0f3a9415c74e72ceb8d082a6f619e420

标签：target,Deep,state,replay,memory,action,Network
From： https://www.cnblogs.com/mario24678/p/16789551.html

BOOST::ASIO Network programming
#include<boost/asio/io_service.hpp>#include<boost/asio/write.hpp>#include<boost/asio/buffer.hpp>#include<boost/asio/ip/tcp.hpp>#include<array>#inclu......
03 Quorum Queues Internals - A Deep Dive
标题：QuorumQueuesInternals-ADeepDive原文：https://www.cloudamqp.com/blog/quorum-queues-internals-a-deep-dive.html时间：2019-04-03在本文中，我们将更详细地了解......
Multi-view Denoising Graph Auto-Encoders on Heterogeneous Information Networks f
动机本文是2021年KDD上的一篇文章。最近有不少工作利用异构图去解决推荐系统冷启动问题，但是这些方法都忽略了在冷启动场景下训练和推理的差异。针对以上问题，本文提出了MvD......
【DL4J速成】Deeplearning4j图像分类从模型自定义到测试
文章首发于微信公众号《有三AI》欢迎来到专栏《2小时玩转开源框架系列》，这是我们第九篇，前面已经说过了caffe，tensorflow，pytorch，mxnet，keras，paddlepaddle，cntk，chainer。今天说......
BAPI_NETWORK_COMP_REMOVE 物料组件删除
物料组件删除BAPI：BAPI_NETWORK_COMP_REMOVE首先调用BAPI_NETWORK_COMP_GETDETAIL获取明细,得到物料组件唯一编号：component只需要将物料组件......
读论文《IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Lear
论文地址：https://arxiv.org/pdf/1802.01561v2.pdf 论文《IMPALA:ScalableDistributedDeep-RLwithImportanceWeightedActor-LearnerArchitectures》是基......
Visualizing Deep Neural Network Decisions: Prediction Difference Analysis
目录概本文方法代码ZintgrafL.M.,CohenT.S.,AdelT.andWellingM.Visualizingdeepneuralnetworkdecisions:predictiondifferenceanalysis.InInternati......
GNNExplainer: Generating Explanations for Graph Neural Networks
目录概符号说明本文方法代码YingR.,BourgeoisD.,YouJ.,ZitnikM.andLeskovecJ.GNNExplainer:generatingexplanationsforgraphneuralnetworks.InAdvanc......
Deepin操作系统虚拟机玩3D
1.下载VMwarePlayer下载地址：[VMwareWorkstation16.2.4PlayerforLinux64-bit](https://customerconnect.vmware.com/en/downloads/details?downloadGroup=WKST-PLA......
leet Code 977. Squares of a Sorted Array_network
[977.SquaresofaSortedArray][(https://leetcode.cn/problems/squares-of-a-sorted-array/)暴力解法对数组中每个元素平方后再排序代码如下：classSolution......

Deep Q Network

相关文章

赞助商

阅读排行