2024-11-29Online Anomalous Subtrajectory Detection onRoad Networks with Deep Reinforcement Learning (二)该代码采用计算图的方式进行计算编码RSRNetdetermine做奖励的计算reward=explore(model,observations,labels,text,SRN,batched_data)策略优化ASDNet中explore做的动作就是在做预测,并会记录这里的值用作后面的计算是的,你理解得对。ep_as存储的动作实际上就是