问题建模

异构多智能体战场决策

所有智能体之间在无直接通讯的情况下完全独立决策，分别由不同的程序控制并可以运行在不同的主机上

POSG模型给了我们一个更好的理解不确定环境下多智能体规划问题的途径，但在这里问题的规模是最大的挑战。最基本的做法是采用分层设计的思想(Stone P, 1998)，将整个规划框架分为三层处理。

战场感知问题

对于初步环境，采取完全信息，即敌我信息完全可观测，这时状态空间为双方所有agent的编号、方位、武器。

对于进阶环境，采取不完全信息，即可观测信息为雷达照射区域，雷达照射区域下方可获取对方agent的编号、方位、武器信息。对于敌方三维信息可采取降维模糊化的手段，方便训练。

感知算法设计1

如图所示，当视野中player 距离在team_ far_length内，其身份可识别;

距离在team_ far_ length与team_too_far_ length之间时，身份呈概率可见，概率随着距离的增加而降低

另外，智能体还存在一个对物体的感知距离，见图中的visible distance 内的圆形区域。

对于不在视角内但在这个感知距离内的物体，智能体可以获得其位置信息及物体类型信息

上述部分可观察的机制为世界模型的维护与更新带来了两点问题:

第一,场上可视范围之外的球员无法观察到,这样的情况下无法对其位置速度等信息进行直接同步;

第二，即使处于可视范围内被观察到的球员，智能体仍有可能无法获知其装备类型，为了做同步更新还需要先进行身份确认。

针对第-一个问题的处理方法是给每个物体的状态参量都加入了一个置信度(conf),参量被更新时置信度重置为1.0。任何周期，当参量没有得到更新时，将对置信度做指数衰减，乘以一个conf_ decay。比如球的conf decay设为0.96,球员的conf_ decay设为0.99.

而针对第二个问题，由于实时决策过程能够分配给底层更新的计算时间非常有限。

雷达感知建模

行为设计问题

切依靠智能体自主决策，从模型给出的原子动作开始，直接去规划出进攻或者防守的策略是不切实际的。

在决策算法的设计中，很自然的引入了中间层的设计。在我们的实现框架中间层又叫做战略层和战术层，是抽象意义的战略行为，典型的比如有结合人类经验抽象出来的迂回、包夹等。

决策行为描述

将指挥决策分解为战役决策和战术决策，按照其层级关系对状态空间和动作空间进行分割。

战役决策针对全局作战态势信息（敌我作战资源伤亡情况、主要打击目标等）下达宏观作战指令，例如，导弹打击、逃避机动、追逐机动、迂回机动、指定未知空域侦察机动等。

战术决策对执行宏观作战指令的作战编组下达微观作战动作，例如，当战役决策层下达“导弹打击”的动作到战术决策层时，战役决策层以歼灭敌方飞机为目标，根据交战双方作战单位数量、阵型等局部作战态势信息，对下属作战单元下达攻击、机动规避等微观作战动作，其他战术决策与此类似。

分层结构

定义 \(BP\) 为战役决策、 \(bp\)为战术决策，为战役策略，定义的状态空间、动作空间、反馈奖励为、、，用代表在战术决策池内的个战术策略，定义的状态空间、动作空间、反馈奖励为、、。

在时刻，获取全局战场态势信息，基于此时的态势选取：

假设在时刻，根据局部态势信息选取战术动作。当其选取的战术指令执行完成后，获得反馈奖励为和其下一个态势信息，同时获得信息序列存储到回放缓存中为训练做准备。

战役策略根据选取的战术策略：反馈信息计算所选取作战指令所获取的反馈奖励：

同样，战役策略得到它的下一个状态和信息序列，存储到回放缓存中。此时刻为，将会根据此时的状态信息进行下一次的战术策略选取。

导弹命中问题

标签：战术,动作,建模,作战,决策,问题,战役,信息
From： https://www.cnblogs.com/zuti666/p/18092794

习题4-11 兔子繁衍问题
探索--题目集索引一对兔子，从出生后第3个月起每个月都生一对兔子。小兔子长到第3个月后每个月又生一对兔子。假如兔子都不死，请问第1个月出生的一对兔子，至少需要繁衍到第几个月时兔子总数才可以达到N对？输入格式:输入在一行中给出一个不超过10000的正整数N。输出格式:在一行......
基础优化核心思路：覆盖问题分析思路(RSRP)
一、通过采样点明确问题分布看红色和黄色覆盖较差的区域。二、明确红色和黄色明确问题点点主服务小区。2.1、该主服务器小区与问题点距离过大导致路径传播损耗严重：1、判断标准：问题点与主服务小区距离大于600米、2、临时优化方案：暂用该小区主覆盖3、最终优化方案：选取更适......
数学建模（线性规划 python代码两种)
线性规划：线性规划（LinearProgramming，LP）是一种数学优化方法，用于解决一类特定类型的最优化问题。该问题的目标是在给定的一组线性约束条件下，找到使某个线性目标函数达到最大或最小的变量值。线性规划问题可以表示为以下标准形式：最小化（或最大化）：Z=c^T*x约束条件：Ax<=b,......
ForkJoinPool在生产环境中使用遇到的一个问题
1、背景在我们的项目中有这么一个场景，需要消费kafka中的消息，并生成对应的工单数据。早些时候程序运行的好好的，但是有一天，我们升级了容器的配置，结果导致部分消息无法消费。而消费者的代码是使用CompletableFuture.runAsync(()->{while(true){.....}})来实现的。即：需要消......
解决长尾问题，BEV-CLIP：自动驾驶中复杂场景的多模态BEV检索方法
解决长尾问题，BEV-CLIP：自动驾驶中复杂场景的多模态BEV检索方法理想汽车的工作，原文，BEV-CLIP:Multi-modalBEVRetrievalMethodologyforComplexSceneinAutonomousDriving链接：https://arxiv.org/pdf/2401.01065.pdf自动驾驶中对复杂场景数据的检索需求正在增加，尤其是随着......
解决主流办法没能HttpMediaTypeNotAcceptableException: No acceptable representatio
问题描述：写web项目时遇到一些小问题，前端请求后端死活报406错误问题，一些网络上主流的方法试过之后仍然无法解决问题。问题分析： @RestController会在返回结果时直接返回对象，再由Spring将对象转为json，如果结果对象没有get方法，就会报以上错误......
数学建模常用代码
一维插值步骤步骤：（1）输入已知数据，x,y（2）输入待插自变量的值x1代码：x=1:12;y=[589152529313022252724];x1=1:0.1:12;t=interp1(x,y,x1,'spline');% plot(x1,t,'r:') %作图xlabel('x'),ylabel('y')二维插值步骤步骤：（1）先输入二维数据的x,y坐标值（2）输入Z......
【阻抗建模、验证扫频法】光伏并网逆变器扫频与稳定性分析(包含锁相环电流环)（Simulink
......
补充--关于nginx服务器多个网站如何设置404的问题？
补充--关于nginx服务器多个网站如何设置404的问题？需求1：设置多个网站404页面为一个都需配置网站的nginx.conf,以上面的多网站为例，404发布目录下，每个的nginx.conf1.知道每个网站的（nginx.conf）配置路径www.it.com/usr/local/nginx/conf/nginx.confbbs.it.com/usr/loc......
raft算法和etcd代码解析-3.网络分区问题及其它
网络分区问题网络分区导致选举永远无法达成共识，选举不断超时，任期号将不断增加为避免这个问题，candidate会探测网络环境以免发起无意义的竞选集群变更leader收到配置变更要求，会广播配置变更日志，日志包括新结点和老节点，在收到老节点的多数派认可后，leader后提交该请求在处理配置......

问题建模

问题建模

战场感知问题

感知算法设计1

雷达感知建模

行为设计问题

决策行为描述

分层结构

导弹命中问题

相关文章

赞助商

阅读排行