【个人感想】关于E2E决策

时间：2023-11-10 18:35:02浏览次数：36

标签：轨迹感想决策网络 E2E 算法目标优化

这是horizon做的，nuplan第二，https://arxiv.org/pdf/2306.15700.pdf

感觉从UNIAD开始提端到端的都开始玩赖了，网络规划结果只作为优化初始解，然后接个利用感知结果做优化的planning

优化的planning是在线跑的时候才用，训的时候不用，也不能用因为用了的话就梯度消失了，uniad也一样的

E2E现在说是决策导向，但抽出来看他们做的跟决策相关的事情其实是接了一个head输出模仿人类的轨迹，然后在线跑的时候加个优化器把感知的显式结果用上来一套规则决策

如果结果很好的话，我的评价是优化算法设计的不错，因为head扔出来的轨迹质量可以很差，而且我用任何IL/RL算法甚至硬用规则采样也能实现同样的结果，不需要他的head给的优化初始解

本质上他还是模仿学习，让初始优化轨迹像人类轨迹。

但是，决策本质是一个优化问题，我们尝试让网络学会这个优化问题的解法。

比如目标是避免碰撞，那么网络应该通过数据的学习，学会不去执行碰撞动作，我们需要网络生成的轨迹符合我们优化问题的目标。

这些方法里面，网络训练的目标是，输出轨迹像人类轨迹。

然而，最优的决策结果像人类轨迹是充分不必要条件，最优决策结果看起来会很像人类开的，但人类开的轨迹就不是最优轨迹，更不用提模仿学习去拟合真值带来的误差，以及本来就不存在真值。

优化问题被单独拎出来，在在线决策的阶段使用来达成最优决策目标，这违背了用网络做决策的初衷，相当于网络没有学会我们优化的目标，把这个大问题大目标直接规避掉了。

换句话说，我原先用优化算法实现目标A，发现不太行，于是寄希望于用网络来实现目标A，

然而现在的方案是，用网络实现目标B，然后再接一个目标为A的优化算法来修正我的解，使其达到目标A，那网络的意义是？网络根本也没有学会如何达成A目标

退一步讲，即使是这个也结构，也应该是用目标A去训练网络，只是在实际跑的过程中给我

我确实承认这是一套行之有效的方案，也很认可在实际应用中在网络后面接一个优化算法来兜底。

但是如果说这个算是决策领域的创新的话，我个人认为有点偷梁换柱，移花接木

标签：轨迹,感想,决策,网络,E2E,算法,目标,优化
From： https://www.cnblogs.com/Zer0-Chambers/p/17824782.html

PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SV
全文下载链接：http://tecdat.cn/?p=26219最近我们被客户要求撰写关于银行机器学习的研究报告，包括一些图形和统计输出。该数据与银行机构的直接营销活动相关，营销活动基于电话。通常，需要与同一客户的多个联系人联系，以便访问产品（银行定期存款）是否会（“是”）或不会（“否”）订阅银行数据......
Matlab决策树、模糊C-均值聚类算法分析大学教师职称学历评分可视化
全文链接：https://tecdat.cn/?p=34203原文出处：拓端数据部落公众号本文使用Matlab编程语言中的决策树和模糊C-均值聚类算法，帮助客户对大学教师职称、学历与评分之间的关系进行深入分析。背景随着高等教育的快速发展，教师队伍的素质和能力成为了影响高校发展的重要因素。职称和学......
sklearn-决策树
目录决策树算法关键特征维度&判别条件决策树算法：选择决策条件纯度的概念信息增益增益率：基尼指数：纯度度量方法1)纯度函数%20%E7%BA%AF%E5%BA%A6%E5%87%BD%E6%95%B0)2)纯度度量函数%20%E7%BA%AF%E5%BA%A6%E5%BA%A6%E9%87%8F%E5%87%BD%E6%95%B0)编辑决策树算法关键了解了“if-else”......
决策树算法原理
目录决策树算法关键特征维度&判别条件决策树算法：选择决策条件纯度的概念信息增益增益率：基尼指数：纯度度量方法1)纯度函数%20%E7%BA%AF%E5%BA%A6%E5%87%BD%E6%95%B0)2)纯度度量函数%20%E7%BA%AF%E5%BA%A6%E5%BA%A6%E9%87%8F%E5%87%BD%E6%95%B0)编辑决策树算法关键了解了“if-else”......
近日感想，未来的思考
1.前段时间一直在跟建民老师做排产相关的工作，昨天跟建民老师实地去了博欧金属企业实地探访探讨了排产系统。对于工业企业的数字化更是了解了数字化的威力。当我知道他靠这套系统盈利翻倍了挣了很多钱，信息化的力量就是如此吧。我感觉技术带来的革新，和未来的风口就是企业的数字化，......
【学习笔记】决策单调性与四边形不等式
Itst-决策单调性与四边形不等式学习笔记。这方面是真的一点不会啊。学点东西吧apj。约定对于\(n\timesm\)的矩阵\(A\)，定义：子矩阵\(A_{[i_1,i_2,\cdots,i_k],[j_1,j_2,\cdots,j_l]}\)为矩阵\(A\)中第\(i_1,i_2,\cdots,i_k\)行和第\(j_1,j_2,\cdots......
大模型训练中Loss出现NaN的解决策略
在深度学习中，模型训练时的loss值通常是评估模型性能的重要指标。然而，有时候在训练过程中，loss值可能会出现nan，这可能会导致训练中断或者模型性能下降。本文将探讨导致loss出现nan的原因，以及相应的解决方法。一、原因分析梯度爆炸梯度爆炸是导致loss出现nan的一个常见原因。当梯度在......
CRM软件助力企业科学决策
我们常说“选择大于努力”，这对于企业发展同样适用。每一家企业管理者在日常工作中都要做大量决策，员工只是将决策落地，而这些决策往往决定了公司大大小小项目实施的顺利与否。因此，采用CRM软件助力企业科学决策显得十分关键。越来越多企业发展的过程中都出现了数字化转型的需求......
读书感想
《代码大全2》是一本关于编程技巧和软件开发的经典指南，作者史蒂夫·迈克康奈尔以独特的见解和经验，阐述了编程的艺术和灵魂。这本书不仅关注技术层面的问题，还关注软件开发的整体过程。它强调了良好的代码设计和清晰的逻辑思维的重要性，并详细介绍了程序员常见的陷阱和错误，提供了解......
规则引擎决策表选型对比
名称框架使用复杂度web编辑界面开源友好使用指南活跃度核心使用方式优势劣势Drools高无ApacheLicensehttps://www.cnblogs.com/ityml/p/15993391.html https://www.jianshu.com/p/786f272d3db2https://blog.csdn.net/xushiyu1996818/article/details/126025301......

【个人感想】关于E2E决策

相关文章

赞助商

阅读排行