决策单调性

决策单调性

时间：2024-03-05 18:00:10浏览次数：30

标签：决策单调 mathcal 考虑转移 dp

小 trick 不足挂齿。

考虑一个最优化分段 dp 状物 \(dp_i\gets \max\limits_{j=1}^{i-1}\{dp_j+w(j+1,i)\}\)，然而你只会 \(\mathcal O(nc)\) 转移，其中 \(c\) 是计算权值的复杂度。

这时候我们尝试使用决策单调性，也就是最终转移到 \(i\) 的 \(j\) 和最终转移到 \(i+1\) 的 \(k\) 始终有 \(j\leqslant k\)。

想发现是否有这样的性质也并不难。考虑到 \(i\) 的两条转移 \(dp_u+w(u+1,i)\) 和 \(dp_v+w(v+1,i)\) 且满足 \(u<v\)，你只需要保证存在性质 \(dp_u<dp_v\) 且后面那个东西的增量也满足 \(\Delta_u<\Delta_v\) 就行了。

然后就做完了。分 \(k\) 段的话就把 dp 数组变成 2D 的，然后尝试发现对于分相同段数存在决策单调性。

下面说说写法。

这东西绝不能双指针。虽然决策点的位置满足单调性，但是每个点上面的贡献完全不一定单调，所以双指针二分什么的都不行。

考虑分治。考虑拿下区间 \([1,n]\) 的中点 \(dp_{mid}\) 的转移点，显然可以 \(\mathcal O(nc)\) 取得，然后往两边分治，这样每次需要考虑的决策点折半，需要考虑的被转移点也折半，于是复杂度 \(\mathcal O(cn\log n)\)。

标签：决策,单调,mathcal,考虑,转移,dp
From： https://www.cnblogs.com/lemonniforever/p/18054581

实战解析：打造风控特征变量平台，赋能数据驱动决策
金融业务产品授信准入、交易营销等环节存在广泛的风控诉求，随着业务种类增多，传统的专家规则、评分卡模型难以应付日趋复杂的风控场景。在传统风控以专家规则系统为主流应用的语境下，规则模型的入参习惯被称为“变量”。基于专家规则的风险评估，存在规则触发阈值难量化的特点，规则命中......
代码随想录算法训练营第三十六天| ● 738.单调递增的数字 ● 968.监控二叉树 ● 总
单调递增的数字题目链接：738.单调递增的数字-力扣（LeetCode）思路：从左向右验证是否按位单调递增，如果出现递减的区间，则从该位开始验证该位减1后是否比左边的相邻位大，如果不符合就接着向左寻找这样的位，如果找到了，则将该位前面的位复制到结果中，该位减1加入结果，该位之后的位全部改......
「马尔可夫决策过程」学习笔记
马尔可夫决策过程个人在学习「马尔可夫过程」时（基于这本教材，强烈推荐），做了些总结，并将遇到了一些感到困惑自我解答了，在此整理并记录一下。1.马尔可夫性质简单的一句话：当前状态只取决于上一时刻的状态。这个视频很生动地解释了这一性质。2.马尔可夫过程「马尔可夫过程」......
感觉不错 Feel Good 和长方形（单调栈的应用）
感觉不错FeelGood和长方形（单调栈的应用）题目描述给出正整数\(n\)和一个长度为\(n\)的数列\(a\)，要求找出一个子区间\([l,r]\)，使这个子区间的数字和乘上子区间中的最小值最大。形式化的，要求找出\([l,r]\)使得：\[\left(\sum\limits_{i=l}^{r}a_i\right)\times\min\lim......
动手学强化学习（三）：马尔可夫决策过程
转载自：https://hrl.boyuai.com/chapter/1/马尔可夫决策过程3.1简介马尔可夫决策过程（Markovdecisionprocess，MDP）是强化学习的重要概念。要学好强化学习，我们首先要掌握马尔可夫决策过程的基础知识。前两章所说的强化学习中的环境一般就是一个马尔可夫决策过程。与多臂老胡机问题......
Python 机器学习决策树文本特征的处理
Python机器学习中，决策树是一种常用的分类和回归模型。决策树可以处理数值型特征和类别型特征。对于文本特征，决策树通常使用词袋模型(BOW)或TF-IDF模型进行处理。在处理文本特征时，决策树（和机器学习算法通常）不能直接处理原始文本。文本必须首先转换成算法能理解的数值形式。......
实时洞察，智能决策：销售数据大屏引领未来
在数字化浪潮席卷全球的今天，数据已经成为企业决策的核心要素。尤其对于销售团队来说，如何快速、准确地把握市场动态，分析客户行为，成为决定胜负的关键。而智能销售数据大屏，正是这样一款能够帮助企业洞察市场脉络、决胜未来之战的利器。智能销售数据大屏通过整合企业内外的各类销......
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化
全文链接:https://tecdat.cn/?p=33760原文出处：拓端数据部落公众号概述：众所周知，心脏疾病是目前全球最主要的死因。开发一个能够预测患者心脏疾病存在的计算系统将显著降低死亡率并大幅降低医疗保健成本。机器学习在全球许多领域中被广泛应用，尤其在医疗行业中越来越受欢迎。机器......
CCPC2023深圳 K-四国军棋（线段树维护单调栈哈希值）
传送门解题思路对于每个人的棋子，总是最高的那个棋子发挥决定性作用，被消耗后，再看剩下的最高的棋子。这就相当于单调不递增栈的维护过程。最后就要比较两个人的单调不递增栈是否完全相同。和经典的楼房重建相似，但是这个题不止需要维护单调栈的长度，还要维护哈希值。我是分开写的......
AI与人类联手，智能排序人类决策：RLHF标注工具打造协同标注新纪元，重塑AI训练体验
AI与人类联手，智能排序人类决策：RLHF标注工具打造协同标注新纪元，重塑AI训练体验在大模型训练的RLHF阶段，需要人工对模型生成的多份数据进行标注排序，然而目前缺乏开源可用的RLHF标注平台。RLHF标注工具是一个简单易用的，可以在大模型进行RLHF（基于人类反馈的强化学习）标注排序的......

相关文章

赞助商

阅读排行