首页 > 其他分享 >《浅谈保序回归问题》学习笔记

《浅谈保序回归问题》学习笔记

时间:2023-01-13 11:33:43浏览次数:47  
标签:浅谈 preceq epsilon sum 均值 mid 笔记 forall 保序

1.偏序关系

设 $\preceq $ 是集合 \(S\) 上的一个二元关系,若 \(R\) 满足:

  • 自反性:\(\forall x \in S\),\(x \preceq x\) ;
  • 反对称性:\(\forall x, y \in S\), \(x \preceq y, y \preceq x \Rightarrow x = y\);
  • 传递性:\(\forall x, y, z \in S\),\(x \preceq y, y \preceq z \Rightarrow x \preceq z\)。

2.问题描述

给定正整数 \(p\) 和一个偏序关系(DAG),每个点有权值 \((w_i, y_i)\),你需要给每个点附上一个权值 \(f_i\),使得 \(\forall x, y, s.t. x \preceq y\),\(f_x \leq f_y\),最小化回归代价:

\[\sum\limits_{i \in S}w_i|f_i - y_i|^p \]

特别地,当 \(p \to \infty\) 时,回归代价为 \(\max_{i\in S}w_i|f_i - y_i|\)。

对于一个给定的 \(p\),称上面的问题是 \(L_p\) 问题。

3.\(L_p\) 均值及其性质

定义 \(L_p\) 均值为使得 \(\sum_{i\in S}w_i|k - y_i|^p\) 最小的 \(k\),即 \(f_i\) 均相同时的答案,可以对目标式求导,导数为 0 即是答案。

当 \(p = 1\) 时,\(L_1\) 均值是大家幼儿园都知道的带权中位数;当 \(p = 2\) 时,是带权平均数,即 \((\sum\limits_{i \in S}w_iy_i)/(\sum\limits_{i \in S}w_i)\) 。

当 \(p > 1\) 时,\(L_p\) 均值唯一。且对于任意一组 \(L_p\) 问题的最优解 \(\{f_i\}\),存在 \(S\) 的一个子集 \(T\),使得 \(T\) 的 \(L_p\) 均值为 \(f_i\)。

4.一般问题的算法

在 \(L_p\) 问题的基础上而外加入限制 \(S = \{a, b\}(a < b)\),使得 \(\forall i, a \leq f_i \leq b\)。

\(p = 1\) 的情况

当 \(p = 1\) 时,一个点集 \(U\) 的 \(L_p\) 均值可能是一段区间,同时显然存在一个最优解使得 \(f_i \in \{y_i\}\) 中,移动 \(f_i\) 的改变量是一些一次函数。

引理 1 :在 \(L_1\) 问题中,若存在区间 \((a, b)\) 使得所有 \(y_i\) 不在 \((a, b)\),且存在一组最优解 \(z_i\) 使得 \(z_i\) 也不在 \((a, b)\)。定义一个集合对区间 \(S = (a,b)\) 取整为 \(z^S\):若 \(z_i \leq a\),\(z_i = a\);若 \(z_i \geq b\),\(z_i = b\);否则不变。则 \(z^S\) 为 \(S\) 问题的一组最优解。

根据引理,可以进行整体二分。二分到 \([l, r]\) 时,计算 \(S = (y_{mid}, y_{mid+1})\) 的最优解,根据 \(z_i\) 的取值情况继续划分成 \([l, mid]\) 和 \([mid+1,r]\) 的两个子问题。

\(1 < p <\infty\) 的情况

当 \(1 <p < \infty\),其 \(L_p\) 均值唯一,且代价函数在 \(< L_p\) 时递减,\(>L_p\) 时递增。

整体二分,找一个极小的 $\epsilon $ 使得任意 \(y_i, f_i\) 不在 \((mid, mid+\epsilon)\) 中,根据引理,每个 \(f_i\) 只能等于 \(mid\) 或 $mid+\epsilon $。 若 \(U\) 中任意一点选择了 $mid+\epsilon $,则所有满足 \(x \in U, i \preceq x\) 的点都只能选择 \(mid+\epsilon\),等价于闭合子图模型。钦定所有点先选择 \(mid\),若选择 $mid+\epsilon $ 的改变量为 \(w_i[(mid+\epsilon)^p - y_i]-w_i[mid^p - y_i]\) ,然后跑最小权闭合子图即可。

但可能精度误差较大。此时可以将 \(mid\) 看做变量 \(x\),两边同时除以 \(\epsilon\),变成 \(x\) 在 \(mid\) 时的导数,此时不会出现精度误差。

特殊情况的解法

对于树上的情况,可以 DP 维护分段函数,也可以直接整体二分后跑树形 DP。

5.例题

[省选联考 2020 A 卷] 魔法商店

【2018集训队互测Day2】有向图

标签:浅谈,preceq,epsilon,sum,均值,mid,笔记,forall,保序
From: https://www.cnblogs.com/henrici3106/p/17049100.html

相关文章

  • Arcaea 自制 | 学习笔记
    安装图形化制谱工具ArcadeZero谷歌云盘:https://drive.google.com/drive/folders/1ziY89wDWrwQJxbD-YGCSIwMwdE_WzrRE?usp=sharing关于Arcade的使用请参考https://n......
  • 零基础学习SpringBoot3笔记01_2023-01-13
    零基础学习SpringBoot3笔记01_2023-01-132023-01-131.环境1.1.软件环境安装JDK17并配置环境变量,略安装MySQL5.5并配置环境变量,略安装MySQL客户端工具HeidiSQL,略......
  • 浅谈服务接口的高可用设计
    作者:京东零售王磊前言作为一个后端研发人员,开发服务接口是我正常不过的工作了,这些接口不管是面向前端HTTP或者是供其他服务RPC远程调用的,都绕不开一个共同的话题就是“高可......
  • 浅谈服务接口的高可用设计
    作者:京东零售王磊前言作为一个后端研发人员,开发服务接口是我正常不过的工作了,这些接口不管是面向前端HTTP或者是供其他服务RPC远程调用的,都绕不开一个共同的话题就是“......
  • uniapp 开发微信小程序问题笔记
    最近接手了一个小程序开发,从头开始。使用了uniapp搭建,以前没有做过小程序开发,着手看文档、查文档。一步一步完成了任务的开发。特此记录开发过程中的问题。开发建议:使......
  • 读编程与类型系统笔记06_函数类型的高级应用
    1. 装饰器模式1.1. 扩展对象的行为,而不必修改对象的类1.2. 装饰的对象可以执行其原始实现没有提供的功能1.3. 优势1.3.1. 支持单一职责原则1.3.1.1. 每个类只......
  • 信息检索导论--读书笔记(一)布尔检索
    术语介绍信息检索(InformationRetrieval):信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。非结构化数......
  • [概率论与数理统计]笔记:3.5 大数定律与中心极限定理
    3.5大数定律与中心极限定理切比雪夫不等式定义\(EX\)和\(DX\)存在,对于任意的\(\epsilon>0\),有\[P\{|X-EX|\ge\epsilon\}\le\frac{DX}{\epsilon^2}\]证明这里证明\(......
  • Linux学习笔记:curl命令
    一、介绍cURL,全称CommandLineURLviewer,是一个利用URL规则在命令行下工作的文件传输工具。其主要作用是通过http、ftp等方式下载文件,也能够上传文件,作为一个功能......
  • C#设计模式学习笔记:设计原则
    原文网址:https://www.cnblogs.com/atomy/p/12144242.html   本笔记摘抄自:https://www.cnblogs.com/PatrickLiu/p/8287784.html,记录一下学习过程以备后续查用。  ......