Learning Models with Uniform Performance via Distributionally Robust Optimization

时间：2023-02-26 15:24:58浏览次数：59

标签：Distributionally via Learning Models uncertainty eta rho mathcal theta

大致内容

Duchi J. C. and Namkoong H. Learning models with uniform performance via distributionally robust optimization. The Annals of Statistics, 49(3), 1378-1406, 2021.

大致内容

本文系统介绍了了如何处理 DRO 问题:

\[\min_{\theta} \Bigg\{ \mathcal{R}_f (\theta; P_0) := \sup_{Q \ll P_0} \{\mathbb{E}_Q[\ell(\theta; X)]: D_f(Q\|P_0) \le \rho\}, \Bigg\} \]
其中 \(f\) 是一凸函数,

\[D_f(Q\|P_0) := \int f(\frac{dQ}{d P_0}) dP_0 \]
为 \(f\)-divergence, 由此可以定义 uncertainty region:

\[\{Q: D_f(Q\|P_0 \le \rho\}. \]
让我们用人话说就是, 我们希望得到这样的一个最优的参数 \(\theta^*\), 它不仅使得在当前分布 \(P_0\) 上是优良的, 在与 \(P_0\) 相近 (由 uncertainty region 定义)的其它分布上也是优良的. 这一诉求在实际训练模型的时候是很有用的:
1. 在实际中我们只有估计 \(\hat{P}_0\);
2. 训练的数据分布和测试的数据分布往往有偏差, 但是一般来说这两种分布是相近的, 所以如果我们在 \(\hat{P}_0\) 的 uncertainty region 上进行一个整体的优化, 那么就保证更好地一个泛化性.
作者给出, 当我们只考虑 Cressie-Read family 地 f-divergences:

\[f_k(t) := \frac{t^k - kt + k - 1}{k (k - 1)}, \]
时有

\[\mathcal{R}_k(\theta; P) = \inf_{\eta \in \mathbb{R}} \{ c_k(\rho) \mathbb{E}_P [(\ell(\theta; X) - \eta)_+^{k_*}]^{\frac{1}{k_*}} + \eta\}, \]
其中 \(k_* = k / (k - 1)\), \(c_k(\rho) := (1 + k(k-1)\rho)^{1 / k}\).
可以注意到, 实际上 \(\mathcal{R}_k\) 只统计了那些大于 \(\eta\) 的损失, 这意味着, DRO 实际上是一种更关注'少数'群体 (tail) 的一种优化方案, 所以会有更佳的鲁棒性和公平性.
更多例子请回看原文.

标签：Distributionally,via,Learning,Models,uncertainty,eta,rho,mathcal,theta
From： https://www.cnblogs.com/MTandHJ/p/17156755.html

cpp generate random number to fill array,order the array via quick sort
//model.util.h#include<iostream>#include<random>template<typenameT>Tget_random_num(Tmin,Tmax){std::random_devicerd;std:......
《PROMOTING COOPERATION IN MULTI-AGENT REINFORCEMENT LEARNING VIA MUTUAL HELP》
通过互相帮助促进多智能体强化学习中的合作总结该篇文章主要是提出了一个新的多智能体强化学习算法，目的是为了提高合作程度和总社会奖励。具体实现基于传统Actor-Critic......
32-DRF框架-序列化器ModelSerializer
#如果我们想要使用序列化器对应的是Django的模型类，DRF为我们提供了ModelSerializer模型类序列化器来帮助我们快速创建一个Serializer类创建modelserializer序列化器#......
python+playwright 学习-9.页面对象模型Page Object Models
前言POM(PageObjectModels)页面对象模型已经成了写web自动化的一个标准模型。页面对象模型PageObjectModels页面对象代表Web应用程序的一部分。电子商务Web......
drf高级五ModelSerializer
不同于Serializer，可以帮助我们完成。它将根据模型自动生成一组字段。它将根据模型上的参数自动生成序列化程序的验证程序。它包括create()和update()简单默认实现。......
Optimizing Top-N Collaborative Filtering via Dynamic Negative Item Sampling
目录概符号说明MotivationDynamicNegativeSamplingZhangW.,ChenT.,WangJ.andYuY.Optimizingtop-ncollaborativefilteringviadynamicnegativeitemsamp......
Istio从入门到精通——Istio Deployment Models
IstioDeploymentModelshttps://istio.io/latest/docs/ops/deployment/deployment-models/ WhenconfiguringaproductiondeploymentofIstio,youneedtoanswer......
软件教程-使用Quartus+ModelSim联合仿真
最后修改日期：2023/02/17本文前提是用VerilogTestbench文件(.vt)仿真。相较于波形仿真而言，此方法较为通用。下面以QuartusPrime18.0Standard+MentorGraphicsMod......
DeepMDP: Learning Continuous Latent Space Models for Representation Learning
郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Proceedingsofthe36thInternationalConferenceonMachineLearning,LongBeach,California,PMLR97,......
[Temp] Explanation of Keras : tf.keras.models.Sequential
tf.keras.models.SequentialHelponclassSequentialinmodulekeras.engine.sequential:classSequential(keras.engine.functional.Functional)|Sequential(*ar......

Learning Models with Uniform Performance via Distributionally Robust Optimization

大致内容

相关文章

赞助商

阅读排行