是否有对数累积分布函数 (CDF) 和分位数函数的数值稳定的 Python 实现？

时间：2024-08-05 16:35:29浏览次数：18

标签：python scipy

我正在寻找以下函数的数值稳定实现。由于我的应用涉及 t 分布，所以我这里以 t 分布为例。

Log CDF

# Naive Python implementation of the function I need

import scipy
import numpy as np

def t_log_cdf(x, df):
    p = scipy.stats.t.cdf(x, df=df)
    return np.log(p)

在 SciPy 中，有一个 logcdf ，但它是数值不够稳定。将 scipy 函数的行为：

>>> import scipy
>>> import numpy as np

>>> scipy.stats.t.logcdf(np.linspace(0, 60, 5), df=15)
array([-6.93147181e-01, -9.70638014e-11, -4.21884749e-15,  0.00000000e+00,
        0.00000000e+00])

与 R 中的等效函数进行比较：

# R code
> pt(seq(0, 60, length.out = 5), df = 15, log.p = TRUE)
[1] -6.931472e-01 -9.706380e-11 -4.157404e-15 -1.012752e-17 -1.384523e-19

Tensorflow Probability 提供了一个实现，但其结果类似于 scipy 结果。

我无法在 中找到实现PyTorch （根本不提供 t 分布的 CDF）。

基于对数概率的分位数函数：

# Naive Python implementation of the function I need

import scipy
import numpy as np

def t_log_ppf(log_p, loc, scale):
    p = np.exp(log_p)
    return scipy.stats.t.ppf(p, df=df))

我在 SciPy 中找不到对对数概率进行操作的分位数函数， PyTorch ，或 张量流概率

是对的，在对数概率的极端尾部计算 log-CDF 和分位数函数可能会在数值上变得不稳定。观察到 SciPy 和 TensorFlow Probability 中的默认方法在此类情况下难以提供准确结果。

以下是解决这些问题的策略以及提供更稳定实现的方法：

1. 用于 Log-CDF 的任意精度算术

挑战： 主要问题在于浮点数的精度有限。当 CDF 非常接近 1（对于 log-CDF 接近 0）时，直接计算会损失大量有效数字，从而导致不准确或甚至下溢。
解决方案： 使用支持任意精度算术的库。Python 中的一个流行选择是 mpmath 。 mpmath 允许以比标准浮点数高得多的精度执行计算，从而减轻了这些问题。

```python import mpmath

def t_log_cdf_stable(x, df): with mpmath.workdps(30): # 将工作精度设置为 30 位数（或根据需要进行调整） return mpmath.log(mpmath.betainc(df / 2, 0.5, df / (df + mpmath.mpf(x)**2)))

# 示例用法 x_values = np.linspace(0, 60, 5) log_cdf_values = [t_log_cdf_stable(x, 15) for x in x_values] print(log_cdf_values) ```

2. 用于 Log-CDF 的尾部逼近

洞察力： 对于许多分布（包括 t 分布），对于极端尾部值，存在提供准确近似值的专用数学公式（通常涉及渐近展开）。
解决方案： 为 |x| 的大值实现这些尾部逼近值。这需要查阅 t 分布的统计文献以找到适当的公式。

3. 用于基于对数概率的分位数函数（逆 CDF）的反向数值方法

挑战： 即使我们使用 log_cdf 的稳定实现，直接反转它（使用类似 scipy.optimize.fsolve 的方法）也可能在数值上很具有挑战性。
解决方案： 应用专门设计用于反转函数的数值方法，即使在对数概率空间中也是如此。一种这样的方法是使用根查找算法（例如 Brent 方法或 Ridders 方法）结合稳定的 log_cdf 函数。

```python from scipy.optimize import brentq

def t_log_ppf_stable(log_p, df): def objective(x): return t_log_cdf_stable(x, df) - log_p # 为根查找定义适当的界限 a = -1e3
b = 1e3
return brentq(objective, a, b)

# 示例用法 log_p_values = [-6.931472, -9.706380, -4.157404, -1.012752, -1.384523]
quantiles = [t_log_ppf_stable(lp, 15) for lp in log_p_values] print(quantiles) ```

重要注意事项：

选择适当的方法： 最佳方法取决于的特定需求，例如所需的精度水平、计算速度以及正在处理的尾部值的极端程度。任意精度算术非常准确，但可能会比较慢，而尾部逼近值提供了良好的折衷方案。
测试和验证： 始终使用已知结果或替代实现彻底测试选择的实现，以确保其在预期的输入范围内准确且稳定。

如果需要在速度和数值稳定性方面都具有最佳性能的解决方案，可以考虑使用 C/C++ 等编译语言实现这些专门函数，并使用 Python 包装它们。这样，就可以利用优化的数学库并更直接地控制数值计算。

标签：python,scipy
From： 78822823

如何将 *args 参数作为字符串传递给 Python 函数
我正在使用pytubefix制作一个Youtube下载器。API允许我编写如下代码：YouTube(url).streams.filter(progressive=True)但是假设我有一个字符串存储在像args="progressive=True"这样的变量中，我如何使用args字符串来调用函数，就像......
Python Telegram Bot 从数据库获取数据时出错
我正在开发用于管理企业用途任务的电报机器人。团队负责人注册他的公司并获得唯一的ID，然后可以分配任务。问题是，当团队负责人分配任务时，他可以使用/viewtasks访问它们。但是，当员工尝试查看任务时，它会打印出“错误。您尚未注册”。似乎无法检索与用户关联的company_id，即使......
在 Glue 作业中使用 python3+ 创建 CloudFront 签名 URL
是否可以使用python3+为GlueJob中S3文件中的一个特定文件创建具有一定时间限制的CloudFront签名URL？我看到可以在Lambda中做到这一点，但在Python文档中找不到任何内容，特别是胶水工作。任何人都可以提供一些提示吗？defload_private_key(key_path):withopen(......
【Python学习手册（第四版）】学习笔记14-迭代器和列表解析（一）
个人总结难免疏漏，请多包涵。更多内容请查看原文。本文以及学习笔记系列仅用于个人学习、研究交流。本文主要以通俗易懂的语言介绍迭代器（文件迭代、手动迭代iter和next等），列表解析式包括基础知识包括写法、文件上使用列表解析、扩展列表解析语法等，对列表解析不懂的同学着重推荐......
如何获取部署在 Azure 应用服务上并通过 Microsoft 身份提供商进行身份验证的 Python
我使用PythonDash包构建了一个Web应用程序，并将该应用程序部署在Azure应用服务上。Web应用程序当前通过Azure门户的应用程序服务使用Microsoft身份提供程序进行身份验证。但是如何获取登录用户的详细信息呢？在本地运行时如何验证我的Web应用程序？我当前的登录流......
python discord bot nextcord 斜线命令更改语言
我想根据用户的不和谐语言更改斜杠命令的名称。如果语言是韩语/서버如果语言是英语/服务器像这样。我可以使用ctx.locale更改里面的内容，但我也想更改名称和描述。我应该怎么办？当我问ChatGPT时，他们说的很奇怪，谷歌上也没有任何信息。但是有一个机器人可以根据语言......
学习Python的书籍推荐--《Python编程从入门到实践》
版权信息：书名:Python编程:从入门到实践(第3版)作者:[美]埃里克·马瑟斯(EricMatthes)译者:袁国忠评价：1.北京邮电大学副教授陈光老师是这样评价的：编程教学之道，一是重在实践，二是循序渐进一一通过巧妙的实战项目，激发和保持学习的热情，让学习渐入佳境。在这两方......
我可以将 Python 与 javascript 结合起来用于网站或应用程序吗
我不知道如果j添加Python和javascript可以吗我尝试过。但决定在继续之前询问一下是否可以继续但是如果我只使用javascript还是只使用python会更好吗？我只需要建议或答案将Python与Javascript结合用于网站或应用程序不仅完全可行，而且也是一种非常常见的做法！二者......

是否有对数累积分布函数 (CDF) 和分位数函数的数值稳定的 Python 实现？

Log CDF

基于对数概率的分位数函数：

相关文章

赞助商

阅读排行