GPy 回归中的输出 Gram 矩阵（高斯过程）

时间：2024-07-22 12:58:02浏览次数：6

标签：python machine-learning data-science gaussian-process gpy

因为我需要在大量点上训练我的 GP，所以我不仅想保存优化的超参数

ker = GPy.kern.Matern32(nc, ARD=True) 
m = GPy.models.GPRegression(xTrain, np.reshape(yTrain, (-1, 1)), ker, noise_var=1e-8)
m.Mat32.lengthscale.constrain_bounded(0.01, 5e0)
m.Mat32.variance.constrain_bounded(1e-4, 1e+10)
m.Gaussian_noise.variance.constrain_fixed(1e-8)

m.optimize_restarts(messages=True, num_restarts=1, max_f_eval=10000)
np.save(f, m.param_array)

yPrd, yVar = m.predict_noiseless(xTest)
yStd = np.sqrt(yVar)
yPred = np.squeeze(yPrd)

还要保存 Gram 矩阵与观测值 K(s,s)^{-1 的乘法} f in

后验平均值 = K(s^*,s)K(s,s)^{-1} f

从而加载块 K(s,s)^{-1} f并仅与相应的测试点 K(s^*,s) 执行 1 次乘法。我如何访问/输出这些矩阵/保存它们？

可以通过访问 posterior 对象中的 woodbury_vector 属性来访问存储在的 GPy 回归模型中的 Woodbury 向量，该向量表示为 K(X, X) + noise * I 的逆矩阵乘以目标值 ( yTrain )。这是一个更有效的存储后验的方法，尤其是对于大型数据集而言。

以下是如何执行此操作以及如何使用它来进行预测：

import GPy
import numpy as np

# ...（的现有代码用于训练 GP 模型）...

# 访问 Woodbury 向量（K(s, s) + noise * I)^-1 * f
woodbury_vector = m.posterior.woodbury_vector

# 保存 Woodbury 向量以及超参数
np.save(f, m.param_array)  # 可能希望对 Woodbury 向量使用不同的文件
np.save('woodbury_vector.npy', woodbury_vector)

# ...（稍后，加载模型和 Woodbury 向量）...
m = GPy.models.GPRegression.load_model(f)
woodbury_vector = np.load('woodbury_vector.npy')

# 进行预测
kernel = m.kern.copy()  # 复制内核以用于预测
y_pred, y_var = m.predict(xTest, kern=kernel, full_cov=False, Y_metadata=None, woodbury_vector=woodbury_vector)

# ...（其余代码与以前相同）...

说明：

访问 Woodbury 向量： 通过 m.posterior.woodbury_vector 访问训练好的 GP 模型 m 的 Woodbury 向量。
保存 Woodbury 向量： 使用 np.save() 将 Woodbury 向量以及模型参数和其他必要数据保存到文件中。
加载模型和 Woodbury 向量： 使用 GPy.models.GPRegression.load_model() 加载保存的 GP 模型，并使用 np.load() 加载保存的 Woodbury 向量。
使用 Woodbury 向量进行预测： 调用 m.predict() 函数，传递加载的 Woodbury 向量以及其他必要参数。 woodbury_vector 参数告诉 GPy 使用此向量进行预测而不是重新计算。

此方法允许有效地存储表示 (K(s,s) + noise * I)^-1 * f 的信息，并在以后用于预测，而无需存储或反转完整的 Gram 矩阵，这对于大型数据集来说在计算上可能非常昂贵。

标签：python,machine-learning,data-science,gaussian-process,gpy
From： 78776963

Python：定期检测断开故障的USB设备并重新初始化实例
我有一个USB设备，有时会通过USB端口发送串行数据。问题是设备出现故障，有时会无缘无故地断开连接并再次连接到电脑。问题不大，但在这些情况下我需要重新初始化serial.Serial(port)实例，这有点烦人。该设备没有可以从我那里收到的任何命令，我可以验证它是否已连接。我可以......
【校招+社招】华为OD机试 - 拼接URL（Java、JavaScript、Python、C、C++）
鱼弦：公众号【红尘灯塔】，CSDN博客专家、内容合伙人、新星导师、全栈领域优质创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）算法概述URL拼接（URL拼接）是指将多个URL组件（方案、主机、端口、路径、查询参......
使用 Google Colab 时，Python 包“datasets”从 virtualenv 目录“site-packages”中消
我正在使用GoogleColab并尝试创建一个虚拟环境来工作。我的代码是：fromgoogle.colabimportdrivedrive.mount('/content/drive')!pipinstallvirtualenvmyenv_dir='/content/drive/MyDrive/virtual_env/'!virtualenv{myenv_dir}!chmod+x{myen......
Python 3 - openpyxl - 按名称迭代列
使用openpyxl不按数字而是按列标题（ws第一行中的字符串值）迭代列的最简单方法是什么：如下所示：forcellinws.columns['revenue']:print(cell.value)不幸的是，openpyxl不直接支持像ws.columns['revenue']这样按列标题进行迭代。openpyxl......
Python selenium 网络抓取 recaptcha
我想抓取一个网站，但在此之前有一个验证码，我什至使用api获取了数据，并且我还将其注入到网站中，因为网页没有提交按钮，我无法提交。流程是这样的，如果我解决同一网址中的验证码，隐藏的内容将被显示。但它并没有得到解决。我到处都找过了。我找不到解决方案。谁能帮我解决这个问题？......
Python 装饰器详解+案例
Python装饰器是一种特殊的函数，用于修改其他函数的功能。装饰器可以在不改变原函数代码的情况下，对函数进行增加、修改或者扩展功能。装饰器的语法形式是在函数定义前使用@符号，并在@后面加上装饰器的名称。装饰器函数接受被装饰函数作为参数，并返回一个修改后的函数。impo......
如何在 vercel 部署中路由 python 和 typescript 无服务器函数
我从一个带有Next.js和Typescript前端以及python后端的全栈应用程序开始。由于我们想在vercel上部署，因此我们将所有后端功能迁移到/api文件夹中的typescript函数中，可通过以下方式访问：fetch('api/**foldername**)问题是我有一个简单的pytorch模型，因此......
python中datetime模块
datetime模块可以更方便的显示日期，并对日期进行计算。datetime模块中常用的类及其功能描述如下：datetime.datetime------>表示日期时间的类（常用）datetime.timedelta------>表示时间间隔的类（常用）datetime.date------>表示日期的类datetime.time------>表示时间的类datetime.......
Python - requests
前言:介绍:安装及验证:使用:连续接口请求:传参方式: 前言:当你上班无聊的时候,你做什么,说实话有人让我写个requests的教程,教程我觉得网上已经有很多教程了,也很全面,我还是不要献丑了介绍:哎,我认为就是一个接口请求的仓库,不过requests属于第三方库,......
Python学习计划——2.4列表推导式（List Comprehensions）
列表推导式是Python的一种简洁且强大的语法，用于生成新的列表。它可以用更少的代码、更清晰的方式来创建列表，特别是在处理简单的循环和条件操作时。1.基本语法列表推导式的基本语法如下：[expressionforiteminiterable]expression：表达式，计算结果用于生成列表的元素。ite......

GPy 回归中的输出 Gram 矩阵（高斯过程）

相关文章

赞助商

阅读排行