首页 > 其他分享 >可解释性机器学习——从金融科技视角(2)

可解释性机器学习——从金融科技视角(2)

时间:2024-03-30 17:58:05浏览次数:26  
标签:解释 视角 机器 模型 解释性 学习 算法 方法

可解释性机器学习——从金融科技视角(2)

内容摘要:解释方法的分类


文章目录


1、模型内在的解释(I)or 模型训练后的分析(A)

模型内在的解释:通过限制机器学习模型复杂性,分析算法设计。
模型训练后的分析:例如,计算决策树的排列特征重要性。


2、根据解释方法的结果划分

  • Feature summary statistic(特征汇总统计)

计算特征重要性、特征成对交互强度

  • Feature summary visualization(可视化)

绘制曲线发现依赖关系

  • Model internals (模型内部结构和参数)

如神经网络习得的权重

  • Data point(通过数据视角分析)

其中一种方法称为反事实解释:为了解释对某一数据实例的预测,该方法通过改变一些特征来找到类似的数据点,而预测结果会以相关的方式发生变化(如预测类别变化)。另一个例子是识别预测类别的实质:输出新数据点的可解释模型发挥作用,必须对数据点本身进行解释。这对图像和文本非常有效,但对包含数百个特征的表格数据不那么有用。

  • Intrinsically interpretable model(用可解释性模型近似黑盒模型)

解释黑盒模型的一种方法是用可解释模型对其进行近似(全局或局部)。而可解释模型本身是通过查看内部模型结构和参数或特征汇总统计来解释的。

ps:写这段话突然打不出顿号,结果是win11要手动ctrl+句点切换中英文(x_x)


3、解释方法适用于所有模型还是特定模型

线性模型中回归权重的解释就是适用于特定模型的解释,本质上可解释模型的解释方法总是只适用于这些模型,而不可迁移。只用于解释神经网络等模型的工具也是针对特定模型的。而解释CNN这种黑盒模型的研究是当前机器学习的难点。并且由于大家对应用层面机器学习展现出来的强大魅力所吸引,更少的人关注模型的可解释性。
与模型无关的工具可用于任何机器学习模型,并在模型训练完成后应用(即1中提到的事后)。这些与模型无关的方法通常通过分析特征输入和输出对来工作,但这些方法无法访问权重或结构等模型内部的信息。

4、局部解释(local)or 全局解释(global)

解释方法是解释单个预测还是解释整个模型行为?或者范围介于两者之间

ps:算法透明度 VS 可解释性

\算法透明度\是关于算法如何从数据中学习模型,以及它可以学习什么样的关系。 如果使用卷积神经网络对图像进行分类,则可以解释该算法在最低层上学习边缘检测器和滤波器, 这是对算法工作原理的理解,但不是对最终习得的特定模型的理解,也不是对如何做出单个预测的理解。 算法透明度只需要了解算法,而不需要了解数据或学习的模型。 线性模型的最小二乘法等算法得到了很好的研究和理解。 它们的特点是透明度高。 深度学习方法(通过具有数百万个权重的网络梯度)其内部工作原理是正在进行的研究的重点,它们不太透明。

  • 全局可解释性
  • 全局可解释性:moedl层面的
  • 局部可解释性:单个预测
  • 局部可解释性:一组预测

待更


文章组织结构

  • 首先,介绍可解释性,包括理解可解释性的重要性,解释方法的分类,解释的评估,解释方法的性质。
  • 其次,了解目前经典的可解释的模型,包括线性回归,逻辑回归,GLM、GAM等、决策树、决策规则、规则拟合Rulefit等。
  • 然后,分析与模型无关的全局方法(部份依赖图PDP、局部积累效应ALE图、功能交互、功能分解、排列特征重要性等)和与模型无关的局部方法(ICE、LIME、反事实解释,作用域规则、Shaley、SHAP等)
  • 最后,着重讨论神经网络的解释,并聊聊现目前的最新进展。

标签:解释,视角,机器,模型,解释性,学习,算法,方法
From: https://blog.csdn.net/flex_university/article/details/137169193

相关文章

  • 5、Pico Robot 机器人课程
    5.1小车前进注意:电机速度受到电池电量影响,例程是在电池电量较高(电量数值在26000以上)的情况下,如果电池电量较低需要及时充电或者修改电机速度。一、学习目标1.学习树莓派Pico主板和小车扩展板的电机结合进行实验。2.了解电机的使用。二、硬件使用本次课程使用PICO主板以及......
  • 机器学习实战-手把手教会你如何用梯度下降实现线性回归
    机器学习实战-利用梯度下降实现单变量线性回归文章目录前言一、导包二、处理异常并导入数据集1.处理异常2.导入数据集3.查看是否导入成功4.绘制人口-收益图,可视化查看三、使用梯度下降来实现线性回归,以最小化代价函数1.定义方法计算代价函数2.添加偏置项3.分离特征和......
  • 【机器学习】数据探索(Data Exploration)---数据质量和数据特征分析
    一、引言  在机器学习项目中,数据探索是至关重要的一步。它不仅是模型构建的基础,还是确保模型性能稳定、预测准确的关键。数据探索的过程中,数据质量和数据特征分析占据了核心地位。数据质量直接关系到模型能否从数据中提取有效信息,而数据特征分析则决定了模型能否准确捕捉......
  • NVIDIA公司在实体机器人上的第一步尝试 —— Nova Cater AMR —— 九号机器人与英伟达
    相关:https://www.leiphone.com/category/robot/Hgy9i8azqGncESIB.htmlNovaCaterAMR是一款仓储运货机器人,可以应用在仓储物流上,也可以应用在酒店运送菜品上;该机器人使用和NVIDIA公司联合开发的自动驾驶系统,这也是NVIDIA公司在实体机器人上的首次尝试。九号公司是一家中国公......
  • 机器学习模型
    机器模型机器学习领域模型很多,根据不同的任务、算法类型和应用进行分类。模型各有特点,适用于不同的机器学习任务和应用。选择合适的模型取决于具体的问题、数据特性和期望的输出。1.监督学习模型:线性模型:线性回归、逻辑回归,是最基础的模型,用于预测连续值或分类。决策树:CART......
  • Python环境下基于机器学习的空压机故障识别(出口阀泄漏等)
    Python环境下基于机器学习(多层感知机,决策树,随机森林,高斯过程,AdaBoost,朴素贝叶斯)的压缩机故障识别(出口阀泄漏,止逆阀泄露,轴承损伤,惯性轮损伤,活塞损伤,皮带损伤等)。空压机是一种经典的动力设备,也被誉为企业产品生产的"生命气源",,广泛应用于制药工业、爆破采煤、矿上通风、风动实......
  • 2.4 比较检验 机器学习
    目录常见比较检验方法总述2.4.1假设检验2.4.2交叉验证T检验2.4.3McNemar检验接我们的上一篇《性能度量》,那么我们在某种度量下取得评估结果后,是否可以直接比较以评判优劣呢?实际上是不可以的。因为我们第一,测试性能不等于泛化性能,第二,测试性能会随着测试集的变化而......
  • ssh实现linux机器之间的互相访问和命令控制
    在Linux系统之间互相访问并通过命令控制可以通过多种方式实现,其中最常用的方法是使用SSH(SecureShell)协议。SSH是一个提供加密的网络协议,通过它可以安全地在不安全的网络上进行远程登录和其他网络服务。以下是使用SSH实现Linux系统之间互相访问的基本步骤:1.安装SSH服务在两台Li......
  • 机器人姿态估计-IMU、互补滤波算法应用+C代码实现
    机器人姿态估计-IMU、互补滤波算法应用附赠自动驾驶学习资料和量产经验:链接机器人的姿态测量对于许多应用至关重要,如导航、运动控制等。在这篇文章中,我们将介绍如何利用MPU6050传感器以及互补滤波和卡尔曼滤波算法来实现自平衡车的姿态测量。我们将从原理出发,逐步介绍互补滤波......
  • 管理者权力的探讨:资深团队管理者的视角
    管理者权力的探讨:资深团队管理者的视角在团队的管理过程中,管理者的权力是一个不可忽视的因素。它不仅关系到团队的日常运作,还直接影响到项目的成败和团队成员的士气。对于资深团队管理人员而言,如何理解和运用这一权力,是一项至关重要的任务。管理者权力的本质首先,我们需要明确管......