首页 > 其他分享 >数据科学进阶:SHAP值与模型解释——从理论到实践

数据科学进阶:SHAP值与模型解释——从理论到实践

时间:2024-11-04 18:17:45浏览次数:3  
标签:解释 SHAP Shapley 进阶 模型 LSTM 方法

2024深度学习发论文&模型涨点之——SHAP可解释学习

SHAP(SHapley Additive exPlanations)是一种用于解释机器学习模型预测结果的方法,它基于Shapley值理论,通过将预测结果分解为每个特征的影响,为模型提供全局和局部的可解释性。

SHAP的核心思想是将特征值的贡献分配到不同的特征中,计算每个特征的Shapley值,并将其与特征值相乘得到该特征对于预测结果的贡献。这种方法可以用于机器学习模型,包括分类和回归模型,可以生成图像化和定量的解释结果,帮助用户解释模型的决策过程。

论文精选

论文1:

SHAP value-based ERP analysis (SHERPA): Increasing the sensitivity of EEG signals with explainable AI methods

基于SHAP值的ERP分析(SHERPA):用可解释的AI方法提高EEG信号的敏感性

方法

  • 卷积神经网络(CNN):用于分类实验条件,提取EEG信号中的特征。

  • SHAPley Additive exPlanations (SHAP):作为事后解释器,识别重要的时间和空间特征,以理解ERP数据中的模式。

图片

创新点

  • SHERPA方法:结合了CNN和SHAP,提供了一种新颖的方法来自动识别ERP分析中最重要的时间点和电极,无需先验假设。

  • 重要性评分:通过计算“重要性评分”量化ERP对心理机制的相关性,提高了ERP信号的敏感性。

  • 数据驱动与研究者驱动方法的结合:SHERPA结合了数据驱动方法和研究者驱动方法的优点,提供了更精确的结果,同时避免了多重比较问题和统计校正的影响。

图片


论文2:

SHAP-IQ: Unified Approximation of any-order Shapley Interactions

SHAP-IQ:任何阶Shapley相互作用的统一近似

方法

  • 基于采样的近似器:提出了一种高效的基于采样的方法来计算任意阶的Shapley相互作用。

  • 理论保证:为近似质量提供了理论保证,并估计了点估计的方差。

  • 特殊情况下的SV表示:对于特殊情况的Shapley值(SV),提供了一种新的表示方法,并与Unbiased KernelSHAP相对应,简化了计算。

图片

创新点

  • SHAPley Interaction Quantification (SHAP-IQ):提出了一种新的统一近似方法,可以应用于任何满足线性、对称和虚拟公理的基数相互作用指数(CII)。

  • 效率和效果:通过解释语言、图像分类和高维合成模型,展示了SHAP-IQ在计算效率和效果上的优势。

  • 理论基础:为SHAP-IQ提供了坚实的理论基础,包括无偏性、一致性和一般近似界限的证明,以及对n-Shapley值和Shapley Taylor相互作用指数的效率条件的证明。

图片


论文3:

SHapley Additive exPlanations (SHAP) for Efficient Feature Selection in Rolling Bearing Fault Diagnosis

滚动轴承故障诊断中高效特征选择的SHapley Additive exPlanations (SHAP)

方法

  • 三阶段方法:提出了一个三阶段的故障检测、分类和严重程度估计的方法,每个阶段都构建不同的机器学习模型来处理特定的任务。

  • 特征选择:使用可解释的人工智能(XAI)技术来精心选择机器学习(ML)模型的最优特征。

  • 支持向量机(SVM):选择SVM作为故障检测、分类和严重程度估计任务的机器学习技术。

  • Case Western Reserve University (CWRU) 基准:使用CWRU基准来验证方法,这是一个公认的滚动轴承故障分析的基准。

图片

创新点

  • 阶段性方法:通过将故障诊断任务分解为三个阶段,并且利用前一阶段的信息来优化后续阶段,提高了故障诊断的有效性。

  • SHAP值的应用:首次将SHAP值应用于故障诊断领域,用于解释模型预测并识别关键特征,增强了模型的可解释性。

  • 特征选择的优化:即使在特征数量非常有限的情况下,也能通过SHAP值选择最优特征集,实现超过90%的准确率,提高了模型的效率和准确性。

  • 模型的泛化能力:所提出的方法不仅适用于特定的特征集和机器学习技术,而且具有很高的泛化能力,可以应用于广泛的数据集和不同的机器学习技术。

图片


论文4:

The importance of interpreting machine learning models for blood glucose prediction in diabetes: an analysis using SHAP

糖尿病血糖预测中解释机器学习模型的重要性:使用SHAP的分析

方法

  • 长短期记忆网络(LSTM):使用LSTM网络来预测血糖水平,这是一个适用于时间序列预测问题的强大模型。

  • 生理和非生理LSTM模型:设计了两种LSTM模型,一种考虑了生理学解释(p-LSTM),另一种没有(np-LSTM)。

  • SHAP值分析:使用SHAP值来解释LSTM模型的输出,确定每个输入特征对模型预测的贡献。

  • 决策支持系统(DSS):将LSTM模型集成到DSS中,以提供预防性治疗建议,如校正性胰岛素注射(CIB)。

图片

创新点

  • 模型解释的重要性:强调了在糖尿病管理中使用机器学习模型时,解释模型输出的重要性,特别是在模型被用于决策支持系统时。

  • 生理学解释的LSTM模型:通过在LSTM模型中引入预处理层,使得模型能够学习胰岛素和碳水化合物对血糖水平变化的正确生理效应。

  • SHAP值在血糖预测中的应用:展示了SHAP值在解释血糖预测模型中的有效性,特别是在检测学习偏差和提高模型解释性方面。

  • 决策支持系统的集成:通过将解释性工具(如SHAP)与LSTM模型结合,提高了DSS在提供校正性胰岛素注射建议方面的准确性和安全性。

图片

标签:解释,SHAP,Shapley,进阶,模型,LSTM,方法
From: https://blog.csdn.net/AIzhijie001/article/details/143490898

相关文章

  • 如何在离线的Linux服务器上部署 Ollama,并使用 Ollama 管理运行 Qwen 大模型
    手动安装Ollama根据Linux的版本下载对应版本的Ollama,查看LinuxCPU型号,使用下面的命令#查看Linux版本号cat/proc/version#查看cpu架构lscpux86_64CPU选择下载ollama-linux-amd64;aarch64|arm64CPU选择下载ollama-linux-arm64安装和运行在有网络的环境下载好tg......
  • NeurIPS 2024 | 真实世界复杂任务,全新基准GTA助力大模型工具调用能力评测
     点击访问我的技术博客https://tmqcjr.com/利用语言模型调用工具,是实现通用目标智能体(general-purposeagents)的重要途径,对语言模型的工具调用能力提出了挑战。然而,现有的工具评测和真实世界场景存在很大差距,局限性主要体现在以下几个方面:评估问题通常是AI生成的,形式固......
  • python小白入手之——函数进阶
    函数的返回值有多个函数参数种类:位置参数、关键字参数、缺省参数、不定长参数1.位置参数:调用函数时根据函数定义的参数位置来传递函数(传递的函数和定义的参数的顺序一致)2.关键字参数:纯粹的关键字传参可以不按照固定顺序可以和位置参数混用,位置参数必须在前,且匹配参数顺序......
  • 强噪声下基于mscnn-bigru-attention深度学习模型CWRU(凯斯西储大学)轴承故障诊断(Pytho
     1.效果视频(以0HP数据集为例,在-30DB下的测试准确率效果)强噪声下基于mscnn-bigru-attention深度学习模型CWRU(凯斯西储大学)轴承故障诊断_哔哩哔哩_bilibili对原始信号分别添加不同强度的高斯白噪声,以模拟实验数据遇到的实际环境中干扰噪声。原始信号(以0HP数据为例进行展示,可......
  • 带界面下的基于mscnn-bigru-attention深度学习模型江南大学轴承故障诊断(Python代码,很
     1。效果视频:基于mscnn-bigru-attention深度学习模型江南大学轴承故障诊断带界面_哔哩哔哩_bilibili 2.江南大学轴承数据集介绍采样频率:50khz,采样时间:10s转速:6008001000/rpm内圈故障:ib外圈故障:ob滚动体故障:tb正常:N 以600转速下的内圈故障数据为例展示:开始数据......
  • 【学习】软件测试中V模型、W模型、螺旋模型三者介绍
    在软件工程的星辰大海之中,存在着三种独特的航路图:V模型、W模型以及螺旋模型。它们分别以各自的方式描绘了软件开发与测试的不同旅程。首先映入眼帘的是V模型——一个以垂直线条贯穿始终的简洁图形。这个模型如同一座倒立的“V”字形山峰,寓意着软件开发生命周期中的步步攀升与......
  • CMDB模型管理:构筑高效IT运维的坚实基础
    在CMDB中,模型是一个非常重要的概念,在前面的文章中我们提到了模型对于保障CMDB数据准确性的重要性。那么,要如何理解CMDB的模型呢?模型在CMDB中又是什么地位?能起到什么作用呢?一、模型概述在CMDB中,模型指的是对IT基础设施中各种配置项(ConfigurationItems,简称CI)的抽象表示,包括这些配......
  • 说说Java的类加载机制?究竟什么是双亲委派模型?6B
    首先引入一个概念,什么是Java类加载器?一句话总结:类加载器(classloader)用来加载Java类到Java虚拟机中。官方总结:Java类加载器(英语:JavaClassloader)是Java运行时环境(JavaRuntimeEnvironment)的一部分,负责动态加载Java类到Java虚拟机的内存空间中。类通常是按需加载,即第一次使......
  • 外网爆火的LLM应用手册来了!内行人都在学的大模型黑书,评分高达9.9!!!
    Transformer模型介绍朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】Transformer是工业化、同质化的后深度学习模型,其设计目标是能够在高性能计算机(超级计算机)上以并行方式进行计算。通过同质化,一个Transformer模型可以执行各种任务,而不......
  • 基于模型预测控制(MPC)的微电网调度优化的研究(Matlab代码实现)
    ......