本书讲解了当前可解释机器学习方法中存在的局限性。这些方法包括partial dependence plots(PDP)、累积局部效应(Accumulated Local Effects,ALE)、排列特征重要性、leave-one-covariate out(LOCO)和局部可解释模型不可知解释(LIME)。所有这些方法都可以用来解释经过训练的机器学习模型表现,或预测机器学习模型表现。但是在以下情况下,这些解释方法可能不太有效:
如果模型对交互进行建模(例如,当使用随机森林时)
如果特征彼此紧密相关
如果模型不能正确地模拟因果关系
如果解释方法的参数设置不正确
针对以上这些情况,本书进行了详细深入的分析并给出了一些解决办法。
bshq:机器学习新书-《可解释机器学习局限性》最新版下载
本书目录