首页 > 编程语言 >基于间隔密度的概念漂移检测算法mdm-DDM

基于间隔密度的概念漂移检测算法mdm-DDM

时间:2023-09-16 20:23:54浏览次数:41  
标签:密度 mdm 间隔 样本 分类器 DDM 数据流 漂移

概念漂移

​ 概念漂移是数据流挖掘领域中一个重要的研究点。传统的机器学习算法在操作时通常假设数据是静态的,其数据分布不会随着时间发生变化。然而对于真实的数据流来说,由于数据流天生的时间性,到达的数据的分布可能会随着时间的推移不断改变。这使得传统的批处理模型不适合对数据流的进行挖掘分析,模型更是需要有检测和适应数据分布变化的能力。例如,在服装店销售预测的例子中,如果季节性因素导致服装销售额在夏季月份较高,那么在冬季该预测模型可能就不管用了

​ 如果要对概念漂移下定义的话,它的定义是:概念漂移是一种现象,即目标领域的统计属性随着时间的推移以一种任意的方式变化。

​ 如果用一句话来描述概念漂移的话,它就是:数据分布不均匀,使得过去训练的表现不能保证将来的结果

基于间隔密度的概念漂移检测算法mdm-DDM

背景

​ 参考论文:https://kns.cnki.net/kcms2/article/abstract?v=3uoqIhG8C475KOm_zrgu4lQARvep2SAkaWjBDt8_rTOnKA7PWSN5MEdRZ4_Punz3wA-1d-2-our_XnGz-hr7Ar5EH4I5MWNB&uniplatform=NZKPT

​ mdm-DDM解决了基于错误率的漂移检测算法必须及时获取标记数据标签的问题。mdm-DDM利用间隔密度作为检测漂移的度量,然后结合McDiarmid 不等式来进行显著性检验,以此判断是否产生概念漂移。

​ 本文只考虑了没有明确决策边界的mdm-DDM,在有标签情况下,用集成分类器来进行预测。

定义

  • 间隔区域
    • 预测空间中最容易分类错误的部分
  • 间隔密度
    • 分类器不确定区域中的样本密度,即具有不确定性的数据样本占总体样本的密度

间隔密度计算

  1. 对于每一个样本x来说:

\[margin = P_E(y = trueclass|x) - P_E(y \neq trueclass|x) \]

​ 其中E指的是集成分类器。被减数指的是样本经过分类器预测后,集成分类器预测标签为样本标签的概率。减数的是样本经过分类器预测后,集成分类器预测标签不为样本标签的概率。

  1. 间隔密度的计算方式:

\[S_{(w,b)} = \begin{cases} 1,if\ margin \leq \theta_{margin\ of\ uncertainty}\\ 0, 其他\end{cases} \]

\[MD_{svm} = \frac{\sum{S_{(w,b)}(x)}}{|X|},\forall x\in X \]

​ 其中

标签:密度,mdm,间隔,样本,分类器,DDM,数据流,漂移
From: https://www.cnblogs.com/ggyt/p/17707242.html

相关文章

  • AddMvcCore,AddControllers,AddControllersWithViews,AddRazorPages的区别
    AddMvc/AddMvcCore/AddControllers等区别1.services.AddMvcCore()只注册运行 Controller/RazorPages 必要的核心服务,确保 Pipeline 程序可动作,其馀如像 DataAnnotationModelValidation、身分验证等服务要自己加挂,除有特殊客制需求,一般不太常用。2.services.AddControl......
  • AddMicrosoftIdentityWebApp
    C:\Users\clu\.nuget\packages\microsoft.identity.web\2.9.0\lib\netcoreapp3.1\Microsoft.Identity.Web.dll[assembly: AssemblyFileVersion("2.9.0.0")][assembly: AssemblyInformationalVersion("2.9.0+87400de3c669d962b2035d36ab6d2415cd4123f......
  • 如何有效检测、识别和管理 Terraform 配置漂移?
    在理想的IaC世界中,我们所有的基础设施实现和更新都是通过将更新的代码推送到GitHub来编写和实现的,这将触发Jenkins或Circle-Ci中的CI/CD流水线,并且这些更改会反映在我们常用的公有云中。但现实并没有这么顺利,原因可能有很多,例如: 公司仍处于云自动化的初级阶段;不......
  • 如何有效检测、识别和管理 Terraform 配置漂移?
    作者|KrishnaduttPanchagnula翻译|Seal软件链接|https://betterprogramming.pub/detecting-identifying-and-managing-terraform-state-drift-997366a74537 在理想的IaC世界中,我们所有的基础设施实现和更新都是通过将更新的代码推送到GitHub来编写和实现的,这将触发Jenki......
  • 人大金仓学习之二_ksh和kddm的学习
    人大金仓学习之二_ksh和kddm的学习摘要承接上一篇文章主要是这里总结一下ksh相关的文档.这里学习了很多文档:https://help.kingbase.com.cn/v8/perfor/performance-optimization/performance-optimization-6.html#sys-kddmhttps://help.kingbase.com.cn/v8/perfor/sql-op......
  • mac打开ddms卡住的问题解决
    https://blog.csdn.net/qq_35244415/article/details/110656444?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1-110656444-blog-88994745.235^v38^pc_relevant_default_base&depth_1-utm_source=distribute.......
  • 解析机器学习中的数据漂移问题
    编者按:当模型在生产中呈现的输入与训练期间提供的分布不对应时,通常会发生数据漂移。VatsalP.的这篇文章,介绍了如何通过漂移指标直观了解数据漂移程度,并n通过一个使用合成数据的例子来展示如何利用Python计算数据随时间的漂移指标。以下是译文,Enjoy!作者|VatsalP.编译|岳扬由......
  • ASEMI代理LT8609AJDDM#WTRPBF原装ADI车规级芯片
    编辑:llASEMI代理LT8609AJDDM#WTRPBF原装ADI车规级芯片型号:LT8609AJDDM#WTRPBF品牌:ADI/亚德诺封装:DFN-10批号:2023+安装类型:表面贴装型引脚数量:10工作温度:-40°C~125°C类型:车规级芯片LT8609AJDDM#WTRPBF特征宽输入电压范围:3.0V至42V超低静态电流突发模式®操作:<2.5......
  • ASEMI代理LT8609AJDDM#WTRPBF原装ADI车规级芯片
    编辑:llASEMI代理LT8609AJDDM#WTRPBF原装ADI车规级芯片型号:LT8609AJDDM#WTRPBF品牌:ADI/亚德诺封装:DFN-10批号:2023+安装类型:表面贴装型引脚数量:10工作温度:-40°C~125°C类型:车规级芯片LT8609AJDDM#WTRPBF特征宽输入电压范围:3.0V至42V超低静态电流突发模式®操作:<2.5µAIQ将12VIN调......
  • ASEMI代理ADI亚德诺LT8609AJDDM#WTRPBF车规级芯片
    编辑-ZLT8609AJDDM#WTRPBF特点:宽输入电压范围:3.0V至42V超低静态电流突发模式®操作:将12VIN调节到3.3VOUT时IQ为2.5µA输出纹波<10mVP-P高效2MHz同步操作:1A时效率为93%,12VIN可获得5VOUT最大连续输出为3A快速最短开关接通时间:45nsLT8609A提供固定的......