首页 > 其他分享 >基于距离度量学习的异常检测:一种通过相关距离度量的异常检测方法

基于距离度量学习的异常检测:一种通过相关距离度量的异常检测方法

时间:2024-08-22 11:38:46浏览次数:13  
标签:记录 检测 距离 其他 异常 度量

异常通常被定义为数据集中与大多数其他项目非常不同的项目。或者说任何与所有其他记录(或几乎所有其他记录)显著不同的记录,并且与其他记录的差异程度超出正常范围,都可以合理地被认为是异常。

例如上图显示的数据集中,我们有四个簇(A、B、C和D)和三个位于这些簇之外的点:P1、P2和P3可能被视为异常,因为它们每个都远离所有其他点 - 也就是说,它们与大多数其他点有显著差异。

同样,簇A只有五个点。虽然这些点彼此相当接近,但它们远离所有其他点,所以也可能被认为是异常。内点(较大簇内的点)都非常接近大量其他点。例如,簇C中间的任何点都非常接近许多其他点(即与许多其他点非常相似),所以不会被视为异常。

我们可以用许多其他方式来看待异常,实际上许多其他方法也用于异常检测 - 例如基于频繁项集、关联规则、压缩、马尔可夫模型等的异常检测方法。但是事实上,最常见的异常检测算法背后的基本思想,包括kNN、LOF(局部异常因子)、Radius等众多算法,都是使用数据见距离来进行计算的。

这就引出了一个问题:如何量化一条记录与其他记录的差异程度。在异常检测中最常见的一些包括欧几里得距离、曼哈顿距离和Gower距离,以及许多类似的度量。

但在本文中,将一种非常通用且可能未被充分使用的方法,用于计算表格数据中两条记录之间的差异,这对异常检测非常有用,称为距离度量学习 - 以及一种专门应用于异常检测的方法。

 

https://avoid.overfit.cn/post/81746cc2ef314702a838c2aaa9d57b6b

标签:记录,检测,距离,其他,异常,度量
From: https://www.cnblogs.com/deephub/p/18373525

相关文章

  • <数据集>车内视角行人识别数据集<目标检测>
    数据集格式:VOC+YOLO格式图片数量:6470张标注数量(xml文件个数):6470标注数量(txt文件个数):6470标注类别数:1标注类别名称:['pedestrian']序号类别名称图片数框数1pedestrian647029587使用标注工具:labelImg标注规则:对类别进行画水平矩形框图片示例:标注示例:......
  • 字符串信息检测原理代码剖析
    想要用单片机识别一长串字符并执行对应指令,有两种办法:数组法和循环法错误的实例:if(RXDATE=='L') { if(RXDATE=='E') { if(RXDATE=='D') { if(RXDATE=='1') { LED1=0; } if(RXDATE......
  • 基于STM32(STM32F103RETX)项目:水质检测与水位控制器(中控板)
    目录项目介绍一、项目需求二、设计方案三、相关技术点四、预计效果设备开发一、TDS模块二、LORA模块三、OLED模块四、4G通信模块五、IM1281B电能计量模块项目结项一、该项目能让自己有什么收获二、总结项目中遇到的问题,以及解决办法项目介绍一、项目需求1.水资......
  • 昇腾 - AscendCL C++应用开发 目标检测中的非极大值抑制NMS和计算候选边界框之间的交
    昇腾-AscendCLC++应用开发目标检测中的非极大值抑制(NMS,Non-MaximumSuppression)涉及计算候选边界框之间的交并比(IOU,IntersectionoverUnion)flyfish结构体BBox:定义了一个边界框的数据结构,包含中心坐标、宽高、置信度分数、类别索引和输出索引。函数IOU:计算两个......
  • 华为OD机试 - 密码输入检测 字符串
    只在本地跑过,不确保一定对#include<stdio.h>#include<stdlib.h>#include<stdbool.h>#include<string.h>#definesetbit(value,bit)(value=value|(1<<bit))intmain(void){charbuf[201];charout[201];inti=0;int......
  • <数据集>无人机航拍不同高度牧羊识别数据集<目标检测>
    数据集格式:VOC+YOLO格式图片数量:6065张标注数量(xml文件个数):6065标注数量(txt文件个数):6065标注类别数:1标注类别名称:['sheep']序号类别名称图片数框数1sheep6065149785使用标注工具:labelImg标注规则:对类别进行画水平矩形框图片示例:标注示例:......
  • <数据集>鸟类识别数据集<目标检测>
    数据集格式:VOC+YOLO格式图片数量:16287张标注数量(xml文件个数):16287标注数量(txt文件个数):16287标注类别数:10标注类别名称:['ChestnutMunia','ZebraDove','GardenSunbird','CollaredKingfisher','CrestedMyna','PhilippinePied-Fantail&......
  • arcgis js 获取距离和面积
    Definesthetypeofcalculationforthegeometry.Thetypecanbeoneofthefollowing:planar: Planarmeasurementsuse2DCartesianmathematicstocalculatelength.Usethistypeifthelengthneedstobecalculatedintheinputspatialreferenceotherw......
  • 【目标检测】Transformers在小目标检测中的应用:最新技术的基准测试和调查
    《TransformersinSmallObjectDetection:ABenchmarkandSurveyofState-of-the-Art》Transformers在小目标检测中的应用:最新技术的基准测试和调查原文:https://arxiv.org/abs/2309.049021研究背景和目的小目标检测(SOD)对现有目标检测方法具有挑战性,而Transformer......
  • 【OpenCV教程】轮廓检测过程
    @目录1.查找轮廓1.1API1.2轮廓层级检测模式:索引号(层级)RETR_EXTERNAL(索引顺序:从右下到左上)RETR_LIST(recommended)(索引顺序:从右下到左上,由外到内)RETR_CCOMP(notrecommended)(索引顺序:由内到外,从右下到左上)RETR_TREE(recommended)1.3轮廓坐标点储存方式2.绘制轮廓2.1API3.轮廓面......