首页 > 其他分享 >常用度量函数/距离

常用度量函数/距离

时间:2023-11-22 11:28:28浏览次数:23  
标签:Distance 常用 frac 函数 sum 距离 sqrt 度量 mathrm

常用的距离变换

  • 闵可夫斯基距离/明氏距离(Minkowski Distance)

\[\left(\sum_{i=1}^n|x_i-y_i|^p\right)^{1/p} \]

  • 曼哈顿距离/城市街区距离(Manhattan Distance)

\[d(x,y)=\sum_{i=1}^n|x_i-y_i| \]

  • 欧式距离(Euclidean Distance)

\[d(x,y)=\sqrt{\sum_n^{i=1}(x_i-y_j)^2} \]

  • 切比雪夫距离(Chebyshev distance)

\[d(x,y)=\max_i(|x_i-y_i|) \]

  • 倒角距离
    给定两个点集,他们之间的倒角距离为:

\[\mathrm d_{\mathrm CD}\left(\mathrm S_1,\mathrm S_2\right)=\frac{1}{\mathrm S_1}\sum_{\mathrm x\in\mathrm S_1}\min_{\mathrm y\in\mathrm S_2}||\mathrm x-\mathrm y||_2^2+\frac{1}{\mathrm S_2}\sum_{\mathrm y\in\mathrm S_2}\min_{\mathrm x\in\mathrm S_1}||\mathrm x-\mathrm y||_2^2 \]

  • 马氏距离(Mahalanobis distance)

\[D_M(x,y)=\sqrt{(x-y)^T\Sigma^{-1}(x-y)} \]

  • 汉明距离(Hamming distance)
    二进制对应位置不相同的个数。
  • 杰卡德距离(Jaccard Distance)
    衡量两个集合的差异性。

\[d(A,B)=1-J(A,B)=\frac{|A\cup B|-|A\cap B|}{|A\cup B|} \]

  • 豪斯多夫距离(Hausdorff Distance,HD)
  • 陆地移动距离(Earth Mover’s Distance,EMD)
    image

相似度

  • 余弦相似度(Cosine Similarity)
    几何含义:两个向量夹角的余弦值。

\[ \begin{aligned} cos\theta & =\frac{\sum_{i=1}^n(A_i\times B_i)}{\sqrt{\sum_{i=1}^n(A_i)^2}\times\sqrt{\sum_{i=1}^n(B_i)^2}} \\ &=\frac{A\cdot B}{|A|\times|B|} \end{aligned} \]

  • 皮尔森相关系数(Pearson Correlation Coefficient)
    衡量两个变量之间的线性相关。

\[r=\frac{\sum_{i=1}^n(x_i-\hat{x})(y_i-\hat{y})}{\sqrt{\sum_{i=1}^n\left(x_i-\hat{x}\right)^2\sqrt{\sum_{i=1}^n\left(y_i-\hat{y}\right)^2}}} \]

  • KL散度/相对熵(Kullback-Leibler Divergence)
    衡量两个分布之间的距离,越小越相似。

\[D_{KL}(p||q)=\sum_{i=1}^Np(x_i)\cdot log\frac{p(x_i)}{q(x_i)} \]

  • 互信息(Mutual Information)
    一个随机变量中包含的关于另一个随机变量的信息量,或者说一个随机变量由于已知另一个随机变量而减少的不确定性。

\[I(X;Y)=\sum_{x\in X}\sum_{y\in Y}p(x,y)log\frac{p(x,y)}{p(x)p(y)} \]

标签:Distance,常用,frac,函数,sum,距离,sqrt,度量,mathrm
From: https://www.cnblogs.com/grdiv/p/17848536.html

相关文章

  • 了解常用的Linux指令
    Linux存在很多指令suroot切换到管理员cd文件切换到该文件cd  切出pwd查看当前工作目录cat命令查看文件file1的内容touch创建文件mkdir创建文件夹rmdir删除文件夹:wq退出vi编辑器以上很多都是Linux常见的指令,通过本次课程的学习,加上课程练习,巩固了对Linux指......
  • Jtti:常用的运维监控工具有哪些
    运维监控工具用于监视和管理计算机系统、网络和应用程序的性能、可用性和安全性。以下是一些常用的运维监控工具:Nagios:Nagios是一款开源的监控系统,可用于监测主机、服务和网络设备。它支持插件式架构,可以通过插件扩展功能。Zabbix:Zabbix是一款开源的网络监控和管理系统,具有实时监......
  • 这些仪表板常用的数据分析模型,你都见过吗?
    本文由葡萄城技术团队发布。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。前言在数字化时代,数据已经成为了企业决策和管理的重要依据。而仪表板作为一种数据可视化工具,则可以帮助企业更加直观地了解和分析数据,从而作出更准确和有效......
  • 三、Linux基本使用和常用命令
    Linux基本使用和常用命令1、登录Linux操作系统方式1.图形化界面基于xwindowSystem显示框架开发由KDE(类似于苹果系统)、GNOME.v.3.0提供图形化桌面环境2.虚拟控制台文本方式(Ctrl+Alt+F3) 3.Web网页登录前提是需要打开网页控制台,由cock.pit程序提供‘’‘......
  • redis常用知识
    1.安装aptinstallredis2.启动、停止、重启serviceredisstartserviceredisstopserviceredisrestartredis-server/etc/redis/redis.conf也可以启动kill-9进程号停止3.配置项绑定ip:如果要远程访问,将此行注释bind127.0.0.1端口:p......
  • 常用英语单词1
    intelligencen智力;智能;情报 artificialintelligence人工智能 marketingintelligence市场情报 remoldtheintelligenceservices重组情报部门 aprivateintelligence-analysisfirm私人情报分析公司suppressnativeintelligence压抑天性thevalueofintelligencetes......
  • SQLAlchemy快速使用、SQLAlchemy原生操作、SQLAlchemy操作表、一对多关系、多对多关系
    SQLAlchemy快速使用介绍#SQLAlchemy是一个基于Python实现的ORM框架,对象关系映射#orm框架----》djangoorm--》只能用在django中,不能独立使用#python界的orm框架-peewee:小型-sqlalchemy:企业级,支持异步,用在异步框架中-djagnoormm-TortoiseORM......
  • C语言【函数、作用域、常用系统函数】
    C语言【函数、作用域、常用系统函数】一、函数1、函数的声明//函数声明格式intadd(intx,inty);//或intadd(int,int);​ 自定义函数如果放在main函数之后,需要声明函数才可以访问到。如果未声明,则编译器会自动补一个返回类型未int类型的声明,这样以来,如果自定义函数......
  • java list转字符串常用方法
    使用标准toString()方法List.toString()是最简单的,但它在开头和结尾添加方括号,每个字符串用逗号分隔符分隔。缺点是我们不能用另一个分隔符替换逗号,也不能去掉方括号。publicstaticvoidmain(String[]args){//creatingalistwithstrings.List<String>......
  • Mysql常用参考
    Mysql1一张图看懂MySQLhttps://www.cnblogs.com/VicLiu/p/14888719.html2打通MySQL架构和业务的任督二脉https://www.cnblogs.com/VicLiu/p/14622039.html3MySQL数据库设计规范https://www.cnblogs.com/VicLiu/p/13896504.html4MySQL优化之EXPLAIN详解(执行计划)https......