首页 > 其他分享 >关于余弦相似性的取值范围为-1到1的归一化

关于余弦相似性的取值范围为-1到1的归一化

时间:2023-05-26 14:56:25浏览次数:42  
标签:余弦 归一化 相似性 夹角 取值 向量 范围

对于余弦相似性(Cosine Similarity),其范围确实是介于-1到1之间。这是因为余弦相似性衡量的是两个向量之间的夹角,其值的符号表示向量之间的方向关系,而数值的大小表示它们的相似程度。

当两个向量的夹角为0度时,即完全重合,余弦相似性为1。当两个向量的夹角为90度时,即正交或无关,余弦相似性为0。当两个向量的夹角为180度时,即完全相反,余弦相似性为-1。

然而,在实际应用中,相似性度量通常被归一化到0到1的范围内,使其更直观和易于解释。这样可以使用更常见的相似度指标,如相关系数或欧几里德距离。因此,如果使用余弦相似性作为相似性度量,并将其归一化到0到1之间,则范围通常是0到1。

要将范围在-1到1之间的余弦相似性归一化到0到1之间,可以使用以下公式进行线性转换:

归一化相似性 = (余弦相似性 + 1) / 2

这个公式将余弦相似性的范围从-1到1映射到0到1之间。当余弦相似性为-1时,归一化相似性为0;当余弦相似性为1时,归一化相似性为1。

标签:余弦,归一化,相似性,夹角,取值,向量,范围
From: https://www.cnblogs.com/chentiao/p/17434743.html

相关文章

  • python计算余弦相似性和汉明距离
    要使用矩阵相乘来计算7个二进制编码之间的余弦相似性,我们需要先将二进制编码转换为数值向量。对于每个二进制编码,我们可以将0映射为-1,将1映射为1,从而得到一个数值向量。然后,我们可以将这些数值向量表示为一个矩阵,并进行矩阵相乘来计算余弦相似性。以下是一个示例代码,使用Python和......
  • m基于matlab的LDPC译码算法性能仿真,对比BP译码,最小和译码以及归一化偏移最小和译码
    1.算法仿真效果matlab2022a仿真结果如下:  2.算法涉及理论知识概要       LDPC码是麻省理工学院RobertGallager于1963年在博士论文中提出的一种具有稀疏校验矩阵的分组纠错码。几乎适用于所有的信道,因此成为编码界近年来的研究热点。它的性能逼近香农极限,且描述和......
  • js 关于 replace 取值、替换第几个匹配项
    〇、前言在日常开发中,经常遇到针对字符串的替换、截取,知识点比较碎容易混淆,特此总结一下,仅供参考。一、替换第一个匹配项字符串替换letstrtest="0123测试replace456测试replace789测试replace0"console.log("原字符串:"+strtest)letoutstr=strtest.replace("测试","c......
  • 枚举类型的获取值
    publicenumSubjectEnum{语文=1,数学=2,英语=3,物理=4,化学=5,地理=6,生物=7,历史=8,政治=9,} 根据数值获取枚举的NamepublicstringGetEnumNameByKey(intkey){......
  • golang配置读取值viper
    viper简介Viper是Go应用程序的完整配置解决方案,包括12-Factor应用程序。它旨在在应用程序中工作,并且可以处理所有类型的配置需求和格式。它支持:设置默认值从JSON、TOML、YAML、HCL、envfile和Java属性配置文件中读取实时观看和重新读取配置文件(可选)从环境变量中读取从远程......
  • 余弦相似度精度问题引起的偏差
    余弦相似度精度问题引起的偏差余弦相似度值不等于1(实际是等于1)两个向量\(a\)和\(b\)是相同的,余弦相似度值应该是1,但是通过sklearn和numpy计算的结果却不等于1,会出现大于1或者小于1的情况,实际上余弦值应该是在[-1,1]这个区间内的。使用sklearn.metrics.pairwise.cosine_simil......
  • 余弦相似性的应用
    余弦相似性介绍余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。cosine_similarity是一种度量两个非零向量之间夹角的相似性的方法。它的计算方法如下:\(cosine\_similarity(A,......
  • 无人机VESC7500,低压伺服keil源码,可以无感,霍尔单馈,正余弦,ABZ等多种反馈信号,是用非线性
    无人机VESC7500,低压伺服keil源码,可以无感,霍尔单馈,正余弦,ABZ等多种反馈信号,是用非线性磁链观测器,高频注入等多种算法于一身,上位机源码,原理图。没有PCB!最大电流300A,是学习不错的资料。ID:13295688026550883......
  • m基于归一化最小和译码算法的LDPC误码率性能仿真,对比不同的迭代次数,量化位宽以及归
    1.算法仿真效果matlab2022a仿真结果如下:      2.算法涉及理论知识概要        LDPC码是麻省理工学院RobertGallager于1963年在博士论文中提出的一种具有稀疏校验矩阵的分组纠错码。几乎适用于所有的信道,因此成为编码界近年来的研究热点。它的性能逼近......
  • m基于归一化最小和译码算法的LDPC误码率性能仿真,对比不同的迭代次数,量化位宽以及归
    1.算法仿真效果matlab2022a仿真结果如下:2.算法涉及理论知识概要LDPC码是麻省理工学院RobertGallager于1963年在博士论文中提出的一种具有稀疏校验矩阵的分组纠错码。几乎适用于所有的信道,因此成为编码界近年来的研究热点。它的性能逼近香农极限,且描述和实现简单,易于进行理论分......