220602-多维数组的Jaccard指数计算

时间：2023-04-03 12:32:47浏览次数：42

标签：pre https jaccard Jaccard print jas np 220602 多维

背景：计算两个多维数据的交并商

220602-多维数组的Jaccard指数计算_机器学习

a = np.arange(0,9).reshape(-1,3)
print(a)

b = np.arange(4,13).reshape(-1,3)
print(b)

c = np.random.rand(4,3)
print(c, '\n')


A = np.concatenate([a,c],axis=0)
B = np.concatenate([b,c],axis=0)

print(A)
print(B)

def jaccard_index_arr(A, B):
    inter = np.array([x for x in set(tuple(x) for x in A) & set(tuple(x) for x in B)])
    union = np.array([x for x in set(tuple(x) for x in A) | set(tuple(x) for x in B)])
    index = len(inter)/len(union)
    print(len(inter), len(union), index)
    return index

jaccard_index_arr(A, B)

import pandas as pd 
from auto_funcs2 import jaccard_array_similarity


df_pre = pd.read_pickle("jaccard.pkl")
num_cat = 10

def get_indicator_jaccard(df_pre, num_cat):
    import pandas as pd 
    import numpy as np
    jas_list = []
    for c in range(num_cat):
        try:
            A = df_pre[df_pre['pse_lab']==c][['red1', 'red2']].to_numpy()
            B = df_pre[df_pre['usp_lab']==c][['red1', 'red2']].to_numpy()
            jas = jaccard_array_similarity(A,B)
            jas_list.append(jas)
            print(jas)
        except:
            jas_list.append(0)
    jas_mean = np.mean(jas_list)
    print(jas_mean)
    return jas_mean
    
std_dif = get_indicator_jaccard(df_pre, num_cat)

参考文献
[1] https://stackoverflow.com/questions/8317022/get-intersecting-rows-across-two-2d-numpy-arrays
[2] https://scikit-learn.org/stable/modules/generated/sklearn.metrics.jaccard_score.html
[3] https://leetcode.com/problems/intersection-of-two-arrays/
[4] https://scikit-learn.org/0.15/modules/generated/sklearn.metrics.jaccard_similarity_score.html
[5] https://docs.scipy.org/doc/scipy/reference/generated/scipy.spatial.distance.jaccard.html
[6] https://www.statology.org/jaccard-similarity-python/
[8] https://zhuanlan.zhihu.com/p/358736351

标签：pre,https,jaccard,Jaccard,print,jas,np,220602,多维
From： https://blog.51cto.com/guokliu/6166021

使用篇丨链路追踪（Tracing）其实很简单：请求轨迹回溯与多维链路筛选
作者：涯海在日常生活中，我们可能都经历过以下场景：去医院看病就诊，但预约页面迟迟无法打开；新款手机发布日促销秒杀，下单页面一直卡住转菊花；游戏大版本更新，在线人数过多，导致人物一直在“漂移”。这些问题令产品体验变得非常差，有耐心的同学还会吐槽几句，没耐心的同学早已转身离开。试想一下......
C语言逆向——数组和结构体，数组多维只是一个编译构造的假象，本质会转成一维数组，结构体
数组数组是C语言中非常重要的一个概念，学习C语言主要就是两个知识点：数组、指针，学好这两个，那么你的C语言一定也会很好。什么是数组？或者说什么情况下我们需要使用数组，比如说我们需要定义一个人的年龄，我们可以定义一个变量来表示，但是如果我们需要定义三个人的年龄呢？那就需要三个变......
NOI 1.8编程基础之多维数组
02:同行列对角线的格子1.描述输入三个自然数N，i，j （1<=i<=N，1<=j<=N），输出在一个N*N格的棋盘中（行列均从1开始编号），与格子（i，j）同行、同列、同一对角线的所有格子的位置。如：n=4，i=2，j=3表示了棋盘中的第二行第三列的格子，如下图：第一列第二列第三列第四列 ......
PHP 多维数组搜索 PHP multi dimensional array search
array_column()返回input数组中键值为column_key的列，如果指定了可选参数index_key，那么input数组中的这一列的值将作为返回数组中对应值的键。参数input需要取出数组......
将一个多维数组整合成树形结构，可以通过递归函数来实现
functionbuildTree(arr,parentId=null){lettree=[];for(leti=0;i<arr.length;i++){letitem=arr[i];if(item.parentId===parentId......
多维数组
......
HJ61放苹果_动态规划，递归——需要使用判断避免递归出界。注意多维数组的建立和append(
1importsys2m,n=list(map(int,sys.stdin.readline().strip().split()))3#defapple(m,n):4#returndp,dp[m][n]5ifm<n:6m,n=m,m7d......
界面控件DevExtreme的Pivot Grid组件——轻松实现多维数据分析
DevExtreme拥有高性能的HTML5/JavaScript小部件集合，使您可以利用现代Web开发堆栈（包括React，Angular，ASP.NETCore，jQuery，Knockout等）构建交互式的Web应用程序，该套件附带功能......
多维分析利器—Druid
Druid是一个用于大数据实时查询与分析的分布式列式数据存储系统。为了应对海量数据的实时查询和多维分析，Druid应运而生。Druid诞生于MetaMarkets公司，而互联网广告分析正是M......
C多级指针与多维数组
使用指针访问数组指针类型的加减运算可以使指针内保存的首地址移动。指针类型加n后。首地址向后移动n*步长字节。指针类型减n后。首地址向前移动n*步长字节。步......

220602-多维数组的Jaccard指数计算

相关文章

赞助商

阅读排行