相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数(Person)。 相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。 取值从-1到1。 需要说明的是,皮尔逊相关系数并不是唯一的相关系数,但是最常见的相关系数,以下解释都是针对皮尔逊相关系数。
pg中的相关系数统计函数corr
SELECT corr("Amount", "Activities") as "Corr Coef Using PGSQL Func" FROM( SELECT DATE_TRUNC('day', p.payment_date)::DATE AS "Day", SUM(p.amount) AS "Amount", COUNT(DISTINCT a.activity_id) AS "Activities" FROM public.payments p INNER JOIN public.subscriptions s ON p.subscription_id = s.subscription_id INNER JOIN public.users u ON s.user_id = u.user_id INNER JOIN public.activity a ON a.user_id = u.user_id GROUP BY 1) as a;
从上可知pg的相关系数计算基本参考皮尔逊相关系数。
参考: https://baike.baidu.com/item/%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/3109424 https://zhuanlan.zhihu.com/p/431865174 http://www.light-pg.com/docs/lightdb/13.3-22.2/functions-aggregate.html 标签:lightdb,相关系数,id,皮尔逊,user,corr,public From: https://www.cnblogs.com/lightdb/p/16995334.html