应用场景
找到事物和事物之间的联系。比如购物篮分析,根据顾客的购物篮情况,推测,哪些产品经常一起购买,这样商场更明白如何进行推销。
常见算法
Apriori。通过对物品的支持度、置信度、提升度的计算,以此了解两个物品之间的关联性。这里其实涉及了两个目标:
1、了解我当前应该怎么捆绑销售,就是直接把某两类商品绑起来卖。这个结果,需要这样来得到:买A,也会买B的概率(捆绑支持度)是75%,如果大于设定的支持度阈值,代表可以考虑捆绑销售;
2、了解我以后可以怎么向客户推荐,就是看到你买了A,就问问,你要不要买B啊。并且推销成功的概率很大。这个结果,需要这样来得到:先计算只要买A,就一定会买B的概率(置信度),然后计算单独购买B的概率(单独支持度),用置信度/支持度,得到的数据,如果等于1,代表他俩没啥关系,就是捆绑买的概率和单独买B的概率一样;如果大于1,代表有正相关性,有很大关系,比如是1.7,那就是顾客购买B的可能性比随机情况下高70%,也就是买了A我太有可能买B了;如果小于1,代表负相关性,表示他俩一起购买的概率,比单独购买B的概率还要低。
算法示例
Transaction ID | Items
1 | A, C, D
2 | B, C, E
3 | A, B, C, E
4 | B, E
如上,是4个购物篮的情况。我们现在看下{A} => {C}和{A} => {E}的情况。也就是买了A又买C,和买了A又买E的情况。
【{A} => {C}】
1、买A也买C的支持度(Support)。支持度表示规则在所有交易中出现的频率。这里,我们计算A和C一起购买的支持度:
- 有2个交易同时购买了A和C(交易1, 3)。
- 总共有4个交易。
支持度:支持度({A,C})=2/4=0.5
2、置信度(Confidence)。置信度表示在购买A的交易中,有多少比例也购买了C:
- 有2个交易同时购买了A和C(交易1, 3)。
- 总共有2个交易购买了A(交易1, 3)。
置信度:置信度({A}=>{C})=2/2=1
3、买C的支持度(Support)。C在所有交易中出现的频率:
- 有3个交易购买了C(交易1, 2, 3)。
- 总共有4个交易。
支持度:支持度({C})=3/4=0.75
4、提升度(Lift)。提升度表示A和C一起购买的概率与单独购买C的概率之比:
提升度:提升度=置信度({A}=>{C}) / 支持度({C})=1/0.75=4/3≈1.33
【{A} => {E}】
1、买A也会买E的支持度(Support)。支持度表示规则在所有交易中出现的频率。这里,我们计算B和E一起购买的支持度:
- 有1个交易同时购买了A和E(交易 3)。
- 总共有4个交易。
支持度:支持度({B,E})=1/4=0.25
2、置信度(Confidence)。置信度表示在购买A的交易中,有多少比例也购买了E:
- 有1个交易同时购买了A和E(交易3)。
- 总共有3个交易购买了A(交易1, 3)。
置信度:置信度({B}=>{E})=1/2=0.5
3、E的支持度。E在所有交易中出现的频率:
- 有3个交易购买了E(交易2, 3, 4)。
- 总共有4个交易。
支持度:支持度({E})=3/4=0.75
4、提升度(Lift)。提升度表示A和E一起购买的概率与单独购买E的概率之比:
提升度=置信度({A}=>{E}) / 支持度({E})=0.5/0.75≈0.67
总结
-
规则 {A} => {C}:
- 支持度(A+C):0.5
- 置信度:1
- 提升度:1.33
-
规则 {A} => {E}:
- 支持度(A+E):0.25
- 置信度:0.5
- 提升度:0.67
通过这些计算,我们可以有两个结论:
1)根据同时购买的支持度来看是否有适合捆绑销售的商品。通常,我们要先预定义一个阈值,这个阈值根据行业、市场、具体业务来定,一般可以定为50%。即大于等于50%的可以考虑进行捆绑销售,比如A+C。对于30%-50%的,属于中等支持度,这种可以考虑促销的时候用来捆绑销售;低于30%的就没必要再看考了,大概率没人这么买;
2)根据提升度,决定是否要对顾客进行某些组合的推荐。规则 {A} => {C} 具有正关联(提升度 > 1),而规则 {A} => {E} 具有负关联(提升度 < 1)。这意味着购买A的顾客更可能也购买C,而购买A的顾客不太可能也购买E。我们推销的时候可以这样来推销。
标签:概率,置信度,--,支持,关联,学习,购买,交易,提升 From: https://www.cnblogs.com/1234roro/p/18298029