首页 > 其他分享 >第7章【拓展思考】航空公司客户流失分析

第7章【拓展思考】航空公司客户流失分析

时间:2023-03-22 09:37:23浏览次数:31  
标签:航空公司 用户 建模 流失 次数 客户 思考 数据

实战背景

  • 如今的营销已经远远不同于过去了,那个一张传单一则广告的时代结束了,这是个大数据的时代。
  • 一个时代有一个时代的生存法则,那些没有适应时代的企业,即使曾经是个庞然大物,今天也几乎不见踪影。
  • 在航空公司这个特殊的领域,国内竞争还是很严峻的,**一个顾客的流失造成的损失是4-5个新顾客的流入所不能弥补的**,分析用户(特别是会员用户)相关信息,建立模型,发现流失用户特征,制定针对性营销策略,挽留用户是企业生存的重要一环。
  • 本项目基于大数据样本进行挖掘建模,根据用户特征建立模型发现用户流失特征及其原因分析。

分析

  • 其实,作为航空公司,客户流失是不可避免的,因为有些用户乘机频率非常低,这部分用户是偶然用户,他们的流失没有太大的挽留价值。
  • 再者,那些会员用户才是研究的重点,愿意入会的,一定是有频繁乘机体验的,这部分人要么是商务精英要么是比较富裕的人,这几类人都是颇具头脑的。但是,即使这样还是流失了,那就是航空公司给出的服务问题了,这类人是重点研究对象。

处理过程

  当前,有一个比较尴尬的问题,什么样的顾客可以定义为流失呢?样本数据中根本没有这一项。我们不妨这样定义:

客户类型  定义方式
已流失客户 第二年飞行次数与第一年飞行次数比例小于50%
准流失客户 第二年飞行次数与第一年飞行次数比例在[50%,90%)内
未流失客户 第二年飞行次数与第一年飞行次数比例大于90%

 

  • 通过上面的定义,解决了这个问题,以一种相对合理的方式定义了用户类型。
  • 当然,实际处理时还需要选取客户的关键属性建立模型,如会员卡级别、客户类型(如上定义)、平均乘机时间间隔、平均折扣率、积分兑换次数、非乘机积分总和、单位里程票价和单位里程积分等。
  • 任然采用数据挖掘领域常用的82开进行训练测试样本分布。

数据获取

  • 数据给出(特征过多)

数据探索

  • 首先声明,表头均没有使用中文,均为**航空公司报表专业术语**,**观测窗口使用两年**(06年4月到08年3月),请了解后再阅读本博客,这里不做赘述了。
  • 经过初步的数据探索,我得到了一个分析表,记录数目,各列的平均值、四分位数、标准差、极值等; - 为数据预处理定下了**基本的基调**,首先,有几列数据几乎所有记录都为0,这是没有意义的。(在数据挖掘领域中没有对比的数据是没有任何意义的,因为所有数据都是为了建模服务的)

数据预处理

  • 在数据预处理的第一步就出现了一个不算问题的问题,就是由于Excel解析csv以及编码的一些问题,我看到的表格是错位的,我数据处理第一步就直接数据流导出去成为一个新的xls文件,对于xls文件Excel的解析没有问题,现在,最基本的,我们可视化判断没有了阻碍。(保留最开始的数据是数据分析的基本原则之一)
  • 然后,发现第一列用户编号是用户的唯一标识,然而这对于建模是没有意义的,必须剔除第一列。
  • 选取合适属性构造了需要的六个属性LRFMCK模型,并进行标准化数据。

数据挖掘建模

  • 流失用户的分析,并且判断用户会不会流失,这是一个分类问题,我们使用决策树建模。
  • 需要下载:pydotplus

    https://graphviz.org/download/

后续处理

  • 通过分类预测现有用户是否流失倾向是无比重要的,发现流失可能性进行相应营销比较必要,这里决策树预测准确率还算可以,在深度合适(发现4-5)预测准确率达到85%左右,对于营销需求是达到了。

补充说明

  • 参考书《Python数据分析与挖掘》
  • 本案例使用决策树建模

 

 

标签:航空公司,用户,建模,流失,次数,客户,思考,数据
From: https://www.cnblogs.com/CiciXuanblog/p/17242382.html

相关文章

  • 【信息化】在企业信息化转型过程中的经历和思考
        曾经以为我会一直做一名程序员到退休,其中发生了很多事情,然而还是决定转到甲方信息化岗位上。最近1年多,一直都在国企从事信息化方面的工作,也获得了自己的一些思......
  • 云原生时代——投资人视角下的云原生趋势思考
    今天我们不讲行业和商业,讲讲近几年最热的概念——云原生(CloudNative)。我认为云原生是未来10年IT发展最重要的趋势,但是它涵盖的概念非常多,需要花很多时间研究,同时浩如......
  • 28个案例问题分析---26---nacos命名空间名字和id不一致带来的思考--nacos
    故事背景为什么要修改命名空间:由于dev和localhost使用了同一个命名空间服务,多个服务调用的时候,由于开发人员启动将本地服务注册到和dev同一个命名空间下,导致了dev的部分功......
  • 软件开发的一些思考
    1.测试驱动开发1)测试驱动开发是有争议的。有些人鼓吹它的好处,有些人却质疑它的有效性。鼓吹和质疑者中都不乏大佬。2)测试贯穿开发过程(包括规划,设计过程),这个理念很对,目的......
  • 算法思维:思考问题的一种方式
    方法论:万物皆朴素的第一性原理几乎任何领域的任何问题的解决方案,都可以看作是“某个结构上的朴素方法的优化“。计算机只能处理规模有限的问题,在给定规模且不考虑效率的......
  • KMP算法思考
    第一个全匹配没有价值,从第二个开始    采取每次匹配的最大值,则next数组为 计算next数组时也用了KMP算法,因此当不匹配时,j=next[j]; ......
  • golang中关于死锁的思考与学习
    1、Golang中死锁的触发条件1.1书上关于死锁的四个必要条件的讲解发生死锁时,线程永远不能完成,系统资源被阻碍使用,以致于阻止了其他作业开始执行。在讨论处理死锁问题的各......
  • Linux进程调度的思考
    a.进程怎么载入到CPU中运行?b.当前进程正在运行,怎么确定是否要切换下一个进程?c.怎么选出下一个进程?d.选择进程的算法和优先级?e.介绍一下常用的算法调度逻辑?f.从......
  • 个人所最偏爱的“游戏的表达”的思考和总结
    思维导图,个人比较喜欢用MindMaster这个思维导图软件,所以会使用这个软件,来整理思绪。《游戏改变世界》中一些个人最为关注的观点个人的话,还是更喜欢,童话,卡通,童真类型的,......
  • 代码去重引发对lamba表达式思考
    对重复代码进行治理,发现很多冗余代码就因为其中的一行无法复用,就拷贝一份,造成大量重复代码,且后期维护成本很高,很容易改漏了 1、使用函数指针进行代码去重如下代码相似......