首页 > 其他分享 >会员

会员

时间:2023-03-12 19:35:38浏览次数:32  
标签:plt 会员 airline corr notnull import data

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sn
data=pd.read_csv('../data/air_data.csv')
explore=data.describe(percentiles=[],include='all').T
from datetime import datetime
ffp=data['FFP_DATE'].apply(lambda x:datetime.strptime(x,'%Y/%m/%d'))
ffp_year=ffp.map(lambda x : x.year)
#绘制各年份会员入会人数直方图
fig=plt.figure(figsize=(8,5))
plt.rcParams['font.sans-serif'] = 'SimHei'  # 设置中文显示
plt.rcParams['axes.unicode_minus'] = False
plt.hist(ffp_year, bins='auto', color='#111111')
plt.xlabel('年份')
plt.ylabel('入会人数')
plt.title('各年份会员入会人数 2020310143049吕莹')
plt.show()
plt.close

male=pd.value_counts(data['GENDER'])['男']
female=pd.value_counts(data['GENDER'])['女']
fig = plt.figure(figsize = (7 ,4))  # 设置画布大小
plt.pie([ male, female], labels=['男','女'], colors=['lightskyblue', 'lightcoral'],
       autopct='%1.1f%%')
plt.title('会员性别比例 2020310143049吕莹')
plt.show()
plt.close

# 提取属性并合并为新数据集
data_corr = data[['FFP_TIER','FLIGHT_COUNT','LAST_TO_END',
                  'SEG_KM_SUM','EXCHANGE_COUNT','Points_Sum']]
age1 = data['AGE'].fillna(0)
data_corr['AGE'] = age1.astype('int64')
data_corr['ffp_year'] = ffp_year

# 计算相关性矩阵
dt_corr = data_corr.corr(method = 'pearson')
print('相关性矩阵为:\n',dt_corr)

# 绘制热力图
import seaborn as sns
plt.subplots(figsize=(10, 10)) # 设置画面大小 
sns.heatmap(dt_corr, annot=True, vmax=1, square=True, cmap='Blues') 
plt.title('热力图-2020310143049吕莹')
plt.show()
plt.close

# 去除票价为空的记录
airline_notnull = data.loc[data['SUM_YR_1'].notnull() & 
                                   data['SUM_YR_2'].notnull(),:]
print('删除缺失记录后数据的形状为:',airline_notnull.shape)

# 只保留票价非零的,或者平均折扣率不为0且总飞行公里数大于0的记录。
index1 = airline_notnull['SUM_YR_1'] != 0
index2 = airline_notnull['SUM_YR_2'] != 0
index3 = (airline_notnull['SEG_KM_SUM']> 0) & (airline_notnull['avg_discount'] != 0)
index4 = airline_notnull['AGE'] > 100  # 去除年龄大于100的记录
airline = airline_notnull[(index1 | index2) & index3 & ~index4]
print('数据清洗后数据的形状为:',airline.shape)

import pandas as pd
import numpy as np

 

标签:plt,会员,airline,corr,notnull,import,data
From: https://www.cnblogs.com/cyszd/p/17208831.html

相关文章

  • 在线客服系统接入网站会员,绑定会员ID,展示会员昵称头像,传递手机号等扩展字段【唯一客服
    在客服系统聊天链接里,可以带上自己网站的会员信息,例如:昵称、头像、手机号等具体使用方式如下   聊天链接中增加以下参数:visitor_id:自有会员visitor_name:自有......
  • 百度网盘提速方法 非会员下载也能达到M级别
    目前的网盘市场,百度网盘属于一家独大的局面。正因为如此,它的尿性不是一般的低,比如上传速率可以达到M级别,下载如果不是会员,就是100-200k的样子,多一点都没有。一个电影2-3g,没......
  • 送你一年SVIP会员
    你是否见过这种VIP链接卡片呢?你是否会点击这种卡片呢?酷酷在这里告诉你,这种链接有窃取信息和盗号的风险。如何辨别?正确的腾讯网址是​​qq.com​​​、​​http://qq.com​​......
  • 送你一年SVIP会员
    你是否见过这种VIP链接卡片呢?你是否会点击这种卡片呢?酷酷在这里告诉你,这种链接有窃取信息和盗号的风险。如何辨别?正确的腾讯网址是qq.com、http://qq.com、https://qq......
  • 炉石传说 古墓惊魂 高级会员
    ULDA_504下午茶(TeaTime)TeaTime下午茶Gain4ManaCrystalsanddraw2extracardsforthenextbossonly.仅在下一场首领战中获得四个法力水晶,额外抽两张牌。 DA......
  • 253. 会议室 II(会员题目)
    题目给你输入若干形如[begin,end]的区间,代表若干会议的开始时间和结束时间,请你计算至少需要申请多少间会议室。函数签名如下://返回需要申请的会议室数量intminMeeting......
  • 百度网盘会员svip如何帮你快速下载文件
    这个是我发现的一个临时解决网盘文件快速下载的网址里面有便宜的网盘会员地址如下:https://docs.qq.com/doc/DRkt6QnlZbXNFSlNR有需要的可以购买,临时用很方便......
  • X会员“圈养”长沙胃,盒马鲜生“有备而来”的会员制
    文|易不二“我们希望与Costco、山姆正面交锋。”盒马第一次放出要做X会员店消息的时候,盒马总裁侯毅如是说。旗开得胜。落户浦东的首家盒马X会员店,在开业两个月就实现了盈......
  • 推一款懒人听书导出神器(文件导出、会员下载音频导出来、导出mp3、导出本地)
    划重点: 下面这款懒人听书导出神器,可以将音频(文件导出、会员下载音频导出来、导出mp3、导出本地)。 懒人听书文件导出本地工具: ​​windows电脑版:​​​​https://jscs.lan......
  • C语言会员管理系统
    C语言会员管理系统一、会员管理系统设计与实现设计一个会员管理系统。根据以下功能,分析使用的逻辑结构和存储结构。(1)增加功能:能够录入新数据(包括:姓名、电话号码、......