游戏APP用户行为流程:
数据导入
install_table=pd.read_excel('./Data/游戏APP安装与注册信息 .xlsx',sheet_name='安装信息')
register_table=pd.read_excel('./Data/游戏APP安装与注册信息 .xlsx',sheet_name='注册信息')
数据概况
print("安装信息:")
print(install_table.info())
print("-"*30)
print(install_table.describe())
print("-"*30)
print(install_table.isnull().sum())
print("-"*30)
print(install_table.duplicated().sum())
print("注册信息:")
print(register_table.info())
print("-"*30)
print(register_table.describe())
print("-"*30)
print(register_table.isnull().sum())
print("-"*30)
print(register_table.duplicated().sum())
数据处理
两张表中的安装时间范围不相同,选择相同的安装时间分析(2020-4-20——2020-04-26)
install=install_table[install_table['安装时间']>='2020-04-20 00:00:00']
register=register_table[register_table['安装时间']>='2020-04-20 00:00:00']
print(install['安装时间'].min(),install['安装时间'].max())
print(register['安装时间'].min(),register['安装时间'].max())
数据分析
安装信息分析
1.安装人数、注册人数、激活率
激活率=激活人数/安装人数(这里激活人数以注册人数代替)
install_num=install.用户唯一ID.count()
register_num=register.用户唯一ID.count()
print(f'安装人数:{install_num}激活人数:{register_num}')
print('激活率:%.2f%%'%(register_num/install_num*100))
2.日安装量变化趋势
install['安装日期']=install['安装时间'].dt.date
data=install.groupby('安装日期')['用户唯一ID'].count()
print(data)
data.plot()
plt.show()
3.TOP5子渠道
print(install['子渠道'].value_counts()[:5])
install['子渠道'].value_counts()[:5].plot.pie()
4.安装的手机类型统计TOP10
由于手机品牌名称存在大小写不一的情况(例如OPPO,oppo),因此必须先统一格式后再统计:
install['手机类型']=install['机型'].str.upper()
install['手机类型']=install['手机类型'].str.split('-').str[0]
install['手机类型'].value_counts()[:10].plot.bar()
注册信息分析
1.每日注册人数
register['注册日期']=pd.to_datetime(register['注册时间']).dt.date
register.groupby('注册日期').用户唯一ID.count().plot()
2.不同类型用户的注册时段
register['注册时段']=pd.to_datetime(register['注册时间']).dt.hour
register.groupby(['用户类型','注册时段']).用户唯一ID.count().unstack(0).plot()
3.激活所用天数分析
标签:注册,游戏,APP,register,用户,安装时间,install,print,table From: https://www.cnblogs.com/0chenxian0/p/17396743.html