首页 > 其他分享 >数据挖掘

数据挖掘

时间:2023-02-25 10:56:39浏览次数:29  
标签:plot plt show labels sale 数据挖掘 data

饼图:

import pandas as pd
import matplotlib.pyplot as plt
catering_dish_profit="D:\大三下\数据分析\data\catering_dish_profit.xls"
data=pd.read_excel(catering_dish_profit)
x=data['盈利']
labels=data['菜品名']
plt.figure(figsize=(8,6))
plt.pie(x,labels=labels)
plt.rcParams['font.sans-serif']='SimHei'
plt.title('菜品销售量分布(饼图)-3029')
plt.axis('equal')
plt.show()

x=data['菜品名']
y=data['盈利']
plt.figure(figsize=(8,6))
plt.bar(x,y)
plt.rcParams['font.sans-serif']='SimHei'
plt.xlabel('菜品')
plt.ylabel('销量')
plt.title('菜品销售量分布(条形图)-3029')
plt.show()

 

 

 

 柱形图

import pandas as pd
import numpy as np
catering_sale = "D:\大三下\数据分析\data\catering_fish_congee.xls" # 餐饮数据
data = pd.read_excel(catering_sale,names=['date','sale']) # 读取数据,指定“日期”列为索引


bins = [0,500,1000,1500,2000,2500,3000,3500,4000]
labels = ['[0,500)','[500,1000)','[1000,1500)','[1500,2000)',
'[2000,2500)','[2500,3000)','[3000,3500)','[3500,4000)']

data['sale分层'] = pd.cut(data.sale, bins, labels=labels)
aggResult = data.groupby(by=['sale分层'])['sale'].agg([("sale",np.size)])

pAggResult = round(aggResult/aggResult.sum(), 2, ) * 100

import matplotlib.pyplot as plt
plt.figure(figsize=(10,6)) # 设置图框大小尺寸
pAggResult['sale'].plot(kind='bar',width=0.8,fontsize=10) # 绘制频率直方图
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.title('季度销售额频率分布直方图-3029',fontsize=20)
plt.show()

 

 

 

 散点图

import pandas as pd
import matplotlib.pyplot as plt
data=pd.read_excel("D:\大三下\数据分析\data\dish_sale.xls")
plt.figure(figsize=(8,4))
plt.plot(data['月份'], data['A部门'],color='green',label='A部门',marker='o')
plt.plot(data['月份'], data['B部门'],color='red',label='B部门',marker='s')
plt.plot(data['月份'], data['C部门'],color='skyblue',label='C部门',marker='x')
plt.legend()
plt.ylabel('销售额(万元)')
plt.title('年度部门销售图-3029',fontsize=20)
plt.show()

data=pd.read_excel("D:\大三下\数据分析\data\dish_sale_b.xls")
plt.figure(figsize=(8,4))
plt.plot(data['月份'], data['2012年'],color='green',label='2012年',marker='o')
plt.plot(data['月份'], data['2013年'],color='red',label='2013年',marker='s')
plt.plot(data['月份'], data['2014年'],color='skyblue',label='2014年',marker='x')
plt.legend()
plt.ylabel('销售额(万元)')
plt.title('B部门近三年销售图-3029',fontsize=20)
plt.show()

 

 

 

 

 

 箱型图

import pandas as pd
import matplotlib.pyplot as plt
catering_sale="D:\大三下\数据分析\data\catering_sale.xls"
data=pd.read_excel(catering_sale,index_col='日期')
print(data.describe())

plt.rcParams['font.sans-serif']='SimHei'
plt.rcParams['axes.unicode_minus']=False

plt.figure()
p=data.boxplot(return_type='dict')
x=p['fliers'][0].get_xdata()
y=p['fliers'][0].get_ydata()


for i in range(len(x)):
if i>0:
plt.annotate(y[i], xy=(x[i],y[i]),xytext=(x[i]+0.05-0.8/(y[i]-y[i-1]),y[i]))
else:
plt.annotate(y[i],xy=(x[i],y[i]),xytext=(x[i]+0.08,y[i]))

plt.title('异常值检测图(箱型图)-3029')
plt.show()

 

 

 

 

 

 学习心得:

经过近一个星期的学习,掌握了常用图形如何用代码生成。使用图形能够更好的反应出数据的占比、类型,通过使用不同的图形,有利于进行数据分析。

标签:plot,plt,show,labels,sale,数据挖掘,data
From: https://www.cnblogs.com/x3029/p/17153938.html

相关文章