首页 > 其他分享 >大数据分析与可视化 之 随堂练习

大数据分析与可视化 之 随堂练习

时间:2023-12-30 20:33:42浏览次数:23  
标签:数据分析 iris #%% df 随堂 np fdata 可视化 print

随堂练习,随手记录

2.ipynb

#%%

import numpy as np
import csv

#%%

iris_data = []
with open(r'文件地址')as csvfile:
    csv_reader = csv.reader(csvfile)
    birth_header = next(csv_reader)
    for row in csv_reader:
        iris_data.append(row)
print(iris_data)

#%%

iris_list = []
for row in iris_data:
    iris_list.append(tuple(row[1:]))
iris_list

#%%

datatype = np.dtype([("Sepal.Length",np.str_,40),
                    ("Sepal.Width",np.str_,40),
                    ("Petal.Length",np.str_,40),
                    ("Petal.Width",np.str_,40),
                    ("Species",np.str_,40)])
print(datatype)

#%%

iris_data = np.array(iris_list,dtype = datatype)
iris_data

#%%

PetalLength = iris_data['Petal.Length'].astype(float)
PetalLength

#%%

np.sort(PetalLength)

#%%

np.unique(PetalLength)

#%%

np.sum(PetalLength)

#%%

np.mean(PetalLength)

#%%

np.std(PetalLength)

#%%

np.var(PetalLength)

#%%

np.min(PetalLength)

#%%

np.max(PetalLength)

3.ipynb

#%%

import numpy as np
import pandas as pd
s = pd.Series([1,2,3,4,5,6,7,8,9])
print(s)

#%%

df = pd.DataFrame(np.random.randint(1, 20,size=(10,4))) 
print(df)

#%%

temp1=df.iloc[0] 
print(temp1)

#%%

print(df[0])

#%%

print(df.head(3))

#%%

print(df.tail(3))

#%%

print(df[1:3])

#%%

print(df.loc[1,1])

#%%

print(df[df[1] > 0])

#%%

df['add'] = [0,1,2,3,4,5,6,7,8,9] 
print(df)

4.ipynb

#%%

import pandas as pd
data = {'sudent': ['zhao', 'qian', 'sun', 'li', 'zhou', 'wu', 'zheng', 'wang'], 
        'class': [1, 2, 2, 3, 3, 4, 1, 5], 
        'score': [90, 80, 85, 75, 95, 70, 70,85]} 
df = pd.DataFrame(data) 
print(df) 
print(df.columns)

#%%

pd.DataFrame(data, columns=['class', 'student', 'score'])

#%%

print(df['class']) 
print(df.score)

#%%

print(df.index)

#%%

val = pd.Series([10, 9, 8], index=[2, 3, 4]) 
df['year'] = val 
print(df)

#%%

df['isnull'] = df.year.isnull() 
print(df)

#%%

del df['isnull'] 
print(df)

5.ipynb

#%%

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
%matplotlib inline

#%%

fdata = pd.read_csv(r'E:\Job\code\BigData\chapter05\tips.csv')
fdata.head()

#%%

fdata.describe()

#%%

fdata.rename(columns={'total_bill':'消费总额','tip':'小费','sex':'性别','smoker':'是否抽烟','day':'星期','time':'聚餐时间段','size':'人数'},inplace=True)
fdata.head()

#%%

fdata.plot(kind = 'scatter',x='消费总额',y='小费')

#%%

fdata.groupby('性别')['小费'].mean()

#%%

print(fdata['星期'].unique())
r = fdata.groupby('星期')['小费'].mean()
fig = r.plot(kind = 'bar',x = '星期',y = '小费',fontsize = 12,rot = 30)
fig.axes.title.set_size(16)

#%%

r = fdata.groupby(['性别','是否抽烟'])['小费'].mean()
fig = r.plot(kind = 'bar',x = '星期',y = '小费',fontsize = 12,rot = 30)
fig.axes.title.set_size(16)


#%%

r = fdata.groupby(['聚餐时间段'])['小费'].mean()
fig = r.plot(kind = 'bar',x = '星期',y = '小费',fontsize = 15,rot = 30)
fig.axes.title.set_size(16)

标签:数据分析,iris,#%%,df,随堂,np,fdata,可视化,print
From: https://www.cnblogs.com/IvanKK/p/17936768

相关文章

  • 大数据分析与可视化 之 小说爬虫类
    大数据分析与可视化之小说爬虫类importrandomimportrequestsfromlxmlimportetreeimporttimeclassWebScraper:def__init__(self,url,output_file):self.url=urlself.output_file=output_fileself.headers={......
  • 大数据分析与可视化 之 实验10 Pandas实现数据分析
    实验10Pandas实现数据分析实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Pandas的字符串函数。掌握Pandas统计汇总函数。掌握Pandas排序、分组、合并与级联函数。能利用上述函数进行综合数据分析。二、实验要求通过编程实现使用Pandas字符串函数进行文本......
  • 大数据分析与可视化 之 实验11 Matplotlib绘制图表(一)
    实验11Matplotlib绘制图表(一)实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Matplotlib的框架及图形属性。掌握Matplotlib绘制图形的步骤。掌握Matplotlib绘制直线、曲线图、折线图。掌握Matplotlib绘制柱形图、条形图、饼图。二、实验要求通过编程实现使用......
  • 大数据分析与可视化 之 实验12 Matplotlib绘制图表(二)
    实验12Matplotlib绘制图表(二)实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Matplotlib的框架及图形属性。掌握Matplotlib绘制图形的步骤。掌握Matplotlib绘制柱形图、条形图、饼图、折线图。掌握Matplotlib绘制散点图、等高线图、极坐标图、3D图。二、实验......
  • 大数据分析与可视化 之 实验06 Pandas缺失值处理
    实验06Pandas缺失值处理实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握判断缺失值、过滤缺失值、填充缺失缺失值等缺失值处理解决实际数据中的缺失值问题二、实验要求使用常见的缺失值处理函数(如:isnull()、notnull()、fillna()、dropna()函数)等知识在PyCharm......
  • 大数据分析与可视化 之 实验07 Pandas合并与级联
    实验07Pandas合并与级联实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握pandas合并/拼接掌握pandas级联二、实验要求利用pandas合并、拼接和级联等知识在PyCharm中编写程序,实现Python数据处理的相关操作。三、实验内容任务1.现有如下图的两个DataFrame数据......
  • 大数据分析与可视化 之 实验08 Pandas字符串和文本处理
    实验08Pandas字符串和文本处理实验学时:2学时实验类型:验证实验要求:必修一、实验目的学会正确使用常见的字符串函数如:len()、find()、strip()、replace()、contains()函数。解决实际数据中的字符串和文本处理问题。二、实验要求使用常见的字符串函数(如:len()、find()、s......
  • 大数据分析与可视化 之 实验09 Pandas函数应用
    实验09Pandas函数应用实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握pandas函数应用的方法:pipe()、apply()和applymap()。能编写自定义函数。能使用pandas函数应用调用自定义函数解决数据分析实际问题。二、实验要求利用pandas函数应用的方法解决数据分析实......
  • 大数据分析与可视化 之 实验02 Numpy创建数组
    实验02Numpy创建数组实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Numpy创建数组的方法掌握Numpyndarray的属性、运算掌握Numpy迭代数值,修改数组中元素的值掌握Numpy常用函数的使用方法二、实验要求使用Numpy.array的构造函数创建数组,学会使用Numpyndar......
  • 大数据分析与可视化 之 实验03 Numpy实现数据分析
    实验03Numpy实现数据分析实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Numpy的字符串函数掌握Numpy统计函数掌握Numpy排序、分组、线性代数函数二、实验要求通过编程实现使用Numpy字符串函数进行文本处理,使用统计函数进行数据分析等常用操作。三、实验内......