首页 > 编程语言 >Python Seaborn 基本数据排名分析

Python Seaborn 基本数据排名分析

时间:2024-01-28 21:22:28浏览次数:28  
标签:hue plt Seaborn Python data import 排名 数据 order

 

Python 中使用 Seaborn 进行基本的数据排名分析通常涉及到可视化数据的分布和排名。Seaborn 是一个基于 Matplotlib 的数据可视化库,提供了丰富的图表类型,使得数据分析更加直观。可以对数据进行初步的排名分析,了解数据的基本分布情况,从而为更深入的数据分析打下基础。

1、条形图

条形图用于显示离散变量的值。在排名分析中,它可以用来表示不同类别的数量或平均值。使用barplot()绘制条形图的函数,常用参数如下,

参数

描述

x

指定数据的横轴变量

y

指定数据的纵轴变量

hue

在同一图中添加另一个类别维度

data

要使用的数据集,通常是 pandas 的 DataFrame

order

控制条形的顺序

hue_order

使用 hue 时控制不同 hue 类别的顺序

estimator

用于聚合的统计函数,默认是平均值

ci

置信区间的大小,默认是 95%

n_boot

计算置信区间的引导样本的数量

orient

控制条形图的方向,'v' 垂直,'h' 水平

color

设置所有条形的颜色

palette

为不同的类别指定不同的颜色

saturation

设置颜色的饱和度

errcolor

错误条的颜色

errwidth

错误条的宽度

capsize

错误条两端的横杠大小

dodge

使用 hue 时,控制条形是否应该分开

使用示例:

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

# 生成示例数据集
tips =  pd.DataFrame({
    'total_bill': [16.99, 10.34, 21.01, 23.68, 24.59],
    'tip': [1.01, 1.66, 3.50, 3.31, 3.61],
    'sex': ['Female', 'Male', 'Male', 'Male', 'Female'],
    'smoker': ['No', 'Yes', 'No', 'Yes', 'No'],
    'day': ['Sun', 'Thur', 'Sat', 'Sun', 'Fri'],
    'size': [2, 3, 3, 2, 4]
})

# 设置 seaborn 样式
sns.set(style="whitegrid")

sns.barplot(x="day", 
            y="total_bill", 
            hue="sex", 
            data=tips, 
            order=["Thur", "Fri", "Sat", "Sun"], 
            hue_order=["Female", "Male"],
            estimator=sum, 
            ci=95, 
            n_boot=1000, 
            orient="v", 
            color="blue", 
            palette="deep", 
            saturation=0.5, 
            errcolor="gray", 
            errwidth=1, 
            capsize=0.1, 
            dodge=True)

# 添加图表标题和标签
plt.title('cjavapy')

plt.draw()

# 展示图表
plt.show()

2、计数图

计数图是条形图的一个特例,用于显示每个类别的观察数量。使用 countplot() 绘制计数图用于显示类别变量中每个类别的观察数量。常用参数如下,

参数名称

描述

data

输入数据,可以是 DataFrame、数组、列表等。

x, y

数据中的变量,用于沿 x 轴或 y 轴绘制计数。

hue

分类变量名,用于数据分组,以不同颜色区分。

order

控制主分类的顺序。

hue_order

控制 hue 分类的顺序。

orient

设置图的方向,"v" 为垂直,"h" 为水平。

color

设置所有条形的颜色。

palette

设置不同的颜色,常用于

hue

参数。

saturation

调整颜色的饱和度。

dodge

设置条形是否分开或堆叠,用于

hue

参数。

ax

指定在哪个 matplotlib 的 Axes 对象上绘图。

kwargs

传递给底层 matplotlib 函数的其他关键字参数,用于自定义图表。

使用示例:

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# 创建示例数据
np.random.seed(0)
data = pd.DataFrame({
    'Fruit': np.random.choice(['Apple', 'Banana', 'Orange', 'Grapes'], size=100),
    'Gender': np.random.choice(['Male', 'Female'], size=100)
})

# 创建 countplot
plt.figure(figsize=(10, 6))
sns.countplot(
    data=data,
    x='Fruit',
    hue='Gender',
    order=['Apple', 'Banana', 'Orange', 'Grapes'],  # 控制主分类的顺序
    hue_order=['Male', 'Female'],  # 控制hue分类的顺序
    orient='v',
    color='blue',
    palette='Set1',  # 颜色板
    saturation=0.8,
    dodge=True  # 分开显示每个 hue 类别
)

# 添加标题
plt.title('cjavapy')
plt.draw()
plt.show()

3、线图

数据点是连续的或有时间序列时,线图是一个好选择。它可以展示趋势和排名的变化。使用lineplot() 是 Seaborn 中用于绘制线性数据的一个非常有用的函数。常用参数如下,

参数

描述

data

DataFrame、数组或列表类型的数据集

x

指定数据集中用于横轴的变量

y

指定数据集中用于纵轴的变量

hue

数据的分类变量名称,用于颜色区分

style

数据的分类变量名称,用于线条样式

size

数据的分类变量名称,用于线条粗细

palette

设置线条颜色

markers

是否在每个数据点处显示标记

dashes

是否为不同的类使用不同的线型

estimator

控制每个 x 值点处 y 值的估计方式

ci

控制置信区间的大小

errorbar

错误条形式

n_boot

计算置信区间时的引导样本数量

使用示例:Python Seaborn 基本数据排名分析-CJavaPy

标签:hue,plt,Seaborn,Python,data,import,排名,数据,order
From: https://www.cnblogs.com/tinyblog/p/17993436

相关文章

  • 卷积神经网络详解+Python实现卷积神经网络Cifar10彩色图片分类
    原文链接:https://blog.csdn.net/master_hunter/article/details/133156758卷积神经网络相对于普通神经网络在于以下四个特点:局部感知域:CNN的神经元只与输入数据的一小部分区域相连接,这使得CNN对数据的局部结构具有强大的敏感性,可以自动学习到图像的特征。参数共享:在CNN中,同一个......
  • Python elasticsearch-py类库基础用法
    实践环境https://pypi.org/project/elasticsearch/pipinstallelasticsearch==7.6.0离线安装包及依赖包下载地址:https://files.pythonhosted.org/packages/f5/71/45d36a8df68f3ebb098d6861b2c017f3d094538c0fb98fa61d4dc43e69b9/urllib3-1.26.2-py2.py3-none-any.whl#sha256=......
  • 快乐学Python,如何对数据进行清洗?(缺失值处理和重复值删除)
    上一篇文章中,我们介绍了通过pandas读取数据到DataFrame中之后,对DataFrame中数据的操作方式,这篇文章我们继续来介绍:数据清洗。即:当读取的数据出现缺失或异常时,我们如何对缺失的数据进行预处理。1、缺失值是什么?当我们从数据文件(CSV、Excel等)或者其他数据源加载到DataFrame中时,往......
  • 如何使用Python实现图像识别?
    原文链接:https://blog.csdn.net/qq_61433567/article/details/1311398481OpenCV(OpenSourceComputerVisionLibrary):用于图像处理和计算机视觉方面的函数库。2NumPy:用于处理数组和矩阵。3Matplotlib:用于绘制图像和图表。可以使用以下命令来安装这些库:pipinstallopencv-python......
  • 读论文-基于Python的协同过滤算法的研究与应用实现
    前言今天读的论文为一篇名为《基于Python的协同过滤算法的研究与应用实现》的论文,文章是在2019年9月发表于《电脑知识与技术》的一篇期刊论文。摘要随着科学技术的快速发展和知识产权的日益重要,大多数用户会选择在播放平台上看电影。例如腾讯视频、爱奇艺等,用户迫切需要一个合......
  • Python 实现 zip 分卷解压
    在上传数据备份到云端的时候,由于数据文件过大,可能会遇到各种各样的问题:比如49G的大文件gitlfspush到99%突然失败,你说心态爆炸不爆炸?再比如某些网盘会限制单个文件上传大小限制在4G以内;因此我们可能会用7z之类的压缩软件对数据文件进行分卷压缩,得到多个分卷文件,例如......
  • python 国内各大源列表:
    附,国内各大源列表:名称地址阿里 https://mirrors.aliyun.com/pypi/simple豆瓣 http://pypi.douban.com/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple中国科学技术大学 https://pypi.mirrors.ustc.edu.cn/simple华中理工大学 http://pypi.hustunique.com/simple山东......
  • python第五节:集合set(2)
    集合删除remove方法如果找不到元素则报错(KeyError)。如:setVar.remove(element)setVar:为一个set类型的变量element:集合中要查找并删除的元素函数作用:在集合setVar中查找element元素,如果存在则删除;如果没找到,则报错。例子1:set1={'a','b'}set1.remove('a')#set1.remove('c......
  • python02-变量及输出
    目标变量的作用定义变量认识数据类型一.变量的作用举例体验:我们去图书馆读书,怎么样快速找到自己想要的书籍呢?是不是管理员提前将书放到固定位置,并把这个位置进行了编号,我们只需要在图书馆中按照这个编号查找指定的位置就能找到想要的书籍。这个编号其实就是把书籍存放的......
  • C-like structures in Python
    bytes转Structuredefconvert_bytes_to_structure(st:object,byte:bytes):assertctypes.sizeof(st)==len(byte),'sizeerror!need:%d,give:%d'%(ctypes.sizeof(st),len(byte))#ctypes.memmove(ctypes.pointer(st),byte,ctypes.sizeof(st))......