首页 > 其他分享 >numpy和pandas的基本用法

numpy和pandas的基本用法

时间:2023-08-29 10:35:11浏览次数:35  
标签:df 用法 column 数组 np numpy pandas

安装numpy模块

pip install numpy

可以通过导入numpy模块来使用它

import numpy as np

1.创建数组:

a = np.array([1, 2, 3, 4, 5])  # 从列表创建一维数组
b = np.zeros((3, 3))  # 创建一个3x3的全零数组
c = np.ones((2, 2))  # 创建一个2x2的全一数组
d = np.arange(0, 10, 2)  # 从0到10(不包括10),步长为2创建一维数组

2.数组操作:

a.shape  # 获取数组的形状
a.ndim  # 获取数组的维度
a.size  # 获取数组的元素个数
a.dtype  # 获取数组的数据类型
a.reshape((2, 3))  # 改变数组的形状
a.min()  # 返回数组的最小值
a.max()  # 返回数组的最大值
a.sum()  # 返回数组的元素和

3.数组运算:

a + b  # 数组相加(对应元素相加)
a - b  # 数组相减(对应元素相减)
a * b  # 数组相乘(对应元素相乘)
a / b  # 数组相除(对应元素相除)
np.dot(a, b)  # 数组的矩阵乘法
np.sin(a)  # 对数组中的每个元素应用sin函数

安装pandas模块

pip install pandas

可以通过导入pandas模块来使用它

import pandas as pd

1.创建和读取数据:

# 从CSV文件读取数据
df = pd.read_csv('data.csv')
# 从excel文件读取数据
data = pandas.read_excel('1.xlsx')

2.数据处理和操作:

# 查看数据头部和尾部
df.head()  # 默认显示前5行
df.tail(10)  # 显示后10行

# 查看数据统计信息
df.describe()  # 显示数值列的统计信息
df['column'].mean()  # 计算某一列的平均值

# 选择和过滤数据
df['column']  # 选择某一列
df[['column1', 'column2']]  # 选择多列
df[condition]  # 根据条件选择行

# 添加和删除数据
df['new_column'] = values  # 添加新列
df.drop('column', axis=1, inplace=True)  # 删除列

# 数据排序和分组
df.sort_values('column')  # 按列值排序
df.groupby('column').mean()  # 按列分组并计算平均值

# 处理缺失数据
df.dropna()  # 删除包含缺失值的行
df.fillna(value)  # 用指定值填充缺失值

3.数据可视化:

df.plot()  # 绘制折线图
df.plot(kind='bar')  # 绘制柱状图
df.plot(kind='scatter', x='column1', y='column2')  # 绘制散点图

小案例(读取excel中的数据进行分析)

import numpy as np
import pandas as pd

df = pd.read_excel('1.xlsx', sheet_name='Sheet1')
# 在read_excel()函数中,1.xlsx是Excel文件的路径,Sheet1是要读取的工作表的名称。可以根据需要更改这些参数。

df.head()  # 查看数据前几行
df.shape  # 查看数据形状(行数和列数)
df.columns  # 查看列名
df['column']  # 选择某一列
df.describe()  # 查看数据的统计信息

# 使用NumPy的array()函数将数据转换为NumPy数组(如果需要):
data = np.array(df)

标签:df,用法,column,数组,np,numpy,pandas
From: https://www.cnblogs.com/XxMa/p/17664119.html

相关文章

  • MySql之 replace 用法
    mysqlreplace实例说明: UPDATEtb1SETf1=REPLACE(f1,'abc','def'); REPLACE(str,from_str,to_str) 在字符串str中所有出现的字符串from_str均被to_str替换,然后返回这个字符串 这个函数用来批量替换数据中的非法关键字是很有用的!如下例子: 例1:UPDATEBBSTo......
  • 通过pandas读取excel数据,很多数据开头带有'特殊字符,如何处理?
    大家好,我是皮皮。一、前言前几天在Python最强王者群【wen】问了一个Pandas数据处理的问题,一起来看看吧。请教问题:通过pandas读取excle数据,很多数据开头带有'特殊字符,我用replace或者strip()函数处理均无法处理。二、实现过程这里【瑜亮老师】也给了一个代码,如下所示:df.columns......
  • numpy转pillow图像报错TypeError: Cannot handle this data type: (1, 1, 134), <f4 Ty
    报错TypeError:Cannothandlethisdatatype:(1,1,134),<f4,我猜你很可能是在将array数据转换成图片,使用的是函数Image.fromarray()而这个函数处理的是uint8类型,所以你可以使用:print(image.dtype)查看数据类型,不是uint8格式就转换成uint8:Image.fromarray(np.uint8(ima......
  • .NET API 中的 FromRoute、FromQuery、FromBody 用法
    原文链接:https://www.cnblogs.com/ysmc/p/17663663.html最近技术交流群里,还有不少小伙伴不知道 FromRoute、FromQuery、FromBody这几个特性是怎么使用的,也不清楚它们之间的区别在哪里,特意写下这个文章,希望可以帮助到迷茫的小伙伴。在API开发过程中,我们先要确定我们的接口......
  • 汇编调试命令debug的基本用法
      在学习16位汇编时,debug是常用的调试工具,但很多基本用法命令帮助中并未提及,经查验和实验,特记录如下:  一、基本概念:  1、参数分隔符  debug中参数之间的分隔符可用“空格”或“逗号”,效果一致,如:  -rax等于-r,ax  -d0100:00000010等于-d0100:0000,0010  2......
  • numpy常见操作汇总
    numpy怎么把一个尺寸为(14,15)扩展元素到(14,15,3)您可以使用NumPy的广播(broadcasting)功能来将一个尺寸为(14,15)的数组扩展为(14,15,3)。广播允许您在某些情况下自动对不同形状的数组执行操作,以使它们具有相同的形状,从而进行元素级操作。在这种情况下,您可以通过在第三......
  • numpy中计算相关系数的np.corrcoef
    np.corrcoef的作用计算Pearson乘积矩相关系数。它可以用来分析给定数据集中各个变量之间的线性相关程度,返回一个相关系数矩阵,相关系数矩阵中的值介于-1到1之间,包括-1和1。这些值表明了变量之间的线性相关性及其方向。具体来说,正值接近1表示正向线性相关,负值接近-1......
  • Lnton羚通视频算法算力云平台关于pandas 处理什么样的数据?
    pandas数据表格的表示 想存储一些 Titanic 乘客数据,知道姓名,年龄,性别等;df=pd.DataFrame({"Name":["Braund,Mr.OwenHarris","Allen,Mr.WilliamHenry","Bonnell,Miss.Elizabeth",......
  • SAP ABAP 里 FILTER 关键字的用法举例
    FILTER是ABAP中的一个关键字,用于在内部表中进行数据筛选和过滤,以便于提取所需的数据集。FILTER关键字用于从内部表中筛选符合特定条件的数据行。它通过提供条件表达式,只返回满足条件的数据行,从而在不修改原始数据的情况下生成一个新的内部表。FILTER关键字在处理大量数据时非常有......
  • python dict(zip()) 用法
    下面是一篇关于 dict(zip()) 用法的博客文章:Python中的 dict(zip()) 是一种结合使用内置函数 dict() 和 zip() 的方法。zip() 函数用于从多个可迭代对象(如列表、元组、集合等)中提取元素,并将相应的元素配对在一起。配对的元素以元组的形式返回。dict() 函数接受一个由......