首页 > 其他分享 >数据分析---numpy模块

数据分析---numpy模块

时间:2024-05-27 21:22:31浏览次数:31  
标签:数据分析 arr 16 34 --- 数组 array numpy

前戏

NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库。重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型、多维数组上执行的数值运算。

快捷键的使用:

  • 添加cell:a或者b
  • 删除:x
  • 修改cell的模式:
    • m:修改成markdown模式
    • y:修改成code模式
  • 执行cell:
    • shift+enter
  • tab:自动补全
  • 代开帮助文档:shift+tab

1. numpy模块的创建

点击查看代码
import numpy as np
arr = np.array()
arr

# 输出结果<details>

array([1, 2, 3])

2.使用numpy创建一个一维数组

点击查看代码
import numpy as np
arr = np.array([1,2,3])
arr

# 输出结果
array([1, 2, 3])

3.numpy创建一个多维数组

点击查看代码
import numpy as np
arr = np.array([[1,2,3],[4,5,6]])
arr

# 输出结果
array(
[[1, 2, 3],
[4, 5, 6]])

4.数组和列表的区别

  • 数组中存储的数据元素类型必须是统一类型
  • 优先级;
    • 字符串 > 浮点数 > 整数

举例:将外部的一张图片加载到numpy数组中,然后尝试改变数组元素的数值查看原始图片的影响

点击查看代码
import matplotlib.pyplot as plt
img_arr = plt.imread('./1.jpg')
img_arr # 这里生成的是图片的数组
plt.imshow(img_arr) # 将图片数组i女性可视化展示

5.numpy 5个基本功能

  • zeros()
  • ones()
  • linespace()
  • arange()
  • random()系列
点击查看代码
import numpy as np 
arr = np.zeros(shape=(3,4)) # 创建一个3行4列的数组,并用0来填充
arr1 = np.ones(shape=(2,3)) # 创建一个2行3列的数组,并用1来填充
arr2 = np.linespace(0,100,num=20) # 创建一个0到100之间,20个数字但他们是等差数列的数组
arr3 = np.arange(10,50,step=2) # 创建一个10-50之间的,d为2的等差数列数组
arr4 = np.random.randint(0,100,size=(5,3)) # 创建一个0到100之间,5行3列的随机数字数组

6.numpy的常用属性

  • shape
  • ndim
  • size
  • dtype
点击查看代码
import numpy as np
arr = np.random.randint(0,100,size = (3,4)) # 创建一个0到100之间,3行4列的随机数字数组
arr.shape # 获取arr这个数组的几行几列(返回的是数组的形状)

arr.ndim # 返回的是数组的维度

arr.size # 返回的是数组元素的个数

arr.dtype #返回的是数组元素的类型
arr.dtype = 'uint8' #修改数组的元素类型

7.numpy的索引(重点)

点击查看代码
import numpy as np
arr = np.random.randint(1,100,size=(5,6))
arr
  - array([[69, 80,  7, 90, 31, 44],
       [37, 57, 26, 92, 91, 34],
       [13, 16, 93, 54, 87, 34],
       [ 5, 16, 47, 66, 51, 12],
       [54, 63, 20, 11, 94, 88]])

arr[1]  # 取出了numpy数组中的下标为1的行数据
  - array([37, 57, 26, 92, 91, 34])

arr[[1,3,4]] # 取出多行
  - arr[[1,3,4]] #取出多行


8.numpy的切片操作

  • 切片操作
    • 切出前两列数据
    • 切出前两行数据
    • 切出前两行的前两列的数据
    • 数组数据翻转
    • 练习:将一张图片上下左右进行翻转操作
    • 练习:将图片进行指定区域的裁剪
点击查看代码
array([[69, 80,  7, 90, 31, 44],
       [37, 57, 26, 92, 91, 34],
       [13, 16, 93, 54, 87, 34],
       [ 5, 16, 47, 66, 51, 12],
       [54, 63, 20, 11, 94, 88]])

# 切出arr数组的前两行的数据
arr[0:2] #arr[行切片]
- array([[69, 80,  7, 90, 31, 44],
       [37, 57, 26, 92, 91, 34]])

# 切出arr数组中的前两列
arr[:,0:2] #arr[行切片,列切片]
- array([[69, 80],
       [37, 57],
       [13, 16],
       [ 5, 16],
       [54, 63]])

# 切出前两行的前两列的数据
arr[0:2,0:2]
- array([[69, 80],
       [37, 57]])


array([[69, 80,  7, 90, 31, 44],
       [37, 57, 26, 92, 91, 34],
       [13, 16, 93, 54, 87, 34],
       [ 5, 16, 47, 66, 51, 12],
       [54, 63, 20, 11, 94, 88]])


#将数组的行倒置
arr[::-1]
- array([[54, 63, 20, 11, 94, 88],
       [ 5, 16, 47, 66, 51, 12],
       [13, 16, 93, 54, 87, 34],
       [37, 57, 26, 92, 91, 34],
       [69, 80,  7, 90, 31, 44]])

#将数组的列倒置
arr[:,::-1]
- array([[44, 31, 90,  7, 80, 69],
       [34, 91, 92, 26, 57, 37],
       [34, 87, 54, 93, 16, 13],
       [12, 51, 66, 47, 16,  5],
       [88, 94, 11, 20, 63, 54]])

#所有元素倒置
arr[::-1,::-1]
- array([[88, 94, 11, 20, 63, 54],
       [12, 51, 66, 47, 16,  5],
       [34, 87, 54, 93, 16, 13],
       [34, 91, 92, 26, 57, 37],
       [44, 31, 90,  7, 80, 69]])


# 将一张图片进行左右翻转
img_arr = plt.imread('./1.jpg')
plt.imshow(img_arr)
img_arr.shape
- (300, 450, 3)

# 左右翻转
plt.imshow(img_arr[:,::-1,:]) #img_arr[行,列,颜色]

# 图片上下翻转
plt.imshow(img_arr[::-1,:,:])

#图片裁剪的功能
plt.imshow(img_arr[66:200,78:300,:])

9.变形reshape

点击查看代码
arr **是一个5行6列的二维数组**
array([[69, 80,  7, 90, 31, 44],
       [37, 57, 26, 92, 91, 34],
       [13, 16, 93, 54, 87, 34],
       [ 5, 16, 47, 66, 51, 12],
       [54, 63, 20, 11, 94, 88]])

#将二维的数组变形成1维
arr_1 = arr.reshape((30,))

#将一维变形成多维
arr_1.reshape((6,5))

10.级联操作

  • 将多个numpy数组进行横向或者纵向的拼接
    • axis轴向的理解
      • 0:列
      • 1:行
    • 问题:
      • 级联的两个数组维度一样,但是行列个数不一样会如何?
点击查看代码
# 将两个数组级联,行级联
np.concatenate((arr,arr),axis=1)
- array([[69, 80,  7, 90, 31, 44, 69, 80,  7, 90, 31, 44],
       [37, 57, 26, 92, 91, 34, 37, 57, 26, 92, 91, 34],
       [13, 16, 93, 54, 87, 34, 13, 16, 93, 54, 87, 34],
       [ 5, 16, 47, 66, 51, 12,  5, 16, 47, 66, 51, 12],
       [54, 63, 20, 11, 94, 88, 54, 63, 20, 11, 94, 88]])

# 将三张图片进行级联,列级联
arr_3 = np.concatenate((img_arr,img_arr,img_arr),axis=0)
plt.imshow(arr_3)

11.常用的聚合操作

  • sum,max,min,mean
点击查看代码
array([[69, 80,  7, 90, 31, 44],
       [37, 57, 26, 92, 91, 34],
       [13, 16, 93, 54, 87, 34],
       [ 5, 16, 47, 66, 51, 12],
       [54, 63, 20, 11, 94, 88]])

# 行相加
arr.sum(axis=1)
- array([321, 337, 297, 197, 330])

# 每行的最大值
arr.max(axis=1)
- array([90, 92, 93, 66, 94])

12.常用的数学函数

  • NumPy 提供了标准的三角函数:sin()、cos()、tan()
  • numpy.around(a,decimals) 函数返回指定数字的四舍五入值。
    • 参数说明:
      • a: 数组
      • decimals: 舍入的小数位数。 默认值为0。 如果为负,整数将四舍五入到小数点左侧的位置
点击查看代码
np.sin(2.5)
0.5984721441039564

np.around(3.84,2)
3.84

13.常用的统计函数

  • numpy.amin() 和 numpy.amax(),用于计算数组中的元素沿指定轴的最小、最大值。
  • numpy.ptp():计算数组中元素最大值与最小值的差(最大值 - 最小值)。
  • numpy.median() 函数用于计算数组 a 中元素的中位数(中值)
  • 标准差std():标准差是一组数据平均值分散程度的一种度量。
    • 公式:std = sqrt(mean((x - x.mean())**2))
    • 如果数组是 [1,2,3,4],则其平均值为 2.5。 因此,差的平方是 [2.25,0.25,0.25,2.25],并且其平均值的平方根除以 4,即 sqrt(5/4) ,结果为 1.1180339887498949。
  • 方差var():统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数,即 mean((x - x.mean())** 2)。换句话说,标准差是方差的平方根。
点击查看代码
arr[1].std()
26.66718749491384

arr[1].var()
711.138888888889

12.矩阵相关

  • NumPy 中包含了一个矩阵库 numpy.matlib,该模块中的函数返回的是一个矩阵,而不是 ndarray 对象。一个 的矩阵是一个由行(row)列(column)元素排列成的矩形阵列。
  • numpy.matlib.identity() 函数返回给定大小的单位矩阵。单位矩阵是个方阵,从左上角到右下角的对角线(称为主对角线)上的元素均为 1,除此以外全都为 0。
点击查看代码
# eye返回一个标准的单位矩阵
np.eye(6)
- array([[1., 0., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0.],
       [0., 0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 1.]])

- 转置矩阵
    - .T

arr.T
- array([[69, 37, 13,  5, 54],
       [80, 57, 16, 16, 63],
       [ 7, 26, 93, 47, 20],
       [90, 92, 54, 66, 11],
       [31, 91, 87, 51, 94],
       [44, 34, 34, 12, 88]])

13.矩阵相乘

  • 矩阵相乘
    • numpy.dot(a, b, out=None)
      • a : ndarray 数组
      • b : ndarray 数组
    • 第一个矩阵第一行的每个数字(2和1),各自乘以第二个矩阵第一列对应位置的数字(1和1),然后将乘积相加( 2 x 1 + 1 x 1),得到结果矩阵左上角的那个值3。也就是说,结果矩阵第m行与第n列交叉位置的那个值,等于第一个矩阵第m行与第二个矩阵第n列,对应位置的每个值的乘积之和。
    • 线性代数基于矩阵的推导:
点击查看代码
a1 = np.array([[2,1],[4,3]])
a2 = np.array([[1,2],[1,0]])

np.dot(a1,a2)

array([[3, 4],
       [7, 8]])

标签:数据分析,arr,16,34,---,数组,array,numpy
From: https://www.cnblogs.com/Tmars/p/18216277

相关文章

  • Nginx R31 doc-13-Limiting Access to Proxied HTTP Resources 访问限流
    前言大家好,我是老马。很高兴遇到你。我们为java开发者实现了java版本的nginxhttps://github.com/houbb/nginx4j如果你想知道servlet如何处理的,可以参考我的另一个项目:手写从零实现简易版tomcatminicat手写nginx系列如果你对netty不是很熟悉,可以读一下从......
  • 鸿蒙HarmonyOS实战-Stage模型(线程模型)
    ......
  • c++设计模式-装饰器模式和代理模式
    namespace_nmsp1{//抽象的控件类classControl{public:virtualvoiddraw()=0;//draw方法,用于将自身绘制到屏幕上。public:virtual~Control(){}//做父类时析构函数应该为虚函数};//列表控件类classListCtrl......
  • Java-JVM-运行时数据区
    参考:面试必问,JVM内存模型详解一篇文章掌握整个JVM,JVM超详细解析!!!JVM内存模型深度刨析图灵课堂-JVM极简教程(视频)0.是什么JVM是JavaVirtualMachine的缩写,即Java虚拟机。它能够运行编译后的Java字节码,使Java程序具有跨平台的特性。JVM并不会在安装JDK或JRE时自动启动,当......
  • 2000.1-2022.06.17中国经济政策不确定性指数日度数据
    2000.1-2022.06.17中国经济政策不确定性指数数据(日度)1、时间:2001.1.1-2022.06.172、指标:CNEPU(经济政策不确定性指数)3、来源:ChinaEconomicPolicyUncertaintyIndex4、用途:可用于量化我国经济政策的不确定性,预测宏观经济增长,分析政策波动对企业的影响5、指标解释:中国经济......
  • 系统编程练习题----使用消息队列实现两个进程之间的通信
    目录题目思路代码展示进程A进程B结果展示题目要求进程A创建一条消息队列之后向进程B发送SIGUSR1信号,进程B收到该信号之后打开消息队列并写入一段信息作为消息写入到消息队列中,要求进程B在写入消息之后,发SIGUSR2信号给进程A,进程A收到该信号则从消息队列中读取消息并输出消息正文......
  • NumPy 二项分布生成与 Seaborn 可视化技巧
    二项分布简介二项分布是一种离散概率分布,用于描述在固定次数的独立试验中,事件“成功”的次数的概率分布。它通常用于分析诸如抛硬币、做选择题等具有两个结果(成功或失败)的事件。参数二项分布用三个参数来定义:n:试验次数,表示重复相同实验的次数。p:每次试验中成功事件发生的概......
  • 【ROS】-- 自定义回调队列
    在ros中,我们常用的回调处理是ros::spin()或者ros::spinOnce(),但是,这两个是阻塞式单线程处理的,即当不做其他处理的情况下,某一个回调函数堵塞,其他topic或者service的回调函数就无法进入。使用ros多线程的方式可以解决该问题,但引入多线程会导致线程安全的问题。针对某些场景,......
  • 7-44 黑洞数
    黑洞数也称为陷阱数,又称“Kaprekar问题”,是一类具有奇特转换特性的数。任何一个各位数字不全相同的三位数,经有限次“重排求差”操作,总会得到495。最后所得的495即为三位黑洞数。所谓“重排求差”操作即组成该数的数字重排后的最大数减去重排后的最小数。(6174为四位黑洞数。)例......
  • 2024-05-23_结构体概念等作业
    1.如有以下代码:structstudent{intnum;charname[32];floatscore;}stu;则下面的叙述不正确的是:()A.struct是结构体类型的关键字B.structstudent是用户定义的结构体类型C.num,score都是结构体成员名D.stu是用户定义的结构体类型名解析:A:正确,在C......