首页 > 其他分享 >使用 NumPy 进行数据处理——数据科学第 185 天

使用 NumPy 进行数据处理——数据科学第 185 天

时间:2022-08-28 18:01:32浏览次数:95  
标签:输出 matrix np 直方图 数组 185 数据处理 NumPy

使用 NumPy 进行数据预处理——数据科学第 185 天

Source: https://numpy.org/

上次,我们查看了安装 NumPy 包并探索了使用 NumPy 的数组的基础知识。 — 是的,上次是第 184 天,但我在发表文章时打错了字。

[

使用 NumPy 进行数据处理——数据科学第 146 天

是的,已经有一段时间了。准确地说,我离开了两个半月,其他项目占用了我更多的时间……

媒体网

](/vizneo-academy/data-processing-with-numpy-data-science-day-146-dabb87e97a28)

今天,我们来看看如何在 NumPy 中使用统计函数。

例如,您可以设置以下数组:

 matrix_A = np.array([[1,0,0,3,1],[3,6,6,2,9],[4,5,3,8,0]])  
 矩阵_A #输出->  
 数组([[1, 0, 0, 3, 1],  
 [3, 6, 6, 2, 9],  
 [4, 5, 3, 8, 0]])

如果您获取所有值并将它们排序在一个列表中,您将获得一个值列表。

 np.sort(矩阵_A,轴=无)  
 #输出->  
 数组([0, 0, 0, 1, 1, 2, 3, 3, 3, 4, 5, 6, 6, 8, 9])

通过在这个数组上应用中位数,它应该给出列表中的中间值。

 np.median(matrix_A)  
 #输出->  
 3.0

平均值返回一个浮点数

 np.mean(matrix_A)  
 #输出->  
 3.4

数组的方差给出

 np.var(matrix_A)  
 #输出->  
 7.84

标准差

 np.std(matrix_A)  
 #输出->  
 2.8

现在,测试 2.8² 也等于方差 7.84

 np.std(matrix_A)**2  
 #输出->  
 7.839999999999999

所以看起来是正确的。

继续使用直方图,在这种情况下显示来自数组的数值数据的频率。

 matrix_A = np.array([[1,0,0,3,1],[3,6,6,2,9],[4,5,3,8,0]])  
 矩阵_A  
 #输出->  
 数组([[1, 0, 0, 3, 1],  
 [3, 6, 6, 2, 9],  
 [4, 5, 3, 8, 0]]) np.sort(矩阵_A,轴=无)  
 #输出->  
 数组([0, 0, 0, 1, 1, 2, 3, 3, 3, 4, 5, 6, 6, 8, 9])  
 # 我们可以看到值的频率 np.histogram(matrix_A, bins = 10, range = (0,9))  
 #输出->  
 (数组([3, 2, 1, 3, 1, 1, 2, 0, 1, 1]),  
 数组([0., 0.9, 1.8, 2.7, 3.6, 4.5, 5.4, 6.3, 7.2, 8.1, 9. ]))

直方图数组有两个值列表,其中第一个显示 bin 中每个值范围的频率。在这种情况下,bin 被定义为 10 个 bin,从 0 到 9。

通过使用 matplotlib,我们可以说明直方图:

 将 matplotlib.pyplot 导入为 plt  
 plt.hist(matrix_A.flat, bins = np.histogram(matrix_A)[1])  
 plt.show()

Author image

未完待续…

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/1348/52422817

标签:输出,matrix,np,直方图,数组,185,数据处理,NumPy
From: https://www.cnblogs.com/amboke/p/16633258.html

相关文章

  • 矩阵和 numpy.transpose
              矩阵和numpy.transpose由文章[Transformer源码详解(Pytorch版本)-知乎(zhihu.com)](https://zhuanlan.zhihu.com/p/398039366?utm_cam......
  • Java8 新特性之流式数据处理
    一.流式处理简介在我接触到java8流式处理的时候,我的第一感觉是流式处理让集合操作变得简洁了许多,通常我们需要多行代码才能完成的操作,借助于流式处理可以在一行中实现......
  • NC20185 [JSOI2010]缓存交换
    题目原题地址:[JSOI2010]缓存交换题目编号:NC20185题目类型:堆、贪心时间限制:C/C++1秒,其他语言2秒空间限制:C/C++262144K,其他语言524288K1.题目大意Cache容量以及......
  • 关于ppo中针对MLP和RNN两种不同网络结构的数据处理与采样方法
    在RL中,需要对数据进行采样,因此如何构造可采样的数据或数据块,则是需要关注的问题: ifself.actor_critic.is_recurrent:data_generator=rollouts.recurrent_generat......
  • Pandas数据处理
    通用方法 pandas.melt =>选择一个列变量为列索引值为列数据dfABC0a121b342c56pd.melt(df,id_vars=['A'],value_vars=['B'],var......
  • 【python】numpy数组升维函数expand_dims()
    expand_dims(a,axis),其中a为输入的数组,axis为整型指定要增加的维数位置可以结合shape()来看,shape()返回的是一个tuple,把其看成一个数组并指定下标。如果shape为(1,2),则......
  • Windows10 pybind11 opencv 和numpy相互转换 (tcy)
      利用pybind11实现python和C++图像之间的相互调用。将Mat类引入python中。 图像相互转换通过左值引用及智能指针实现。封装了类操作及8个函数(Mat和numpy......
  • 验证码和前台数据处理结果
    验证码和前台数据处理结果RegistUserServlet类:@WebServlet("/registUserServlet")publicclassRegistUserServletextendsHttpServlet{protectedvoiddoPost(......
  • pagehelper list数据处理后进行分页
    问题背景:PageHelper的分页只有在PageHelper.startPage(pageNum,pageSize)之后的数据库查询语句才起作用,原因是PageHelper的实现原理是在数据库查询过程中通过拦截器拦截处......
  • numpy的基本使用
    参考1.Numpy介绍Numpy全称为numbericalpython。2.ndarray介绍ndarray全称N-dimensionalarray,一个N维数组类型,相同类型元素的集合。ndarray比python中的原生列表运算......