首页 > 其他分享 >数据分析进阶

数据分析进阶

时间:2024-05-22 14:44:59浏览次数:14  
标签:数据分析 None 进阶 dtype random shape 数组 np

numpy

numpy提供了一种数组类型,高维数组,提供了数据分析的运算基础(业务表一般就是二维)
import numpy as np
导入numpy库,并查看numpy版本
np._version_

创建array

数据类型一致的一个连续的内存空间,python的列表list不要求数据类型一致
numpy的设计初衷是用于运算的,所以对数据类型进行统一化
如果传进来的列表包含不同的类型,则统一为同一类型,优先级:str>float>int

创建一个numpy的数组

array = np.array([1])

参数介绍:
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

  • dtype数据类型,可选
  • copy对象是否需要复制,可选
  • order创建数组的样式,C为行方向,F为列方向,A为任意方向(默认)
  • subok默认返回一个与基类类型一致的数组
  • ndmin指定生成数组的最小维度

创建高维数组

1. * np.ones(shape,dtype=None,order='C')

以1填充的数组
shape =(m,n) m行n列 二维数组
shape = (m) m个元素的一维数组
shape = (m,) m个元素的一维数组

shape = (m,1) m行1列的二维数组
shape = (1,n) 1行n列的二维数组

`#构造一个5行3列的二维数组`
np.ones(shape=(5,3),dtype=np.int(8))
#构造一个长度为3的一维数组
np.ones(shape=(3))

2. * np.zeros(shape,dtype=float,order='C')

以0填充数组

3. * np.full(shape,fill_value,dtype=None,order='C')

fill_value是填充值,填充值填充数组

4. * np.eye(N,M=None,k=0,dtype=float)

单位矩阵的构造方式
对角线为1其他位置为0
N控制阶数,M和N默认相等,k控制对角线位移

5. np.linspace(start,stop,num=50,endpoint=True,retstep=False,dtype=None)

生成等差数列方法一
七时至,终止值,个数
np.linspace(0,10,10,endpoint=False)生成一个从0到9(因为endpoint为False)的等差数列,一共十个数

6. np.arrange([start,] stop, [step,] dtype=None)

生成等差数列方法二
七十至,终止值,步长
np.arrange(0,10,step=1)
生成一个0-9的数组

7. np.random.randint(low,high=None,size=None,dtype='|')

size相当于shape
生成随机整数
np.random.randint(0,100,size=(5,5))

8.正态函数分布

  • np.randaom.randn(d0,d1,...,dn)标准正态分布
  • np.random.normal()普通正态分布
    标准
    np.random.randn(3,5)
    普通
    np.random.normal(loc=170,scale=5,size=(5,3))
    loc数学期望,scale方差

9. np.random.random(size=None)

生成0-1的随机小数,左闭右开
np.random.random(size=100)
np.random.random(5,3)

10. np.random.permutation(10)

生成0-9的随机无序整数索引

标签:数据分析,None,进阶,dtype,random,shape,数组,np
From: https://www.cnblogs.com/fklife/p/18205606

相关文章

  • PySpark-大数据分析实用指南-全-
    PySpark大数据分析实用指南(全)原文:zh.annas-archive.org/md5/62C4D847CB664AD1379DE037B94D0AE5译者:飞龙协议:CCBY-NC-SA4.0前言ApacheSpark是一个开源的并行处理框架,已经存在了相当长的时间。ApacheSpark的许多用途之一是在集群计算机上进行数据分析应用程序。本书......
  • 跨平台应用开发进阶(八) :uni-app 实现Android原生APP-云打包集成极光推送(JG-JPUSH)详
    跨平台应用开发进阶(八):uni-app实现Android原生APP-云打包集成极光推送(JG-JPUSH)详细教程:https://blog.csdn.net/sunhuaqiang1/article/details/124337987?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171619616916800182772309%2522%252C%2522scm%2522%253A%252......
  • C语言编程题练习 (从初识到入门再到进阶)修正版
    C语言编程题练习......
  • Python数据分析numpy、pandas、matplotlib包
    Python数据分析numpy、pandas、matplotlib一、基础1.1notebook的一些配置快捷键:ctrl+enter执行单元格程序并且不跳转到下一行esc+L可以显示行号结果是打印的而没有返回任何的值就没有out1.2列表基础知识回顾b=[1,2.3,'a','b']b#列表中的元素允许各个元素不一样......
  • 2024年CodeStar年度综合评估-提高进阶组
    T3.挑剔的美食家作为一名挑剔的美食家,小猴对食物是很讲究的,哪怕摆在面前的只有若干香蕉和苹果,小猴依然有他的讲究。已知目前已有\(n\)根香蕉和\(m\)个苹果,小猴制定了以下规则来决定自己的食用顺序:每个香蕉都被认为是独特的个体,可以理解为编号为\(1\simn\)的香蕉各不......
  • Python数据分析与挖掘实战(1-3章)
    非原创,仅个人关于《Python数据分析与挖掘实战》的学习笔记第一章基础略第二章数据分析简介基本概念元组、列表、字典、集合函数式编程:map()函数:定义一个函数,然后用map()逐一应用到map列表中的每个元素。map(lambdax+2:a)reduce()函数:用于递归计算。reduce(lambdax,......
  • Python进阶之实现单例模式的常见方法
    【一】单例模式介绍【1】什么是单例模式一个类只允许创建一个对象(或者实例),那这个类就是一个单例类,这种设计模式就叫作单例设计模式,简称单例模式【2】为什么要学单例模式当一个类的功能比较单一,只需要一个实例对象就可以完成需求时,就可以使用单例模式来节省内存资源【3】......
  • python 面向对象(进阶篇)
    python面向对象(进阶篇) 上一篇《Python面向对象(初级篇)》文章介绍了面向对象基本知识:面向对象是一种编程方式,此编程方式的实现是基于对 类 和 对象 的使用类是一个模板,模板中包装了多个“函数”供使用(可以讲多函数中公用的变量封装到对象中)对象,根据模板创建的实例(即......
  • LangChain 进阶历史对话管理
    自动历史管理前面的示例将消息显式地传递给链。这是一种完全可接受的方法,但确实需要外部管理新消息。LangChain还包括一个名为RunnableWithMessageHistory的包裹器,能够自动处理这个过程。为了展示其工作原理,我们稍微修改上面的提示,增加一个最终输入变量,该变量在聊天历史记录之后......
  • 常见数据分析模型与方法①-RFM
    一、简述RFM用于对用户进行分类,并判断每类细分用户的价值。通过最近一次消费时间(R):客户距离最近的一次采购时间的间隔。最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。这三......