首页 > 其他分享 >大数据基本公式——一:基础

大数据基本公式——一:基础

时间:2024-07-20 10:17:57浏览次数:12  
标签:基本 10 plt 公式 random 四分 数组 np 数据

7课   说白了np.array用来创造数组

np.linespace(0,10,100)  产生0-10之间均匀分布的100个数字  不写100的话就50个

 dtype=np.float32  unit8是图片一般0-255 unit16 32 64 无符号整型

a.astype(np.int16)

8课

切片如果改变,原来的数组的值也会改变,因为数据量太大了。占内存。所以用copy方法在内存中搞   .copy()深复制

切片简写a[0][2][1]简写成a[0,2,1]

a[:,2,1]维度全取,第二行,第一个

9课

a[a>10] 里面是布尔,再选数组

a[(a>5)&(a<20)]

10课

标量加最简单,同形加是对应元素相加,相同形状。行相加,列相同行不一,就让那一行给他们轮流发生关系

广播复用一行对应对方两行

a.reshape(2,1)     原来是[0,1] 变成 ([0],[1] )

a.T转置,将2X5变成5X2

11课

连接用元祖np.concatnate((a,b))由数组组成的元祖进行合并,我理解所谓合并就是将两个数组合并

如果都是一行就合在一起了,

合并还用stack方法np.stack([1,2,3,4],[5,6,7,8])每一个数祖做为元素合并

concatnate 不增加维度,而stack是堆起来

添加是用np.append(a,5) 但是:高围数组用append时如果不指定轴会让其合并,并且展开。需要注意的一点 列添加元素,再看看,值得复习一下也就是加一列

np.append(a,[[5],[6]])   这就是给每行的最后边加上一个值 

np.unique(a) 

 

12课

np.mean(a)   np.sun(a)  a.sun是对象方法

a.mena(axis=1)

第一次讲方差

13课

np.random.randn(10)正态分布的随机数    np.random.rand——————20课讲,0-1的随机数

a=np.sort(a)要先赋值才等于a.sort____顶级方法改变不了原值 

a.reshape(2,5)等价于 a.shape=2.5

np.argsort(a)返回排序后的索引

np.argmax(a)返回最大值 索引

np.where(a>2)___》2的索引   不常用,一般用a[a>2]

 

np.where(cond,a,b)______值 得一记,当cond为True时从a取,false从b取

(a>2).sun()   算出a>2的数量

 

14课

np.random.randn(10)正态分布随机数

np.random.normal(size=(3,4))标准分布随机数_______均值为0方差为1

np.random.randint(1,10,(3,4))最小值 ,最大值 ,3行4列正值    ——————自然数随机数

np.random.permutation(len(a))    乱序 生成一个从0到这个值之音的一个乱序的值 

np.random.choice([1,2,3,4,5,6])  随机选一个数   可以再加一个参数size=2每次取出2个

np.random.seed(5)  np.random.randn(3,4)   前面加上了seed后面再运行就是一样的结果了

 

np.save(11.txt,a)   np.load(全路径)

np.savetxt(11.txt,a)  保存为文本形式   np.loadtxt(11.txt,a)

 

15课 ——————marker,linewidth,color

plt.plot(x,y label='a公司')

plt.legend()显示label的字样————不然没有

plt.plot(x,color='r',linestyle='-.',linewidth=5,marker='^')

plt.xlabel('age')给x加标签

plt.title('student')

plt.xlim___x轴的取值范围

plt.ylim___y轴的取值范围  

x.ticks([0,4,8],['baby','young','adult'])取值标记——————在哪些关键位置设置名字

18课

plt.grid()加网格

plt.style.use('ggplot')

import seaborn直接这样写就是引入了

 19课

plt.bar(x,y,bottom=y)用y做底和别的图对比————有两个图的情况

plt.figure(figsize=(10,10))视始化一张画布  默认会有还给我

直方图plt.hist (data,bins=40)里面的bins是分成多少份 

箱形图的异常值:这个 值+大于上四分位+1.5倍上四分位-下四分位,或:小于下四分位-上四分位-下四分位的1.5倍

线形图plt.scatter()   里面的s= 是管点的大小

 

20课

堆积图(占有率)

plt.stackplot( comp,y1,y2,y3,y4,labels=列表,就显示名字了)      plt.xticks([1,2,3,4],['2011','2012','2013','2014'])加上y轴的名字

 

饼图:plt.pie   

labels=['apple','micro','yahoo','google']
size=[15,30,45,10]

explode=(0.1,0,0,0)
plt.pie(size,labels=labels,autopct="%1.1f%%",explode=explode,startangle=90)

列宽为1,小数点后为1,f为float

 

 

 

22课

plt.subplot

plt.suptitle('')总标题

 

24课

plt.rcParams['font.ans-serif']=['SimHei']

显示中文:plt.rcParams['font.sans-serif']=['SimHei']    显示负号: plt.rcParams['axes.unicode_minus']=False

plt.xticks([],[],rotation=30)让字进行旋转

plt.savefig('位置/xxx.jpg')

在解释器中,如果想让图片显示出来,可能要先保存图片再.show()才行   

标签:基本,10,plt,公式,random,四分,数组,np,数据
From: https://www.cnblogs.com/wenjingping/p/18011315

相关文章

  • java 基本语法2
    1java的String类型和c++的string类似但存在以下区别(1)String为常量字符串不可以修改(2)String不支持'[]'的访问格式,获取对应下标的字符需要使用charAt(index);(3)String不可以用''来比较字符串是否相等,对于;Stringstr="haha",在串池中开辟空间,而使用new和Scanner读入在堆......
  • es统计数据去除某个字段的某些数据
    es统计数据去除某个字段的某些数据要在Elasticsearch中统计数据并去除某个字段的特定数据,可以使用以下步骤:使用terms聚合获取不需要的数据的分布。使用filter聚合结合terms筛选掉不需要的数据。以下是一个Elasticsearch查询的例子,假设我们有一个名为logs的索引,我们想要统计一......
  • 【大数据专题】Flink题库
    1.简述什么是ApacheFlink?ApacheFlink是一个开源的基于流的有状态计算框架。它是分布式地执行的,具备低延迟、高吞吐的优秀性能,并且非常擅长处理有状态的复杂计算逻辑场景2.简述Flink的核心概念?Flink的核心概念主要有四个:EventStreams、State、Time和Snapsho......
  • siebel切换数据源【转】
    需求:将SIT应用服务器10.10.1.151中配置的数据源改为测试集群数据库服务器10.10.1.53、10.10.1.54 方法:1.将正式环境数据库1718的RACDB还原到测试集群服务器1.53、1.542.停server和gatway3.修改E:\app\Administrator\product\11.2.0\client_1\network\admin下的Tnsnames......
  • Oracle(11)Oracle有哪些常见的数据类型?
    Oracle数据库提供了多种数据类型,用于存储不同类型的数据。以下是一些常见的Oracle数据类型,并结合代码进行详细说明:VARCHAR2:存储可变长度的字符串,最大长度为4000字节。CREATETABLEemployees(employee_idNUMBER,first_nameVARCHAR2(50),last_nameVAR......
  • 数据结构:栈
    数据结构:栈满足栈的特性,只有先进后出的特性,不能遍历,也就不能遍历打印,也不能随机访问。栈栈:栈是在处理数据时是先进后出、就是先进栈的数据最后一个出栈、最后一个进栈的数据第一个出栈、栈就类似于给一把手枪弹夹压子弹,给弹夹压子弹的顺序就如同数据进栈的顺序,第一颗子......
  • 数据容器
    数据容器序列:元组,序列,字符串切片a="万过薪月,员序程马黑来,nohtyP学"#方法一:先逆序[::-1]再切片取出,可以连着写b=a[::-1][9:14]print(b)#方法二:先取出来再逆序print(a[5:10][::-1])#方法三:split划分print(a.split(",")[1][0:5][::-1])#方法四:split划分+replaceprint......
  • 【Rust光年纪】解锁Rust语言核心库奥秘:加密、数字签名和数据库操作全面解析
    从加密到数据库:探索Rust语言丰富的工具库生态系统前言在Rust语言开发中,使用合适的库可以极大地提高代码的安全性和效率。本文将介绍一些用于加密、数字签名、数据库连接等功能的Rust语言库,帮助读者快速了解其核心功能、使用场景以及安装配置等方面的信息。欢迎订阅专栏:R......
  • 【视频讲解】PCA主成分分析原理及R语言2实例合集|附代码数据
    原文链接:https://tecdat.cn/?p=37034原文出处:拓端数据部落公众号 分析师:RuoyiXu在数据分析的浩瀚宇宙中,我们时常面对多变量的数据海洋。这些变量虽然信息丰富,却也给处理带来了巨大挑战:工作量激增,而关键信息却可能淹没在繁杂的数据之中。为了有效减少指标数量同时尽可能保留原......
  • 大数据学习02
    HDFS(HadoopDistributedFileSystem)HDFS是Hadoop的核心组件之一,旨在解决大数据存储和管理的问题。其主要特性包括高容错性、高可扩展性和高吞吐量。HDFS将文件拆分成多个数据块,并将这些数据块分布存储在集群的不同节点上,从而实现数据的高可靠性和高可用性。HDFS的主......