大数据基本公式——一：基础

时间：2024-07-20 10:17:57浏览次数：12

标签：基本 10 plt 公式 random 四分数组 np 数据

7课说白了np.array用来创造数组

np.linespace(0,10,100) 产生0-10之间均匀分布的100个数字不写100的话就50个

dtype=np.float32 unit8是图片一般0-255 unit16 32 64 无符号整型

a.astype(np.int16)

8课

切片如果改变，原来的数组的值也会改变，因为数据量太大了。占内存。所以用copy方法在内存中搞 .copy()深复制

切片简写a[0][2][1]简写成a[0,2,1]

a[:,2,1]维度全取，第二行，第一个

9课

a[a>10] 里面是布尔，再选数组

a[(a>5)&(a<20)]

10课

标量加最简单，同形加是对应元素相加，相同形状。行相加，列相同行不一，就让那一行给他们轮流发生关系

广播复用一行对应对方两行

a.reshape(2,1) 原来是[0,1] 变成 ([0],[1] )

a.T转置，将2X5变成5X2

11课

连接用元祖np.concatnate((a,b))由数组组成的元祖进行合并，我理解所谓合并就是将两个数组合并

如果都是一行就合在一起了，

合并还用stack方法np.stack([1,2,3,4],[5,6,7,8])每一个数祖做为元素合并

concatnate 不增加维度，而stack是堆起来

添加是用np.append(a,5) 但是：高围数组用append时如果不指定轴会让其合并，并且展开。需要注意的一点列添加元素，再看看，值得复习一下也就是加一列

np.append(a,[[5],[6]]) 这就是给每行的最后边加上一个值

np.unique(a)

12课

np.mean(a) np.sun(a) a.sun是对象方法

a.mena(axis=1)

第一次讲方差

13课

np.random.randn(10)正态分布的随机数 np.random.rand——————20课讲，0-1的随机数

a=np.sort(a)要先赋值才等于a.sort____顶级方法改变不了原值

a.reshape(2,5)等价于 a.shape=2.5

np.argsort(a)返回排序后的索引

np.argmax(a)返回最大值索引

np.where(a>2)___》2的索引不常用，一般用a[a>2]

np.where(cond,a,b)______值得一记，当cond为True时从a取，false从b取

(a>2).sun() 算出a>2的数量

14课

np.random.randn(10)正态分布随机数

np.random.normal(size=(3,4))标准分布随机数_______均值为0方差为1

np.random.randint(1,10,(3,4))最小值，最大值，3行4列正值 ——————自然数随机数

np.random.permutation（len(a)）乱序生成一个从0到这个值之音的一个乱序的值

np.random.choice([1,2,3,4,5,6]) 随机选一个数可以再加一个参数size=2每次取出2个

np.random.seed(5) np.random.randn(3,4) 前面加上了seed后面再运行就是一样的结果了

np.save(11.txt,a) np.load(全路径)

np.savetxt(11.txt,a) 保存为文本形式 np.loadtxt(11.txt,a)

15课 ——————marker，linewidth,color

plt.plot(x,y label='a公司')

plt.legend()显示label的字样————不然没有

plt.plot(x,color='r',linestyle='-.',linewidth=5,marker='^')

plt.xlabel('age')给x加标签

plt.title('student')

plt.xlim___x轴的取值范围

plt.ylim___y轴的取值范围

x.ticks([0,4,8],['baby','young','adult'])取值标记——————在哪些关键位置设置名字

18课

plt.grid()加网格

plt.style.use('ggplot')

import seaborn直接这样写就是引入了

19课

plt.bar(x,y,bottom=y)用y做底和别的图对比————有两个图的情况

plt.figure（figsize=(10,10)）视始化一张画布默认会有还给我

直方图plt.hist (data,bins=40)里面的bins是分成多少份

箱形图的异常值：这个值+大于上四分位+1.5倍上四分位-下四分位，或：小于下四分位-上四分位-下四分位的1.5倍

线形图plt.scatter() 里面的s= 是管点的大小

20课

堆积图（占有率）

plt.stackplot( comp,y1,y2,y3,y4,labels=列表，就显示名字了) plt.xticks([1,2,3,4],['2011','2012','2013','2014'])加上y轴的名字

饼图：plt.pie

labels=['apple','micro','yahoo','google']
size=[15,30,45,10]

explode=(0.1,0,0,0)
plt.pie(size,labels=labels,autopct="%1.1f%%",explode=explode,startangle=90)

列宽为1，小数点后为1，f为float

22课

plt.subplot

plt.suptitle('')总标题

24课

plt.rcParams['font.ans-serif']=['SimHei']

显示中文：plt.rcParams['font.sans-serif']=['SimHei'] 显示负号： plt.rcParams['axes.unicode_minus']=False

plt.xticks([],[],rotation=30)让字进行旋转

plt.savefig('位置/xxx.jpg')

在解释器中，如果想让图片显示出来，可能要先保存图片再.show(）才行　　

标签：基本,10,plt,公式,random,四分,数组,np,数据
From： https://www.cnblogs.com/wenjingping/p/18011315

java 基本语法2
1java的String类型和c++的string类似但存在以下区别(1)String为常量字符串不可以修改(2)String不支持'[]'的访问格式,获取对应下标的字符需要使用charAt(index);(3)String不可以用''来比较字符串是否相等,对于;Stringstr="haha",在串池中开辟空间,而使用new和Scanner读入在堆......
es统计数据去除某个字段的某些数据
es统计数据去除某个字段的某些数据要在Elasticsearch中统计数据并去除某个字段的特定数据，可以使用以下步骤：使用terms聚合获取不需要的数据的分布。使用filter聚合结合terms筛选掉不需要的数据。以下是一个Elasticsearch查询的例子，假设我们有一个名为logs的索引，我们想要统计一......
【大数据专题】Flink题库
1.简述什么是ApacheFlink？ApacheFlink是一个开源的基于流的有状态计算框架。它是分布式地执行的，具备低延迟、高吞吐的优秀性能，并且非常擅长处理有状态的复杂计算逻辑场景2.简述Flink的核心概念？Flink的核心概念主要有四个：EventStreams、State、Time和Snapsho......
siebel切换数据源【转】
需求：将SIT应用服务器10.10.1.151中配置的数据源改为测试集群数据库服务器10.10.1.53、10.10.1.54 方法：1.将正式环境数据库1718的RACDB还原到测试集群服务器1.53、1.542.停server和gatway3.修改E:\app\Administrator\product\11.2.0\client_1\network\admin下的Tnsnames......
Oracle（11）Oracle有哪些常见的数据类型？
Oracle数据库提供了多种数据类型，用于存储不同类型的数据。以下是一些常见的Oracle数据类型，并结合代码进行详细说明：VARCHAR2：存储可变长度的字符串，最大长度为4000字节。CREATETABLEemployees(employee_idNUMBER,first_nameVARCHAR2(50),last_nameVAR......
数据结构：栈
数据结构：栈满足栈的特性，只有先进后出的特性，不能遍历，也就不能遍历打印，也不能随机访问。栈栈：栈是在处理数据时是先进后出、就是先进栈的数据最后一个出栈、最后一个进栈的数据第一个出栈、栈就类似于给一把手枪弹夹压子弹，给弹夹压子弹的顺序就如同数据进栈的顺序，第一颗子......
数据容器
数据容器序列：元组，序列，字符串切片a="万过薪月,员序程马黑来,nohtyP学"#方法一：先逆序[::-1]再切片取出，可以连着写b=a[::-1][9:14]print(b)#方法二：先取出来再逆序print(a[5:10][::-1])#方法三：split划分print(a.split(",")[1][0:5][::-1])#方法四：split划分+replaceprint......
【Rust光年纪】解锁Rust语言核心库奥秘：加密、数字签名和数据库操作全面解析
从加密到数据库：探索Rust语言丰富的工具库生态系统前言在Rust语言开发中，使用合适的库可以极大地提高代码的安全性和效率。本文将介绍一些用于加密、数字签名、数据库连接等功能的Rust语言库，帮助读者快速了解其核心功能、使用场景以及安装配置等方面的信息。欢迎订阅专栏：R......
【视频讲解】PCA主成分分析原理及R语言2实例合集|附代码数据
原文链接：https://tecdat.cn/?p=37034原文出处：拓端数据部落公众号分析师：RuoyiXu在数据分析的浩瀚宇宙中，我们时常面对多变量的数据海洋。这些变量虽然信息丰富，却也给处理带来了巨大挑战：工作量激增，而关键信息却可能淹没在繁杂的数据之中。为了有效减少指标数量同时尽可能保留原......
大数据学习02
HDFS(HadoopDistributedFileSystem)HDFS是Hadoop的核心组件之一，旨在解决大数据存储和管理的问题。其主要特性包括高容错性、高可扩展性和高吞吐量。HDFS将文件拆分成多个数据块，并将这些数据块分布存储在集群的不同节点上，从而实现数据的高可靠性和高可用性。HDFS的主......

大数据基本公式——一：基础

相关文章

赞助商

阅读排行