首页 > 编程语言 >【利用Python进行数据分析8】Pandas入门(描述性统计的汇总与计算)

【利用Python进行数据分析8】Pandas入门(描述性统计的汇总与计算)

时间:2024-07-16 22:56:22浏览次数:15  
标签:obj2 Python Series df 描述性 pd NA print Pandas

导包
import yfinance as yf
import pandas as pd
import numpy as np
1.描述性统计的汇总与计算
#1.描述性统计的汇总与计算
#数值型数据
df=pd.DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],
                index=["a","b","c","d"],
                columns=["one","two"])
#print(df.sum())#输出列之和的Series
#print(df.sum(axis=1))#输出行之和的Series
#print(df.sum(axis=1,skipna=False))#不跳过NA的计算,即有NA则和直接返回NA
#print(df.mean(axis=1))#算平均数,要求至少有一个非NA,此时计算的平均数是剩余非NA数的平均值
#print(df.idxmax())#最大值索引
#print(df.cumsum())#按列逐行累计加和
#print(df.describe())#生成多个汇总统计
#print("---------------------")
#非数值型
obj=pd.Series(["a","a","b","c"]*4)
#print(obj.describe())
2.相关系数与协方差
#2.相关系数与协方差
symbols=['AAPL','GOOG','IBM','MSFT']
#data=yf.download(symbols,"2016-10-17","2016-10-21")#下载历史五日数据,要tz,先留着(
3.唯一值,计数和成员属性
#3.唯一值,计数和成员属性
obj2=pd.Series(["c","a","d","a","a","b","b","c","c"])
uniques=obj2.unique()#生成唯一值的数组形式
#print(uniques)#数值型可用sort排序
#print(obj2.value_counts())#统计频次,按频次降序排列生成Series
#print(pd.Series(obj2.to_numpy()).value_counts())#统计频次,按频次降序排列生成Numpy

#print(obj2[obj2.isin(["b","c"])])#过滤指定项子集
vals=pd.Series(["c","b","a","d"])
#print(pd.Index(vals).get_indexer(obj2))#Index.get_indexer方法,输出vals规定的索引array

data2=pd.DataFrame({"Qu1":(1,3,4,3,4),
                    "Qu2":(2,3,1,2,3),
                    "Qu3":(1,5,2,4,4)})

#print(data2["Qu1"].value_counts().sort_index())#取一列计数
#print(data2.value_counts())#每行当作元组

标签:obj2,Python,Series,df,描述性,pd,NA,print,Pandas
From: https://blog.csdn.net/real_Tartaglia/article/details/140479210

相关文章

  • Python进阶(1)--面向对象
    文章目录面向对象类的定义类的构造实例化一个类三大特点封装私有属性继承和多态继承继承的作用多态总结总结面向对象Python是一种广泛使用的解释型、高级编程、通用型编程语言,它以其简洁、易读以及面向对象的特性而闻名。面向对象编程(Object-OrientedProgramm......
  • 初始python异常捕获
    1、打开文件#打开文件的两种方式f=open("文件名/文件路径","要进行的操作",encoding="utf-8")#其中utf-8可以省略不写withopen("文件名/文件路径","要进行的操作",encoding="utf-8")asf:#这两种的区别,第一种需要进行手动关闭文件,里面没有内置关闭f.close第二种内置关闭,......
  • python如何执行windows命令
    python如何执行windows命令?方法如下:1、使用os.system("cmd")特点是执行的时候程序会打出cmd在Linux上执行的信息。import osos.system("ls")2、使用Popen模块产生新的process现在大部分人都喜欢使用Popen。Popen方法不会打印出cmd在linux上执行的信息。的确,Popen非......
  • 初识python容器
    python容器数据容器分类:list,tuple,str,set,dictlist1、列表的格式:变量名称=["元素1","元素2","列表1","元素4"]eg:name_list=["wo","xi","huan","ni","520",[1,2,3]]#定义空变量变量名称=[]变量名称=list()......
  • Python爬虫Post请求返回值为-1000
    今天写了一个简单的爬虫程序,为了爬取kfc官网的餐厅数据,代码如下#ajax的post请求--肯德基官网defcreate_request(page):url='http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx'data={ 'cname':'濮阳', 'pid':'', 'pageIndex':p......
  • python的浅复制
    天天用着python写代码,但是其实很多东西原理都不是很清楚,还是得知其所以然,否则处处踩坑关键词:递归、列表、set,边遍历边修改边遍历边修改是一件很危险的行为,小白无知,竟然大胆的使用了,还莫名其妙work了,然后进入了细致的分析。第一种情况defbacktracing(index):globalc......
  • PYTHON用时变马尔可夫区制转换(MARKOV REGIME SWITCHING)自回归模型分析经济时间序列|附
    全文下载链接:http://tecdat.cn/?p=22617最近我们被客户要求撰写关于MRS的研究报告,包括一些图形和统计输出。本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。它应用了Hamilton(1989)的滤波器和Kim(1994)的平滑器  %matplot......
  • 十天学会Python——第6天:面向对象
    1面向对象1.1类和对象(用类创建对象)类的语法:class类名():执行的代码对象的语法:对象名=类名()classWasher(): #定义类defwash(self): print("可以洗衣服")print(self) #返回结果是跟下面gree的地址一样gree1=Washer()......
  • 深入解析 Python 文件操作利器 —— shutil
    在Python编程中,文件操作是一个常见且重要的任务。无论是复制文件、移动文件还是压缩文件,Python都提供了强大的库来简化这些操作。其中,shutil库无疑是文件操作的得力助手。本文将深入探讨shutil库的各种功能,包括文件复制、内容覆盖、文件移动和重命名、文件删除、文件......
  • 【已解决】完美解决Python2操作中 文名文件乱码 问题:深入解析与策略
    【已解决】完美解决Python2操作中文名文件乱码问题:深入解析与策略亲测有效一、乱码问题的根源剖析二、优雅处理乱码问题的策略1.统一编码:2.正确处理文件路径:3.异常处理:4.环境适配:三、示例代码与最佳实践四、扩展应用与高级技巧五、总结与展望一、......