首页 > 其他分享 >3.1-Pandas数据结构

3.1-Pandas数据结构

时间:2023-10-18 15:38:10浏览次数:40  
标签:packages apple satisfied Pandas 3.1 数据结构 data pandas Out

3.1-Pandas数据结构    

3.1.1 认识Pandas库

  • 基于Numpy的一种工具,为解决数据分析任务而创建的,纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具
  • 基本上你能用Excel或者Bi工具进行的数据处理,Pandas也都能实现,而且更快
  In [ ]:
pip install pandas
   
Requirement already satisfied: pandas in c:\users\dengzl\.conda\envs\data_analysis\lib\site-packages (2.1.1)
Requirement already satisfied: numpy>=1.22.4 in c:\users\dengzl\.conda\envs\data_analysis\lib\site-packages (from pandas) (1.26.0)
Requirement already satisfied: python-dateutil>=2.8.2 in c:\users\dengzl\.conda\envs\data_analysis\lib\site-packages (from pandas) (2.8.2)
Requirement already satisfied: pytz>=2020.1 in c:\users\dengzl\.conda\envs\data_analysis\lib\site-packages (from pandas) (2023.3.post1)
Requirement already satisfied: tzdata>=2022.1 in c:\users\dengzl\.conda\envs\data_analysis\lib\site-packages (from pandas) (2023.3)
Requirement already satisfied: six>=1.5 in c:\users\dengzl\.conda\envs\data_analysis\lib\site-packages (from python-dateutil>=2.8.2->pandas) (1.16.0)
Note: you may need to restart the kernel to use updated packages.
   

3.1.2 数据结构:Series、DataFrame

区别

  • series,只是一个一维数据结构,它由index和value组成
  • dataframe,是一个二维结构,处理拥有index和value之外,还拥有column. 联系
  • dataframe由多个series组成,无论是行还是列,单独拆分出来都是一个series

1697526982802.png

  In [ ]:
# 创建一张二维表格 ---> 判断数据结构/属性
data = {'apples':[3,2,0,1],'oranges':[0,3,7,2]}
data
  Out[ ]:
{'apples': [3, 2, 0, 1], 'oranges': [0, 3, 7, 2]}
  In [ ]:
type(data)
  Out[ ]:
dict
  In [ ]:
import pandas as pd
data = pd.DataFrame(data)
data
  Out[ ]:  
 applesoranges
0 3 0
1 2 3
2 0 7
3 1 2
  In [ ]:
type(data)
  Out[ ]:
pandas.core.frame.DataFrame
  In [ ]:
apple = data['apples']
apple
  Out[ ]:
0    3
1    2
2    0
3    1
Name: apples, dtype: int64
  In [ ]:
type(apple)
  Out[ ]:
pandas.core.series.Series
  In [ ]:
apple = pd.Series(apple, index=[3,2,1,0])
apple
  Out[ ]:
3    1
2    0
1    2
0    3
Name: apples, dtype: int64
  In [ ]:
apple.reset_index()   # 重置索引
  Out[ ]:  
 indexapples
0 3 1
1 2 0
2 1 2
3 0 3
  In [ ]:
apple.reset_index(drop=True)  # 重置索引并删除原有索引
  Out[ ]:
0    1
1    0
2    2
3    3
Name: apples, dtype: int64
   

3.1.3 Numpy v.s. Pandas

  In [ ]:
# 两者的互相转换
import numpy as np
data2 = np.arange(15).reshape(3,5)
data2
  Out[ ]:
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])
  In [ ]:
pd.DataFrame(data2)
  Out[ ]:  
 01234
0 0 1 2 3 4
1 5 6 7 8 9
2 10 11 12 13 14
  In [ ]:
data3 = pd.DataFrame(data2,columns=['a','b','c','d','e'])   # numpy转为pandans
data3
  Out[ ]:  
 abcde
0 0 1 2 3 4
1 5 6 7 8 9
2 10 11 12 13 14
  In [ ]:
data3.values   # pandans转为numpy
  Out[ ]:
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])
  In [ ]:  

标签:packages,apple,satisfied,Pandas,3.1,数据结构,data,pandas,Out
From: https://www.cnblogs.com/mlzxdzl/p/17772462.html

相关文章

  • 2023.10.13NOIPSIM3总结
    T1卡牌赛时打了一个\(\Omicron(nm)\)的暴力,拿到30分。我们发现第\(i\)张牌对BOSS造成的伤害为$att_i*\lceil\frac{hp_i}{Att}\rceil$,那么考虑以卡牌血量值域为下标开一个桶,储存相同血量的卡牌的\(\sumatt\)。对于每一级BOSS的攻击力,我们都可以在桶上根据\(\lceil......
  • [911] Read Data from Google Sheets into Pandas without the Google Sheets API (.g
    ref:ReadDatafromGoogleSheetsintoPandaswithouttheGoogleSheetsAPIimportpandasaspdsheet_id="1XqOtPkiE_Q0dfGSoyxrH730RkwrTczcRbDeJJpqRByQ"sheet_name="Sheet1"url=f"https://docs.google.com/spreadsheets/d/{sheet......
  • 【数据结构】7.平衡搜索树(AVL树和红黑树)
    0.概述对于普通的搜索树,如果一直插入比第一个元素小的元素,它会退化成一个无限向左下角眼神的单链表,使得时间复杂度退化为O(n)。如果我们在插入时保持树的结构是平衡的,则可以保证查找、插入和删除的时间复杂度有对数级的时间性能,下面讲到的AVL树和红黑树都是平衡搜索树,通过旋......
  • 界面组件DevExpress WPF v23.1 - 全面升级文档处理功能
    DevExpressWPF拥有120+个控件和库,将帮助您交付满足甚至超出企业需求的高性能业务应用程序。通过DevExpressWPF能创建有着强大互动功能的XAML基础应用程序,这些应用程序专注于当代客户的需求和构建未来新一代支持触摸的解决方案。无论是Office办公软件的衍伸产品,还是以数据为中心......
  • 1数据结构
    数据结构数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。基本概念数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。数据元素:是组成数据的、有一定意义的基本单位,在计算......
  • C#学习笔记--数据结构、泛型、委托事件等进阶知识点
    C#进阶简单数据结构类ArrayList元素类型以Object类型存储,支持增删查改的数组容器。因而存在装箱拆箱操作,谨慎使用。//ArrayListArrayListarray=newArrayList();//增=================array.Add("Hello");array.Add(true);array.Add("Tony");//添加单个元素array.Add(......
  • 2023.10.17——每日总结
    学习所花时间(包括上课):9h代码量(行):0行博客量(篇):1篇今天,上午学习,下午学习;我了解到的知识点:1.大型数据库明日计划:学习......
  • 「Log」2023.10.17 小记
    CSP第二轮倒数\(3\)天。序幕\(\text{6:40}\):到校,整理博客。\(\text{7:30}\):模拟赛发题。题意都很简单,感觉都是很怪异的配置,T1性质是显著的,一会就切了。T3感觉不知道想考啥,反手扔个乱搞。T2T4是一点思路没有,T4连暴力都不会,应该涉及到切比雪夫距离性质啥的。被创死了......
  • 十天学完基础数据结构-第四天(链表(Linked List))
    链表的基本概念链表是一种线性数据结构,与数组不同,链表的元素(节点)之间通过指针相互连接。链表有以下基本概念:节点:链表中的每个数据项称为节点,每个节点包含数据和一个指向下一个节点的指针。头节点:链表的第一个节点称为头节点,它通常用来表示整个链表的起始位置。尾节点:链表的最后一个......
  • 数据结构
    数据结构数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。基本概念数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。数据元素:是组成数据的、有一定意义的基本单位,在计算......