Jupyter note book工具
1.打开命令C:\Users\用户名>jupyter.exe notebook
2.配置文件
C:\Users\用户名\jupyter_notebook_config.py
设置默认打开路径
## The directory to use for notebooks and kernels. # Default: '' # c.ServerApp.root_dir = '' c.NotebookApp.notebook_dir = r'F:\jupyter_Documents\Python_courses'
Pandas基本介绍
Pandas:Panel data + Data analysis
特点:pandas的底层是基于Numpy作为封装,针对二维数据结构运算做了专门的优化。
难点:工具本身并不难,难是难在这些工具方法特别多,方法的参数也比较多,需要分类记忆。
重点掌握:Pandas的两大基本数据结构:Series和DataFrame
Series
Series这种数据结构类似于Python中的列表,Series = 列表(value) + 标签(index) 是一个一维的数据结构
import pandas as pd # 1.通过传入常规 Python 构造 Series 数据类型 ser1 = pd.Series(['a', 'b', 'c', 'd','e']) print(ser1) print(type(ser1)) # 2.通过字典的方式构造 Series ser2 = pd.Series ({'name':'billy','age':'15','location':'china'}) print(ser2) print(type(ser2)) print(ser2.index) print(ser2.values) print(ser1.index[1:3])# 索引切片前闭后开 print(ser1.values[1:3])# 通过分片的形式获取特定的值或者是标签内容 ser1.index = ['one','two','three','four','five'] # 修改 Series 数据的 index 值,注意修改的index 必须与 Series 的长度一致 print(ser1) # ser1.values = [1,2,3,4,5] # values 无法通过属性直接修改 print(ser1) # 如何修改 Series 中的 values? # 先要选中要修改的 values 值,然后再修改 ser1[:] = [1,2,3,4,5] print(ser1) # 改 three 中的值 ser1[2:3] = [88] print(ser1) ser3 = pd.Series(data = [6,7,8,9,10], index = ['a','b','c','d','e']) # 如果不传入 index 值,默认是 0 开始 print(ser3)