首页 > 编程语言 >《Python数据科学手册》

《Python数据科学手册》

时间:2022-11-08 21:34:20浏览次数:70  
标签:jupyter Python matplotlib 手册 Notebook https 科学 com


《Python数据科学手册》【美】Jake VanderPlas著 陶俊杰译

Absorb what is useful, discard what is not, and  add what is uniquel what own.(取其精华,去其糟粕,再加点自己的独创。)

本书在GitHub上开源:​​https://github.com/jakevdp/PythonDataScienceHandbook​

作者在博客发布Notebook的HTML版本:​​https://jakevdp.github.io/PythonDataScienceHandbook/​

 

精华总结+issue汇总

第一章 Ipython:超越Python

1.三种开发环境:

1)在线版Notebook编程环境——有浏览器就可学习编程知识,推荐想快速掌握知识的朋友使用。目前,有许多安装Python编程环境的Anaconda发行版的网络平台(PaaS),支持Jupyter Notebook编程环境,可以免费使用,如JupyterHub(​​https://tmpnb.org​​​)、SageMathCloud(​​https://cloud.sagemath.com​​​)、微软Azure(​​https://notebooks.azure.com/​​)

它们可以在线运行Notebook文件,编写调试运行代码,也支持文件的上传、下载、新建、删除,还可以运行Terminal工具。

另外,基于Github的Notebook,还有binder(​​https://mybinder.org​​)支持代码仓库一键部署。

类似的在线免费Notebook编程环境还有很多,特别推荐德国Yves Hilpisch博士的The Python Quants Group公司开发的Python Quants Platform(https://tpq.io/)。

Jupyter Notebook支持许多编程语言(Python、R、Scala、Julia、Haskell、Ruby......),甚至支持Kotlin(​​https://github.com/ligee/kotlin-jupyter​​​)、Java 9的REPL新功能JShell(​​https://github.com/Bachmann1234/java9_kernel​​)。

 

2)在电脑上安装Anaconda发行版。由于网络问题,推荐清华大学TUNA镜像下载和更新Anaconda集成开发环境:​​https://mirror.tuna.tsinghua.edu.cn/help/anaconda/​

3)适合了解Docker镜像(​​https://github.com/jupyter/docker-stacks​​),一键安装,省时省力。里面除了标准Anaconda开发环境,还支持Spark、TensorFlow的Notebook开发环境。

 

2.如果你需要一个 Python 入门教程,那么我推荐你阅读本书的姊妹篇 A Whirlwind Tour of the Python Language

 

3.数据收集:​​bicloud的博客——数据挖掘博客收集​

 总结了人脸识别技术、深度学习文章、机器学习课程、深度学习课程、各种数据集。

 

4.GitChat

GitChat 是一个知识分享平台,通过这个平台我们希望改变知识的学习方式。如:​​如何科学的学习一门编程语言?​​

 

5.软件安装注意事项

Anaconda发现版有两种,选哪个?

1)Miniconda:只包含Python解释器和一个名为conda的命令行工具。conda是一个跨平台的程序包管理器,可以管理各种Python程序包,类似于Linux用户熟悉的apt和yum程序包管理器。

2)Anaconda:除了包含Python和conda之外,还同时绑定了四五百个科学计算程序包。所以有几个G大。

推荐:安装Miniconda,所有程序包手动安装(确认选择的是适合Python3的版本),安装包:conda install numpy pandas scikit-learn matplotlib seaborn ipython-notebook

 

第三方模块的安装问题:见我的另一篇博客:​​Python入门之第三方模块安装​​

7.用memory_profiler诊断内存的用量?

参看:《Python高性能编程》——2.9 用memory_profiler诊断内存的用量:​​https://m.aliyun.com/yunqi/articles/96841/​

Issue:如果在运行的时候出现如下的gbk解码错误,解决方案是首先进入 memory_profiler.py文件中,找到第1127行(不同版本可能略有差别),
把with open(filename) as f: 更改成 with open(filename, encoding=’utf-8’) as f:!!! 

 

8.网络资源汇总:

1)Ipython网站:​​http://ipython.org/​

2)nbviewer网站:​​https://nbviewer.jupyter.org/​

3)有趣的IPython Notebook集合(​​https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks​​)

 

第二章 Numpy入门

1.P54代码使用%matplotlib inline

import matplotlib.pyplot as plt

import seaborn; seaborn.set()

plt.hist(heights)

plt.title('Height Distribution of US Presidents')

plt.xlabel('height (cm)')

plt.ylabel('number');

在cmd的ipython窗口中执行不成功?执行%matplotlib inline就报错,而且直方图画不出来?

其中最后一句%matplotlib inline比较奇怪,而且无论你是用哪个python的IDE如spyder或者pycharm,这个地方都会报错,显示是invalid syntax(无效语法)。那为什么代码里面还是会有这一句呢?原来是这样的。
%matplotlib作用

是在使用jupyter notebook 或者 jupyter qtconsole的时候,才会经常用到%matplotlib,也就是说那一份代码可能就是别人使用jupyter notebook 或者 jupyter qtconsole进行编辑的。关于jupyter notebook是什么,可以参考这个链接:[Jupyter Notebook介绍、安装及使用教程][1]
而%matplotlib具体作用是当你调用matplotlib.pyplot的绘图函数plot()进行绘图的时候,或者生成一个figure画布的时候,可以直接在你的python console里面生成图像。

参看:Python关于%matplotlib inline——​​https://www.jianshu.com/p/2dda5bb8ce7d​

Python--matplotlib绘图可视化知识点整理

 

标签:jupyter,Python,matplotlib,手册,Notebook,https,科学,com
From: https://blog.51cto.com/u_15405812/5834925

相关文章

  • Python入门之第三方模块安装
    Python入门之第三方模块安装平台:Win10x64+Anaconda3-5.3.0(+Python3.7.0) Issue说明:pipinstallline_profiler-2.1.2-cp37-cp37m-win_amd64.whl报错pip版本过低,需要更新......
  • Python 爬虫之lxml
    网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、......
  • Python——面向对象(魔法方法、元类)
    Python——面向对象(魔法方法、元类)魔法方法'''魔法方法: 类中定义的双下方法都称为魔法方法 不需要人为调用在特定的条件下回自动触发运行 eg:__init__创建空......
  • python3-pycharm TAB键转换为4个空格
     pycharm默认Tab为4个空格1【File】→【setting】编辑2.【Editor】→【CodeStyle】→【Python】编辑二、pycharm空格显示【General】→【Appearance】→Showwhitespace......
  • 【Python】第4章-5 求e的近似值
    自然常数e可以用级数1+1/1!+1/2!+⋯+1/n!+⋯来近似计算。本题要求对给定的非负整数n,求该级数的前n+1项和。输入格式:输入第一行中给出非负整数n(≤1000)。输出格......
  • MLK-FMC-SSDNVME子卡硬件手册
    1产品概述MLK-FMC-SSDNVME子卡可接两路PCIE的标准M.2接口,支持PCIEx4,用于连接SSD固态硬盘,不支持SATA。MLK-FMC-SSDNVME子卡为标准HPC接口子卡,可接FPGA开发板,满足VITA57.1......
  • 米联客MLK-FMC-3GSDI硬件手册
    1产品概述MLK-FMC-3GSDI子卡是一款实现FPGA通过GTH高速收发器从同轴电缆接收3G-SDI信号,并通过FIFO回环导出SDI信号到同轴电缆输出。传输速率可以达到2.97Gbps,它......
  • 学习python-Day85
    今日学习内容一、前台全局样式和js配置针对body、div默认统一样式,我们可以都去掉后端接口的地址,统一写以后可以统一改1.global.css声明全局样式和项目的初始化样......
  • 【Python】第4章-3 猴子吃桃问题
    一只猴子第一天摘下若干个桃子,当即吃了一半,还不过瘾,又多吃了一个;第二天早上又将剩下的桃子吃掉一半,又多吃了一个。以后每天早上都吃了前一天剩下的一半加一个。到第N天早上......
  • Python中切片操作的详细用法
    在利用Python解决各种实际问题的过程中,经常会遇到从某个对象中抽取部分值的情况,切片操作正是专门用于完成这一操作的有力武器。理论上而言,只要条件表达式得当,可以通过单次......