首页 > 编程语言 >n1_python数据分析

n1_python数据分析

时间:2022-11-30 21:22:50浏览次数:44  
标签:数据分析 Java python 代码 工具包 Python n1

1.Python语言及其特征

  • 优点:代码编写效率高;程序代码可读性强;可扩展性强;属于解释型语言,支持动态数据类型。

  • 缺点:① 属于解释型语言,代码执行速度较慢;② 在移动终端类应用中尚未普及;③ 与JDBC和ODBC相比,python数据库访问接口的功能和性能有待优化;④ python的部分特征虽然提高了程序员编写代码的效率,但是在计算机执行时容易引发运行时错误。

    从人的角度看,python优点很多;从计算机的角度看,python的缺点不少。

  • 在语法上,python 2.x与python 3.x的差异较大,python 3.x不支持向下兼容python 2.x(backward-compatible),但可以使用2to3(Automated Python 2 to 3 code translation)等工具将python 2.x的代码转换为python 3.x的代码。

  • 在数据科学中一般采用python或者R,而不用Java、C、C++、C#等语言的原因:

    ①程序语言设计的目的。Java、C等语言是为软件开发而设计的,不适合完成数据分析任务。如果使用Java、C去做的话,则大量的精力消耗在流程控制、数据结构的定义和算法的设计上,难以集中精力去处理数据问题。

    例如数据集的读写是数据分析中经常遇到的工作,如果用Java编写,需要多层for语句,非常繁琐。但是在python或R中,支持向量化计算,可以直接读写数据集(不需要for语句)。python和R采用泛型函数式编程,可以直接调用sort()函数来实现数据集的排序工作,不需要额外编写排序算法和代码。

    ②第三方扩展工具包/模块,更为重要。python和R并不是比Java、C更强,而是可以调用众多专门用于数据分析任务的第三方扩展包或模块。

2.面向数据分析的python编程

从数据分析的角度看,掌握基础语法和第三方工具包即可。

1)Python语言的基础语法

  • 变量及其定义方法
  • 运算符、表达式、语句
  • 数据类型和数据结构
  • 包与模块
  • 内置函数、模块函数和自定义函数
  • 迭代器与可迭代对象
  • 生成器与装饰器
  • 查看帮助信息的方法
  • 异常处理、当前工作目录与文件读写
  • 面向对象编程

2)第三方工具包

数据分析中通常使用已开发好的python第三方工具包,不是用python基础语法自行重新开发核心数据分析任务,主要原因在于:python第三方工具包不仅实现了数据分析的核心任务,降低数据分析的开发成本,同时对python基础语法进行了优化,提高了运行性能。

  1. 基础类:pandas,numpy,scipy
  2. 数据可视化类:matplotlib,seaborn,bokeh,basemap,plotly,networkx
  3. 机器学习类:scikit-learn,pytorch,tensorflow,theano,keras
  4. 统计建模类:statsmodels
  5. 自然语言处理、数据挖掘及其他:nltk,gensim,scrapy,pattern,open-cv

3.Python IDE

① Jupyter Notebook、Jupyter Lab和Spyder:用于编写Python程序,是Python的编辑器

② Anaconda Prompt:用于编写PIP和Conda命令

③ Anaconda Navigator:用于显示Anaconda平台的各组成成分

Jupyter Lab以B/S模式执行,而其中编写的Python代码以Cell(代码单元格)为单位进行组织和执行;每个Cell的执行顺序由程序员执行时随意指定,而并非由Cell的显示前后顺序和代码之间的逻辑关系决定。Cell的多次执行可以导致变量的当前值随之变化。

标签:数据分析,Java,python,代码,工具包,Python,n1
From: https://www.cnblogs.com/olin25/p/16939788.html

相关文章

  • 进入python的世界_day42_前端——何为前端、HTTP、HTML、head和body以及常用标签
    一、前端1.何为前端​ 与用户打交道的操作界面即为前端,一般都是做了美化的2.前端核心基础HTML>>>:网页的骨架CSS>>>:网页的样式JS>>>:网页的动态(比如说滑动......
  • Python threading Thread多线程的使用方法
    PythonthreadingThread多线程的使用方法目录​​PythonthreadingThread多线程的使用方法​​​​1.使用Threading模块创建线程​​​​2.Thread线程同步​​​​3.使用......
  • python用ARIMA模型预测CO2浓度时间序列实现|附代码数据
    全文下载链接:http://tecdat.cn/?p=20424时间序列为预测未来数据提供了方法。根据先前的值,时间序列可用于预测经济,天气的趋势。时间序列数据的特定属性意味着通常需要专门......
  • 极客编程python入门-生成器
    generator通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。在Python中,这种一边循环一边计算的机制,称为生成器:generator。只要把一个列表生......
  • python之路39 前端开始 各种标签
    前端前夕前端三剑客HTML网页的骨架CSS网页的样式JavaScript网页的动态1.编写服务端2.浏览器充当客户端访问服务端3.浏览器无法......
  • 力扣287(java&python)-寻找重复数(中等)
    题目:给定一个包含 n+1个整数的数组 nums,其数字都在 [1,n] 范围内(包括1和n),可知至少存在一个重复的整数。假设nums只有一个重复的整数,返回 这个重复的数......
  • Python: 括号匹配
     s1='[{(b)}][[]]'s2='[{(b}][[]]'defbrackets_match(s:str)->bool:opening_brackets='([{'closing_brackets=')]}'nexus={')':'(',......
  • Python: stack
     Astackisalineardatastructurethatstoresitemsinalast-in-first-outLIFOorfirst-in-last-outFILOmanner,Instack,anewelementisaddedatonee......
  • 10 个杀手级的 Python 自动化脚本
    重复性任务总是耗时且无聊,想一想你想要一张一张地裁剪100张照片或FetchAPI、纠正拼写和语法等工作,所有这些任务都很耗时,为什么不自动化它们呢?在今天的文章中,我将与你......
  • PYTHON 数据结构 - 列表
    1.1列表列表类似元组:可以存放多个元素(可不同类型)有顺序可重复列表是可变的,可添加,删除,排序元素1.2列表的创建#列表=[元素1,元素2,...]a=[1,2,3,4]a=[]......