首页 > 其他分享 >数据分析报告的阅读

数据分析报告的阅读

时间:2023-10-26 15:47:07浏览次数:25  
标签:数据分析 报告 html 阅读 数据 pandas 属性

数据分析报告的阅读

如何生成数据分析报告

通常我们拿到一份数据时,我们希望尽快了解她的全貌,那就不可避免的要做探索性数据分析的工作(EDA)。而这项工作对于我而言一次两次到还好,有些数据集的特征值极多,且分布规律极其抽象,所以我还是希望有一种自动生成报告的方法。为此,特学习了利用pandas profiling来自动生成数据报告的方法。代码如下:

import pandas as pd
import pandas_profiling as pp

df = pd.read_csv('data/kaggle_house_pred_train.csv')

# 生成数据报告,并转换为 html 的形式
report = pandas_profiling.ProfileReport(df)
report.to_file('report.html')

如上是常用的模板,总的来说就是读入数据-->生成报告-->转换为.html

解读数据分析报告

数据报告由如下五个部分组成:数据摘要、各特征的基础分析、变量交互、缺失值和样本。

image

Overview

数据摘要可以很好的展现数据的全貌,但是缺点是没有做可视化。

image
她通常包含:属性值、样本总数、缺失值及确实率、重复行及重复率、各属性的分类

注意: 第二栏 Alerts 会给出异常提醒,包含: 属性是否服从正态分布、哪些属性有较高的相关性、属性有较高的缺失率,较高的含零率等等。

Variables

image

这里几乎涵盖所以基础探索性分析所需要的统计变量,甚至还做了可视化,这对我们分析属性值的分布情况非常有利。

同时,在这个 .html 中还可以下拉选择更多丰富的拓展。

Interactions

image

交互性分析也是一个非常强大的模块,它可以很好的可视化展现两个数值属性之间的相关性情况。

Missing Value

image

这部分包含三个功能:count、matrix、heatmap,分别是数值统计、以矩阵的方式显示、相关性热力图。

Samples

image

这部本是样本展示,一般展示前十条和后十条样本。

标签:数据分析,报告,html,阅读,数据,pandas,属性
From: https://www.cnblogs.com/Tatsukyou/p/17789169.html

相关文章

  • 学生成绩数据分析软件,提升数据分析效率?
     学生成绩数据分析软件在教育领域中起着重要的作用,可以帮助教育机构和教师更好地理解学生的学习情况、评估教学效果,并提供决策支持。这些软件利用统计分析、数据挖掘和机器学习等技术,可以处理大量的学生成绩数据,并从中提取有价值的信息。下面将详细介绍一些常见的学生成绩数据......
  • 高校教研大数据分析系统
    学校常用的成绩分析软件在教育领域扮演着至关重要的角色,它们帮助学校管理者和教师对学生的学习进展进行跟踪和分析。以下是一些常用的成绩分析软件及其功能说明。学生成绩管理系统:学生成绩管理系统是一种全面的学生学习数据管理和分析解决方案。它可以帮助学校管理者和教师快速......
  • CocosCreator3.x 应用在UI(Sprite) 上的 shader(.effect) 的合批,通过自定义顶点参数(四
    源码阅读部分顶点数量、布局相关设置针对UI所使用的Mesh的顶点设置:如simple模式使用1个矩形(2x2个顶点),sliced模式使用9个矩形(4x4个顶点)dataLength相当于顶点数量。vertexRow和vertexCol描述了网格形状。SetIndexBuffer则描述网格中所有“三角形”分别由哪3......
  • 干货!分享Nginx搭建web测试报告服务器的落地方案
    Nginx搭建web测试报告服务器的实现思路有这样一个需求:把自动化测试过程中生成的html测试报告能够通过浏览器直接访问查看!实现思路很简单,就是部署一个web服务器,然后把测试报告部署到web服务器的指定目录即可,然后通过http://ip:port/path/报告名称.html的形式进行访问。我们通过ngin......
  • 10月《中国数据库行业分析报告》已发布,深度剖析甲骨文大会Oracle技术新趋势
    为了帮助大家及时了解中国数据库行业发展现状、梳理当前数据库市场环境和产品生态等情况,从2022年4月起,墨天轮社区行业分析研究团队出品将持续每月为大家推出最新《中国数据库行业分析报告》,持续传播数据技术知识、努力促进技术创新与行业生态发展,目前已更至第十七期,并发布了共计1......
  • 测试报告模板三
    测试报告项目:编写:文档版本版本号修改日期编写评审批准修改内容1.0建立目 录1.  简介41.1         编写目的..41.2         参考资料..41.3         术语定义..42.  测试背景42.1         项目背景..42.2         ......
  • 测试总结报告模板一
    XX测试总结报告文档作者:编写日期:项目经理:批准日期:文档修改纪录表日期制修人修改内容描述目录1.      引言....31.1.    目的..31.2.    背景..31.3.    测试范围和内容...31.4.    定义..31.5.    参考资料..32.      测试总结..........
  • 风靡一时的【数据分析师】岗位正在逐步消失
    风靡一时的【数据分析师】岗位正在逐步消失哈喽,大家好呀!好久不见,今天因本人所在城市大雨不停,宅在家里就和大家一起“吐槽”一下【数据分析师】这个岗位吧,本文仅仅是吐槽哈。1、【数据分析师】岗位是做什么的呢?说到数据分析,其实就是字面意思,通过数据,进行分析,得出结论和建议,简单哈。......
  • 【论文阅读笔记】【OCR-文本识别】 Towards Accurate Scene Text Recognition with Se
    SRNCVPR2020读论文思考的问题论文试图解决什么问题?如何利用文本的上下文语义信息来辅助文本识别任务RNN能部分利用语义信息,但它的利用方式是串行的,极大地限制了语义信息的帮助,会造成错误累积以及效率缓慢等问题文章提出了什么样的解决方法?提出全局语义理解......
  • 【论文阅读笔记】【OCR-文本识别】 Read Like Humans: Autonomous, Bidirectional and
    ABINetCVPR2021(Oral)读论文思考的问题论文试图解决什么问题?如何对语言的上下文进行建模而不是对视觉特征的上下文信息进行建模如何在端到端的文本识别模型中更好、更高效地对文本的语言知识进行建模,提升对困难情况的字符识别效果文章提出了什么样的解决方法?......