数据质量分析要求我们拿到数据后要先检测是否存在缺失值和异常值;数据特征分析要求我们在数据挖掘建模前,通过频率分布分析、对比分析、帕累托分析、周期性分析、相关性分析等方法,对采集的样本数据的特征规律进行分析,以了解数据的规律和趋势,为数据挖掘的后续环节提供支持。
一方面,Matplotlib是绘图工具的基础,pandas 绘图依赖于它;另一方面,pandas 绘图有着简单直接的优势,因此,两者互结合,往往能够以最高的效率做出符合我们需要的图。
数据质量分析要求我们拿到数据后要先检测是否存在缺失值和异常值;数据特征分析要求我们在数据挖掘建模前,通过频率分布分析、对比分析、帕累托分析、周期性分析、相关性分析等方法,对采集的样本数据的特征规律进行分析,以了解数据的规律和趋势,为数据挖掘的后续环节提供支持。
一方面,Matplotlib是绘图工具的基础,pandas 绘图依赖于它;另一方面,pandas 绘图有着简单直接的优势,因此,两者互结合,往往能够以最高的效率做出符合我们需要的图。