Python科学计算生态系统和库
- NumPy(Numerical Python):Python科学计算的基础包
- pandas:提供了快速便捷处理结构化数据的大量数据结构和函数
- matplotlib:绘制图表和其它二维数据可视化的Python库
- SciPy:专门解决科学计算中各种标准问题域的包的集合
- scikit-learn:通用机器学习工具包
- statsmodels:统计分析包
scikit-learn子模块
- 分类:SVM、近邻、随机森林、逻辑回归等等。
- 回归:Lasso、岭回归等等。
- 聚类:k-均值、谱聚类等等。
- 降维:PCA、特征选择、矩阵分解等等。
- 选型:网格搜索、交叉验证、度量。
- 预处理:特征提取、标准化。