• 2024-09-10亦菲喊你来学机器学习(20) --PCA数据降维
    文章目录PCA数据降维一、降维二、优缺点三、参数四、实例应用1.读取文件2.分离特征和目标变量3.使用PCA进行降维4.打印特征所占百分比和具体比例5.PCA降维后的数据6.划分数据集7.训练逻辑回归模型8.评估模型性能总结PCA数据降维主成分分析(PrincipalCompon
  • 2024-09-02亦菲喊你来学机器学习(18) --TF-IDF方法
    文章目录TF-IDF词频TF逆文档频率IDF计算TF-IDF值应用实验使用TF-IDF1.收集数据2.数据预处理3.构建TF-IDF模型对象4.转化稀疏矩阵5.排序取值完整代码展示jieba分词总结TF-IDFTF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文档频率)是一种用于信息检
  • 2024-09-02亦菲喊你来学机器学习(19) --TF-IDF中文处理
    文章目录TF-IDFjieba库中文分词分词自定义添加词典TF-IDF应用中文文章1.收集数据2.数据预处理3.构建TF-IDF模型对象4.排序取值总结TF-IDFTF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文档频率)是一种用于信息检索与文本挖掘的常用加权技术。TF-IDF
  • 2024-08-31亦菲喊你来学机器学习(16) --K-means聚类算法
    文章目录K-means基本步骤优缺点构建模型总结K-meansK-means算法是一种广泛使用的聚类算法,旨在将数据集划分为K个簇,使得每个簇内的数据点尽可能相似,而不同簇之间的数据点尽可能不同。这个算法通过迭代的方式实现,每次迭代都会更新簇的中心(即簇内所有点的均值),然后将
  • 2024-08-28亦菲喊你来学机器学习(14) --贝叶斯算法
    文章目录贝叶斯一、贝叶斯定理二、贝叶斯算法的核心概念三、贝叶斯算法的优点与局限优点:局限:四、构建模型训练模型测试模型总结贝叶斯贝叶斯算法(Bayesianalgorithm)是一种基于贝叶斯定理的机器学习方法,主要用于估计模型参数和进行概率推断。以下是对贝叶斯算法的
  • 2024-08-24亦菲喊你来学机器学习(10) --决策树算法
    文章目录决策树一、基本定义二、学习过程三、剪枝处理四、决策树的特点五、构建模型训练模型测试模型总结决策树机器学习中的决策树算法是一种基本的分类与回归方法,它通过树状结构建立决策模型,以解决分类和回归问题。以下是对决策树算法的详细解析:一、基本定义决
  • 2024-08-23亦菲喊你来学机器学习(9) --逻辑回归实现手写数字识别
    文章目录逻辑回归实现手写数字识别训练模型测试模型总结逻辑回归逻辑回归(LogisticRegression)虽然是一种广泛使用的分类算法,但它通常更适用于二分类问题。然而,通过一些策略(如一对多分类,也称为OvR或One-vs-Rest),逻辑回归也可以被扩展到多分类问题,如手写数字识别(通常是