华为LAB实验室4-朴素贝叶斯

时间：2023-02-27 16:32:47浏览次数：47

标签：特征向量步骤 LAB 贝叶斯华为垃圾邮件文本处理邮件

各位好，我是乾颐堂大堂子。领取完整实战指南可以私信我，关键词：实战指南

通过 jieba 文字分词库对邮件数据集的垃圾邮件和进行文本处理，提取特征。然后调用 sklearn 机器学习库中的朴素贝叶斯算法训练模型，最后推理测试集中邮件是否为垃圾邮件。

华为LAB实验室4-朴素贝叶斯_LAB实验室

步骤 1 引入相关依赖的包

华为LAB实验室4-朴素贝叶斯_乾颐堂_02

步骤 2 构建文本处理函数

删除其中的干扰字符，例如【】*。，等等，然后分词，剩下的词汇认为是有效词汇。

华为LAB实验室4-朴素贝叶斯_朴素贝叶斯_03

华为LAB实验室4-朴素贝叶斯_LAB实验室_04

步骤3构建文本读取函数

获取文件中所有词,进行文本处理

华为LAB实验室4-朴素贝叶斯_朴素贝叶斯_05

步骤4构建数据集

统计全部训练集中每个有效词汇的出现次数，截取出现次数最多的前500个根据预处理后的垃圾邮件和非垃圾邮件内容生成特征向量，统计得到的500个词语分别在该邮件中的出现概率

华为LAB实验室4-朴素贝叶斯_LAB实验室_06

华为LAB实验室4-朴素贝叶斯_乾颐堂_07

得到特征向量和已知邮件分类创建并训练朴素贝叶斯模型。

华为LAB实验室4-朴素贝叶斯_乾颐堂_08

步骤6模型测试

读取测试邮件，对邮件文本进行预处理，提取特征向量。使用训练好的模型，根据提取的特征向量对邮件进行分类

华为LAB实验室4-朴素贝叶斯_朴素贝叶斯_09

华为LAB实验室4-朴素贝叶斯_华为_10

华为LAB实验室4-朴素贝叶斯_乾颐堂_11

更多网工提升干货，请关注公众号：乾颐堂网络实验室

标签：特征向量,步骤,LAB,贝叶斯,华为,垃圾邮件,文本处理,邮件
From： https://blog.51cto.com/u_15966276/6088630

全民开发者时代到来！华为云开发者日深圳站成功举办
摘要：2月25日，华为云开发者日HDC.CloudDay2023年首场在深圳天安云谷成功举行。本文分享自华为云社区《全民开发者时代到来！华为云开发者日深圳站成功举办》，作者：华为云社区......
华为LAB实验室-2逻辑回归
各位好，我是乾颐堂大堂子。领取完整实战指南可以私信我，关键词：“实战指南”~在逻辑回归部分，使用的数据集为自定义的房屋租金和面积相关的数据集，在实验初始阶段会进行定义。步......
上传gitlab代码后jenkins自动进行发布的配置
1、安装GitLabPlugin和GenericWebhookTriggerPlugin两个插件2、要在gitlab生成一个访问api的token 3、在jenkins的系统管理里找到下面界面进行输......
NSGA2多目标优化算法的MATLAB仿真
1.算法描述首先将一群具有多个目标的个体（解集，或者说线代里的向量形式）作为父代初始种群，在每一次迭代中，GA操作后合并父代于自带。通过非支配排序，我们将所有个......
OpenMMLab教程【零】OpenMMLab介绍与安装
前言该系列教程旨在向计算机视觉领域入门者介绍当下流行的OpenMMLab框架，从计算机视觉领域多个基础任务入手，详细解读其基础知识、在OpenMMLab体系下的组织构建方式、......
m基于神经网络的气候预测matlab仿真,气候数据采用的BoM气候数据,神经网络为matlab编程
1.算法描述人工神经网络（ArtificialNeuralNetworks，简写为ANNs）也简称为神经网络（NNs）或称作连接模型（ConnectionModel），它是一种模仿动物神经网络行为特征，进......
m基于RBF神经网络的数据预测matlab仿真,测试数据分别采用趋势型数据，周期型数据以及混
1.算法描述 1985年，Powell提出了多变量插值的径向基函数（RBF)方法。径向基函数是一个取值仅仅依赖于离原点距离的实值函数，也可以是到任意一点c的距离，c点称为中......
华为云携手金蝶，探索高成长型企业“数字化创新管理”之路
摘要：华为云携手合作伙伴金蝶，通过成熟的方案验证和项目实践，选择了金蝶云·星空经营管理解决方案作为工业领域的战略利器。当前，全球正处在从工业经济向数字经济加速转型过渡......
20230227-华为防火墙双机热备配置
一、双机热备主要涉及到三个协议：VRRP:两台防火墙共享一个虚拟IP（VRRP只支持两台防火墙，不支持多台），同一个VRRP组的两个接口通过协商确定主（master）和备（backup）状态，只有主状态的防......
华为Push用户增长服务：精准触达，加速增长
速戳了解华为Push用户增长服务：通过精细化运营，助力开发者高效实现用户增长，提升用户活跃度和粘性！合作咨询请点此链接了解更多详情>>访问华为开发者联盟官网获取开发指导......

华为LAB实验室4-朴素贝叶斯

相关文章

赞助商

阅读排行