首页 > 其他分享 > 机器学习 吴恩达 第十章 笔记

机器学习 吴恩达 第十章 笔记

时间:2023-02-07 02:44:06浏览次数:54  
标签:吴恩达 机器 特征向量 复杂 第十章 笔记 学习 垃圾邮件 邮件

十、机器学习系统的设计(Machine Learning System Design)

11.1 确定执行的优先级

  在接下来的视频中,我将谈到机器学习系统的设计.这些视频将谈及在设计复杂的机器学习系统时,你将遇到的主要问题.同时我们会试着给出一些关于如何巧妙构建一个复杂的机器学习系统的建议.
  下面的课程的的数学性可能不是那么强,但是我认为我们将要讲到的这些东西是非常有用的,可能在构建大型的机器学习系统时,节省大量的时间.本周以一个垃圾邮件分类器算法为例进行讨论.
   为了解决这样一个问题,我们首先要做的决定是如何选择并表达邮件特征向量\(x\).我们可以选择一个由100个最常出现在垃圾邮件中的词所构成的列表,根据这些词是否有在邮件中出现,来获得我们的特征向量(出现为1,不出现为0),尺寸为100×1.这里只是举例,实际用法最多的是采取训练集中出现频率最多的n(10000 ~ 50000)个单词,将其作为特征向量.
  那么如何让分类器有高精准度和低错误率.
1.收集更多的数据,让我们有更多的垃圾邮件和非垃圾邮件的样本
2.基于邮件的路由信息开发一系列复杂的特征
3.基于邮件的正文信息开发一系列复杂的特征,包括考虑截词的处理
4.为探测刻意的拼写错误(把watch 写成w4tch)开发复杂的算法
  在上面这些选项中,非常难决定应该在哪一项上花费时间和精力,作出明智的选择,比随着感觉走要更好.当我们使用机器学习时,总是可以"头脑风暴"一下,想出一堆方法来试试.实际上,当你需要通过头脑风暴来想出不同方法来尝试去提高精度的时候,你可能已经超越了很多人了.
  我们将在随后的课程中讲误差分析,我会告诉你怎样用一个更加系统性的方法,从一堆不同的方法中,选取合适的那一个。因此,你更有可能选择一个真正的好方法,能让你花上几天几周,甚至是几个月去进行深入的研究.

标签:吴恩达,机器,特征向量,复杂,第十章,笔记,学习,垃圾邮件,邮件
From: https://www.cnblogs.com/newblg/p/17097138.html

相关文章

  • 前端面试题学习-个人总结笔记 Day 5 JS
    前端面试题学习-个人总结笔记Day5JS这是看别人总结的基础上再度总结的,总结的链接如下链接1.前端路由+检测浏览器版本+Polyfill+文件扩展名+Object.is2.e......
  • go加解密学习笔记
    1、概念加解密分为以下几种对称加密,加解密都使用的是同一个密钥,其中的代表就是AES、DES非对加解密,加解密使用不同的密钥,其中的代表就是RSA签名算法,如MD5、S......
  • Spring IOC官方文档学习笔记(九)之基于注解的容器配置
    1.基于注解的配置与基于xml的配置(1)在xml配置文件中,使用context:annotation-config</context:annotation-config>标签即可开启基于注解的配置,如下所示,该标签会隐式的向......
  • OpenMMLab AI实战营 第四课笔记
    OpenMMLabAI实战营第四课笔记目录OpenMMLabAI实战营第四课笔记目标检测与MMDetection1.什么是目标检测1.1目标检测的应用1.1.1目标检测in人脸识别1.1.2目标检......
  • 前端面试题学习-个人总结笔记 Day 4 JS
    前端面试题学习-个人总结笔记Day4JS这是看别人总结的基础上再度总结的,总结的链接如下链接1.对闭包的理解+严格模式+判断对象是否属于某个类+map某个案例2.......
  • 《分布式技术原理与算法解析》学习笔记Day03
    分布式互斥方法什么是分布式互斥?对于同一个共享资源,当一个程序正在使用的时候,不希望被其他程序打扰,这种排他性的资源访问方式,叫做分布式互斥,被互斥访问的共享资源被称作......
  • 关于Kubernetes 中通过 Kustomize 实现YAML资源文件组合与继承的一些笔记
    写在前面分享一些通过Kustomize实现YAML资源文件组合与继承的笔记官方文档里叫做组织和定制,这里这么叫方便理解博文内容基本为官网文档内容理解不足小伙伴帮忙指正......
  • [思路笔记] 线段树合并与你
    明天再来补最后一题的思路。CF208EBloodCousins题目大意给一棵\(n\)个点的树,点编号为\(1\)到\(n\)。共\(m\)次询问,每次询问给出一对整数\(v\)和\(p\),求有多......
  • 前端面试题学习-个人总结笔记 Day 3 JS
    前端面试题学习-个人总结笔记Day3JS这是看别人总结的基础上再度总结的,总结的链接如下链接1.JS基本数据类型+内部属性[[Class]]+内置对象2.内置对象3.JS......
  • 【ctf权威竞赛指南笔记】1.CTF
    赛事介绍赛事起源CTF(CaptureTheFlag)中文译作夺旗赛,原为西方传统运动,两队人马互相前往对方的基地夺取旗帜。在网络空间安全领域被用来指代技术人员之间进行技术竞技的比......