首页 > 其他分享 >机器学习实战(01)-人工智能概要

机器学习实战(01)-人工智能概要

时间:2023-07-24 23:01:06浏览次数:40  
标签:01 机器 概要 人工智能 知识 学习 算法 数据

1 发展历程

20世纪50年代:人工智能概念诞生

  • 1956年,“人工智能”这个术语由麦卡锡在达特茅斯会议上首次提出
  • 主要研究逻辑和推理,以及如何在机器上模拟人类智能

20世纪60年代:知识表达期

  • 开始研究知识表达,使用谓词逻辑来表达知识
  • 开发可以解题的专家系统,例如Dendral专家系统

20世纪70年代:知识库期

  • 研究汇集知识到知识库,并开发程序利用知识库做推理
  • 出现视觉、语音、运动控制等领域的专家系统

20世纪80年代:专家系统盛行期

  • 专家系统成为人工智能的主流应用,应用于医疗、工程等领域
  • 持续完善知识表达与推理系统

20世纪90年代:统计学习和深度学习兴起

  • 机器学习成为主流,神经网络和深度学习理论进展显著
  • 1997年,深蓝击败国际象棋世界冠军卡斯帕罗夫

21世纪:深度学习和人工智能应用爆发期

  • 深度学习技术不断成熟,语音、图像、自然语言处理取得进展
  • AlphaGo击败围棋世界冠军,人工智能应用进入爆发期

人工智能发展至今,已经由最初的专注推理转为数据驱动的统计学习与深度学习,并取得了巨大的进步,未来发展潜力巨大。

好的,人工智能主要可以分为以下几个分支:

2 人工智能的主要分支

2.1 机器学习(Machine Learning)

机器学习是人工智能的核心分支之一,它主要是通过算法和统计模型来实现机器对数据特征的自动学习,并对新的输入数据进行预测或决策。常见的机器学习算法有监督学习、无监督学习、半监督学习、强化学习等。

2.2 计算机视觉(Computer Vision)

计算机视觉通过相机、图像传感器和图像处理算法,来模拟人眼对物体进行识别和跟踪的功能。它可以应用于面部识别、医学影像分析、自动驾驶等领域。

2.3 自然语言处理(NLP)

自然语言处理让机器解析、理解人类的语言。它的应用有机器翻译、语音识别、信息检索等,是智能助手、chatbot的关键技术。

2.4 机器人(Robotics)

机器人技术研究如何模拟人类的行为能力,分为运算能力、感知能力、决策能力、执行能力等。它广泛应用于工业、服务、家居、军事等领域。

2.5 知识表示与推理(KR&R)

知识表示与推理关注如何用计算机来表示世界知识,并模拟人类经验进行推理。它可用于专家系统、知识管理、智能助手等应用。

以上是人工智能的主要研究方向,它们相辅相成,共同推动着人工智能技术的发展。不同方向都有自己的独特侧重点和应用领域。

3 机器学习是什么

使机器通过算法和统计模型对数据进行学习,并对新的数据做出预测或决策。

简单来说,机器学习就是让计算机自己通过数据去“学习”,而不需要人工进行明确的编程。机器学习的基本思想是构建一个可以从数据中 generalization(归纳总结)知识的系统。

机器学习主要可以分为以下三类:

  1. 监督学习(Supervised Learning):给机器提供大量带有正确答案(标签)的数据,使其通过这些样本数据去学习一个预测模型,然后对新数据做出预测。例如分类和回归。
  2. 无监督学习(Unsupervised Learning):不提供正确答案,让机器自己通过探索数据的内在结构来进行学习。例如聚类和降维。
  3. 强化学习(Reinforcement Learning):通过让机器与环境进行交互,提供反馈的方式让机器学习最优解。例如机器人。

机器学习算法包括支持向量机、神经网络、贝叶斯算法、集成学习等。它广泛应用于图像识别、自然语言处理、预测分析等领域。随着算法和算力的进步,机器学习正在推动人工智能的发展。

4 机器学习的工作流程

机器学习实战(01)-人工智能概要_机器学习

1.获取数据 2.数据基本处理 3.特征工程 4.机器学习(模型训练) 5.模型评估 结果达到要求,上线服务

没有达到要求,重新上面步骤

4.1 获取数据

在数据集中一般:

  • 一行数据我们称为一个样本
  • 一列数据我们成为一个特征
  • 有些数据有目标值 (标签值),有些数据没有目标值(如上表中,电影类型就是这个数据集的目标值

数据类型构成

数据类型一:特征值+目标值 (目标值是连续的和离散的)

数据类型二:只有特征值,没有目标值

数据分割

机器学习一般的数据集会划分为两个部分:

  • 训练数据
    用于训练,构建模型
  • 测试数据
    在模型检验时使用,用于评估模型是否有效

划分比例:

  • 训练集: 70% 80% 75%
  • 测试集: 30% 20% 25%

4.2 数据基本处理

即对故据进行缺失值、去除异常值等处理。

4.3 特征工程(Feature Engineering)

使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。

意义:会直接影响机器学习的效果。

意义

吴恩达说:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

内容

特征提取:将任意数据 (如文本或图像) 转换为可用于机器学习的数字特征 特征预处理:通过一些转换函数,将特征数据转换成更加适合算法模型的特征数据过程

机器学习实战(01)-人工智能概要_数据_02

特征降维:在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程。

机器学习实战(01)-人工智能概要_机器学习_03


标签:01,机器,概要,人工智能,知识,学习,算法,数据
From: https://blog.51cto.com/JavaEdge/6840884

相关文章

  • day01课程回顾
    day02:Java相关概念一、回顾程序:解决问题编写的一系列计算机指令的有序集合计算机语言低级语言机器语言汇编语言高级语言面向过程面向对象:JavaJava发展Java之父:詹姆斯高斯林1996年JavaJDK5.0是Java的分水岭我们用JDK8DOS命令Java特......
  • 【ChatGPT】AI 人工智能能让你成为更聪明的程序员吗?
    目录......
  • 饮冰三年-人工智能-Django淘宝拾遗-85-常用的Python格式化工具
       Python代码格式化对于团队协作、代码质量、错误预防以及与Python社区的契合都具有重要意义。好的代码格式化不仅是一种编码规范,更是一种良好的编码习惯,有助于提高整个项目的质量和可维护性。   在团队中,可能有不同的编码规范和自定义的格式化规则。尽管有一些格式......
  • HAOI2011 Problem b
    Problemblink做法:莫比乌斯反演。思路:对于给出的\(n\)个询问,每次求有多少个数对\((x,y)\),满足\(a\lex\leb\),\(c\ley\led\),且\(\gcd(x,y)=k\),\(\gcd(x,y)\)函数为\(x\)和\(y\)的最大公约数。我们设\[\operatorname{f}(n)=\sum\limits_{i=1}^x\sum\limit......
  • ChatGPT:人工智能交互的未来之光
    一、ChatGPT:开启自然语言交流新纪元ChatGPT是基于GPT(生成式预训练)技术的最新版本,它采用深度学习模型,通过在大规模文本数据上的预训练来理解自然语言,并生成具有连贯性和合理性的回复。ChatGPT是一种通用的人工智能模型,能够在各种领域展现出卓越的表现,如智能客服、内容创作、教育......
  • Vue项目启动 报错error:0308010C:digital envelope routines::unsupported
    出现这个错误是因为node.jsV17版本中最近发布的OpenSSL3.0,而OpenSSL3.0对允许算法和密钥大小增加了严格的限制,可能会对生态系统造成一些影响.解决方法package.json增加配置"scripts":{"serve":"setNODE_OPTIONS=--openssl-legacy-provider&&vue-cli-serviceserve......
  • python DB2 01 安装篇
    #1安装pipinstallibm_db-ihttps://pypi.douban.com/simple安装完,程序里importibm_db,如果没有报错基本就成功了但是在真正执行SQL语句的时候,我报错了:SQLCODE=-1042解决方法:找到Python目录下的site-packages\clidriver\bin\amd64.VC12.CRT中找到msvcp120.dll、msvc......
  • 【WebGL系列-01】获取WebGL上下文
    获取WebGL上下文获取上下文WebGL上下文是从<canvas>标签中获取到的,通过canvas对象的getContext()函数可以获取WebGLRenderingContext。跟据参数的不同,getContext()函数可以获取不同种类的渲染上下文。接口canvas.getContext(contextType:String,contextAttributes?:Objec......
  • 洛谷AT_jsc2019_qual_e Card Collector 题解
    题目链接CardCollector-洛谷|计算机科学教育新生态(luogu.com.cn)思路将每一行、每一列转化为点,第i行第j列的卡牌转化为i->j+m(m为行数)的有向边。总共会抽取m+n(m为行数,n为列数)张牌,每个点的出度为1。结果图为基环森林;那么题目就转化为求最大基环森林。代码1#include......
  • 上海科技大学智能生活组齐聚合合信息,“沉浸式”体验人工智能产品
    近期,上海科技大学组织本科生产业实践-校企联合人才培养活动,30余名学生组成的“智能生活组”实地参访人工智能及大数据科技企业上海合合信息科技股份有限公司(简称“合合信息”)。本次活动旨在通过项目体验、主题交流,加深学生对于研究方向的专业认知,充分理解市场需求,达成学以致用的目......