第二章 智能体
智能体
- 智能体是在环境中感知和行动的事物。
- 智能体 = 架构 + 程序
一个智能体在任何给定的时刻的动作选择可能取决于内置知识和迄今为止观察到的整个感知序列,而不是它未感知到的任何事物。
即:智能体可能会根据内置知识和到当前时刻为止感知到的所有数据对给定时刻做出动作选择。(有因果,不是无中生有)
理性智能体
作为一般规则,更好的做法是根据一个人在环境中真正想要实现的目标,而不是根据一个人认为智能体应该如何表现来设计性能度量。
即:设计性能度量时,应以目标结果为导向来设计性能度量,性能度量设计的标准应与目标结果相挂钩。
发现有习题。。。能写多少算多少吧,明天补上自己会的部分。
以下内容来自香芋大佬的整理:(搬运过来先码住)
https://shiningxy.github.io/xyDocs/#/aima/aimanote
- 智能体的智能体函数指定智能体在响应任何感知序列时所采取的动作。
- 性能度量评估智能体在环境中的行为。给定到目前为止所看到的感知序列时,理性智能体的动作是为了最大化性能度量的期望值。
- 任务环境规范包括性能度量、外部环境、执行器和传感器。在设计智能体时,第一步必须始终是尽可能地指定任务环境。
- 任务环境在几个重要维度上有所不同。它们可以是完全可观测的或部分可观测的、单智能体的或多智能体的、确定性的或非确定性的、回合式的或序贯的、静态的或动态的、离散的或连续的、已知的或未知的。
- 在性能度量未知或难以正确指定的情况下,智能体优化错误目标的风险很大。在这种情况下,智能体设计应该反映真实目标的不确定性。
- 智能体程序实现智能体函数。存在各种基本的智能体编程,反映了决策过程中明确使用的信息类型。这些设计在效率、紧凑性和灵活性方面各不相同。智能体程序的适当设计取决于环境的性质。
- 简单反射型智能体直接响应感知,而基于模型的反射型智能体保持内部状态以跟踪当前感知中不明晰的世界状态。基于目标的智能体采取行动来实现目标,而基于效用的智能体试图最大化自己期望的“快乐”。
- 所有智能体都可以通过学习提升性能。