• 2024-07-31(10-2-02)智能行为决策算法:常用的智能行为决策算法(2)-------强化学习
    10.2.2 强化学习强化学习是一种机器学习方法,其核心思想是通过代理程序与环境的交互学习最优行为策略,以最大化累积奖励。在强化学习中,代理程序通过观察环境的状态,并选择动作来影响环境,从而学习如何在面对不同状态时做出最优的决策。和强化学习相关的关键概念包括:环境与代理