题目
在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力A. 动态规划A.Bellman方程C. 贪心策略D. 蒙特卡洛采样
在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力
- A. 动态规划
- A.Bellman方程
- C. 贪心策略
- D. 蒙特卡洛采样
题目解答
答案
C
解析
在强化学习中,利用与探索之间的平衡是至关重要的。利用指的是使用已知的最佳策略来最大化奖励,而探索则是尝试新的行动以发现可能更好的策略。贪心策略是一种典型的利用策略,它总是选择当前已知的最佳行动。然而,为了在利用和探索之间找到平衡,需要引入一些机制来鼓励探索。例如,ε-贪心策略就是一种在贪心策略基础上引入探索的方法,它以一定的概率选择随机行动,从而在利用和探索之间取得平衡。