A、监督学习
B、非监督学习
C、强化学习
D、线性回归
A、监督学习
B、非监督学习
C、强化学习
D、线性回归
A.状态动作函数
B.状态值函数
C.动作值函数
D.策略函数
A、期望值
B、最大值
C、最小值
D、总和
A、大;小
B、大;大
C、小;小
D、小;大
A、大;小
B、大;大
C、小;小
D、小;大
A、探索;开发
B、开发;探索
C、探索;输出
D、开发;输出
A、探索
B、开发
C、输入
D、输出
A、外部影响
B、主体内因
C、历史状态
D、当前状态
A、客观性
B、主体性
C、超前性
D、滞后性
A、支持向量机
B、决策树
C、神经网络
D、线性回归
A、状态
B、动作
C、回报
D、强化