我无法弄清楚为什么这段代码不起作用。当我将奖励列入清单时,我收到一个错误,告诉我尺寸不正确。我不知道该怎么做。
我正在实施……
排 rewards.append(reward) 导致错误,这是因为你的 rewards 变量是Tensor,正如您在其中定义的那样 rewards = tf.placeholder('float32',shape=[None]) 并且你不能将值附加到这样的张量。 你可能想打电话 rewards_list.append(reward) 。
rewards.append(reward)
rewards
rewards = tf.placeholder('float32',shape=[None])
rewards_list.append(reward)
此外,您正在初始化变量
observations_list = [] actions_list = [] rewards_list = []
在循环内部,因此在每次迭代中,ols值将被空列表覆盖。你可能想要在那之前有3行 while not done: 线。
while not done: