从技术上讲,错误只是告诉你pred_w(i,j)应该是pred_w [i,j],如果你想引用矩阵的一个条目。但是,要使这个代码能够运行,需要进行相当多的重写。
为了实际优化损失,主要的是它需要在网络中的权重方面是可区分的。在这种情况下您可以使用的示例可能是:
(x-0.5)^ N表示相对较高的N.
或log-barriers,即-log(x)-log(1-x)
实际上计算数字(这对于优化没有帮助)可以用类似的东西来实现
count = tf.sum(pred_w<=0.1) + tf.sum(predictions_w>=0.9)
也许这有助于在训练期间输出该范围内有多少数字或类似的东西。