我正在尝试使用DeepLearning4j库在Java中实现深度确定性策略梯度算法,但是我在有效实现策略梯度时遇到了一些麻烦。
在……
实现政策梯度,如外部错误例子所示,对我来说效果很好
https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/misc/externalerrors/MultiLayerNetworkExternalErrors.java