模型并行性是当模型的参数不适合单个GPU的内存时使用的技术。当您的模型非常复杂(多层)或某些层很大时,就会发生这种情况。通常,模型并行性是您应该仅作为最后手段使用的东西,因为它通常很慢。
你的模型看起来很简单,所以我不确定你是否真的需要模型并行性(它只是一个例子?)。如果你想一次只使用一个GPU并且可以将你的所有模型都安装到单个GPU中,我不建议做模型并行。
如果您确定需要模型并行性,请参阅 这个例子 使用Apache MXNet来做到这一点。