我刚刚浏览了两者的源代码 TFRecordDataset 和 parallel_interleave 。请注意,我正在查看tf.data.experimental,因为不推荐使用tf.contrib.data。有趣的是,他们都打电话给同一个班级, ParallelInterleaveDataset 利用并行阅读。我想它可以选择优化你的管道,因为你可以使用block_length,sloppy,buffer_output_elements和prefetch_input_elements这些参数,当使用parallel_interleave来加速你的管道时,同时也会在排序中赋予一些随机性。