一些事情可以帮助根本导致缺乏加速。
您可以检查转换为TRT的节点数。
使用最新版本的TF(1.13或每晚)来使用添加的所有最新功能。
配置文件(例如nvprof或tf profiler),以查看推理工作负载的瓶颈。
TF-TRT用户指南可能会有所帮助: https://docs.nvidia.com/deeplearning/dgx/integrate-tf-trt/index.html
这个回购中还有很多例子: https://github.com/tensorflow/tensorrt