在Postgresql中,您将不得不为每个写入的插入语句等待一次完整的往返(延迟)。此延迟是数据库一直到加载数据的机器之间的延迟。
在AWS中,您有许多选项可以提高性能。
对于初学者,您可以将原始数据加载到EC2实例并从那里开始导入,但是,除非可以直接在ec2实例上加载,否则您可能无法使用dataStage工具。
您可以将dataStage配置为使用批处理,其中每个insert语句实际上包含许多行。通常,越多越快。
禁用数据压缩并确保您已尽一切努力将两个端点之间的延迟降至最低。