我不确定我是否可以提供适当的解决方案,但我们有类似的设置。
我们有存储在RBDMS(postgresql)中的元信息和HDF5文件中的实际科学数据。 我们在HPC上运行了一些分析。它的完成方式如下:
REST
PBS
我建议不要将二进制文件存储在RDBMS中作为BLOB。 我会把它们保持为HDF5格式。您可以为数据库和文件系统提供不同的备份策略。
另外几个指针:
NoSQL
Elasticsearch