如果您还没有获得所需的Graph OLAP性能,或者将数据移动到Spark的速度很慢或很麻烦,我建议您看一下AnzoGraph。它由构建Netezza和ParAccel / Redshift的同一团队编程。
AnzoGraph是大规模并行处理本机Graph OLAP(GOLAP)引擎的基于C / C ++ HPC的实现 - 即数据仓库样式交互式或批量报告分析和图形数据的聚合。它具有非常高的性能,可以在商用计算机上进行线性扩展,因此可以处理您提到的数据集(您甚至可能不需要用于该大小数据的集群)。在撰写本文时,它不支持Tinkerpop / Gremlin,这对您来说可能是一个问题。它支持SPARQL1.1以及RDF *(属性图支持,它还不是W3C SPARQL标准的一部分)以及常规分析所需的许多其他扩展功能/聚合功能。它还支持推理,命名查询,视图,各种图算法等
免责声明:我为剑桥语义学工作。