我们只将它用作NLP与dl4j的一组接口的一部分。一个tokenizer工厂和标记器,它在内部使用UIMA进行标记化和句子分割,并使用我们的句子界面。这与使用deeplearning4j本身构建自己的模型非常不同。
据我所知,你正在运行一个使用一些基于OpenNLP的AnalysisEngines的UIMA管道,到目前为止还没问题。 从您的问题中不清楚的是您在功能方面寻找的是什么,而不是工具。 所以我认为这是第一个要澄清的事情。
除此之外,Apache UIMA是一个架构框架;在那里,您可以集成OpenNLP,DL4J,ClearTK或其他任何对您的非结构化信息处理任务有用的东西。
在Apache OpenNLP项目中,我们正在做一些实验来集成不同的DL框架,你可以拥有一个 https://issues.apache.org/jira/browse/OPENNLP-1009 (目前的原型基于DL4J)。
既然你提到你正在利用Apache Spark集群,DL4J可能是一个很好的选择,因为它应该能够顺利地与它集成。