根据您提到的要求,您可以在培训和测试期间使用Weka的Filtered Classifier选项。我没有重复我录制的视频广播 这里 和 这里 。
但基本思路不是将StringToWord向量用作直接过滤器,而是将其用作FilteredClassifier选项中的过滤选项。您生成的模型只需一次。然后,您可以直接在未标记数据上应用模型,而无需重新训练它们,也无需在未标记数据上再次应用StringToWord向量。 FilteredClassifier将为您解决这些问题。