我正在使用mxnet的DEC(https://github.com/apache/incubator-mxnet/tree/master/example/deep-embedded-clustering)
虽然它默认在MNIST上运行,但我已将数据源更改为多个……
聚类方法(单独使用)不提供用于标记未包括在用于导出聚类的计算中的样本的方法。您可以使用新样本重新运行聚类算法,但由于不同的随机初始化,群集可能会更改并被赋予不同的群集标签。所以这可能就是为什么每次都会看到不同的预测。
一种选择是以监督方式使用聚类方法中的聚类标签来预测新样本的聚类标签。您可以找到与新样本最近的聚类中心(在要素空间中)并将其用作聚类标签,但这会忽略聚类的形状。一个更好的解决方案是训练分类模型,以便在给定先前聚类数据的情况下预测新样本的聚类标签。这些方法的成功取决于聚类的质量(即所使用的特征空间,聚类的可分离性等)。