是的,不是。在文档中 这里 ,它提到:
添加模型序列化/反序列化后权重更新。 也就是说,你可以用200GB的新文本更新模型状态 调用 loadFullModel ,补充说 TokenizerFactory 和 SentenceIterator 它,并呼吁 fit() 在恢复的模型上。
loadFullModel
TokenizerFactory
SentenceIterator
fit()
这意味着可以使用新的语料库重新训练和更新模型权重。但是词汇中不会添加任何新单词。
检查代码和Javadoc 这里 。