斯坦福NLP：如何禁用警告？

作者: 筱梨
发布时间: 2025-01-18 04:12:31 (19天前)
转自：

3 条回复

0#
回复此人
苞米地里的蒙面妖 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 人们可以这样做： </p> <pre> <code> Reader reader = new StringReader(paragraphText); DocumentPreprocessor documentPreprocessor = new DocumentPreprocessor(reader, DocumentPreprocessor.DocType.Plain); TokenizerFactory<? extends HasWord> factory = PTBTokenizer.factory(); factory.setOptions("untokenizable=noneDelete"); documentPreprocessor.setTokenizerFactory(factory); </code> </pre> <P> 从这里： <a href="https://github.com/stanfordnlp/CoreNLP/issues/103#issuecomment-157793500" rel="nofollow noreferrer"> https://github.com/stanfordnlp/CoreNLP/issues/103#issuecomment-157793500 </A> </p> </DIV>

编辑
1#
回复此人
雨儿 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 如果您直接使用Tokenizer，Denis Kulagin给出的答案是好的;如果您在StanfordCoreNLP管道的更高级别操作，则可以简单地给出属性（或等效的命令行选项）： </p> <pre> <code> tokenize.options = untokenizable=noneDelete </code> </pre> <P> （以静默方式删除所有未知字符）或以静默方式保留它们： </p> <pre> <code> tokenize.options = untokenizable=noneKeep </code> </pre> </DIV>

编辑

登录后才能参与评论