Stanford NLP Tagger通过NLTK - tag_sents将所有内容分成字符

作者: 银角
发布时间: 2025-03-14 01:52:29 (5天前)
转自：

stanford_model =’

斯坦福
</跨度>
-postagger /型号/英文双向distsim.tagger”
stanford_jar =’

斯坦福
</跨度>
-postagger /

斯坦福
</跨度>
-postagger.jar”
tagger = StanfordPOSTagger（stanford_model，stanford_jar锟

3 条回复

0# 不见你 | 2019-08-31 10-32

该
tag_sents
function获取字符串列表的列表。


    
      tagger.tag_sents(word_tokenize(“The quick brown fox jumps over the lazy dog.”))
</code>


  
    这是一个有用的习语：
  

   
    
       tagger.tag_sents(word_tokenize(sent) for sent in sent_tokenize(text))
</code>
  

  
    哪里
     
      text
    
     是一个字符串。

1#
回复此人
一生浮华 | 2019-08-31 10-32

alvas所说的另一种变体，对我有用：
tagger.tag_sents([[text]])
。

编辑

登录后才能参与评论