Stanford NLP Tagger通过NLTK - tag_sents将所有内容分成字符


银角
2025-03-14 01:52:29 (5天前)

stanford_model =’

斯坦福
</跨度>
-postagger /型号/英文双向distsim.tagger”
stanford_jar =’

斯坦福
</跨度>
-postagger /

斯坦福
</跨度>
-postagger.jar”
tagger = StanfordPOSTagger(stanford_model,stanford_jar锟

3 条回复
  1. 0# 不见你 | 2019-08-31 10-32





    tag_sents

    function获取字符串列表的列表。




    1. tagger.tag_sents(word_tokenize(“The quick brown fox jumps over the lazy dog.”))

    2. </code>


    这是一个有用的习语:




    1. tagger.tag_sents(word_tokenize(sent) for sent in sent_tokenize(text))

    2. </code>


    哪里

    text

    是一个字符串。


  2. 1# 一生浮华 | 2019-08-31 10-32



    alvas所说的另一种变体,对我有用:

    tagger.tag_sents([[text]])



登录 后才能参与评论