Python NLTK:从斯坦福依赖解析结果中提取词汇头项


一腔诗意喂了狗
2025-03-13 12:29:27 (6月前)
  1. 我有一个句子,我想提取词汇头项目,我可以使用依赖解析


斯坦福
</跨度>

NLP
</跨度>
图书馆。

我怎样才能在句子中提取主头部?

在句子的情况下,parser-full-2014-06-16 /

斯坦福
</跨度>
-parser-3.4型号/教育/

斯坦福
</跨度>
/

NLP
</跨度>
/models/lexparser/englishPCFG.ser.gz“)
分析树= standepparse.raw_parse(文本)
p_tree =列表(分析树)[0]
打印

2 条回复
  1. 0# Autistic | 2019-08-31 10-32



    要查找句子的依赖头部,只需查找其中的节点

    head

    值指向

    root

    节点。在

    NLTK

    API到

    DependencyGraph

    ,您可以轻松地查找其头部指向字典的第一个索引的节点。



    请注意,在依赖解析中,与典型的chomsky普通形式/ CFG解析树不同,依赖解析可能有多个头。



    但是,由于您将依赖项输出转换为Tree结构,因此您可以执行以下操作:




    1. tree_head = next(n for n in p_tree.node_values() if n[‘head’] == 1)

    2. </code>


    但请注意语言上的句子中的头部

    Download and share this tool

    应该

    Download



    </强>

    share

    。但计算上,树是分层的,而普通形式的树也是如此

    ROOT->Download->and->share

    但是一些解析器也可能生成这个树:

    ROOT->and->Download;share


登录 后才能参与评论