文本关键词提取,对文本分词后使用多种方法提取给定语料中的关键词,包含结巴自带的 TF-IDF 算法、TextRank 算法、Scikit-Learn 包中的 TF-IDF
关键词提取,使用多种方法提取给定语料中的关键词。步骤:
一共使用了四种方法提取关键词:
依赖:
data 目录中 origin.txt 文件是原始数据,执行 keywords.py 脚本后,输出关键词文件在 data 目录下。