基于文档主题结构的关键词抽取方法研究.pdf


立即下载 樱花弄๑•ั็•็
2025-03-08
学位 论文 主题 关键 文档 词抽取 结构 方法 清华 学校
3.1 MB

基于文档主题结构的关键词抽取
方法研究
(申请清华大学工学博士学位论文)
培 养 单 位 : 计算机科学与技术系
学 科 : 计算机科学与技术
研 究 生 : 刘 知 远
指 导 教 师 : 孙 茂 松 教 授
二○一一年三月
Research on Keyword Extraction Using
Document Topical Structure
Dissertation Submitted to
Tsinghua University
in partial fulfillment of the requirement
for the degree of
Doctor of Engineering
by
Liu Zhiyuan
( Computer Science and Technology )
Dissertation Supervisor : Professor Sun Maosong
March, 2011
关于学位论文使用授权的说明
本人完全了解清华大学有关保留、使用学位论文的规定,即:
清华大学拥有在著作权法规定范围内学位论文的使用权,其中包
括:(1)已获学位的研究生必须按学校规定提交学位论文,学校可以
采用影印、缩印或其他复制手段保存研究生上交的学位论文;(2)为
教学和科研目的,学校可以将公开的学位论文作为资料在图书馆、资
料室等场所供校内师生阅读,或在校园网上供校内师生浏览部分内
容;(3)根据《中华人民共和国学位条例暂行实施办法》,向国家图
书馆报送可以公开的学位论文。
本人保证遵守上述规定。
(保密的论文在解密后应遵守此规定)
作者签名: 导师签名:
日 期: 日 期:
摘 要
摘 要
关键词是快速获取文档主题的重要方式,在信息检索和自然语言处理等领域
均有重要应用。传统的方法仅依靠词汇的统计信息进行推荐,没有考虑文档主题
结构对关键词抽取的影响。本文主要研究考虑文档主题结构的关键词抽取方法。
本文针对文档主题结构在关键词抽取中的重要作用,从四个方面提出考虑文档主
题结构的关键词抽取方法:基于文档内部信息构建主题的关键词抽取,基于隐含
主题模型构建主题的关键词抽取,综合利用隐含主题模型和文档结构的关键词抽
取,以及基于文档与关键词主题一致性的关


学位/论文/主题/关键/文档/词抽取/结构/方法/清华/学校/ 学位/论文/主题/关键/文档/词抽取/结构/方法/清华/学校/
-1 条回复
登录 后才能参与评论
-->