项目作者: xavier-niu
项目描述 :
对Centering Resonance Analysis(CRA)的实现,其主要针对于中文语言的实现,使用Neo4j作为图数据库存储单词与单词之间的关系。
高级语言: Python
项目地址: git://github.com/xavier-niu/Centering-Resonance-Analysis.git
Centering Resonance Analysis (CRA)

这个项目是对Centering Resonance Analysis(CRA)的实现,其主要针对于中文语言的实现。在v1.0.0中,使用py2neo代替原先neo4j-driver,同时关系不会重复添加,生成的图具有更好的效果。
基础配置
本项目使用Neo4j作为图数据库存储单词与单词之间的关系,所以需要指定图数据库的uri、dbname和password。
所以在使用时需要创建conf.py,然后添加一些相关配置
- neo4j_cra_bolt: 是否使用bolt(Bool)
- neo4j_cra_host: neo4j的uri
- neo4j_cra_db: neo4j的数据库名
- neo4j_cra_psw: neo4j的密码
实现效果
文章摘自习近平致信祝贺首届数字中国建设峰会开幕,最终效果图如下:

存在的问题
目前打算将CRA应用到假新闻检测中,但是我认为CRA还有一些地方不足以支撑其对假新闻的辨别:
- 缺乏对数量词的分析。假新闻中对于数据的造假是很普遍的,但是原始的CRA方法仅仅是通过连接名词短语来实现的。
参考资料
- Corman, S. R., Kuhn, T., McPhee, R., and K. Dooley (2002). Studying Complex Discursive Systems: Centering Resonance Analysis of Communication. Human Communication Research, 28(2), 157-206.
- Visone - CRA
- jieba中文分词
Contact