项目作者: xavier-niu

项目描述 :
对Centering Resonance Analysis(CRA)的实现,其主要针对于中文语言的实现,使用Neo4j作为图数据库存储单词与单词之间的关系。
高级语言: Python
项目地址: git://github.com/xavier-niu/Centering-Resonance-Analysis.git
创建时间: 2019-01-22T09:25:41Z
项目社区:https://github.com/xavier-niu/Centering-Resonance-Analysis

开源协议:

下载


Centering Resonance Analysis (CRA)

这个项目是对Centering Resonance Analysis(CRA)的实现,其主要针对于中文语言的实现。在v1.0.0中,使用py2neo代替原先neo4j-driver,同时关系不会重复添加,生成的图具有更好的效果。

基础配置

本项目使用Neo4j作为图数据库存储单词与单词之间的关系,所以需要指定图数据库的uri、dbname和password。

所以在使用时需要创建conf.py,然后添加一些相关配置

  • neo4j_cra_bolt: 是否使用bolt(Bool)
  • neo4j_cra_host: neo4j的uri
  • neo4j_cra_db: neo4j的数据库名
  • neo4j_cra_psw: neo4j的密码

实现效果

文章摘自习近平致信祝贺首届数字中国建设峰会开幕,最终效果图如下:

存在的问题

目前打算将CRA应用到假新闻检测中,但是我认为CRA还有一些地方不足以支撑其对假新闻的辨别:

  • 缺乏对数量词的分析。假新闻中对于数据的造假是很普遍的,但是原始的CRA方法仅仅是通过连接名词短语来实现的。

参考资料

  • Corman, S. R., Kuhn, T., McPhee, R., and K. Dooley (2002). Studying Complex Discursive Systems: Centering Resonance Analysis of Communication. Human Communication Research, 28(2), 157-206.
  • Visone - CRA
  • jieba中文分词

Contact