项目作者: turbolent

项目描述 :
Filter a Wikidata RDF Dump
高级语言: Java
项目地址: git://github.com/turbolent/wikidata-dump-filter.git
创建时间: 2017-10-29T00:08:42Z
项目社区:https://github.com/turbolent/wikidata-dump-filter

开源协议:MIT License

下载


Wikidata Dump Filter

Filter a Wikidata RDF Dump

Usage

  • Split the dump into parts: ./split.sh latest-truthy.nt.gz parts/
  • Filter the parts in parallel: ls parts/part_* | ./run.sh out/