项目作者: crazymaster

项目描述 :
Build Parallel Corpus for Japanese Text Simplification
高级语言: Jupyter Notebook
项目地址: git://github.com/crazymaster/jats.git
创建时间: 2019-06-14T05:41:29Z
项目社区:https://github.com/crazymaster/jats

开源协议:MIT License

下载


jats Build Status

Build Parallel Corpus for Japanese Text Simplification

Requirements

Ubuntu

  1. sudo apt install mecab libmecab-dev unidic-mecab swig nkf

macOS

  1. brew install mecab mecab-unidic swig nkf

Setup

  1. make setup

Usage

  1. echo 'お腹が空いた。' | python3 -m jatr
  1. python3 -m jatr < data/サンプルテキスト/中級前半.txt
  1. python3 -m jatr data/サンプルテキスト/上級後半.txt
  1. make help

Note

語彙表やコーパスは data ディレクトリ以下に配置