项目作者: chlaudiah
项目描述 :
An Implementation One of Natural Language Processing: Pos Tagging
高级语言: Jupyter Notebook
项目地址: git://github.com/chlaudiah/Pos-Tagging.git
POS-TAGGING
Korpus yang digunakan adalah korpus yang berasal dari website http://bahasa.cs.ui.ac.id/postag/corpus dengan jumlah korpus sebanyak 1000 kalimat dan 20 kalimat sebagai data uji. Pengujian Pos Tagging dilakukan dengan 3 pendekatan, yaitu
- Metode Baseline
- Metode Statistika
- Metode HMM-Viterbi
PETUNJUK PENGGUNAAN PROGRAM
- Setiap metode dibangun didalam program yang berbeda-beda:
a. Metode Baseline: Metode-Baseline_1301150434
b. Metode Statistika : Metode-Statistika_1301150434
c. Metode HMM-Viterbi : Metode-HMMViterbi_1301150434
Hal ini karena jika digabungkan, banyak variable yang overlaps karena nama variabel sama dan harus diganti satu persatu. - Jika ingin melihat kamus yang digunakan untuk membangun feature, dapat membuka file: 1-1 tag dict.txt
- Jika ingin melakukan running program, pastikan nama file sudah sesuai