ndl-lab の deeplab-v3-plus のリポジトリのリファクタリングと修正。個人的に。
このプログラムは以下のリポジトリ(MITライセンス)を改変して作成しています。
$ pip3 install -r requirements.txt
python3 picture_extraction.py --input_dir INPUT_DIR --output_dir OUTPUT_DIR
./models/org_resnet/
ディレクトリを作る。
$ mkdir -p ./models/org_resnet/
$ cd models/org_resnet/
$ wget http://download.tensorflow.org/models/resnet_v2_50_2017_04_14.tar.gz ./models/org_resnet/
$ tar -zxvf resnet_v2_50_2017_04_14.tar.gz
$ cd data_in
$ python3 draw_annot_img.py datas_test
$ python3 create_pascal_tf_record.py datas_test
data_in/datas/【dataset名】/
以下に「img
」「xml
」 ディレクトリを作って、そこにデータを入れる。data_in/datas_demo/
が参考になるはず。
$ cd data_in
$ python3 copy_dataset.py 【1. のパス】 datas/【dataset名】
【dataset名】
は自分で決める。-m
data_in/datas/【dataset名】
ディレクトリがすでに存在する場合、コピーをスキップする。(削除しない)-r
【1. のパス】
以下を、再帰的に探索する。-a
教師データ生成
$ cd data_in
$ python3 draw_annot_img.py datas/【dataset名】 -set_path 【_settings/ のパス】
data_in/datas/【dataset名】/annot_img
に生成される。-set_path
_settings/
がすでにあるなら、そのパスを指定する。(作業ディレクトリにコピーされる)_settings/
が新規作成される。all.txt
1_overall
2_handwritten
3_typography
4_illustration
5_stamp
6_headline
7_caption
8_textline
9_table
set_order.csv
1_overall
4_illustration
2_handwritten,3_typography
8_textline
6_headline,7_caption
9_table
5_stamp
を除外し、2と3、6と8 を同じラベルとして扱う設定例。
$ python3 create_pascal_tf_record.py datas/【dataset名】
build_dataset.py
は、copy_dataset.py
と draw_annot_img.py
をまとめて実行するスクリプト。
copy_dataset.py
を手動で行う(copy_dataset.py
が使えない)状況の場合は、これを使う必要はない。create_pascal_tf_record.py
は実行する必要がある。copy_dataset.py
と draw_annot_img.py
をまとめたもの。
$ python3 train.py \
data_in/datas/datas_test \
--batch_size=1
$ python3 train.py data_in/datas/【dataset名】