我对机器学习/ python / ubuntu比较陌生。
我有一组.jpg格式的图像,其中一半包含我想学习的功能,另一半则不需要。我在寻找一种将它们转换为所需lmdb格式的方法时遇到了麻烦。
我有必要的文本输入文件。
我的问题是,有人可以convert_imageset.cpp在ubuntu终端中提供如何使用的逐步指南吗?
谢谢
Caffe的快速指南 convert_imageset建立您必须做的第一件事是构建caffe和caffe的工具(convert_imageset是这些工具之一)。安装好caffe并完成之后make,请确保您也可以跑步make tools。验证convert_imageset是否在中创建了二进制文件$CAFFE_ROOT/build/tools。
准备数据图片:将所有图片放在一个文件夹中(我在这里称其为/path/to/jpegs/)。标签:创建一个文本文件(例如/path/to/labels/train.txt),每个输入图像一行。例如:
img_0000.jpeg 1img_0001.jpeg 0img_0002.jpeg 0
在此示例中,第一个图像被标记,1而另两个图像被标记0。
转换数据集在shell中运行二进制文件
~$ GLOG_logtostderr=1 $CAFFE_ROOT/build/tools/convert_imageset \ —resize_height=200 —resize_width=200 —shuffle \ /path/to/jpegs/ \ /path/to/labels/train.txt \ /path/to/lmdb/train_lmdb命令行说明:
GLOG_logtostderr在调用之前,将标志设置为1 convert_imageset表示将日志消息重定向到stderr的日志记录机制。—resize_height并将所有输入图像—resize_width调整为相同大小。 200x200—shuffle随机更改图像的顺序,并且不保留/path/to/labels/train.txt文件中的顺序。以下是images文件夹,标签文本文件和输出名称的路径。请注意,输出名称在调用之前不应该存在,convert_imageset否则会收到可怕的错误消息。其他可能有用的标志:
—backend-允许您在lmdb数据集或之间进行选择levelDB。—gray -将所有图像转换为灰度。—encoded和—encoded_type -在编码(JPG / PNG)保留的影像数据在数据库中的压缩形式。—help -显示一些帮助,请参阅来自tools / convert_imageset.cpp的“标记”下的所有相关标记。