convert_imageset.cpp指南


狗头军师
2025-04-03 10:02:40 (5天前)

我对机器学习/ python / ubuntu比较陌生。

我有一组.jpg格式的图像,其中一半包含我想学习的功能,另一半则不需要。我在寻找一种将它们转换为所需lmdb格式的方法时遇到了麻烦。

我有必要的文本输入文件。

我的问题是,有人可以convert_imageset.cpp在ubuntu终端中提供如何使用的逐步指南吗?

谢谢

2 条回复
  1. 1# v-star*위위 | 2020-07-30 14-32

    Caffe的快速指南 convert_imageset
    建立
    您必须做的第一件事是构建caffe和caffe的工具(convert_imageset是这些工具之一)。
    安装好caffe并完成之后make,请确保您也可以跑步make tools。
    验证convert_imageset是否在中创建了二进制文件$CAFFE_ROOT/build/tools。

    准备数据
    图片:将所有图片放在一个文件夹中(我在这里称其为/path/to/jpegs/)。
    标签:创建一个文本文件(例如/path/to/labels/train.txt),每个输入图像一行。例如:

    img_0000.jpeg 1
    img_0001.jpeg 0
    img_0002.jpeg 0

    在此示例中,第一个图像被标记,1而另两个图像被标记0。

    转换数据集
    在shell中运行二进制文件

    ~$ GLOG_logtostderr=1 $CAFFE_ROOT/build/tools/convert_imageset \
    —resize_height=200 —resize_width=200 —shuffle \
    /path/to/jpegs/ \
    /path/to/labels/train.txt \
    /path/to/lmdb/train_lmdb
    命令行说明:

    GLOG_logtostderr在调用之前,将标志设置为1 convert_imageset表示将日志消息重定向到stderr的日志记录机制。
    —resize_height并将所有输入图像—resize_width调整为相同大小。 200x200
    —shuffle随机更改图像的顺序,并且不保留/path/to/labels/train.txt文件中的顺序。
    以下是images文件夹,标签文本文件和输出名称的路径。请注意,输出名称在调用之前不应该存在,convert_imageset否则会收到可怕的错误消息。
    其他可能有用的标志:

    —backend-允许您在lmdb数据集或之间进行选择levelDB。
    —gray -将所有图像转换为灰度。
    —encoded和—encoded_type -在编码(JPG / PNG)保留的影像数据在数据库中的压缩形式。
    —help -显示一些帮助,请参阅来自tools / convert_imageset.cpp的“标记”下的所有相关标记。

登录 后才能参与评论