Caffeを使用して顕著性分析の深層学習モデルを構築しようとしています(pythonラッパーを使用しています)。しかし、この目的でlmdbデータ構造を生成する方法を理解できません。I Imagenetとmnistの例を確認しましたが、この形式でラベルを生成する必要があることを理解しています。
my_test_dir/picture-foo.jpg 0
しかし、私の場合、各ピクセルに0または1のラベルを付けて、そのピクセルが顕著であるかどうかを示します。それは画像の単一のラベルではありません。
ピクセルごとのラベリング用のlmdbファイルを生成する方法は?
これを確認してください: http://deepdish.io/2015/04/28/creating-lmdb-in-python/
すべての画像をX
に、対応するラベルをY
にロードするだけです。
Caffeでは、lmdbとhdf5の両方が、画像ごとに複数のラベル、必要に応じてマトリックスをサポートしています。次のスレッドを参照してください。
https://github.com/BVLC/caffe/issues/1698#issue-53768814
python code:
http://www.kostyaev.me/article/Multilabel%20Dataset/
編集:たとえば、ラベルの場合、caffe/python/caffe.io.pyにある3次元配列をデータムに変換するcaffe-python関数を使用します:array_to_datum(arr、label = None):