web-dev-qa-db-ja.com

TensorFlow Object Detectionパイプライン構成でdata_augmentation_optionsに可能な値は何ですか?

ここに示すサンプル構成で、TensorFlowを使用してオブジェクト検出モデルを正常にトレーニングしました: https://github.com/tensorflow/models/tree/master/object_detection/samples/configs

次に、より良い結果を得るために構成を微調整します。私が目にする有望なオプションの1つは、「train_config」の下にある「data_augmentation_options」です。現在、次のようになっています。

train_config: {
  batch_size: 1
  ...
  data_augmentation_options {
    random_horizontal_flip {
    }
  }
}

輝度のランダムなスケーリング、トリミング、または微調整を行う他のオプションはありますか?

32
privard

オプションのリストは preprocessor.proto で提供されています。

NormalizeImage normalize_image = 1;
RandomHorizontalFlip random_horizontal_flip = 2;
RandomPixelValueScale random_pixel_value_scale = 3;
RandomImageScale random_image_scale = 4;
RandomRGBtoGray random_rgb_to_gray = 5;
RandomAdjustBrightness random_adjust_brightness = 6;
RandomAdjustContrast random_adjust_contrast = 7;
RandomAdjustHue random_adjust_hue = 8;
RandomAdjustSaturation random_adjust_saturation = 9;
RandomDistortColor random_distort_color = 10;
RandomJitterBoxes random_jitter_boxes = 11;
RandomCropImage random_crop_image = 12;
RandomPadImage random_pad_image = 13;
RandomCropPadImage random_crop_pad_image = 14;
RandomCropToAspectRatio random_crop_to_aspect_ratio = 15;
RandomBlackPatches random_black_patches = 16;
RandomResizeMethod random_resize_method = 17;
ScaleBoxesToPixelCoordinates scale_boxes_to_pixel_coordinates = 18;
ResizeImage resize_image = 19;
SubtractChannelMean subtract_channel_mean = 20;
SSDRandomCrop ssd_random_crop = 21;
SSDRandomCropPad ssd_random_crop_pad = 22;
SSDRandomCropFixedAspectRatio ssd_random_crop_fixed_aspect_ratio = 23;

preprocessor.py で各オプションの詳細を確認できます。引数はキーと値のペアとして提供できます。

  data_augmentation_options {
    ssd_random_crop {
    }
  }
  data_augmentation_options {
    random_pixel_value_scale {
      minval: 0.6
    }
  }
48
Najih Km