KerasのFunctional API(TensorFlowバックエンドを使用)で複数の出力レイヤーを持つテキスト感情分類モデルをトレーニングしています。モデルは、入力としてKeras Preprocessing APIのhashing_trick()関数によって生成されたハッシュ値のNumpy配列を取り、バイナリ1のNumpy配列のlistを使用します-複数の出力を持つモデルをトレーニングするためのKeras仕様に従って、ターゲットとしてホットラベルを付けます(fit()のドキュメントを参照してください: https://keras.io/models/model/ )。
以下は、ほとんどの前処理手順を除いたモデルです。
textual_features = hashing_utility(filtered_words) # Numpy array of hashed values(training data)
label_list = [] # Will eventually contain a list of Numpy arrays of binary one-hot labels
for index in range(one_hot_labels.shape[0]):
label_list.append(one_hot_labels[index])
weighted_loss_value = (1/(len(filtered_words))) # Equal weight on each of the output layers' losses
weighted_loss_values = []
for index in range (one_hot_labels.shape[0]):
weighted_loss_values.append(weighted_loss_value)
text_input = Input(shape = (1,))
intermediate_layer = Dense(64, activation = 'relu')(text_input)
hidden_bottleneck_layer = Dense(32, activation = 'relu')(intermediate_layer)
keras.regularizers.l2(0.1)
output_layers = []
for index in range(len(filtered_words)):
output_layers.append(Dense(2, activation = 'sigmoid')(hidden_bottleneck_layer))
model = Model(inputs = text_input, outputs = output_layers)
model.compile(optimizer = 'RMSprop', loss = 'binary_crossentropy', metrics = ['accuracy'], loss_weights = weighted_loss_values)
model.fit(textual_features, label_list, epochs = 50)
このモデルが生成するエラートレーストレーニングの要点は次のとおりです。
ValueError:ターゲットのチェック時のエラー:dense_3には形状(2)が必要ですが、形状(1)の配列を取得しました
きみの numpy arrays
(入力と出力の両方)にバッチディメンションを含める必要があります。ラベルの形状が現在(2,)
、次のようにバッチディメンションを含めるように変更できます。
label_array = label_array.reshape(1, -1)