web-dev-qa-db-ja.com

NNでの列車損失、有効損失、および列車/ヴァルの意味とは

私は現在、MNISTの例のような例を研究することにより、畳み込みニューラルネットワークについて学んでいます。ニューラルネットワークのトレーニング中に、次のような出力がよく見られます。

 Epoch  |  Train loss  |  Valid loss  |  Train / Val
--------|--------------|--------------|---------------
    50  |    0.004756  |    0.007043  |     0.675330
   100  |    0.004440  |    0.005321  |     0.834432
   250  |    0.003974  |    0.003928  |     1.011598
   500  |    0.002574  |    0.002347  |     1.096366
  1000  |    0.001861  |    0.001613  |     1.153796
  1500  |    0.001558  |    0.001372  |     1.135849
  2000  |    0.001409  |    0.001230  |     1.144821
  2500  |    0.001295  |    0.001146  |     1.130188
  3000  |    0.001195  |    0.001087  |     1.099271

エポックのほかに、誰かが私に各列が正確に何を表しているのか、そして値が何を意味しているのかについて説明してもらえますか?基本的なcnnに関するチュートリアルはたくさんありますが、これを詳細に説明しているチュートリアルはありません。

10
sebaqu

ネットワークのトレーニングに使用されたものに加えて、保持されたデータセットが使用されているようです。トレーニング損失は、トレーニングデータセットのエラーです。検証損失は、トレーニングされたネットワークを介してデータの検証セットを実行した後のエラーです。 Train/validは、2つの間の比率です。

予期せぬことに、エポックが増加すると、検証とトレーニングエラーの両方が低下します。ただし、ある時点で、トレーニングエラーが減少し続ける間(ネットワークはデータをより適切に学習します)、検証エラーが増加し始めます-これはoverfittingです!

20
DMML