私は現在、MNISTの例のような例を研究することにより、畳み込みニューラルネットワークについて学んでいます。ニューラルネットワークのトレーニング中に、次のような出力がよく見られます。
Epoch | Train loss | Valid loss | Train / Val
--------|--------------|--------------|---------------
50 | 0.004756 | 0.007043 | 0.675330
100 | 0.004440 | 0.005321 | 0.834432
250 | 0.003974 | 0.003928 | 1.011598
500 | 0.002574 | 0.002347 | 1.096366
1000 | 0.001861 | 0.001613 | 1.153796
1500 | 0.001558 | 0.001372 | 1.135849
2000 | 0.001409 | 0.001230 | 1.144821
2500 | 0.001295 | 0.001146 | 1.130188
3000 | 0.001195 | 0.001087 | 1.099271
エポックのほかに、誰かが私に各列が正確に何を表しているのか、そして値が何を意味しているのかについて説明してもらえますか?基本的なcnnに関するチュートリアルはたくさんありますが、これを詳細に説明しているチュートリアルはありません。
ネットワークのトレーニングに使用されたものに加えて、保持されたデータセットが使用されているようです。トレーニング損失は、トレーニングデータセットのエラーです。検証損失は、トレーニングされたネットワークを介してデータの検証セットを実行した後のエラーです。 Train/validは、2つの間の比率です。
予期せぬことに、エポックが増加すると、検証とトレーニングエラーの両方が低下します。ただし、ある時点で、トレーニングエラーが減少し続ける間(ネットワークはデータをより適切に学習します)、検証エラーが増加し始めます-これはoverfitting
です!