PyTorch-評価モードでドロップアウトを無効にする方法

Question

これは私が定義したモデルで、2つの完全に接続されたレイヤーを持つ単純なlstmです。

_import copy import torch import torch.nn as nn import torch.nn.functional as F import torch.optim as optim class mylstm(nn.Module): def __init__(self,input_dim, output_dim, hidden_dim,linear_dim): super(mylstm, self).__init__() self.hidden_dim=hidden_dim self.lstm=nn.LSTMCell(input_dim,self.hidden_dim) self.linear1=nn.Linear(hidden_dim,linear_dim) self.linear2=nn.Linear(linear_dim,output_dim) def forward(self, input): out,_=self.lstm(input) out=nn.Dropout(p=0.3)(out) out=self.linear1(out) out=nn.Dropout(p=0.3)(out) out=self.linear2(out) return out _

_x_train_および_x_val_は、形状_(4478,30)_のフロートデータフレームですが、_y_train_および_y_val_は、形状_(4478,10)_のフロートdfです

_ x_train.head() Out[271]: 0 1 2 3 ... 26 27 28 29 0 1.6110 1.6100 1.6293 1.6370 ... 1.6870 1.6925 1.6950 1.6905 1 1.6100 1.6293 1.6370 1.6530 ... 1.6925 1.6950 1.6905 1.6960 2 1.6293 1.6370 1.6530 1.6537 ... 1.6950 1.6905 1.6960 1.6930 3 1.6370 1.6530 1.6537 1.6620 ... 1.6905 1.6960 1.6930 1.6955 4 1.6530 1.6537 1.6620 1.6568 ... 1.6960 1.6930 1.6955 1.7040 [5 rows x 30 columns] x_train.shape Out[272]: (4478, 30) _

変数を定義してbpを1回実行すると、vaildation損失が1.4941であることがわかります

_model=mylstm(30,10,200,100).double() from torch import optim optimizer=optim.RMSprop(model.parameters(), lr=0.001, alpha=0.9) criterion=nn.L1Loss() input_=torch.autograd.Variable(torch.from_numpy(np.array(x_train))) target=torch.autograd.Variable(torch.from_numpy(np.array(y_train))) input2_=torch.autograd.Variable(torch.from_numpy(np.array(x_val))) target2=torch.autograd.Variable(torch.from_numpy(np.array(y_val))) optimizer.zero_grad() output=model(input_) loss=criterion(output,target) loss.backward() optimizer.step() moniter=criterion(model(input2_),target2) moniter Out[274]: tensor(1.4941, dtype=torch.float64, grad_fn=<L1LossBackward>) _

しかし、私は再びフォワード関数を呼び出しました、ドロップアウトのランダム性のために別の番号を取得します

_moniter=criterion(model(input2_),target2) moniter Out[275]: tensor(1.4943, dtype=torch.float64, grad_fn=<L1LossBackward>) _

予測句のドロップアウトをすべてなくすにはどうすればよいですか？

私はeval()を試しました：

_moniter=criterion(model.eval()(input2_),target2) moniter Out[282]: tensor(1.4942, dtype=torch.float64, grad_fn=<L1LossBackward>) moniter=criterion(model.eval()(input2_),target2) moniter Out[283]: tensor(1.4945, dtype=torch.float64, grad_fn=<L1LossBackward>) _

ドロップアウトを制御するために追加のパラメーターpを渡します：

_import copy import torch import torch.nn as nn import torch.nn.functional as F import torch.optim as optim class mylstm(nn.Module): def __init__(self,input_dim, output_dim, hidden_dim,linear_dim,p): super(mylstm, self).__init__() self.hidden_dim=hidden_dim self.lstm=nn.LSTMCell(input_dim,self.hidden_dim) self.linear1=nn.Linear(hidden_dim,linear_dim) self.linear2=nn.Linear(linear_dim,output_dim) def forward(self, input,p): out,_=self.lstm(input) out=nn.Dropout(p=p)(out) out=self.linear1(out) out=nn.Dropout(p=p)(out) out=self.linear2(out) return out model=mylstm(30,10,200,100,0.3).double() output=model(input_) loss=criterion(output,target) loss.backward() optimizer.step() moniter=criterion(model(input2_,0),target2) Traceback (most recent call last): File "<ipython-input-286-e49b6fac918b>", line 1, in <module> output=model(input_) File "D:\Users\shan xu\Anaconda3\lib\site-packages	orch
n\modules\module.py", line 489, in __call__ result = self.forward(*input, **kwargs) TypeError: forward() missing 1 required positional argument: 'p' _

しかし、どちらもうまくいきませんでした。

blue-phoenox · Accepted Answer

_nn.Dropout_で___init___レイヤーを定義し、eval()の呼び出しに応答するようにモデルに割り当てる必要があります。

したがって、このようにモデルを変更すると、うまくいくはずです。

_class mylstm(nn.Module): def __init__(self,input_dim, output_dim, hidden_dim,linear_dim,p): super(mylstm, self).__init__() self.hidden_dim=hidden_dim self.lstm=nn.LSTMCell(input_dim,self.hidden_dim) self.linear1=nn.Linear(hidden_dim,linear_dim) self.linear2=nn.Linear(linear_dim,output_dim) # define dropout layer in __init__ self.drop_layer = nn.Dropout(p=p) def forward(self, input): out,_= self.lstm(input) # apply model dropout, responsive to eval() out= self.drop_layer(out) out= self.linear1(out) # apply model dropout, responsive to eval() out= self.drop_layer(out) out= self.linear2(out) return out _

このように変更すると、このドロップアウトはeval()を呼び出すとすぐに非アクティブになります。

注：後でトレーニングを続行する場合は、モデルでtrain()を呼び出して、評価モードを終了する必要があります。

評価モードのeval()を使用したドロップアウトの小さな実用的な例もここにあります： nn.Dropout vs. F.dropout pyTorch

two four · Answer

他の回答が述べたように、ドロップアウトレイヤーはモデルの___init___メソッドで定義して、モデルが各定義済みレイヤーのすべての情報を追跡できるようにすることが望まれます。モデルの状態が変更されると、すべてのレイヤーに通知され、関連する作業が行われます。たとえば、model.eval()を呼び出すと、モデルはドロップアウトレイヤーを非アクティブ化しますが、すべてのアクティブ化を直接渡します。一般に、ドロップアウトレイヤーを非アクティブ化する場合は、___init___モジュールを使用して_nn.Dropout_メソッドでドロップアウトレイヤーを定義することをお勧めします。