Pytorch：データをテンソルに変換する方法

Question

私はピトーチの初心者です。 Pytorchチュートリアルを参考にしてCNNコードを書こうとしていました。以下はコードの一部ですが、「RuntimeError：変数データはテンソルでなければなりませんが、リストを取得しました」というエラーが表示されます。入力データをテンソルにキャストしようとしましたが、うまく機能しませんでした。誰かが解決策を知っている場合は、私を助けてください...

 def read_labels(file): dic = {} with open(file) as f: reader = f for row in reader: dic[row.split(",")[0]] = row.split(",")[1].rstrip() #rstrip(): eliminate "
" return dic image_names= os.listdir("./train_mini") label_dic = read_labels("labels.csv") names =[] labels = [] images =[] for name in image_names[1:]: images.append(cv2.imread("./train_mini/"+name)) labels.append(label_dic[os.path.splitext(name)[0]]) """ Data distribution """ N = len(images) N_train = int(N * 0.7) N_test = int(N*0.2) X_train, X_tmp, Y_train, Y_tmp = train_test_split(images, labels, train_size=N_train) X_validation, X_test, Y_validation, Y_test = train_test_split(X_tmp, Y_tmp, test_size=N_test) """ Model Definition """ class CNN(nn.Module): def __init__(self): super(CNN, self).__init__() self.head = nn.Sequential( nn.Conv2d(in_channels=1, out_channels=10, kernel_size=5, stride=1), nn.MaxPool2d(kernel_size=2), nn.ReLU(), nn.Conv2d(10, 20, kernel_size=5), nn.MaxPool2d(kernel_size=2), nn.ReLU()) self.tail = nn.Sequential( nn.Linear(320, 50), nn.ReLU(), nn.Linear(50, 10)) def forward(self, x): x = self.head(x) x = x.view(-1, 320) x = self.tail(x) return F.log_softmax(x) CNN = CNN() criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(CNN.parameters(), lr=0.001, momentum=0.9) """ Training """ batch_size = 50 for Epoch in range(2): # loop over the dataset multiple times running_loss = 0.0 for i in range(N / batch_size): #for i, data in enumerate(trainloader, 0): batch = batch_size * i # get the inputs images_batch = X_train[batch:batch + batch_size] labels_batch = Y_train[batch:batch + batch_size] # wrap them in Variable images_batch, labels_batch = Variable(images_batch), Variable(labels_batch) # zero the parameter gradients optimizer.zero_grad() # forward + backward + optimize outputs = CNN(images_batch) loss = criterion(outputs, labels_batch) loss.backward() optimizer.step() # print statistics running_loss += loss.data[0] if i % 2000 == 1999: # print every 2000 mini-batches print('[%d, %5d] loss: %.3f' % (Epoch + 1, i + 1, running_loss / 2000)) running_loss = 0.0 print('Finished Training')

ここでエラーが発生しています

# wrap them in Variable images_batch, labels_batch = Variable(images_batch), Variable(labels_batch)

Wasi Ahmad · Answer

私の推測が正しい場合、おそらく次の行でエラーが発生しています。

# wrap them in Variable images_batch, labels_batch = Variable(images_batch), Variable(labels_batch)

その意味は、 images_batchおよび/またはlabels_batchはリストです。次のように、単純にそれらをnumpy配列に変換してからテンソルに変換できます。

# wrap them in Variable images_batch = torch.from_numpy(numpy.array(images_batch)) labels_batch = torch.from_numpy(numpy.array(labels_batch))

それはあなたの問題を解決するはずです。

Edit：上記のコードスニペットの実行中に次のエラーが発生した場合：

「RuntimeError：指定されたnp.ndarrayをテンソルに変換できません-無効なタイプです。サポートされているタイプはdouble、float、int64、int32、uint8のみです。」

データ型を指定することで、numpy配列を作成できます。例えば、

images_batch = torch.from_numpy(numpy.array(images_batch, dtype='int32'))

images_batchには画像のピクセル情報が含まれているため、int32。詳細については、公式ドキュメントを参照してください。