tensor.permute()
とtensor.view()
の違いは何ですか?
彼らは同じことをしているようです。
_In [12]: aten = torch.tensor([[1, 2, 3], [4, 5, 6]])
In [13]: aten
Out[13]:
tensor([[ 1, 2, 3],
[ 4, 5, 6]])
In [14]: aten.shape
Out[14]: torch.Size([2, 3])
_
torch.view()
は、テンソルを別の互換性のある形状に再形成します。たとえば、入力テンソルaten
の形状は_(2, 3)
_です。これは、形状のテンソル_(6, 1)
_、_(1, 6)
_などとして表示できます。
_# reshaping (or viewing) 2x3 matrix as a column vector of shape 6x1
In [15]: aten.view(6, -1)
Out[15]:
tensor([[ 1],
[ 2],
[ 3],
[ 4],
[ 5],
[ 6]])
In [16]: aten.view(6, -1).shape
Out[16]: torch.Size([6, 1])
_
または、次のように、形状を_(1, 6)
_の行ベクトルとして再形成またはviewすることもできます。
_In [19]: aten.view(-1, 6)
Out[19]: tensor([[ 1, 2, 3, 4, 5, 6]])
In [20]: aten.view(-1, 6).shape
Out[20]: torch.Size([1, 6])
_
一方、tensor.permute()
は、軸を交換するためにのみ使用されます。以下の例は物事を明確にします:
_In [39]: aten
Out[39]:
tensor([[ 1, 2, 3],
[ 4, 5, 6]])
In [40]: aten.shape
Out[40]: torch.Size([2, 3])
# swapping the axes/dimensions 0 and 1
In [41]: aten.permute(1, 0)
Out[41]:
tensor([[ 1, 4],
[ 2, 5],
[ 3, 6]])
# since we permute the axes/dims, the shape changed from (2, 3) => (3, 2)
In [42]: aten.permute(1, 0).shape
Out[42]: torch.Size([3, 2])
_
負のインデックスを使用して、次の場合と同じことを行うこともできます。
_In [45]: aten.permute(-1, 0)
Out[45]:
tensor([[ 1, 4],
[ 2, 5],
[ 3, 6]])
In [46]: aten.permute(-1, 0).shape
Out[46]: torch.Size([3, 2])
_
ビューはテンソルの表現方法を変更します。例:4つの要素を持つテンソルは4X1または2X2または1X4として表すことができますが、置換によって軸が変更されます。データの移動中は移動されますが、ビューではデータは移動されずに再解釈されます。
以下のコード例が役立ちます。 a
は2x2テンソル/行列です。ビューを使用すると、a
を列または行ベクトル(テンソル)として読み取ることができます。しかし、それを移調することはできません。転置するには、置換が必要です。転置は、軸の入れ替え/入れ替えによって実現されます。
In [7]: import torch
In [8]: a = torch.tensor([[1,2],[3,4]])
In [9]: a
Out[9]:
tensor([[ 1, 2],
[ 3, 4]])
In [11]: a.permute(1,0)
Out[11]:
tensor([[ 1, 3],
[ 2, 4]])
In [12]: a.view(4,1)
Out[12]:
tensor([[ 1],
[ 2],
[ 3],
[ 4]])
In [13]:
ボーナス:参照 https://Twitter.com/karpathy/status/1013322763790999552