Pythonで多次元配列から列を抽出する方法を知っている人はいますか?
>>> import numpy as np
>>> A = np.array([[1,2,3,4],[5,6,7,8]])
>>> A
array([[1, 2, 3, 4],
[5, 6, 7, 8]])
>>> A[:,2] # returns the third columm
array([3, 7])
メモリを割り当てるための "numpy.arange"と "reshape"も参照してください。
例:(行列(3×4)を整形して配列を割り当てる)
nrows = 3
ncols = 4
my_array = numpy.arange(nrows*ncols, dtype='double')
my_array = my_array.reshape(nrows, ncols)
あなたは NumPy配列 を使っているのでしょうか? Pythonには 配列 モジュールがありますが、それは多次元配列をサポートしません。通常のPythonのリストも一次元です。
しかしながら、あなたがこのような単純な二次元のリストを持っているならば:
A = [[1,2,3,4],
[5,6,7,8]]
それからあなたはこのようなカラムを抽出することができます:
def column(matrix, i):
return [row[i] for row in matrix]
2列目(インデックス1)を抽出します。
>>> column(A, 1)
[2, 6]
あるいは、単に:
>>> [row[1] for row in A]
[2, 6]
次のような配列があるなら
a = [[1, 2], [2, 3], [3, 4]]
次に、そのような最初の列を抽出します。
[row[0] for row in a]
結果は次のようになります。
[1, 2, 3]
見てみな!
a = [[1, 2], [2, 3], [3, 4]]
a2 = Zip(*a)
a2[0]
zipがうまくいくが引数として単一の配列を必要とする、* aという構文は多次元配列を単一の配列引数に展開するという点を除けば、上記と同じことです。
def get_col(arr, col):
return map(lambda x : x[col], arr)
a = [[1,2,3,4], [5,6,7,8], [9,10,11,12],[13,14,15,16]]
print get_col(a, 3)
pythonのmap関数はもうひとつの方法です。
ちょっとしたバラエティのために、リスト内包表記ではなくmap-reduceスタイルのpythonが好きなら、itemgetter演算子も役立ちます。
# tested in 2.4
from operator import itemgetter
def column(matrix,i):
f = itemgetter(i)
return map(f,matrix)
M = [range(x,x+5) for x in range(10)]
assert column(M,1) == range(1,11)
これを使うこともできます。
values = np.array([[1,2,3],[4,5,6]])
values[...,0] # first column
#[1,4]
注:これは組み込み配列では機能せず、位置合わせもされません(例:np.array([[1,2,3]、[4,5,6,7]]))。
[matrix[i][column] for i in range(len(matrix))]
5行4列のn X m
行列(n
行とm
列)があるとしましょう。
matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]]
Pythonで列を抽出するために、リスト内包表記を使うことができます。
[ [row[i] for row in matrix] for in range(4) ]
あなたの行列が持っている何列でも4を置き換えることができます。結果は
[ [1,5,9,13,17],[2,10,14,18],[3,7,11,15,19],[4,8,12,16,20] ]
下の配列のような配列から列を抽出したいと思います
import numpy as np
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
フォーマットの3列目を取得したい場合は
D=array[[3],
[7],
[11]]
それからあなたは最初に配列を行列にする必要があります
B=np.asmatrix(A)
C=B[:,2]
D=asarray(C)
そして今、あなたはExcelでするのと同じように要素ごとの計算をすることができます。
>>> x = arange(20).reshape(4,5)
>>> x array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
2列目が必要な場合は使用できます
>>> x[:, 1]
array([ 1, 6, 11, 16])
行列を使うもう一つの方法
>>> from numpy import matrix
>>> a = [ [1,2,3],[4,5,6],[7,8,9] ]
>>> matrix(a).transpose()[1].getA()[0]
array([2, 5, 8])
>>> matrix(a).transpose()[0].getA()[0]
array([1, 4, 7])
ちょっと遅れて….
パフォーマンスが重要でデータが長方形の場合は、1次元で格納して通常のスライスで列にアクセスすることもできます。 ...
A = [[1,2,3,4],[5,6,7,8]] #< assume this 4x2-matrix
B = reduce( operator.add, A ) #< get it one-dimensional
def column1d( matrix, dimX, colIdx ):
return matrix[colIdx::dimX]
def row1d( matrix, dimX, rowIdx ):
return matrix[rowIdx:rowIdx+dimX]
>>> column1d( B, 4, 1 )
[2, 6]
>>> row1d( B, 4, 1 )
[2, 3, 4, 5]
きちんとしたことはこれが本当に速いということです。 ただし、では、負のインデックスは機能しません。そのため、インデックス-1では最後の列または行にアクセスできません。
負の索引付けが必要な場合は、アクセサ関数を少し調整することができます。
def column1d( matrix, dimX, colIdx ):
return matrix[colIdx % dimX::dimX]
def row1d( matrix, dimX, dimY, rowIdx ):
rowIdx = (rowIdx % dimY) * dimX
return matrix[rowIdx:rowIdx+dimX]
私は次のヒントを好む:matrix_a
という名前の行列を持ち、column_number
を使う、例えば:
import numpy as np
matrix_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
column_number=2
# you can get the row from transposed matrix - it will be a column:
col=matrix_a.transpose()[column_number]
入れ子リストの入れ替えにZip(*iterable)
を使用しているにもかかわらず、入れ子リストの長さが異なる場合は、以下を使用することもできます。
map(None, *[(1,2,3,), (4,5,), (6,)])
結果は次のとおりです。
[(1, 4, 6), (2, 5, None), (3, None, None)]
したがって、最初の列は次のとおりです。
map(None, *[(1,2,3,), (4,5,), (6,)])[0]
#>(1, 4, 6)
行列から新しいリストへのすべての列:
N = len(matrix)
column_list = [ [matrix[row][column] for row in range(N)] for column in range(N) ]
複数の列を取得したい場合は、単にsliceを使用してください。
a = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
print(a[:, [1, 2]])
[[2 3]
[5 6]
[8 9]]