web-dev-qa-db-ja.com

numpy配列を2次元で拡張する最も簡単な方法は何ですか?

次のような2D配列があります。

XX
xx

余分な行と列を追加する最も効率的な方法は何ですか:

xxy
xxy
yyy

ボーナスポイントについては、単一の行と列をノックアウトできるようにしたいので、たとえば以下のマトリックスでは、aのすべてをノックアウトしてxだけを残したい-具体的にはn番目の行とn番目の列を同時に削除しようとしています-これをできるだけ早くできるようにしたいです:

xxaxx
xxaxx
aaaaa
xxaxx
xxaxx
44
Salim Fadhley

私が考えることができるコードの行の面で最短は、最初の質問です。

>>> import numpy as np
>>> p = np.array([[1,2],[3,4]])

>>> p = np.append(p, [[5,6]], 0)
>>> p = np.append(p, [[7],[8],[9]],1)

>>> p
array([[1, 2, 7],
   [3, 4, 8],
   [5, 6, 9]])

そして2番目の質問

    p = np.array(range(20))
>>> p.shape = (4,5)
>>> p
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])
>>> n = 2
>>> p = np.append(p[:n],p[n+1:],0)
>>> p = np.append(p[...,:n],p[...,n+1:],1)
>>> p
array([[ 0,  1,  3,  4],
       [ 5,  6,  8,  9],
       [15, 16, 18, 19]])
51
tomeedee

からの例を使用して、最初の質問に対する有用な代替答え tomeedeeの答え、numpyを使用することになります vstack and column_stack メソッド:

行列pが与えられると、

>>> import numpy as np
>>> p = np.array([ [1,2] , [3,4] ])

拡張マトリックスは次の方法で生成できます。

>>> p = np.vstack( [ p , [5 , 6] ] )
>>> p = np.column_stack( [ p , [ 7 , 8 , 9 ] ] )
>>> p
array([[1, 2, 7],
       [3, 4, 8],
       [5, 6, 9]])

これらのメソッドは、次のシナリオとは対照的に、1D配列を変更せずにマトリックスに追加できるため、np.append()よりも実際には便利です。

>>> p = np.array([ [ 1 , 2 ] , [ 3 , 4 ] , [ 5 , 6 ] ] )
>>> p = np.append( p , [ 7 , 8 , 9 ] , 1 )
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.6/dist-packages/numpy/lib/function_base.py", line 3234, in append
    return concatenate((arr, values), axis=axis)
ValueError: arrays must have same number of dimensions

2番目の質問に対する答えとして、行と列を削除する良い方法は、次のように論理配列のインデックスを使用することです:

行列pが与えられると、

>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )

行1と列2を削除するとします。

>>> r , c = 1 , 2
>>> p = p [ np.arange( p.shape[0] ) != r , : ] 
>>> p = p [ : , np.arange( p.shape[1] ) != c ]
>>> p
array([[ 0,  1,  3,  4],
       [10, 11, 13, 14],
       [15, 16, 18, 19]])

注-改良されたMatlabユーザーの場合-ワンライナーでこれらを実行する場合は、2回インデックスを作成する必要があります。

>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )    
>>> p = p [ np.arange( p.shape[0] ) != r , : ] [ : , np.arange( p.shape[1] ) != c ]

この手法は、行と列のsetsを削除するように拡張することもできます。したがって、行0と2および列1、2と3を削除する場合は、 numpyのsetdiff1d関数を使用して、目的の論理インデックスを生成できます。

>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )
>>> r = [ 0 , 2 ]
>>> c = [ 1 , 2 , 3 ]
>>> p = p [ np.setdiff1d( np.arange( p.shape[0] ), r ) , : ] 
>>> p = p [ : , np.setdiff1d( np.arange( p.shape[1] ) , c ) ]
>>> p
array([[ 5,  9],
       [15, 19]])
35
rroowwllaanndd

最初の質問の別のエレガントなソリューションは、insertコマンドかもしれません:

p = np.array([[1,2],[3,4]])
p = np.insert(p, 2, values=0, axis=1) # insert values before column 2

につながる:

array([[1, 2, 0],
       [3, 4, 0]])

insertappendよりも遅いかもしれませんが、行/列全体を1つの値で簡単に埋めることができます。

2番目の質問に関しては、以前にdeleteが提案されています:

p = np.delete(p, 2, axis=1)

元のアレイを再び復元します:

array([[1, 2],
       [3, 4]])
7
Björn

大きなマトリックスに割り当てることで、「拡張」するのがはるかに簡単になりました。例えば。

import numpy as np
p = np.array([[1,2], [3,4]])
g = np.array(range(20))
g.shape = (4,5)
g[0:2, 0:2] = p

配列は次のとおりです。

p

   array([[1, 2],
       [3, 4]])

g

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

割り当て後のgの結果:

   array([[ 1,  2,  2,  3,  4],
       [ 3,  4,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])
4
ubershmekel

最初の質問への回答:

Numpy.appendを使用します。

http://docs.scipy.org/doc/numpy/reference/generated/numpy.append.html#numpy.append

2番目の質問への回答:

Numpy.deleteを使用する

http://docs.scipy.org/doc/numpy/reference/generated/numpy.delete.html

次を使用できます。

>>> np.concatenate([array1, array2, ...]) 

例えば.

>>> import numpy as np
>>> a = [[1, 2, 3],[10, 20, 30]]
>>> b = [[100,200,300]]
>>> a = np.array(a) # not necessary, but numpy objects prefered to built-in
>>> b = np.array(b) # "^
>>> a
array([[ 1,  2,  3],
       [10, 20, 30]])
>>> b
array([[100, 200, 300]])
>>> c = np.concatenate([a,b])
>>> c
array([[  1,   2,   3],
       [ 10,  20,  30],
       [100, 200, 300]])
>>> print c
[[  1   2   3]
 [ 10  20  30]
 [100 200 300]]

〜-+-〜-+-〜-+-〜

Numpy配列オブジェクトがそのshapeプロパティの不完全な値で初期化されると、問題が発生する場合があります。この問題は、形状プロパティにTuple:(array_length、element_length)を割り当てることで修正されます。

注:ここで、「array_length」と「element_length」は整数パラメーターであり、これらを値に置き換えます。 「タプル」は、括弧で囲まれた数字のペアです。

例えば.

>>> import numpy as np
>>> a = np.array([[1,2,3],[10,20,30]])
>>> b = np.array([100,200,300]) # initialize b with incorrect dimensions
>>> a.shape
(2, 3)
>>> b.shape
(3,)
>>> c = np.concatenate([a,b])

Traceback (most recent call last):
  File "<pyshell#191>", line 1, in <module>
    c = np.concatenate([a,b])
ValueError: all the input arrays must have same number of dimensions
>>> b.shape = (1,3)
>>> c = np.concatenate([a,b])
>>> c
array([[  1,   2,   3],
       [ 10,  20,  30],
       [100, 200, 300]])
2
Jason

多分これが必要です。

>>> x = np.array([11,22])
>>> y = np.array([18,7,6])
>>> z = np.array([1,3,5])
>>> np.concatenate((x,y,z))
array([11, 22, 18,  7,  6,  1,  3,  5])
0
fandyst