web-dev-qa-db-ja.com

NumPy配列を特定の範囲内に正規化する方法は?

オーディオまたはイメージの配列で何らかの処理を行った後、ファイルに書き戻す前に、範囲内で正規化する必要があります。これは次のように実行できます。

# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()

# Normalize image to between 0 and 255
image = image/(image.max()/255.0)

これを行うためのより冗長で便利な関数の方法はありますか? matplotlib.colors.Normalize()は関連していないようです。

107
endolith
audio /= np.max(np.abs(audio),axis=0)
image *= (255.0/image.max())

/=および*=を使用すると、中間の一時配列を削除できるため、メモリを節約できます。乗算は除算よりも安価であるため、

image *= 255.0/image.max()    # Uses 1 division and image.size multiplications

よりわずかに速い

image /= image.max()/255.0    # Uses 1+image.size divisions

ここでは基本的なnumpyメソッドを使用しているため、これはnumpyで可能な限り効率的なソリューションであると思います。


インプレース操作は、コンテナ配列のdtypeを変更しません。正規化された値は浮動小数点数であるため、インプレース演算を実行する前に、audioおよびimage配列に浮動小数点のdtypeが必要です。まだ浮動小数点dtypeでない場合は、astypeを使用して変換する必要があります。例えば、

image = image.astype('float64')
118
unutbu

配列に正と負の両方のデータが含まれる場合、私は次のようにします:

import numpy as np

a = np.random.Rand(3,2)

# Normalised [0,1]
b = (a - np.min(a))/np.ptp(a)

# Normalised [0,255] as integer
c = 255*(a - np.min(a))/np.ptp(a).astype(int)

# Normalised [-1,1]
d = 2.*(a - np.min(a))/np.ptp(a)-1

また、OPの質問ではない場合でも言及する価値があります 標準化

e = (a - np.mean(a)) / np.std(a)
46
Tactopoda

sklearnを使用して再スケーリングすることもできます。利点は、データの平均中心化に加えて、標準偏差の正規化を調整できること、および軸ごと、フィーチャごと、またはレコードごとにこれを行うことができることです。

from sklearn.preprocessing import scale
X = scale( X, axis=0, with_mean=True, with_std=True, copy=True )

キーワード引数axiswith_meanwith_stdは自明であり、デフォルトの状態で表示されます。引数copyは、Falseに設定されている場合、その場で操作を実行します。ドキュメント ここ

36
cjohnson318

「i」(idiv、imul ..など)バージョンを使用できますが、見た目は悪くありません。

image /= (image.max()/255.0)

他の場合、列によってn次元配列を正規化する関数を書くことができます:

def normalize_columns(arr):
    rows, cols = arr.shape
    for col in xrange(cols):
        arr[:,col] /= abs(arr[:,col]).max()
11
u0b34a0f6ae

audioの値を-1と+1の間、およびimageの値を0〜255の間で最小-最大スケーリングしようとしています。

sklearn.preprocessing.minmax_scale を使用すると、問題を簡単に解決できます。

例えば。:

audio_scaled = minmax_scale(audio, feature_range=(-1,1))

そして

shape = image.shape
image_scaled = minmax_scale(image.ravel(), feature_range=(0,255)).reshape(shape)

note:ベクトルの norm (length)を特定の値(通常)にスケーリングする操作と混同しないでください1)、これは一般に正規化とも呼ばれます。

4
yellow01

簡単な解決策は、sklearn.preprocessingライブラリが提供するスケーラーを使用することです。

scaler = sk.MinMaxScaler(feature_range=(0, 250))
scaler = scaler.fit(X)
X_scaled = scaler.transform(X)
# Checking reconstruction
X_rec = scaler.inverse_transform(X_scaled)

エラーX_rec-Xはゼロになります。必要に応じてfeature_rangeを調整するか、標準のスケーラーsk.StandardScaler()を使用することもできます。

4
Pantelis

this を試したところ、エラーが発生しました

TypeError: ufunc 'true_divide' output (typecode 'd') could not be coerced to provided output parameter (typecode 'l') according to the casting rule ''same_kind''

正規化しようとしていたnumpy配列はinteger配列でした。バージョン> 1.10では型キャストが非推奨になっているようで、それを解決するにはnumpy.true_divide()を使用する必要があります。

arr = np.array(img)
arr = np.true_divide(arr,[255.0],out=None)

imgPIL.Imageオブジェクトでした。

2
SpoiledBrat