これが以前に尋ねられた場合はお詫びしますが、私は結果なしで広範囲を調べました。
import pandas as pd
import numpy as np
df = pd.DataFrame(data = np.random.randint(1,10,10),columns=['a'])
a
0 7
1 8
2 8
3 3
4 1
5 1
6 2
7 8
8 6
9 6
いくつかのルールに従ってb
のいくつかの値をマップする新しい列a
を作成します。たとえば、a = [1,2,3]は1、a = [4,5 、6,7]は2、a = [8,9,10]は3です。1対1のマッピングは明らかですが、値のリストまたは範囲でマッピングしたい場合はどうなりますか?
私はこれらの線に沿って教えました...
df['b'] = df['a'].map({[1,2,3]:1,range(4,7):2,[8,9,10]:3})
いくつかの選択肢があります。
pd.cut
_経由のパンダ/ _np.digitize
_経由のNumPy境界のリストを作成してから、専門のライブラリ関数を使用できます。これは @ EdChum's solution と this answer でも説明されています。
np.select
_によるNumPy_df = pd.DataFrame(data=np.random.randint(1,10,10), columns=['a'])
criteria = [df['a'].between(1, 3), df['a'].between(4, 7), df['a'].between(8, 10)]
values = [1, 2, 3]
df['b'] = np.select(criteria, values, 0)
_
criteria
の要素はブール系列なので、値のlistsの場合は、df['a'].isin([1, 3])
などを使用できます。
range
による辞書マッピング_d = {range(1, 4): 1, range(4, 8): 2, range(8, 11): 3}
df['c'] = df['a'].apply(lambda x: next((v for k, v in d.items() if x in k), 0))
print(df)
a b c
0 1 1 1
1 7 2 2
2 5 2 2
3 1 1 1
4 3 1 1
5 5 2 2
6 4 2 2
7 4 2 2
8 9 3 3
9 3 1 1
_
IIUCあなたは cut
を使用してこれを達成できます:
In[33]:
pd.cut(df['a'], bins=[0,3,7,11], right=True, labels=False)+1
Out[33]:
0 2
1 3
2 3
3 1
4 1
5 1
6 1
7 3
8 2
9 2
ここでは、カットオフ値をcut
に渡します。これにより、labels=False
を渡すことで値が分類され、序数値(ゼロベース)が与えられるため、+1
彼らへ
ここで、カットがどのように計算されたかを確認できます。
In[34]:
pd.cut(df['a'], bins=[0,3,7,11], right=True)
Out[34]:
0 (3, 7]
1 (7, 11]
2 (7, 11]
3 (0, 3]
4 (0, 3]
5 (0, 3]
6 (0, 3]
7 (7, 11]
8 (3, 7]
9 (3, 7]
Name: a, dtype: category
Categories (3, interval[int64]): [(0, 3] < (3, 7] < (7, 11]]