pandasデータフレーム 'df'と2つの列 'A'と 'B'があり、2つの引数を持つ関数があります
def myfunction(B, A):
# do something here to get the result
return result
'apply'関数を使用して行ごとにdfに適用したいと思います
df['C'] = df['B'].apply(myfunction, args=(df['A'],))
しかし、私はエラーが発生します
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
ここで何が起こっているのか、シリーズ全体としてdf ['A']が必要なようです!必要に応じて、そのシリーズの行エントリだけではありません。
私はあなたが必要だと思います:
import pandas as pd
df = pd.DataFrame({'A':[1,2,3],
'B':[4,5,6]})
print (df)
A B
0 1 4
1 2 5
2 3 6
def myfunction(B, A):
#some staff
result = B + A
# do something here to get the result
return result
df['C'] = df.apply(lambda x: myfunction(x.B, x.A), axis=1)
print (df)
A B C
0 1 4 5
1 2 5 7
2 3 6 9
または:
def myfunction(x):
result = x.B + x.A
# do something here to get the result
return result
df['C'] = df.apply(myfunction, axis=1)
print (df)
A B C
0 1 4 5
1 2 5 7
2 3 6 9