Python Pandasインデックスがxより大きい場所でインデックスを選択

Question

インデックスとしての日付といくつかの値を含むDataFrame dfがあるとします。日付が値xより大きい行を選択するにはどうすればよいですか？

インデックスを列に変換してから、select df[df['date']>x]、しかしそれはインデックスで操作を行うよりも遅いですか？

Datageek · Accepted Answer

インデックスを使用してDataFrameから選択する例：

from numpy.random import randn from pandas import DataFrame from datetime import timedelta as td import dateutil.parser d = dateutil.parser.parse("2014-01-01") df = DataFrame(randn(6,2), columns=list('AB'), index=[d + td(days=x) for x in range(1,7)]) In [1]: df Out[1]: A B 2014-01-02 -1.172285 1.706200 2014-01-03 0.039511 -0.320798 2014-01-04 -0.192179 -0.539397 2014-01-05 -0.475917 -0.280055 2014-01-06 0.163376 1.124602 2014-01-07 -2.477812 0.656750 In [2]: df[df.index > dateutil.parser.parse("2014-01-04")] Out[2]: A B 2014-01-05 -0.475917 -0.280055 2014-01-06 0.163376 1.124602 2014-01-07 -2.477812 0.656750

ntg · Answer

既存の答えは正しいですが、インデックスに基づいて選択している場合、ここからの2番目の方法の方が高速です。

# Set index df = df.set_index(df['date']) # Select observations between two datetimes df.loc[pd.TimeStamp('2002-1-1 01:00:00'):pd.TimeStamp('2002-1-1 04:00:00')]