UNIXの時間と価格のデータフレームがあります。インデックス列を変換して、人間が読める日付で表示するようにします。
たとえば、インデックス列に1349633705
としてdate
がありますが、10/07/2012
(または少なくとも10/07/2012 18:15
)として表示したいです。
いくつかのコンテキストについて、ここで私が作業しているコードと私がすでに試したものがあります:
import json
import urllib2
from datetime import datetime
response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json')
data = json.load(response)
df = DataFrame(data['values'])
df.columns = ["date","price"]
#convert dates
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.index = df.date
ご覧のとおり、ここではdf.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
を使用していますが、文字列ではなく整数を使用しているため機能しません。 datetime.date.fromtimestamp
を使用する必要があると思いますが、これをdf.date
全体に適用する方法がよくわかりません。
ありがとう。
これらはエポックからの秒数のようです。
In [20]: df = DataFrame(data['values'])
In [21]: df.columns = ["date","price"]
In [22]: df
Out[22]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 358 entries, 0 to 357
Data columns (total 2 columns):
date 358 non-null values
price 358 non-null values
dtypes: float64(1), int64(1)
In [23]: df.head()
Out[23]:
date price
0 1349720105 12.08
1 1349806505 12.35
2 1349892905 12.15
3 1349979305 12.19
4 1350065705 12.15
In [25]: df['date'] = pd.to_datetime(df['date'],unit='s')
In [26]: df.head()
Out[26]:
date price
0 2012-10-08 18:15:05 12.08
1 2012-10-09 18:15:05 12.35
2 2012-10-10 18:15:05 12.15
3 2012-10-11 18:15:05 12.19
4 2012-10-12 18:15:05 12.15
In [27]: df.dtypes
Out[27]:
date datetime64[ns]
price float64
dtype: object
使用してみた場合:
df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],***unit='s'***))
エラーを受け取ります:
「pandas.tslib.OutOfBoundsDatetime:ユニット「s」で入力を変換できません」
これは、DATE_FIELD
が秒単位で指定されていないことを意味します。
私の場合、ミリ秒でした-Epoch time
。
変換は以下を使用して機能しました:
df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],unit='ms'))
pandas as pd
とdf
をインポートしたと仮定すると、データフレーム
pd.to_datetime(df['date'], unit='s')
私のために働く。
または、上記のコードの行を変更することにより:
# df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.date = df.date.apply(lambda d: datetime.datetime.fromtimestamp(int(d)).strftime('%Y-%m-%d'))
それも動作するはずです。