"2009-05-28T16:15:00"のような形式の日時文字列を取得しています(これはISO 8601です、と私は思います)。 1つのハックなオプションは、time.strptime
を使用して文字列を解析し、Tupleの最初の6つの要素をdatetimeコンストラクタに渡すことです。
datetime.datetime(*time.strptime("2007-03-04T21:08:12", "%Y-%m-%dT%H:%M:%S")[:6])
これを行うための「よりクリーンな」方法を見つけることができませんでした。ありますか?
私は dateutil ライブラリをタイムゾーンの扱いと一般的にしっかりした日付解析に使うことを好みます。 2010-05-08T23:41:54.000ZのようなISO 8601文字列を取得する場合は、特にタイムゾーンが含まれているかどうかがわからない場合は、strptimeを使用してそれを解析する楽しい時間を過ごすことができます。 pyiso8601には、使用中に発生した問題がいくつかあり(トラッカーを確認してください)、数年後には更新されていません。それとは対照的に、dateutilは積極的に活動してきました。
import dateutil.parser
yourdate = dateutil.parser.parse(datestring)
Python 3では、外部ライブラリはありません。
datetime.datetime.strptime('2019-01-04T16:41:24+0200', "%Y-%m-%dT%H:%M:%S%z")
Python 2は%z
フォーマット指定子をサポートしていないので、可能であればどこでもZulu時間を明示的に使うことが最善です:
datetime.datetime.strptime("2007-03-04T21:08:12Z", "%Y-%m-%dT%H:%M:%SZ")
ISO 8601では、さまざまなオプションのコロンとダッシュのバリエーションが許可されているため、基本的にはCCYY-MM-DDThh:mm:ss[Z|(+|-)hh:mm]
です。もしあなたがstrptimeを使いたいのなら、あなたは最初にそれらのバリエーションを取り除く必要があります。
目標はUTC日時オブジェクトを生成することです
あなたがちょうど2016-06-29T19:36:29.3453Z
のようなZ接尾辞でUTCのために働く基本的なケースが欲しいならば:
datetime.datetime.strptime(timestamp.translate(None, ':-'), "%Y%m%dT%H%M%S.%fZ")
2016-06-29T19:36:29.3453-0400
や2008-09-03T20:56:35.450686+05:00
のようなタイムゾーンオフセットを処理したい場合は、以下を使用してください。これらはすべてのバリエーションを20080903T205635.450686+0500
のような変数区切り文字のない何かに変換し、より一貫性のある/解析しやすいものにします。
import re
# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)
datetime.datetime.strptime(conformed_timestamp, "%Y%m%dT%H%M%S.%f%z" )
あなたのシステムが%z
strptimeディレクティブをサポートしていない場合(あなたはValueError: 'z' is a bad directive in format '%Y%m%dT%H%M%S.%f%z'
のようなものを見ます)、手動でZ
(UTC)から時間をオフセットする必要があります。注意%z
は、バージョン3未満のPythonではシステム上で動作しないかもしれません。これは、システム/ Pythonビルドタイプによって異なるCライブラリサポートに依存しているからです(つまり、 Jython 、 Cython など)。
import re
import datetime
# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)
# Split on the offset to remove it. Use a capture group to keep the delimiter
split_timestamp = re.split(r"[+|-]",conformed_timestamp)
main_timestamp = split_timestamp[0]
if len(split_timestamp) == 3:
sign = split_timestamp[1]
offset = split_timestamp[2]
else:
sign = None
offset = None
# Generate the datetime object without the offset at UTC time
output_datetime = datetime.datetime.strptime(main_timestamp +"Z", "%Y%m%dT%H%M%S.%fZ" )
if offset:
# Create timedelta based on offset
offset_delta = datetime.timedelta(hours=int(sign+offset[:-2]), minutes=int(sign+offset[-2:]))
# Offset datetime with timedelta
output_datetime = output_datetime + offset_delta
Tzを意識しないdatetimeとtzを意識しないdatetimeを比較するときに問題に遭遇するかもしれないので、あなたはタイムゾーン情報に注意を払うべきです。
UTCとしてだけでも、常にtz対応にするのが最善の方法です。
#-----------------------------------------------
import datetime
import pytz
import dateutil.parser
#-----------------------------------------------
utc = pytz.utc
BERLIN = pytz.timezone('Europe/Berlin')
#-----------------------------------------------
def to_iso8601(when=None, tz=BERLIN):
if not when:
when = datetime.datetime.now(tz)
if not when.tzinfo:
when = tz.localize(when)
_when = when.strftime("%Y-%m-%dT%H:%M:%S.%f%z")
return _when[:-8] + _when[-5:] # Remove microseconds
#-----------------------------------------------
def from_iso8601(when=None, tz=BERLIN):
_when = dateutil.parser.parse(when)
if not _when.tzinfo:
_when = tz.localize(_when)
return _when
#-----------------------------------------------
まだ試していませんが、 pyiso8601 はこれをサポートすると約束しています。
import datetime, time
def convert_enddate_to_seconds(self, ts):
"""Takes ISO 8601 format(string) and converts into Epoch time."""
dt = datetime.datetime.strptime(ts[:-7],'%Y-%m-%dT%H:%M:%S.%f')+\
datetime.timedelta(hours=int(ts[-5:-3]),
minutes=int(ts[-2:]))*int(ts[-6:-5]+'1')
seconds = time.mktime(dt.timetuple()) + dt.microsecond/1000000.0
return seconds
これにはミリ秒とタイムゾーンも含まれます。
時間が「2012-09-30T15:31:50.262-08:00」の場合、これはエポック時間に変換されます。
>>> import datetime, time
>>> ts = '2012-09-30T15:31:50.262-08:00'
>>> dt = datetime.datetime.strptime(ts[:-7],'%Y-%m-%dT%H:%M:%S.%f')+ datetime.timedelta(hours=int(ts[-5:-3]), minutes=int(ts[-2:]))*int(ts[-6:-5]+'1')
>>> seconds = time.mktime(dt.timetuple()) + dt.microsecond/1000000.0
>>> seconds
1348990310.26
両方:
ISO時間への移行:
isoTime = time.strftime('%Y-%m-%dT%H:%M:%SZ', time.gmtime(epochTime))
エポックまでのISOの時間:
epochTime = time.mktime(time.strptime(isoTime, '%Y-%m-%dT%H:%M:%SZ'))
Isodate が最も完全にサポートされているようです。
aniso 8601 がこれを処理します。また、Python 2とPython 3のタイムゾーンについても理解しています。そして、必要に応じて、 ISO 8601 の残りの部分についても妥当な範囲をカバーしています。
import aniso8601
aniso8601.parse_datetime('2007-03-04T21:08:12')