web-dev-qa-db-ja.com

Pythonで-0400タイムゾーン文字列を使用して日付を解析する方法は?

「2009/05/13 19:19:30 -0400」という形式の日付文字列があります。以前のバージョンのPythonは、末尾のタイムゾーン仕様のためにstrptimeで%z形式タグをサポートしていたようですが、2.6.xはそれを削除したようです。

この文字列をdatetimeオブジェクトに解析する正しい方法は何ですか?

72
fields

Dateutilの解析関数を使用できます。

>>> from dateutil.parser import parse
>>> d = parse('2009/05/13 19:19:30 -0400')
>>> d
datetime.datetime(2009, 5, 13, 19, 19, 30, tzinfo=tzoffset(None, -14400))

このようにして、使用できる日時オブジェクトを取得します。

回答済み のように、dateutil2.0はPython 3.0で記述されており、Python 2.x.では使用できません。Python 2.x dateutil1.5を使用する必要があります。

103
txwikinger

%zはPython 3.2+でサポートされています:

>>> from datetime import datetime
>>> datetime.strptime('2009/05/13 19:19:30 -0400', '%Y/%m/%d %H:%M:%S %z')
datetime.datetime(2009, 5, 13, 19, 19, 30,
                  tzinfo=datetime.timezone(datetime.timedelta(-1, 72000)))

以前のバージョン:

from datetime import datetime

date_str = '2009/05/13 19:19:30 -0400'
naive_date_str, _, offset_str = date_str.rpartition(' ')
naive_dt = datetime.strptime(naive_date_str, '%Y/%m/%d %H:%M:%S')
offset = int(offset_str[-4:-2])*60 + int(offset_str[-2:])
if offset_str[0] == "-":
   offset = -offset
dt = naive_dt.replace(tzinfo=FixedOffset(offset))
print(repr(dt))
# -> datetime.datetime(2009, 5, 13, 19, 19, 30, tzinfo=FixedOffset(-240))
print(dt)
# -> 2009-05-13 19:19:30-04:00

FixedOffsetは、 ドキュメントのコード例 に基づくクラスです。

from datetime import timedelta, tzinfo

class FixedOffset(tzinfo):
    """Fixed offset in minutes: `time = utc_time + utc_offset`."""
    def __init__(self, offset):
        self.__offset = timedelta(minutes=offset)
        hours, minutes = divmod(offset, 60)
        #NOTE: the last part is to remind about deprecated POSIX GMT+h timezones
        #  that have the opposite sign in the name;
        #  the corresponding numeric value is not used e.g., no minutes
        self.__name = '<%+03d%02d>%+d' % (hours, minutes, -hours)
    def utcoffset(self, dt=None):
        return self.__offset
    def tzname(self, dt=None):
        return self.__name
    def dst(self, dt=None):
        return timedelta(0)
    def __repr__(self):
        return 'FixedOffset(%d)' % (self.utcoffset().total_seconds() / 60)
39
jfs

Python 2.7以前の場合の"%z"の問題を修正します

代わりに:

datetime.strptime(t,'%Y-%m-%dT%H:%M %z')

timedeltaを使用して、次のようにタイムゾーンを説明します。

from datetime import datetime,timedelta
def dt_parse(t):
    ret = datetime.strptime(t[0:16],'%Y-%m-%dT%H:%M')
    if t[18]=='+':
        ret-=timedelta(hours=int(t[19:22]),minutes=int(t[23:]))
    Elif t[18]=='-':
        ret+=timedelta(hours=int(t[19:22]),minutes=int(t[23:]))
    return ret

日付はGMTに変換されることに注意してください。これにより、タイムゾーンを気にせずに日付の計算を行うことができます。

21
Uri Goren

Dateutilの使用に関する問題は、dateutilの書式オプションが制限されているため(dayfirstyearfirstのみ)、シリアル化と逆シリアル化の両方に同じフォーマット文字列を使用できないことです。

私のアプリケーションでは、フォーマット文字列を.INIファイルに保存します。各デプロイメントは独自のフォーマットを持つことができます。したがって、dateutilアプローチは本当に好きではありません。

代わりにpytzを使用する代替方法を次に示します。

from datetime import datetime, timedelta

from pytz import timezone, utc
from pytz.tzinfo import StaticTzInfo

class OffsetTime(StaticTzInfo):
    def __init__(self, offset):
        """A dumb timezone based on offset such as +0530, -0600, etc.
        """
        hours = int(offset[:3])
        minutes = int(offset[0] + offset[3:])
        self._utcoffset = timedelta(hours=hours, minutes=minutes)

def load_datetime(value, format):
    if format.endswith('%z'):
        format = format[:-2]
        offset = value[-5:]
        value = value[:-5]
        return OffsetTime(offset).localize(datetime.strptime(value, format))

    return datetime.strptime(value, format)

def dump_datetime(value, format):
    return value.strftime(format)

value = '2009/05/13 19:19:30 -0400'
format = '%Y/%m/%d %H:%M:%S %z'

assert dump_datetime(load_datetime(value, format), format) == value
assert datetime(2009, 5, 13, 23, 19, 30, tzinfo=utc) \
    .astimezone(timezone('US/Eastern')) == load_datetime(value, format)
7
sayap

古いPython用のライナーが1つあります。次のように、+ /-符号に応じてtimedeltaに1/-1を掛けることができます。

datetime.strptime(s[:19], '%Y-%m-%dT%H:%M:%S') + timedelta(hours=int(s[20:22]), minutes=int(s[23:])) * (-1 if s[19] == '+' else 1)
1
Eric Sellin