Pythonで解析する方法がわからない日付時刻文字列があります。
文字列は次のとおりです。
Tue May 08 15:14:45 +0800 2012
私は試した
datetime.strptime("Tue May 08 15:14:45 +0800 2012","%a %b %d %H:%M:%S %z %Y")
しかしPython raises
'z' is a bad directive in format '%a %b %d %H:%M:%S %z %Y'
Python doc:
+ HHMMまたは-HHMMの形式の%z UTCオフセット(オブジェクトが単純な場合は空の文字列)。
この時間文字列を解析する正しい形式は何ですか?
datetime.datetime.strptime
はタイムゾーンの解析に問題があります。 dateutil
package をご覧ください。
>>> from dateutil import parser
>>> parser.parse("Tue May 08 15:14:45 +0800 2012")
datetime.datetime(2012, 5, 8, 15, 14, 45, tzinfo=tzoffset(None, 28800))
あなたの最善の策は、 strptime()
を見ることです。
の線に沿って何か
>>> from datetime import datetime
>>> date_str = 'Tue May 08 15:14:45 +0800 2012'
>>> date = datetime.strptime(date_str, '%a %B %d %H:%M:%S +0800 %Y')
>>> date
datetime.datetime(2012, 5, 8, 15, 14, 45)
残念ながら+0800のタイムゾーンをどうやってやるかわからないのですが、誰か他の人がそれを手伝ってくれるかもしれません。
フォーマット文字列は http://docs.python.org/library/time.html#time.strftime にあり、印刷用の文字列のフォーマットと同じです。
役立つことを願っています
マーク
PS、pypiからpytzをインストールする際のタイムゾーンに対する最善の策。 ( http://pytz.sourceforge.net/ )実際、正しく覚えていれば、pytzには優れた日時解析方法があると思います。標準ライブラリは、タイムゾーン機能を備えた地上では少し薄くなっています。
入力時間文字列の可変utcオフセットをサポートするstdlibソリューションは次のとおりです。
>>> from email.utils import parsedate_tz, mktime_tz
>>> from datetime import datetime, timedelta
>>> timestamp = mktime_tz(parsedate_tz('Tue May 08 15:14:45 +0800 2012'))
>>> utc_time = datetime(1970, 1, 1) + timedelta(seconds=timestamp)
>>> utc_time
datetime.datetime(2012, 5, 8, 7, 14, 45)
SOで何度も議論しています。要するに、プラットフォームがサポートしていないため、「%z」はサポートされていません。私の解決策は新しいものです。タイムゾーンをスキップするだけです。
datetime.datetime.strptime(re.sub(r"[+-]([0-9])+", "", "Tue May 08 15:14:45 +0800 2012"),"%a %b %d %H:%M:%S %Y")
In [117]: datetime.datetime.strptime?
Type: builtin_function_or_method
Base Class: <type 'builtin_function_or_method'>
String Form: <built-in method strptime of type object at 0x9a2520>
Namespace: Interactive
Docstring:
string, format -> new datetime parsed from a string (like time.strptime()).