次の形式の日付に一致させたい:
2010-08-27、2010/08/27
現在、私は実際に実行可能な日付にあまりこだわっていませんが、正しい形式になっているというだけです。
そのための正規表現を教えてください。
ありがとう
datetime
モジュールを使用して日付を解析できます:
import datetime
print datetime.datetime.strptime('2010-08-27', '%Y-%m-%d')
print datetime.datetime.strptime('2010-15-27', '%Y-%m-%d')
出力:
2010-08-27 00:00:00
Traceback (most recent call last):
File "./x.py", line 6, in <module>
print datetime.datetime.strptime('2010-15-27', '%Y-%m-%d')
File "/usr/lib/python2.7/_strptime.py", line 325, in _strptime
(data_string, format))
ValueError: time data '2010-15-27' does not match format '%Y-%m-%d'
したがって、ValueError
をキャッチすると、日付が一致するかどうかがわかります。
def valid_date(datestring):
try:
datetime.datetime.strptime(datestring, '%Y-%m-%d')
return True
except ValueError:
return False
さまざまな形式に対応するには、すべての可能性をテストするか、re
を使用して最初にフィールドを解析します。
import datetime
import re
def valid_date(datestring):
try:
mat=re.match('(\d{2})[/.-](\d{2})[/.-](\d{4})$', datestring)
if mat is not None:
datetime.datetime(*(map(int, mat.groups()[-1::-1])))
return True
except ValueError:
pass
return False
次のコードを使用できます。
import re
# regular expression to match dates in format: 2010-08-27 and 2010/08/27
# date_reg_exp = re.compile('(\d+[-/]\d+[-/]\d+)')
以下の更新された正規表現:
# regular expression to match dates in format: 2010-08-27 and 2010/08/27
# and with mixed separators 2010/08-27
# date_reg_exp = re.compile('\d{4}[-/]\d{2}[-/]\d{2}')
# if separators should not be mixed use backreference:
date_reg_exp = re.compile('\d{4}(?P<sep>[-/])\d{2}(?P=sep)\d{2}')
# a string to test the regular expression above
test_str= """
fsf2010/08/27sdfsdfsd
dsf sfds f2010/08/26 fsdf
asdsds 2009-02-02 afdf
"""
# finds all the matches of the regular expression and
# returns a list containing them
matches_list=date_reg_exp.findall(test_str)
# iterates the matching list and prints all the matches
for match in matches_list:
print match
datetime
モジュールを使用します。あなたがそれを使うべきではありませんが、これは知識のための正規表現です:
r'\d{4}[-/]\d{2}[-/]\d{2}'
dateutilパッケージには、非常にスマートな日付パーサーがあります。幅広い日付形式を解析します。 http://pypi.python.org/pypi/python-dateutil