web-dev-qa-db-ja.com

python正規表現を使用して日付を一致させる

次の形式の日付に一致させたい:

2010-08-27、2010/08/27

現在、私は実際に実行可能な日付にあまりこだわっていませんが、正しい形式になっているというだけです。

そのための正規表現を教えてください。

ありがとう

14
user1308308

datetimeモジュールを使用して日付を解析できます:

import datetime

print datetime.datetime.strptime('2010-08-27', '%Y-%m-%d')
print datetime.datetime.strptime('2010-15-27', '%Y-%m-%d')

出力:

2010-08-27 00:00:00
Traceback (most recent call last):
  File "./x.py", line 6, in <module>
    print datetime.datetime.strptime('2010-15-27', '%Y-%m-%d')
  File "/usr/lib/python2.7/_strptime.py", line 325, in _strptime
    (data_string, format))
ValueError: time data '2010-15-27' does not match format '%Y-%m-%d'

したがって、ValueErrorをキャッチすると、日付が一致するかどうかがわかります。

def valid_date(datestring):
    try:
        datetime.datetime.strptime(datestring, '%Y-%m-%d')
        return True
    except ValueError:
        return False

さまざまな形式に対応するには、すべての可能性をテストするか、reを使用して最初にフィールドを解析します。

import datetime
import re

def valid_date(datestring):
        try:
                mat=re.match('(\d{2})[/.-](\d{2})[/.-](\d{4})$', datestring)
                if mat is not None:
                        datetime.datetime(*(map(int, mat.groups()[-1::-1])))
                        return True
        except ValueError:
                pass
        return False
23
hochl

次のコードを使用できます。

import re

# regular expression to match dates in format: 2010-08-27 and 2010/08/27 
# date_reg_exp = re.compile('(\d+[-/]\d+[-/]\d+)')

以下の更新された正規表現:

# regular expression to match dates in format: 2010-08-27 and 2010/08/27
# and with mixed separators 2010/08-27
# date_reg_exp = re.compile('\d{4}[-/]\d{2}[-/]\d{2}')

# if separators should not be mixed use backreference:
date_reg_exp = re.compile('\d{4}(?P<sep>[-/])\d{2}(?P=sep)\d{2}')

# a string to test the regular expression above
test_str= """
     fsf2010/08/27sdfsdfsd
     dsf sfds f2010/08/26 fsdf 
     asdsds 2009-02-02 afdf
     """
# finds all the matches of the regular expression and
# returns a list containing them
matches_list=date_reg_exp.findall(test_str)

# iterates the matching list and prints all the matches
for match in matches_list:
  print match
12
Thanasis Petsas

datetimeモジュールを使用します。あなたがそれを使うべきではありませんが、これは知識のための正規表現です:

r'\d{4}[-/]\d{2}[-/]\d{2}'
4
jamylak

dateutilパッケージには、非常にスマートな日付パーサーがあります。幅広い日付形式を解析します。 http://pypi.python.org/pypi/python-dateutil

2
Maksym Polshcha