私はこれを持っています:
dates = soup.findAll("div", {"id" : "date"})
ただし、id
はdate_1
、date_2
などになる可能性があるため、idをワイルドカード検索にする必要があります。
呼び出し可能オブジェクトをフィルターとして提供できます。
_dates = soup.findAll("div", {"id" : lambda L: L and L.startswith('date')})
_
または@DSMが指摘するように
_dates = soup.findAll("div", {"id" : re.compile('date.*')})
_
beautifulSoupはRegExpオブジェクトを認識し、その.match()
メソッドを呼び出します。