IMAP4サーバーからメッセージ全体を取得したいのですが。 python docsで、機能するコードのこのビットが見つかった場合:
>>> t, data = M.fetch('1', '(RFC822)')
>>> body = data[0][1]
Data [0] [1]がメッセージの本文を返すことを常に信頼できるかどうか疑問に思っています。 「RFC822.SIZE」を実行すると、タプルの代わりに文字列しか取得できません。
Rfc1730をざっと目を通しましたが、「RFC822」の適切な応答構造を理解できませんでした。また、imaplibのドキュメントからフェッチ結果の構造を判別することも困難です。
RFC822
をフェッチすると、次のようになります。
('OK', [('1 (RFC822 {858569}', 'body of the message', ')')])
しかし、RFC822.SIZE
をフェッチすると、次のようになります。
('OK', ['1 (RFC822.SIZE 847403)'])
Data [0]リストを適切に処理するにはどうすればよいですか?タプルのリストである場合、タプルには正確に3つの部分があり、2番目の部分はペイロードであると信頼できますか?
多分あなたはimap4のためのより良いライブラリを知っていますか?
いいえ... imaplib
は非常に優れたライブラリです。imapなのでわかりにくいです。
あなたはそれをチェックしたいと思うかもしれませんt == 'OK'
、 だが data[0][1]
は、私が使用した分だけ期待どおりに動作します。
私が電子メールで受け取った署名済みの証明書を抽出するために使用する簡単な例を次に示します。
import getpass, os, imaplib, email
from OpenSSL.crypto import load_certificate, FILETYPE_PEM
def getMsgs(servername="myimapserverfqdn"):
usernm = getpass.getuser()
passwd = getpass.getpass()
subject = 'Your SSL Certificate'
conn = imaplib.IMAP4_SSL(servername)
conn.login(usernm,passwd)
conn.select('Inbox')
typ, data = conn.search(None,'(UNSEEN SUBJECT "%s")' % subject)
for num in data[0].split():
typ, data = conn.fetch(num,'(RFC822)')
msg = email.message_from_string(data[0][1])
typ, data = conn.store(num,'-FLAGS','\\Seen')
yield msg
def getAttachment(msg,check):
for part in msg.walk():
if part.get_content_type() == 'application/octet-stream':
if check(part.get_filename()):
return part.get_payload(decode=1)
if __name__ == '__main__':
for msg in getMsgs():
payload = getAttachment(msg,lambda x: x.endswith('.pem'))
if not payload:
continue
try:
cert = load_certificate(FILETYPE_PEM,payload)
except:
cert = None
if cert:
cn = cert.get_subject().commonName
filename = "%s.pem" % cn
if not os.path.exists(filename):
open(filename,'w').write(payload)
print "Writing to %s" % filename
else:
print "%s already exists" % filename
IMAPClient パッケージは、操作がかなり簡単です。説明から:
使いやすく、Pythonicで完全なIMAPクライアントライブラリ。
これは、有用な情報を抽出するための私の解決策でした。これまでのところ信頼性があります:
import datetime
import email
import imaplib
import mailbox
EMAIL_ACCOUNT = "[email protected]"
PASSWORD = "your password"
mail = imaplib.IMAP4_SSL('imap.gmail.com')
mail.login(EMAIL_ACCOUNT, PASSWORD)
mail.list()
mail.select('inbox')
result, data = mail.uid('search', None, "UNSEEN") # (ALL/UNSEEN)
i = len(data[0].split())
for x in range(i):
latest_email_uid = data[0].split()[x]
result, email_data = mail.uid('fetch', latest_email_uid, '(RFC822)')
# result, email_data = conn.store(num,'-FLAGS','\\Seen')
# this might work to set flag to seen, if it doesn't already
raw_email = email_data[0][1]
raw_email_string = raw_email.decode('utf-8')
email_message = email.message_from_string(raw_email_string)
# Header Details
date_Tuple = email.utils.parsedate_tz(email_message['Date'])
if date_Tuple:
local_date = datetime.datetime.fromtimestamp(email.utils.mktime_tz(date_Tuple))
local_message_date = "%s" %(str(local_date.strftime("%a, %d %b %Y %H:%M:%S")))
email_from = str(email.header.make_header(email.header.decode_header(email_message['From'])))
email_to = str(email.header.make_header(email.header.decode_header(email_message['To'])))
subject = str(email.header.make_header(email.header.decode_header(email_message['Subject'])))
# Body details
for part in email_message.walk():
if part.get_content_type() == "text/plain":
body = part.get_payload(decode=True)
file_name = "email_" + str(x) + ".txt"
output_file = open(file_name, 'w')
output_file.write("From: %s\nTo: %s\nDate: %s\nSubject: %s\n\nBody: \n\n%s" %(email_from, email_to,local_message_date, subject, body.decode('utf-8')))
output_file.close()
else:
continue
Imap_toolsパッケージを使用できます: https://pypi.org/project/imap-tools/
特徴:
例:
from imap_tools import MailBox, Q
# get list of email bodies from INBOX folder
with MailBox('imap.mail.com').login('[email protected]', 'password') as mailbox:
bodies = [msg.body for msg in mailbox.fetch()]