Gmailでメールの本文を取得できないPHP API

Question

Gmailに問題がありますPHP API。

メールの本文を取得したいのですが、添付ファイル付きのメールのみ取得できます！私の質問はなぜですか？

これまでの私のコードは次のとおりです。

// Authentication things above... $client = getClient(); $gmail = new Google_Service_Gmail($client); $list = $gmail->users_messages->listUsersMessages('me', ['maxResults' => 1000]); while ($list->getMessages() != null) { foreach ($list->getMessages() as $mlist) { $message_id = $mlist->id; $optParamsGet2['format'] = 'full'; $single_message = $gmail->users_messages->get('me', $message_id, $optParamsGet2); $threadId = $single_message->getThreadId(); $payload = $single_message->getPayload(); $headers = $payload->getHeaders(); $parts = $payload->getParts(); //print_r($parts); PRINTS SOMETHING ONLY IF I HAVE ATTACHMENTS... $body = $parts[0]['body']; $rawData = $body->data; $sanitizedData = strtr($rawData,'-_', '+/'); $decodedMessage = base64_decode($sanitizedData); //should display my body content } if ($list->getNextPageToken() != null) { $pageToken = $list->getNextPageToken(); $list = $gmail->users_messages->listUsersMessages('me', ['pageToken' => $pageToken, 'maxResults' => 1000]); } else { break; } }

私が知っているコンテンツを取得する2番目のオプションは、Headers部分にあるスニペットを使用することですが、最初の50文字程度しか取得しないため、あまり役に立ちません。

Tholle · Accepted Answer

ちょっと実験してみましょう。自分に2つのメッセージを送信しました。 1つはアタッチメントあり、もう1つはアタッチメントなしです。

リクエスト：

GET https://www.googleapis.com/gmail/v1/users/me/messages?maxResults=2

応答：

{ "messages": [ { "id": "14fe21fd6b3fb46f", "threadId": "14fe21fd6b3fb46f" }, { "id": "14fe21f9341ed73c", "threadId": "14fe21f9341ed73c" } ], "nextPageToken": "08943597140129624594", "resultSizeEstimate": 3 }

ペイロードを要求するのは、ここに関連するすべての部分があるためです。

fields = payload GET https://www.googleapis.com/gmail/v1/users/me/messages/14fe21fd6b3fb46f?fields=payload GET https://www.googleapis.com/gmail/v1/users/me/messages/14fe21f9341ed73c?fields=payload

添付ファイルのないメール：

{ "payload": { "parts": [ { "partId": "0", "mimeType": "text/plain", "filename": "", "headers": [ { "name": "Content-Type", "value": "text/plain; charset=UTF-8" } ], "body": { "size": 22, "data": "aGVjaz8gTm8gYXR0YWNobWVudD8NCg==" } }, { "partId": "1", "mimeType": "text/html", "filename": "", "headers": [ { "name": "Content-Type", "value": "text/html; charset=UTF-8" } ], "body": { "size": 43, "data": "PGRpdiBkaXI9Imx0ciI-aGVjaz8gTm8gYXR0YWNobWVudD88L2Rpdj4NCg==" } } ] } }

添付ファイル付きメール：

{ "payload": { "parts": [ { "mimeType": "multipart/alternative", "filename": "", "headers": [ { "name": "Content-Type", "value": "multipart/alternative; boundary=001a1142e23c551e8e05200b4be0" } ], "body": { "size": 0 }, "parts": [ { "partId": "0.0", "mimeType": "text/plain", "filename": "", "headers": [ { "name": "Content-Type", "value": "text/plain; charset=UTF-8" } ], "body": { "size": 9, "data": "V293IG1hbg0K" } }, { "partId": "0.1", "mimeType": "text/html", "filename": "", "headers": [ { "name": "Content-Type", "value": "text/html; charset=UTF-8" } ], "body": { "size": 30, "data": "PGRpdiBkaXI9Imx0ciI-V293IG1hbjwvZGl2Pg0K" } } ] }, { "partId": "1", "mimeType": "image/jpeg", "filename": "feelthebern.jpg", "headers": [ { "name": "Content-Type", "value": "image/jpeg; name=\"feelthebern.jpg\"" }, { "name": "Content-Disposition", "value": "attachment; filename=\"feelthebern.jpg\"" }, { "name": "Content-Transfer-Encoding", "value": "base64" }, { "name": "X-Attachment-Id", "value": "f_ieq3ev0i0" } ], "body": { "attachmentId": "ANGjdJ_2xG3WOiLh6MbUdYy4vo2VhV2kOso5AyuJW3333rbmk8BIE1GJHIOXkNIVGiphP3fGe7iuIl_MGzXBGNGvNslwlz8hOkvJZg2DaasVZsdVFT_5JGvJOLefgaSL4hqKJgtzOZG9K1XSMrRQAtz2V0NX7puPdXDU4gvalSuMRGwBhr_oDSfx2xljHEbGG6I4VLeLZfrzGGKW7BF-GO_FUxzJR8SizRYqIhgZNA6PfRGyOhf1s7bAPNW3M9KqWRgaK07WTOYl7DzW4hpNBPA4jrl7tgsssExHpfviFL7yL52lxsmbsiLe81Z5UoM", "size": 100446 } } ] } }

これらの応答は、コードの$partsに対応しています。ご覧のとおり、運が良ければ$parts[0]['body']->dataで必要なものが得られますが、ほとんどの場合は得られません。

この問題には、一般的に2つの方法があります。次のアルゴリズムを実装できます（PHPは私より優れていますが、これは一般的な概要です）：

payload.partsをトラバースし、探している本文（text/plainまたはtext/html）を含むpartが含まれているかどうかを確認します。あれば、検索は完了です。上記のような添付ファイルのないメールを解析する場合は、これで十分です。
手順1をもう一度実行しますが、今度は、チェックしたparts内にあるpartsを再帰的に使用します。最終的にはpartが見つかります。上記のような添付ファイル付きのメールを解析していた場合、最終的にbodyが見つかります。

アルゴリズムは次のようになります（JavaScriptの例）：

var response = { "payload": { "parts": [ { "mimeType": "multipart/alternative", "filename": "", "headers": [ { "name": "Content-Type", "value": "multipart/alternative; boundary=001a1142e23c551e8e05200b4be0" } ], "body": { "size": 0 }, "parts": [ { "partId": "0.0", "mimeType": "text/plain", "filename": "", "headers": [ { "name": "Content-Type", "value": "text/plain; charset=UTF-8" } ], "body": { "size": 9, "data": "V293IG1hbg0K" } }, { "partId": "0.1", "mimeType": "text/html", "filename": "", "headers": [ { "name": "Content-Type", "value": "text/html; charset=UTF-8" } ], "body": { "size": 30, "data": "PGRpdiBkaXI9Imx0ciI-V293IG1hbjwvZGl2Pg0K" } } ] }, { "partId": "1", "mimeType": "image/jpeg", "filename": "feelthebern.jpg", "headers": [ { "name": "Content-Type", "value": "image/jpeg; name=\"feelthebern.jpg\"" }, { "name": "Content-Disposition", "value": "attachment; filename=\"feelthebern.jpg\"" }, { "name": "Content-Transfer-Encoding", "value": "base64" }, { "name": "X-Attachment-Id", "value": "f_ieq3ev0i0" } ], "body": { "attachmentId": "ANGjdJ_2xG3WOiLh6MbUdYy4vo2VhV2kOso5AyuJW3333rbmk8BIE1GJHIOXkNIVGiphP3fGe7iuIl_MGzXBGNGvNslwlz8hOkvJZg2DaasVZsdVFT_5JGvJOLefgaSL4hqKJgtzOZG9K1XSMrRQAtz2V0NX7puPdXDU4gvalSuMRGwBhr_oDSfx2xljHEbGG6I4VLeLZfrzGGKW7BF-GO_FUxzJR8SizRYqIhgZNA6PfRGyOhf1s7bAPNW3M9KqWRgaK07WTOYl7DzW4hpNBPA4jrl7tgsssExHpfviFL7yL52lxsmbsiLe81Z5UoM", "size": 100446 } } ] } }; // In e.g. a plain text message, the payload is the only part. var parts = [response.payload]; while (parts.length) { var part = parts.shift(); if (part.parts) { parts = parts.concat(part.parts); } if(part.mimeType === 'text/html') { var decodedPart = decodeURIComponent(escape(atob(part.body.data.replace(/\-/g, '+').replace(/\_/g, '/')))); console.log(decodedPart); } }

はるかに簡単なオプションは、メールの生データを取得し、すでに作成されているライブラリに作業を任せることです。

リクエスト：

format = raw fields = raw GET https://www.googleapis.com/gmail/v1/users/me/messages/14fe21fd6b3fb46f?format=raw&fields=raw

応答：

{ "raw": "TUlNRS1WZXJzaW9uOiAxLjANClJlY2VpdmVkOiBieSAxMC4yOC45OS4xOTYgd2l0aCBIVFRQOyBGcmksIDE4IFNlcCAyMDE1IDEzOjIzOjAxIC0wNzAwIChQRFQpDQpEYXRlOiBGcmksIDE4IFNlcCAyMDE1IDIyOjIzOjAxICswMjAwDQpEZWxpdmVyZWQtVG86IGVtdGhvbGluQGdtYWlsLmNvbQ0KTWVzc2FnZS1JRDogPENBRHNaTFJ5eGk2UGt0MHZnUS1iZHd1N2FNLWNHRmZKcEwrRHYyb3ZKOGp4SGN4VWhfQUBtYWlsLmdtYWlsLmNvbT4NClN1YmplY3Q6IFdoYXQgZGENCkZyb206IEVtaWwgVGhvbGluIDxlbXRob2xpbkBnbWFpbC5jb20-DQpUbzogRW1pbCBUaG9saW4gPGVtdGhvbGluQGdtYWlsLmNvbT4NCkNvbnRlbnQtVHlwZTogbXVsdGlwYXJ0L2FsdGVybmF0aXZlOyBib3VuZGFyeT0wMDFhMTE0NjhmMTY1YzUwNDUwNTIwMGI0YzYxDQoNCi0tMDAxYTExNDY4ZjE2NWM1MDQ1MDUyMDBiNGM2MQ0KQ29udGVudC1UeXBlOiB0ZXh0L3BsYWluOyBjaGFyc2V0PVVURi04DQoNCmhlY2s_IE5vIGF0dGFjaG1lbnQ_DQoNCi0tMDAxYTExNDY4ZjE2NWM1MDQ1MDUyMDBiNGM2MQ0KQ29udGVudC1UeXBlOiB0ZXh0L2h0bWw7IGNoYXJzZXQ9VVRGLTgNCg0KPGRpdiBkaXI9Imx0ciI-aGVjaz8gTm8gYXR0YWNobWVudD88L2Rpdj4NCg0KLS0wMDFhMTE0NjhmMTY1YzUwNDUwNTIwMGI0YzYxLS0=" }

2番目の方法の最大の欠点は、未加工のメッセージを取得した場合、すべての添付データがすぐにダウンロードされることです。これは、ユースケースでは、はるかに多くのデータになる可能性があります。

私はPHPは得意ではありませんが、2番目のソリューションを使いたい場合は this が有望に見えます。幸運を！

F3L1X79 · Answer

更新：より完全なコードについては、この下の2番目の回答を確認することをお勧めします。

最後に、私は今日働いたので、ここに本文を見つけるための完全なコード回答があります-@ Tholleのおかげで：

// Authentication things above /* * Decode the body. * @param : encoded body - or null * @return : the body if found, else FALSE; */ function decodeBody($body) { $rawData = $body; $sanitizedData = strtr($rawData,'-_', '+/'); $decodedMessage = base64_decode($sanitizedData); if(!$decodedMessage){ $decodedMessage = FALSE; } return $decodedMessage; } $client = getClient(); $gmail = new Google_Service_Gmail($client); $list = $gmail->users_messages->listUsersMessages('me', ['maxResults' => 1000]); try{ while ($list->getMessages() != null) { foreach ($list->getMessages() as $mlist) { $message_id = $mlist->id; $optParamsGet2['format'] = 'full'; $single_message = $gmail->users_messages->get('me', $message_id, $optParamsGet2); $payload = $single_message->getPayload(); // With no attachment, the payload might be directly in the body, encoded. $body = $payload->getBody(); $FOUND_BODY = decodeBody($body['data']); // If we didn't find a body, let's look for the parts if(!$FOUND_BODY) { $parts = $payload->getParts(); foreach ($parts as $part) { if($part['body']) { $FOUND_BODY = decodeBody($part['body']->data); break; } // Last try: if we didn't find the body in the first parts, // let's loop into the parts of the parts (as @Tholle suggested). if($part['parts'] && !$FOUND_BODY) { foreach ($part['parts'] as $p) { // replace 'text/html' by 'text/plain' if you prefer if($p['mimeType'] === 'text/html' && $p['body']) { $FOUND_BODY = decodeBody($p['body']->data); break; } } } if($FOUND_BODY) { break; } } } // Finally, print the message ID and the body print_r($message_id . " : " . $FOUND_BODY); } if ($list->getNextPageToken() != null) { $pageToken = $list->getNextPageToken(); $list = $gmail->users_messages->listUsersMessages('me', ['pageToken' => $pageToken, 'maxResults' => 1000]); } else { break; } } } catch (Exception $e) { echo $e->getMessage(); }

ご覧のとおり、私の問題はpayload-> partsでは本体が見つからないことがありますが、payload-> bodyでは直接見つかりません。（さらに、複数のパーツのループを追加します）。

これが誰かを助けることを願っています。

F3L1X79 · Answer

興味のある方のために、私は最後の回答を大幅に改善し、text/htmlで機能し（必要に応じてtext/plainにフォールバックし）、完全なHTMLとして印刷されたときに自動ロードされるbase64添付ファイルとして画像を変換しました！

コードは完全ではなく、詳細に説明するには長すぎますが、私にとってはうまくいきます。

自由に変更してください（必要に応じて修正または改善してください）。

// Authentication things above /* * Decode the body. * @param : encoded body - or null * @return : the body if found, else FALSE; */ function decodeBody($body) { $rawData = $body; $sanitizedData = strtr($rawData,'-_', '+/'); $decodedMessage = base64_decode($sanitizedData); if(!$decodedMessage){ $decodedMessage = FALSE; } return $decodedMessage; } $client = getClient(); $gmail = new Google_Service_Gmail($client); $list = $gmail->users_messages->listUsersMessages('me', ['maxResults' => 1000]); try{ while ($list->getMessages() != null) { foreach ($list->getMessages() as $mlist) { $message_id = $mlist->id; $optParamsGet2['format'] = 'full'; $single_message = $gmail->users_messages->get('me', $message_id, $optParamsGet2); $payload = $single_message->getPayload(); $parts = $payload->getParts(); // With no attachment, the payload might be directly in the body, encoded. $body = $payload->getBody(); $FOUND_BODY = FALSE; // If we didn't find a body, let's look for the parts if(!$FOUND_BODY) { foreach ($parts as $part) { if($part['parts'] && !$FOUND_BODY) { foreach ($part['parts'] as $p) { if($p['parts'] && count($p['parts']) > 0){ foreach ($p['parts'] as $y) { if(($y['mimeType'] === 'text/html') && $y['body']) { $FOUND_BODY = decodeBody($y['body']->data); break; } } } else if(($p['mimeType'] === 'text/html') && $p['body']) { $FOUND_BODY = decodeBody($p['body']->data); break; } } } if($FOUND_BODY) { break; } } } // let's save all the images linked to the mail's body: if($FOUND_BODY && count($parts) > 1){ $images_linked = array(); foreach ($parts as $part) { if($part['filename']){ array_Push($images_linked, $part); } else{ if($part['parts']) { foreach ($part['parts'] as $p) { if($p['parts'] && count($p['parts']) > 0){ foreach ($p['parts'] as $y) { if(($y['mimeType'] === 'text/html') && $y['body']) { array_Push($images_linked, $y); } } } else if(($p['mimeType'] !== 'text/html') && $p['body']) { array_Push($images_linked, $p); } } } } } // special case for the wdcid... preg_match_all('/wdcid(.*)"/Uims', $FOUND_BODY, $wdmatches); if(count($wdmatches)) { $z = 0; foreach($wdmatches[0] as $match) { $z++; if($z > 9){ $FOUND_BODY = str_replace($match, 'image0' . $z . '@', $FOUND_BODY); } else { $FOUND_BODY = str_replace($match, 'image00' . $z . '@', $FOUND_BODY); } } } preg_match_all('/src="cid:(.*)"/Uims', $FOUND_BODY, $matches); if(count($matches)) { $search = array(); $replace = array(); // let's trasnform the CIDs as base64 attachements foreach($matches[1] as $match) { foreach($images_linked as $img_linked) { foreach($img_linked['headers'] as $img_lnk) { if( $img_lnk['name'] === 'Content-ID' || $img_lnk['name'] === 'Content-Id' || $img_lnk['name'] === 'X-Attachment-Id'){ if ($match === str_replace('>', '', str_replace('<', '', $img_lnk->value)) || explode("@", $match)[0] === explode(".", $img_linked->filename)[0] || explode("@", $match)[0] === $img_linked->filename){ $search = "src=\"cid:$match\""; $mimetype = $img_linked->mimeType; $attachment = $gmail->users_messages_attachments->get('me', $mlist->id, $img_linked['body']->attachmentId); $data64 = strtr($attachment->getData(), array('-' => '+', '_' => '/')); $replace = "src=\"data:" . $mimetype . ";base64," . $data64 . "\""; $FOUND_BODY = str_replace($search, $replace, $FOUND_BODY); } } } } } } } // If we didn't find the body in the last parts, // let's loop for the first parts (text-html only) if(!$FOUND_BODY) { foreach ($parts as $part) { if($part['body'] && $part['mimeType'] === 'text/html') { $FOUND_BODY = decodeBody($part['body']->data); break; } } } // With no attachment, the payload might be directly in the body, encoded. if(!$FOUND_BODY) { $FOUND_BODY = decodeBody($body['data']); } // Last try: if we didn't find the body in the last parts, // let's loop for the first parts (text-plain only) if(!$FOUND_BODY) { foreach ($parts as $part) { if($part['body']) { $FOUND_BODY = decodeBody($part['body']->data); break; } } } if(!$FOUND_BODY) { $FOUND_BODY = '(No message)'; } // Finally, print the message ID and the body print_r($message_id . ": " . $FOUND_BODY); } if ($list->getNextPageToken() != null) { $pageToken = $list->getNextPageToken(); $list = $gmail->users_messages->listUsersMessages('me', ['pageToken' => $pageToken, 'maxResults' => 1000]); } else { break; } } } catch (Exception $e) { echo $e->getMessage(); }

乾杯。

Maulik Gangani · Answer

これはhtml応答を正しくフィルタリングするため、@ F3L1X79 の回答の改善としてこのコードを記述しました。

<?php ini_set("display_errors", 1); ini_set("track_errors", 1); ini_set("html_errors", 1); error_reporting(E_ALL); require_once __DIR__ . '/vendor/autoload.php'; session_start(); function decodeBody($body) { $rawData = $body; $sanitizedData = strtr($rawData,'-_', '+/'); $decodedMessage = base64_decode($sanitizedData); if(!$decodedMessage){ $decodedMessage = FALSE; } return $decodedMessage; } function fetchMails($gmail, $q) { try{ $list = $gmail->users_messages->listUsersMessages('me', array('q' => $q)); while ($list->getMessages() != null) { foreach ($list->getMessages() as $mlist) { $message_id = $mlist->id; $optParamsGet2['format'] = 'full'; $single_message = $gmail->users_messages->get('me', $message_id, $optParamsGet2); $payload = $single_message->getPayload(); // With no attachment, the payload might be directly in the body, encoded. $body = $payload->getBody(); $FOUND_BODY = decodeBody($body['data']); // If we didn't find a body, let's look for the parts if(!$FOUND_BODY) { $parts = $payload->getParts(); foreach ($parts as $part) { if($part['body'] && $part['mimeType'] == 'text/html') { $FOUND_BODY = decodeBody($part['body']->data); break; } } } if(!$FOUND_BODY) { foreach ($parts as $part) { // Last try: if we didn't find the body in the first parts, // let's loop into the parts of the parts (as @Tholle suggested). if($part['parts'] && !$FOUND_BODY) { foreach ($part['parts'] as $p) { // replace 'text/html' by 'text/plain' if you prefer if($p['mimeType'] === 'text/html' && $p['body']) { $FOUND_BODY = decodeBody($p['body']->data); break; } } } if($FOUND_BODY) { break; } } } // Finally, print the message ID and the body print_r($message_id . " <br> <br> <br> *-*-*- " . $FOUND_BODY); } if ($list->getNextPageToken() != null) { $pageToken = $list->getNextPageToken(); $list = $gmail->users_messages->listUsersMessages('me', array('pageToken' => $pageToken)); } else { break; } } } catch (Exception $e) { echo $e->getMessage(); } } $client = new Google_Client(); $client->setAuthConfig('client_secrets.json'); $client->addScope(Google_Service_Gmail::GMAIL_READONLY); if (isset($_SESSION['access_token']) && $_SESSION['access_token']) { $client->setAccessToken($_SESSION['access_token']); $gmail = new Google_Service_Gmail($client); $q = ' after:2016/11/7'; fetchMails($gmail, $q); } else { $redirect_uri = 'http://' . $_SERVER['HTTP_Host'] . '/gmail-api/oauth2callback.php'; header('Location: ' . filter_var($redirect_uri, FILTER_SANITIZE_URL)); }

potato · Answer

シンプルで堅牢なソリューション

他の回答にはすべて欠陥があるため（スポイラーの詳細）、満足できませんでした。いくつかは長く、質問者（および私）が探していなかった機能が混在しています。

他の回答の潜在的な問題について警告するには：
プレーンテキストのフォールバックなし
または falsy メッセージ本文の処理に失敗-文字列「0」（発生する可能性は低いが、それほど可能性は低い）
またはペイロードツリー構造を十分に深く検索できない

だから私は他の人の手間を省いて私のコードを共有したいと思った（私の受信箱全体でテストした）。

// input: the message object (not the payload!) // output: html or plain text function msg_body($msg) { $body = msg_body_recursive($msg->payload); return array_key_exists('html', $body) ? $body['html'] : $body['plain']; } function msg_body_recursive($part) { if($part->mimeType == 'text/html') { return ['html' => decodeBody($part->body->data)]; } else if($part->mimeType == 'text/plain') { return ['plain' => decodeBody($part->body->data)]; } else if($part->parts) { $return = []; foreach($part->parts as $sub_part) { $result = msg_body_recursive($sub_part); $return = array_merge($return, $result); if(array_key_exists('html', $return)) break; } return $return; } return []; } function decodeBody($encoded) { $sanitizedData = strtr($encoded,'-_', '+/'); return base64_decode($sanitizedData); }

sieppl · Answer

さらなる改善として、コードを再帰的にする必要があります。また、本文を抽出するために、メッセージを「フル」の形式でロードする必要があります。以下の3つの関数を独自のクラスに入れることができます。

private function decodeBody($body) { $rawData = $body; $sanitizedData = strtr($rawData,'-_', '+/'); $decodedMessage = base64_decode($sanitizedData); if(!$decodedMessage) return false; return $decodedMessage; } private function decodeParts($parts) { foreach ($parts as $part) { if ($part->getMimeType() === 'text/html' && $part->getBody()) if ($result = $this->decodeBody($part->getBody()->getData())) return $result; } foreach ($parts as $part) { if ($result = $this->decodeParts($part->getParts())) return $result; } } /** * @param Google_Service_Gmail_Message $message * @return bool|null|string */ public function getMessageBody($message) { $payload = $message->getPayload(); if ($result = $this->decodeBody($payload->getBody()->getData())) return $result; return $this->decodeParts($payload->getParts()); }