web-dev-qa-db-ja.com

生のmultipart / form-dataデータをPHP

私はこの問題に対する本当の答えを見つけることができないようですので、ここに行きます:

PHPでmultipart/form-data形式の未加工のHTTPリクエストデータをどのように解析しますか? raw POSTは、正しくフォーマットされている場合は自動的に解析されますが、参照しているデータは、PHPによって自動的に解析されていないPUTリクエストからのものです。データはマルチパートであり、次のようになります。

------------------------------b2449e94a11c
Content-Disposition: form-data; name="user_id"

3
------------------------------b2449e94a11c
Content-Disposition: form-data; name="post_id"

5
------------------------------b2449e94a11c
Content-Disposition: form-data; name="image"; filename="/tmp/current_file"
Content-Type: application/octet-stream

�����JFIF���������... a bunch of binary data

私はlibcurlでデータを送信しています(疑似コード):

curl_setopt_array(
  CURLOPT_POSTFIELDS => array(
    'user_id' => 3, 
    'post_id' => 5, 
    'image' => '@/tmp/current_file'),
  CURLOPT_CUSTOMREQUEST => 'PUT'
  );

CURLOPT_CUSTOMREQUESTビットをドロップすると、要求はサーバー上でPOSTとして処理され、すべて正常に解析されます。

PHPのHTTPデータパーサーを手動で呼び出す方法や、これを行う他の素晴らしい方法はありますか?そしてはい、私は要求をPUTとして送信する必要があります:)

32
Christof

編集-最初にお読みください:この回答は、7年後もまだ定期的にヒットしています。それ以来、私はこのコードを使用したことがなく、最近それを行うためのより良い方法があるかどうかわかりません。以下のコメントを確認し、このコードが機能しないシナリオが多数あることを確認してください。自己責任。

-

さて、DaveとEvertsの提案により、生のリクエストデータを手動で解析することにしました。約1日探した後、これを行う他の方法は見つかりませんでした。

私はこれからいくつかの助けを得ました thread 。参照されているスレッドで行われるような生データを改ざんすることはできませんでした。アップロードするとファイルが壊れてしまうからです。つまり、すべて正規表現です。これは十分にテストされていませんでしたが、私のワークケースでは機能しているようです。さらに苦労せずに、これがいつか誰かを助けることを期待して:

function parse_raw_http_request(array &$a_data)
{
  // read incoming data
  $input = file_get_contents('php://input');

  // grab multipart boundary from content type header
  preg_match('/boundary=(.*)$/', $_SERVER['CONTENT_TYPE'], $matches);
  $boundary = $matches[1];

  // split content by boundary and get rid of last -- element
  $a_blocks = preg_split("/-+$boundary/", $input);
  array_pop($a_blocks);

  // loop data blocks
  foreach ($a_blocks as $id => $block)
  {
    if (empty($block))
      continue;

    // you'll have to var_dump $block to understand this and maybe replace \n or \r with a visibile char

    // parse uploaded files
    if (strpos($block, 'application/octet-stream') !== FALSE)
    {
      // match "name", then everything after "stream" (optional) except for prepending newlines 
      preg_match("/name=\"([^\"]*)\".*stream[\n|\r]+([^\n\r].*)?$/s", $block, $matches);
    }
    // parse all other fields
    else
    {
      // match "name" and optional value in between newline sequences
      preg_match('/name=\"([^\"]*)\"[\n|\r]+([^\n\r].*)?\r$/s', $block, $matches);
    }
    $a_data[$matches[1]] = $matches[2];
  }        
}

参照による使用法(データをあまりコピーしないようにするため):

$a_data = array();
parse_raw_http_request($a_data);
var_dump($a_data);
28
Christof

誰も言及していないことに驚いていますparse_strまたはmb_parse_str

$result = [];
$rawPost = file_get_contents('php://input');
mb_parse_str($rawPost, $result);
var_dump($result);

http://php.net/manual/en/function.mb-parse-str.php

6
Mahn

Chris のサンプル関数を使用し、$ _ FILESの配列に対する R Porter の必要性など、必要な機能をいくつか追加しました。それが一部の人々に役立つことを願っています。

これが class と例 usage です

<?php
include_once('class.stream.php');

$data = array();

new stream($data);

$_PUT = $data['post'];
$_FILES = $data['file'];

/* Handle moving the file(s) */
if (count($_FILES) > 0) {
    foreach($_FILES as $key => $value) {
        if (!is_uploaded_file($value['tmp_name'])) {
            /* Use getimagesize() or fileinfo() to validate file prior to moving here */
            rename($value['tmp_name'], '/path/to/uploads/'.$value['name']);
        } else {
            move_uploaded_file($value['tmp_name'], '/path/to/uploads/'.$value['name']);
        }
    }
}
5
jas-

同様の(完全に同じではないにしても)形式を使用するマルチパート電子メールパーサーにインスピレーションが見つかるかもしれませんが、それを行う最善の方法は「自分で行う」ことだと思います。

Content-Type HTTPヘッダーから境界を取得し、それを使用してリクエストのさまざまな部分を分解します。リクエストが非常に大きい場合は、リクエスト全体をメモリに(場合によっては複数回)保存する可能性があることに注意してください。

関連するRFCは RFC2388 であり、幸いにもかなり短いです。

2
Evert

コンテンツを解析するためにfopen("php://input")を見ましたか?

ヘッダーは$_SERVER['HTTP_*']としても見つかります。名前は常に大文字で、ダッシュはアンダースコアになります(例:$_SERVER['HTTP_ACCEPT_LANGUAGE'])。

1
Dave Kok

私はhttpヘッダーをあまり扱っていませんが、役立つかもしれないこのコードのコードを見つけました

function http_parse_headers( $header )
{
    $retVal = array();
    $fields = explode("\r\n", preg_replace('/\x0D\x0A[\x09\x20]+/', ' ', $header));
    foreach( $fields as $field ) {
        if( preg_match('/([^:]+): (.+)/m', $field, $match) ) {
            $match[1] = preg_replace('/(?<=^|[\x09\x20\x2D])./e', 'strtoupper("\0")', strtolower(trim($match[1])));
            if( isset($retVal[$match[1]]) ) {
                $retVal[$match[1]] = array($retVal[$match[1]], $match[2]);
            } else {
                $retVal[$match[1]] = trim($match[2]);
            }
        }
    }
    return $retVal;
}

From http://php.net/manual/en/function.http-parse-headers.php

1
Ben