使用 PHP 手动解析原始多部分/表单数据

2022-08-30 12:44:19

我似乎找不到这个问题的真正答案,所以我在这里:

如何在PHP中解析原始HTTP请求数据的格式?我知道如果格式正确,原始POST会自动解析,但是我所指的数据来自PUT请求,该请求不会被PHP自动解析。数据是多部分的,看起来像这样:multipart/form-data

------------------------------b2449e94a11c
Content-Disposition: form-data; name="user_id"

3
------------------------------b2449e94a11c
Content-Disposition: form-data; name="post_id"

5
------------------------------b2449e94a11c
Content-Disposition: form-data; name="image"; filename="/tmp/current_file"
Content-Type: application/octet-stream

�����JFIF���������... a bunch of binary data

我用libcurl发送数据,如下所示(伪代码):

curl_setopt_array(
  CURLOPT_POSTFIELDS => array(
    'user_id' => 3, 
    'post_id' => 5, 
    'image' => '@/tmp/current_file'),
  CURLOPT_CUSTOMREQUEST => 'PUT'
  );

如果我删除CURLOPT_CUSTOMREQUEST位,请求将在服务器上作为POST处理,并且所有内容都可以很好地解析。

有没有办法手动调用PHPs HTTP数据解析器或其他一些不错的方法来做到这一点?是的,我必须将请求作为PUT:)


答案 1

编辑 - 请先阅读:这个答案在7年后仍然受到常规点击。从那时起,我从未使用过此代码,并且不知道现在是否有更好的方法来做到这一点。请查看下面的评论,并知道在许多情况下,此代码将不起作用。使用风险自负。

--

好吧,所以有了Dave和Everts的建议,我决定手动解析原始请求数据。在搜索了大约一天后,我没有找到任何其他方法来做到这一点。

我从这个线程得到了一些帮助。我没有像在引用的线程中那样篡改原始数据,因为这会破坏正在上传的文件。所以这都是正则表达式。这没有经过很好的测试,但似乎适用于我的工作案例。事不宜迟,并希望有朝一日这可以帮助其他人:

function parse_raw_http_request(array &$a_data)
{
  // read incoming data
  $input = file_get_contents('php://input');
  
  // grab multipart boundary from content type header
  preg_match('/boundary=(.*)$/', $_SERVER['CONTENT_TYPE'], $matches);
  $boundary = $matches[1];
  
  // split content by boundary and get rid of last -- element
  $a_blocks = preg_split("/-+$boundary/", $input);
  array_pop($a_blocks);
      
  // loop data blocks
  foreach ($a_blocks as $id => $block)
  {
    if (empty($block))
      continue;
    
    // you'll have to var_dump $block to understand this and maybe replace \n or \r with a visibile char
    
    // parse uploaded files
    if (strpos($block, 'application/octet-stream') !== FALSE)
    {
      // match "name", then everything after "stream" (optional) except for prepending newlines 
      preg_match('/name=\"([^\"]*)\".*stream[\n|\r]+([^\n\r].*)?$/s', $block, $matches);
    }
    // parse all other fields
    else
    {
      // match "name" and optional value in between newline sequences
      preg_match('/name=\"([^\"]*)\"[\n|\r]+([^\n\r].*)?\r$/s', $block, $matches);
    }
    $a_data[$matches[1]] = $matches[2];
  }        
}

通过引用使用(为了不过多地复制数据):

$a_data = array();
parse_raw_http_request($a_data);
var_dump($a_data);

答案 2

我使用了Chris的示例函数,并添加了一些所需的功能,例如R Porter对数组的需求为_FILES美元。希望它能帮助一些人。

这是和示例用法

<?php
include_once('class.stream.php');

$data = array();

new stream($data);

$_PUT = $data['post'];
$_FILES = $data['file'];

/* Handle moving the file(s) */
if (count($_FILES) > 0) {
    foreach($_FILES as $key => $value) {
        if (!is_uploaded_file($value['tmp_name'])) {
            /* Use getimagesize() or fileinfo() to validate file prior to moving here */
            rename($value['tmp_name'], '/path/to/uploads/'.$value['name']);
        } else {
            move_uploaded_file($value['tmp_name'], '/path/to/uploads/'.$value['name']);
        }
    }
}

推荐