仅通过 curl 在 php 中检索标头

2022-08-30 09:16:12

实际上我有两个问题。

(1)如果我只检索标头,而不是使用php和curl进行整页检索,那么远程服务器上使用的处理能力带宽是否会降低?

(2)由于我认为,我可能是错的,第一个问题的答案是肯定的,我试图获取上次修改日期或If-Modified-因为远程文件的标头只是为了将其与本地存储数据的时间日期进行比较,因此我可以在更改的情况下将其存储在本地。但是,我的脚本似乎无法获取该信息,当我运行此命令时,我得到:NULL

class last_change {

 public last_change;

 function set_last_change() {
  $curl = curl_init();
    curl_setopt($curl, CURLOPT_URL, "http://url/file.xml");
    curl_setopt($curl, CURLOPT_HEADER, true);
    curl_setopt($curl, CURLOPT_FILETIME, true);
    curl_setopt($curl, CURLOPT_NOBODY, true);
  // $header = curl_exec($curl);
  $this -> last_change = curl_getinfo($header);
  curl_close($curl);
 }

 function get_last_change() {
  return $this -> last_change['datetime']; // I have tested with Last-Modified & If-Modified-Since to no avail
 }

}

在未编码的情况下,即使我没有请求它,也会显示标头数据,如下所示:$header = curl_exec($curl)

HTTP/1.1 200 OK
Date: Fri, 04 Sep 2009 12:15:51 GMT
Server: Apache/2.2.8 (Linux/SUSE)
Last-Modified: Thu, 03 Sep 2009 12:46:54 GMT
ETag: "198054-118c-472abc735ab80"
Accept-Ranges: bytes
Content-Length: 4492
Content-Type: text/xml

基于此,将返回“上次修改时间”。

那么,我做错了什么呢?


答案 1

您正在将$header传递给 。它应该是(卷曲手柄)。您可以通过将第二个参数传递给 来获取 。(通常 不可用,在这种情况下,它将报告为 -1)。curl_getinfo()$curlfiletimeCURLINFO_FILETIMEcurl_getinfo()filetime

但是,您的课程似乎很浪费,丢弃了许多可能有用的信息。这是另一种可能完成的方法:

class URIInfo 
{
    public $info;
    public $header;
    private $url;

    public function __construct($url)
    {
        $this->url = $url;
        $this->setData();
    }

    public function setData() 
    {
        $curl = curl_init();
        curl_setopt($curl, CURLOPT_URL, $this->url);
        curl_setopt($curl, CURLOPT_FILETIME, true);
        curl_setopt($curl, CURLOPT_NOBODY, true);
        curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
        curl_setopt($curl, CURLOPT_HEADER, true);
        $this->header = curl_exec($curl);
        $this->info = curl_getinfo($curl);
        curl_close($curl);
    }

    public function getFiletime() 
    {
        return $this->info['filetime'];
    }

    // Other functions can be added to retrieve other information.
}

$uri_info = new URIInfo('http://www.codinghorror.com/blog/');
$filetime = $uri_info->getFiletime();
if ($filetime != -1) {
    echo date('Y-m-d H:i:s', $filetime);
} else {
    echo 'filetime not available';
}

是的,服务器上的负载会更轻,因为它只返回HTTP标头(毕竟,响应请求)。打火机的重量会有很大差异。HEAD


答案 2

为什么使用 CURL?有一个PHP函数:

$headers=get_headers("http://www.amazingjokes.com/img/2014/530c9613d29bd_CountvonCount.jpg");
print_r($headers);

返回以下内容:

Array
(
    [0] => HTTP/1.1 200 OK
    [1] => Date: Tue, 11 Mar 2014 22:44:38 GMT
    [2] => Server: Apache
    [3] => Last-Modified: Tue, 25 Feb 2014 14:08:40 GMT
    [4] => ETag: "54e35e8-8873-4f33ba00673f4"
    [5] => Accept-Ranges: bytes
    [6] => Content-Length: 34931
    [7] => Connection: close
    [8] => Content-Type: image/jpeg
)

在此之后应该很容易获得内容类型。

您还可以将 format=1 添加到get_headers:

$headers=get_headers("http://www.amazingjokes.com/img/2014/530c9613d29bd_CountvonCount.jpg",1);
    print_r($headers);

这将返回以下内容:

Array
(
    [0] => HTTP/1.1 200 OK
    [Date] => Tue, 11 Mar 2014 22:44:38 GMT
    [Server] => Apache
    [Last-Modified] => Tue, 25 Feb 2014 14:08:40 GMT
    [ETag] => "54e35e8-8873-4f33ba00673f4"
    [Accept-Ranges] => bytes
    [Content-Length] => 34931
    [Connection] => close
    [Content-Type] => image/jpeg
)

更多阅读在这里 (PHP.NET)


推荐