如何在纯PHP中遵循HTTP重定向后获得最终URL?

2022-08-30 21:24:26

我想做的是找出重定向后的最后一个/最终URL是什么

我宁愿不使用cURL。我想坚持使用纯PHP(流包装器)。

现在我有一个URL(假设 http://domain.test),我使用get_headers()从该页面获取特定的标题。get_headers还将返回多个标头(请参阅下面的编辑)。有没有办法使用这些标头来构建最终 URL?或者是否有PHP函数可以自动执行此操作?Location:

编辑:get_headers()遵循重定向并返回每个响应/重定向的所有标头,因此我有所有标头。Location:


答案 1
function getRedirectUrl ($url) {
    stream_context_set_default(array(
        'http' => array(
            'method' => 'HEAD'
        )
    ));
    $headers = get_headers($url, 1);
    if ($headers !== false && isset($headers['Location'])) {
        return $headers['Location'];
    }
    return false;
}

此外。。。

正如评论中提到的,在所有重定向后,最后一项将是您的最终URL。但重要的是要注意,它并不总是一个数组。有时它只是一个普通的非数组变量。在这种情况下,尝试访问最后一个数组元素很可能会返回单个字符。不理想。$headers['Location']

如果您只对最终URL感兴趣,在所有重定向之后,我建议更改

return $headers['Location'];

return is_array($headers['Location']) ? array_pop($headers['Location']) : $headers['Location'];

...这只是如果速记

if(is_array($headers['Location'])){
     return array_pop($headers['Location']);
}else{
     return $headers['Location'];
}

此修复将处理任一情况(数组,非数组),并消除在调用函数后清除最终 URL 的需要。

在没有重定向的情况下,该函数将返回 。同样,该函数还将返回无效的URL(由于任何原因无效)。因此,在运行此函数之前检查URL的有效性非常重要,否则将重定向检查合并到验证中的某个位置。falsefalse


答案 2
/**
 * get_redirect_url()
 * Gets the address that the provided URL redirects to,
 * or FALSE if there's no redirect. 
 *
 * @param string $url
 * @return string
 */
function get_redirect_url($url){
    $redirect_url = null; 

    $url_parts = @parse_url($url);
    if (!$url_parts) return false;
    if (!isset($url_parts['host'])) return false; //can't process relative URLs
    if (!isset($url_parts['path'])) $url_parts['path'] = '/';

    $sock = fsockopen($url_parts['host'], (isset($url_parts['port']) ? (int)$url_parts['port'] : 80), $errno, $errstr, 30);
    if (!$sock) return false;

    $request = "HEAD " . $url_parts['path'] . (isset($url_parts['query']) ? '?'.$url_parts['query'] : '') . " HTTP/1.1\r\n"; 
    $request .= 'Host: ' . $url_parts['host'] . "\r\n"; 
    $request .= "Connection: Close\r\n\r\n"; 
    fwrite($sock, $request);
    $response = '';
    while(!feof($sock)) $response .= fread($sock, 8192);
    fclose($sock);

    if (preg_match('/^Location: (.+?)$/m', $response, $matches)){
        if ( substr($matches[1], 0, 1) == "/" )
            return $url_parts['scheme'] . "://" . $url_parts['host'] . trim($matches[1]);
        else
            return trim($matches[1]);

    } else {
        return false;
    }

}

/**
 * get_all_redirects()
 * Follows and collects all redirects, in order, for the given URL. 
 *
 * @param string $url
 * @return array
 */
function get_all_redirects($url){
    $redirects = array();
    while ($newurl = get_redirect_url($url)){
        if (in_array($newurl, $redirects)){
            break;
        }
        $redirects[] = $newurl;
        $url = $newurl;
    }
    return $redirects;
}

/**
 * get_final_url()
 * Gets the address that the URL ultimately leads to. 
 * Returns $url itself if it isn't a redirect.
 *
 * @param string $url
 * @return string
 */
function get_final_url($url){
    $redirects = get_all_redirects($url);
    if (count($redirects)>0){
        return array_pop($redirects);
    } else {
        return $url;
    }
}

并且,一如既往,给予信任:

http://w-shadow.com/blog/2008/07/05/how-to-get-redirect-url-in-php/


推荐