用于生成 v4 UUID 的 PHP 函数

2022-08-30 06:07:10

所以我一直在做一些挖掘,我一直在尝试拼凑一个函数,在PHP中生成有效的v4 UUID。这是我能够来的最接近的。我在十六进制,十进制,二进制,PHP的按位运算符等方面的知识几乎不存在。此函数生成有效的 v4 UUID,直到一个区域。v4 UUID 应采用以下形式:

xxxxxxxx-xxxx-4 xxx-yxxx-xxxx

其中 y 为 8、9、A 或 B。这是函数失败的地方,因为它不符合这一点。

我希望在这方面比我更了解的人可以帮我一把,帮助我修复这个功能,这样它就可以遵守这个规则。

功能如下:

<?php

function gen_uuid() {
 $uuid = array(
  'time_low'  => 0,
  'time_mid'  => 0,
  'time_hi'  => 0,
  'clock_seq_hi' => 0,
  'clock_seq_low' => 0,
  'node'   => array()
 );
 
 $uuid['time_low'] = mt_rand(0, 0xffff) + (mt_rand(0, 0xffff) << 16);
 $uuid['time_mid'] = mt_rand(0, 0xffff);
 $uuid['time_hi'] = (4 << 12) | (mt_rand(0, 0x1000));
 $uuid['clock_seq_hi'] = (1 << 7) | (mt_rand(0, 128));
 $uuid['clock_seq_low'] = mt_rand(0, 255);
 
 for ($i = 0; $i < 6; $i++) {
  $uuid['node'][$i] = mt_rand(0, 255);
 }
 
 $uuid = sprintf('%08x-%04x-%04x-%02x%02x-%02x%02x%02x%02x%02x%02x',
  $uuid['time_low'],
  $uuid['time_mid'],
  $uuid['time_hi'],
  $uuid['clock_seq_hi'],
  $uuid['clock_seq_low'],
  $uuid['node'][0],
  $uuid['node'][1],
  $uuid['node'][2],
  $uuid['node'][3],
  $uuid['node'][4],
  $uuid['node'][5]
 );
 
 return $uuid;
}

?>

答案 1

与其将其分解为单个字段,不如生成随机数据块并更改单个字节位置。您还应该使用比mt_rand()更好的随机数生成器。

根据 RFC 4122 - 第 4.4 节,您需要更改以下字段:

  1. time_hi_and_version(第 7 个八位字节的第 4-7 位),
  2. clock_seq_hi_and_reserved(第9个八位字节的第6位和第7位)

所有其他 122 位都应该足够随机。

以下方法使用 openssl_random_pseudo_bytes() 生成 128 位随机数据,在八位字节上进行排列,然后使用 bin2hex()vsprintf() 执行最终格式化。

function guidv4($data)
{
    assert(strlen($data) == 16);

    $data[6] = chr(ord($data[6]) & 0x0f | 0x40); // set version to 0100
    $data[8] = chr(ord($data[8]) & 0x3f | 0x80); // set bits 6-7 to 10

    return vsprintf('%s%s-%s-%s-%s-%s%s%s', str_split(bin2hex($data), 4));
}

echo guidv4(openssl_random_pseudo_bytes(16));

在 PHP 7 中,使用 random_bytes() 生成随机字节序列变得更加简单:

function guidv4($data = null)
{
    $data = $data ?? random_bytes(16);
    // ...
}

答案 2

从PHP手册的这个评论中,你可以使用这个:

function gen_uuid() {
    return sprintf( '%04x%04x-%04x-%04x-%04x-%04x%04x%04x',
        // 32 bits for "time_low"
        mt_rand( 0, 0xffff ), mt_rand( 0, 0xffff ),

        // 16 bits for "time_mid"
        mt_rand( 0, 0xffff ),

        // 16 bits for "time_hi_and_version",
        // four most significant bits holds version number 4
        mt_rand( 0, 0x0fff ) | 0x4000,

        // 16 bits, 8 bits for "clk_seq_hi_res",
        // 8 bits for "clk_seq_low",
        // two most significant bits holds zero and one for variant DCE1.1
        mt_rand( 0, 0x3fff ) | 0x8000,

        // 48 bits for "node"
        mt_rand( 0, 0xffff ), mt_rand( 0, 0xffff ), mt_rand( 0, 0xffff )
    );
}

推荐