查找两个字符串之间不同的第一个字符

2022-08-30 08:44:38

给定两个等长字符串,是否有一种优雅的方法来获取第一个不同字符的偏移量?

显而易见的解决方案是:

for ($offset = 0; $offset < $length; ++$offset) {
    if ($str1[$offset] !== $str2[$offset]) {
        return $offset;
    }
}

但对于这样一个简单的任务来说,这看起来不太对劲。


答案 1

你可以使用按位XOR(^的一个很好的属性来实现这一点:基本上,当你将两个字符串放在一起时,相同的字符将成为空字节()。因此,如果我们对两个字符串进行异形处理,我们只需要使用strspn找到第一个非空字节的位置:"\0"

$position = strspn($string1 ^ $string2, "\0");

这就是它的全部内容。让我们看一个例子:

$string1 = 'foobarbaz';
$string2 = 'foobarbiz';
$pos = strspn($string1 ^ $string2, "\0");

printf(
    'First difference at position %d: "%s" vs "%s"',
    $pos, $string1[$pos], $string2[$pos]
);

这将输出:

位置 7 处的第一个差别:“a” 与 “i”

所以应该这样做。它非常高效,因为它只使用C函数,并且只需要字符串的单个内存副本。

编辑:一个多字节解决方案,沿着相同的路线:

function getCharacterOffsetOfDifference($str1, $str2, $encoding = 'UTF-8') {
    return mb_strlen(
        mb_strcut(
            $str1,
            0, strspn($str1 ^ $str2, "\0"),
            $encoding
        ),
        $encoding
    );
}

首先,使用上述方法找到字节级别的差异,然后将偏移量映射到字符级别。这是使用mb_strcut函数完成的,该函数基本上只是遵循多字节字符边界。substr

var_dump(getCharacterOffsetOfDifference('foo', 'foa')); // 2
var_dump(getCharacterOffsetOfDifference('©oo', 'foa')); // 0
var_dump(getCharacterOffsetOfDifference('f©o', 'fªa')); // 1

它不像第一个解决方案那样优雅,但它仍然是一行(如果你使用默认编码更简单一点):

return mb_strlen(mb_strcut($str1, 0, strspn($str1 ^ $str2, "\0")));

答案 2

如果将字符串转换为单字符一字节值的数组,则可以使用数组比较函数来比较字符串。

您可以通过以下方式获得与 XOR 方法类似的结果。

$string1 = 'foobarbaz';
$string2 = 'foobarbiz';

$array1 = str_split($string1);
$array2 = str_split($string2);

$result = array_diff_assoc($array1, $array2);

$num_diff = count($result);
$first_diff = key($result);

echo "There are " . $num_diff . " differences between the two strings. <br />";
echo "The first difference between the strings is at position " . $first_diff . ". (Zero Index) '$string1[$first_diff]' vs '$string2[$first_diff]'.";

编辑:多字节解决方案

$string1 = 'foorbarbaz';
$string2 = 'foobarbiz';

$array1 = preg_split('((.))u', $string1, PREG_SPLIT_DELIM_CAPTURE | PREG_SPLIT_NO_EMPTY);
$array2 = preg_split('((.))u', $string2, PREG_SPLIT_DELIM_CAPTURE | PREG_SPLIT_NO_EMPTY);

$result = array_diff_assoc($array1, $array2);

$num_diff = count($result);
$first_diff = key($result);

echo "There are " . $num_diff . " differences between the two strings.\n";
echo "The first difference between the strings is at position " . $first_diff . ". (Zero Index) '$string1[$first_diff]' vs '$string2[$first_diff]'.\n";

推荐