为什么 PHP json_encode 函数将 UTF-8 字符串转换为十六进制实体?

2022-08-30 06:27:00

我有一个处理各种语言的PHP脚本。不幸的是,每当我尝试使用时,任何Unicode输出都会转换为十六进制实体。这是预期的行为吗?有没有办法将输出转换为 UTF-8 字符?json_encode

以下是我看到的示例:

输入

echo $text;

输出

База данни грешка.

输入

json_encode($text);

输出

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."

答案 1

从 PHP/5.4.0 开始,有一个名为 .来看看吧:JSON_UNESCAPED_UNICODE

https://php.net/function.json-encode

因此,您应该尝试:

json_encode( $text, JSON_UNESCAPED_UNICODE );

答案 2

JSON_UNESCAPED_UNICODE在 PHP 版本 5.4 或更高版本上可用。
以下代码适用于 V5.3。

更新

  • html_entity_decode比 + 更有效率。packmb_convert_encoding
  • (*SKIP)(*FAIL)跳过反斜杠本身和标志指定的字符。JSON_HEX_*

 

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}

推荐