使用 fgetcsv 读取 CSV 文件时出现的 UTF-8 问题

2022-08-30 12:33:54

我尝试读取 CSV 并回显内容。但是内容显示字符错误。

Mäx Müstermänn -> Mäx MÃ1/4stermänn

CSV 文件的编码为 UTF-8,不含 BOM(使用记事本++ 检查)。

这是 CSV 文件的内容:

"Mäx";"Müstermänn"

我的 PHP 脚本

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</head>
<body>
<?php
$handle = fopen ("specialchars.csv","r");
echo '<table border="1"><tr><td>First name</td><td>Last name</td></tr><tr>';
while ($data = fgetcsv ($handle, 1000, ";")) {
        $num = count ($data);
        for ($c=0; $c < $num; $c++) {
            // output data
            echo "<td>$data[$c]</td>";
        }
        echo "</tr><tr>";
}
?>
</body>
</html>

我试图按照这里的建议使用,但没有成功。内容仍然显示错误。setlocale(LC_ALL, 'de_DE.utf8');

我错过了什么?

编辑:

An 给了我 UTF-8 UTF-8。echo mb_detect_encoding($data[$c],'UTF-8');

echo file_get_contents("specialchars.csv");给我."Mäx";"Müstermänn"

print_r(str_getcsv(reset(explode("\n", file_get_contents("specialchars.csv"))), ';'))

给我

Array ( [0] => Mäx [1] => Müstermänn )

这是什么意思?


答案 1

试试这个:

<?php
$handle = fopen ("specialchars.csv","r");
echo '<table border="1"><tr><td>First name</td><td>Last name</td></tr><tr>';
while ($data = fgetcsv ($handle, 1000, ";")) {
        $data = array_map("utf8_encode", $data); //added
        $num = count ($data);
        for ($c=0; $c < $num; $c++) {
            // output data
            echo "<td>$data[$c]</td>";
        }
        echo "</tr><tr>";
}
?>

答案 2

遇到类似的问题:解析带有特殊字符(如é,è,ö等)的CSV文件...

以下内容对我来说工作正常:

为了在html页面上正确表示字符,需要标题:

header('Content-Type: text/html; charset=UTF-8');

为了正确解析每个字符,我使用了:

utf8_encode(fgets($file));

不要忘记在以下所有字符串操作中使用“多字节字符串函数”,例如:

mb_strtolower($value, 'UTF-8');

推荐