Uint8Array to string in Javascript

2022-08-30 01:10:21

我有一些UTF-8编码的数据生活在Javascript的Uint8Array元素中。有没有一种有效的方法将这些解码为常规的javascript字符串(我相信Javascript使用16位Unicode)?我不想在当时添加一个字符,因为字符串的干扰会变成CPU密集型的。


答案 1

TextEncoder和来自编码标准,由字符串编码库多边填充,在字符串和 ArrayBuffers 之间转换:TextDecoder

var uint8array = new TextEncoder().encode("¢");
var string = new TextDecoder().decode(uint8array);

答案 2

这应该有效:

// http://www.onicos.com/staff/iz/amuse/javascript/expert/utf.txt

/* utf.js - UTF-8 <=> UTF-16 convertion
 *
 * Copyright (C) 1999 Masanao Izumo <iz@onicos.co.jp>
 * Version: 1.0
 * LastModified: Dec 25 1999
 * This library is free.  You can redistribute it and/or modify it.
 */

function Utf8ArrayToStr(array) {
    var out, i, len, c;
    var char2, char3;

    out = "";
    len = array.length;
    i = 0;
    while(i < len) {
    c = array[i++];
    switch(c >> 4)
    { 
      case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:
        // 0xxxxxxx
        out += String.fromCharCode(c);
        break;
      case 12: case 13:
        // 110x xxxx   10xx xxxx
        char2 = array[i++];
        out += String.fromCharCode(((c & 0x1F) << 6) | (char2 & 0x3F));
        break;
      case 14:
        // 1110 xxxx  10xx xxxx  10xx xxxx
        char2 = array[i++];
        char3 = array[i++];
        out += String.fromCharCode(((c & 0x0F) << 12) |
                       ((char2 & 0x3F) << 6) |
                       ((char3 & 0x3F) << 0));
        break;
    }
    }

    return out;
}

它比其他解决方案更干净,因为它不使用任何黑客,也不依赖于浏览器JS功能,例如,在其他JS环境中也可以工作。

查看 JSFiddle 演示

另请参阅相关问题:此处此处