我应该使用 Unicode 符号的哪个子集来标记文本中的特殊子字符串?

2022-09-03 07:28:23

我们的应用程序发送,然后应将其本地化为 。有时这些是,有时只是,所以我们必须标记它们。如果它只使用Unicode,那将是最好的,因为它不需要任何协议更改。stringsclient sidewhole stringssubstring

例:

"Length: (mark)10(mark)"

其中 10 是以厘米为单位的长度,但应将其转换为英寸或毫米。
Unicode 特殊字符是否是在文本中标记此类特殊子字符串的正确选择?(0xFFF0-0xFFFF)


答案 1

不可以,特殊代码块中的代码点有其自己的用途。将它们用于其他目的可能会导致意外效果。即使您自己编写了所有处理代码,传入的数据也可能包含这些代码点。当然,可以检测到它们并将它们过滤掉,但最好使用不能与任何分配的代码点冲突的代码点。

使用 U+FDD0 范围内的码位。U+FDEF.它们被指定为“非字符”,旨在用于应用程序内部。请参阅 Unicode FAQ 部分 Private-Use Character, Noncharacters & Sentinels FAQ


答案 2

推荐