什么是 UTF-8 表示文本文件中的“行尾”

2022-09-01 12:28:00

UTF-8 中“行尾”的二进制表示是什么?


答案 1

一堆

  • LF: 换行, U+000A (UTF-8 在十六进制中: 0A)
  • VT:垂直选项卡,U+000B(UTF-8,十六进制:0B)
  • FF: 换页符,U+000C(UTF-8 在十六进制中:0C)
  • CR: 回车, U+000D (UTF-8 在十六进制中: 0D)
  • CR+LF: CR (U+000D) 后跟 LF (U+000A) (UTF-8 在十六进制中: 0D0A)
  • NEL:下一行 U+0085(十六进制的 UTF-8:C285)
  • LS:换行符,U+2028(UTF-8,十六进制:E280A8)
  • PS:段落分隔符,U+2029(十六进制的 UTF-8:E280A9)

...可能还有更多。

最常用的是(*nix),(Windows和DOS)和(大多数是旧的OSX Mac之前的Mac系统)。LFCR+LFCR


答案 2

来自 Unicode 字符“换行符 (LF)”

在 UTF-8(十六进制)中,其 --> 0x0A (0a)
UTF-8(二进制)--> 00001010

enter image description here


推荐