HTTP 标头中的非法字符

2022-09-02 10:25:41

我正在创建一个,需要设置多个自定义标头。HttpUrlConnection

我想按照下面的思路做一些事情,但是标题映射的内容需要来自单个字符串。是否有任何字符是非法的或很少在 HTTP 标头名称和 HTTP 标头值中使用?

HashMap<String, String> headers = new HashMap<String, String>();

// TODO: How can I fill the headers map reliably from a single string?

HttpURLConnection c = (HttpURLConnection) url.openConnection();
for(Map.Entry<String, String> e : headers.entrySet())
    c.setRequestProperty(e.getKey(), e.getValue());

目前的解决方案

似乎任何HTTP标头名称都不包含任何空格(通常使用破折号代替?),因此我可以使用单个空格将名称与值分开。至于名称 - 值集,似乎我搞砸了,因为根据给定的答案,该值几乎可以包含任何内容。所以我刚刚选择了一个我很确定永远不会被使用的角色:.如果事实证明它确实需要,我只需要调整我的代码:p§

Header1 Value1§Header2 Value2§Header3 Header3

答案 1

RFC7230 的相关 BNF 是:

field-name = token

token = 1*tchar

tchar = "!" / "#" / "$" / "%" / "&" / "'" / "*" / "+" / "-" / 
        "." / "^" / "_" / "`" / "|" / "~" / DIGIT / ALPHA

字符集是可见的 USASCII。

RFC 7230 比你的问题更新,但在相关细节中,它不会改变 RFC 2616 以前所说的内容。

字段名称有一个非常强大的约定,它比RFC允许的限制性要强得多,并且在各种实现中不同程度地强制执行。字段名称通常遵循 [ASCII / NUMERAL] 单词序列的模式,每个单词的第一个字母(仅)大写。单词用单个连字符分隔。

因此,例如“HttpUrlConnection”应该是一个HTTP Header名称(而不是java令牌),你可以称之为“Http-Url-Connection”。

我依稀记得有一次跟踪一个错误,直到某个实现足够严格,以至于不允许在一个单词中使用多个大写字母(这恰好是一个首字母缩略词)。也就是说,非常严格地遵循这种更受限制的格式是值得的。

  • 非 ASCII 字符集在字段名称中不起作用,尽管它们可以在字段值中使用。

  • 标准不支持在字段名称中转义。值转义不是 HTTP 或 MIME 标准关注的问题,但您可以选择重用标准 URL 编码方法来对一组名称值对进行编码。


答案 2

推荐