jQuery技巧不编码引号,在IE中它会剥离你的空格。
基于Django中的转义模板标签,我想它已经被大量使用/测试过,我制作了这个函数,它可以做需要的事情。
它可以说比任何针对空格剥离问题的解决方法更简单(并且可能更快) - 并且它对引号进行编码,例如,如果要在属性值中使用结果,这是必不可少的。
function htmlEscape(str) {
return str
.replace(/&/g, '&')
.replace(/"/g, '"')
.replace(/'/g, ''')
.replace(/</g, '<')
.replace(/>/g, '>');
}
// I needed the opposite function today, so adding here too:
function htmlUnescape(str){
return str
.replace(/"/g, '"')
.replace(/'/g, "'")
.replace(/</g, '<')
.replace(/>/g, '>')
.replace(/&/g, '&');
}
更新 2013-06-17:
在搜索最快的转义时,我发现了一个方法的实现:
http://dumpsite.com/forum/index.php?topic=4.msg29#msg29
(此处也引用:替换字符串中字符的所有实例的最快方法)
此处的一些性能结果:
http://jsperf.com/htmlencoderegex/25replaceAll
它为上面的内置链提供相同的结果字符串。如果有人能解释为什么它更快,我会很高兴!?replace
2015-03-04更新:
我刚刚注意到AngularJS正在使用上述方法:
https://github.com/angular/angular.js/blob/v1.3.14/src/ngSanitize/sanitize.js#L435
他们添加了一些改进 - 他们似乎正在处理一个晦涩难懂的Unicode问题,以及将所有非字母数字字符转换为实体。我的印象是,只要您为文档指定了 UTF8 字符集,后者就没有必要。
我会注意到(4年后)Django仍然没有做这些事情,所以我不确定它们有多重要:
https://github.com/django/django/blob/1.8b1/django/utils/html.py#L44
2016-04-06更新:
您可能还希望转义正斜杠。对于正确的 HTML 编码,这不是必需的,但是 OWASP 建议将其作为反 XSS 安全措施。(感谢@JNF在评论中提出这一建议)/
.replace(/\//g, '/');