转义 Java 正则表达式中的特殊字符
Java或任何开源库中是否有任何方法可以转义(不引用)特殊字符(元字符),以便将其用作正则表达式?
这在动态构建正则表达式时非常方便,而无需手动转义每个单独的字符。
例如,考虑一个简单的正则表达式,如 将数字与小数点(如 )以及以下代码匹配:\d+\.\d+
1.2
String digit = "d";
String point = ".";
String regex1 = "\\d+\\.\\d+";
String regex2 = Pattern.quote(digit + "+" + point + digit + "+");
Pattern numbers1 = Pattern.compile(regex1);
Pattern numbers2 = Pattern.compile(regex2);
System.out.println("Regex 1: " + regex1);
if (numbers1.matcher("1.2").matches()) {
System.out.println("\tMatch");
} else {
System.out.println("\tNo match");
}
System.out.println("Regex 2: " + regex2);
if (numbers2.matcher("1.2").matches()) {
System.out.println("\tMatch");
} else {
System.out.println("\tNo match");
}
毫不奇怪,上述代码生成的输出是:
Regex 1: \d+\.\d+
Match
Regex 2: \Qd+.d+\E
No match
也就是说,匹配但(“动态”构建的)不匹配(相反,它与文本字符串匹配)。regex1
1.2
regex2
d+.d+
那么,有没有一种方法可以自动转义每个正则表达式元字符?
假设有一个静态方法,则escape()
java.util.regex.Pattern
Pattern.escape('.')
将是字符串,但是"\."
Pattern.escape(',')
应该只产生,因为它不是元字符。同样地","
Pattern.escape('d')
可以产生,因为用于表示数字(尽管在这种情况下转义可能没有意义,因为可能意味着字面上的意思,这不会被正则表达式interpeter误解为其他东西,就像这种情况一样)。"\d"
'd'
'd'
'd'
'.'