从字符串中删除所有不在白名单上的字符

2022-09-04 00:46:35

我正在尝试编写java代码,该代码将删除所有不需要的字符,并只允许列入白名单的字符。

例:

String[] whitelist = {"a", "b", "c"..."z", "0"..."9", "[", "]",...}

我只想要有字母(小写和大写)和数字+一些我要添加的下一个字符。然后,我会为字符串中的每个字符开始循环,如果它不在白名单上,则将其替换为空字符串。for()

但这不是很好的解决方案。也许可以使用模式(正则表达式)以某种方式完成?谢谢。


答案 1

是的,您可以使用String.replaceAll,它采用正则表达式:

String input = "BAD good {} []";
String output = input.replaceAll("[^a-z0-9\\[\\]]", "");
System.out.println(output); // good[]

或者在番石榴中,你可以使用CharMatcher

CharMatcher matcher = CharMatcher.inRange('a', 'z')
                          .or(CharMatcher.inRange('0', '9'))
                          .or(CharMatcher.anyOf("[]"));
String input = "BAD good {} []";
String output = matcher.retainFrom(input);

这只显示了小写版本,使其更易于演示。要包含大写字母,请在正则表达式(以及所需的任何其他符号)中使用 - 并且您可以使用 ."[^A-Za-z0-9\\[\\]]"CharMatcherorCharMatcher.inRange('A', 'Z')


答案 2

您可以尝试匹配白名单中未包含的所有内容,并将其替换为空字符串:

String in = "asng $%& 123";
//this assumes your whitelist contains word characters and whitespaces, adapt as needed
System.out.println(in.replaceAll( "[^\\w\\s]+", "" ));