比较忽略重音字符的字符串
2022-09-02 05:21:37
我想知道是否有一种方法可以比较2个字符串并忽略使“noção”等于“nocao”的重音符号。它类似于 string1.methodCompareIgnoreAccent(string2);
我想知道是否有一种方法可以比较2个字符串并忽略使“noção”等于“nocao”的重音符号。它类似于 string1.methodCompareIgnoreAccent(string2);
您可以使用java整理器来比较忽略重音的测试,请参阅一个简单的示例:
import java.text.Collator;
/**
* @author Kennedy
*/
public class SimpleTest
{
public static void main(String[] args)
{
String a = "nocao";
String b = "noção";
final Collator instance = Collator.getInstance();
// This strategy mean it'll ignore the accents
instance.setStrength(Collator.NO_DECOMPOSITION);
// Will print 0 because its EQUAL
System.out.println(instance.compare(a, b));
}
}
文档:JavaDoc
我不会详细解释,因为我只使用了一点Collators,我不是这方面的专家,但你可以谷歌上有一些关于它的文章。
没有内置的方法可以做到这一点,所以你必须构建自己的:
解决方案的一部分是从这里开始 :这首先将所有重音字符拆分为去重音字符,然后是组合变音符号。然后,您只需删除所有组合变音符号即可。另请参见 https://stackoverflow.com/a/1215117/4095834
然后你的等式方法将如下所示:
import java.text.Normalizer;
import java.text.Normalizer.Form;
public boolean equals(Object o) {
// Code omitted
if (yourField.equals(removeAccents(anotherField))) {
return true;
}
}
public static String removeAccents(String text) {
return text == null ? null : Normalizer.normalize(text, Form.NFD)
.replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}