比较忽略重音字符的字符串

2022-09-02 05:21:37

我想知道是否有一种方法可以比较2个字符串并忽略使“noção”等于“nocao”的重音符号。它类似于 string1.methodCompareIgnoreAccent(string2);


答案 1

您可以使用java整理器来比较忽略重音的测试,请参阅一个简单的示例:

import java.text.Collator;

/**
 * @author Kennedy
 */
public class SimpleTest
{

  public static void main(String[] args)
  {
    String a = "nocao";
    String b = "noção";

    final Collator instance = Collator.getInstance();

    // This strategy mean it'll ignore the accents
    instance.setStrength(Collator.NO_DECOMPOSITION);

    // Will print 0 because its EQUAL
    System.out.println(instance.compare(a, b));
  }
}

文档:JavaDoc

我不会详细解释,因为我只使用了一点Collators,我不是这方面的专家,但你可以谷歌上有一些关于它的文章。


答案 2

没有内置的方法可以做到这一点,所以你必须构建自己的:

解决方案的一部分是从这里开始 :这首先将所有重音字符拆分为去重音字符,然后是组合变音符号。然后,您只需删除所有组合变音符号即可。另请参见 https://stackoverflow.com/a/1215117/4095834

然后你的等式方法将如下所示:

import java.text.Normalizer;
import java.text.Normalizer.Form;

public boolean equals(Object o) {
    // Code omitted
    if (yourField.equals(removeAccents(anotherField))) {
        return true;
    }
}

public static String removeAccents(String text) {
    return text == null ? null : Normalizer.normalize(text, Form.NFD)
            .replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}