Java 中的模糊字符串搜索库 [已关闭]

2022-08-31 12:47:14

我正在寻找一个用于模糊字符串搜索的高性能Java库。

有许多算法可以找到类似的字符串,Levenshtein distance,Daitch-Mokotoff Soundex,n-grams等。

存在哪些 Java 实现?他们的利弊?我知道Lucene,任何其他解决方案还是Lucene是最好的?

我发现了这些,有人有经验吗?


答案 1

Commons Lang有Levenshtein distance的实现。

Commons Codec具有soundexmetaphone的实现。


答案 2

如果你主要是比较短字符串,并且想要一些可移植和轻量级的东西,你可以使用众所周知的python算法fuzzywuzzy移植到Java

您可以在此处阅读更多相关信息


推荐