“-”字符的 Lucene Index 问题
我在使用Lucene索引时遇到问题,该索引包含包含“-”字符的索引单词。
它适用于一些包含“-”的单词,但不适用于所有单词,我没有找到原因,为什么它不起作用。
我正在搜索的字段经过分析,并包含带有和不带有“-”字符的单词版本。
我正在使用分析器:org.apache.lucene.analysis.standard.StandardAnalyzer
这里有一个例子:
如果我搜索“gsx-*”我得到了一个结果,索引字段包含“铃木GSX-R 1000 GSX-R1000 GSXR”
但是如果我搜索“v-*”,我没有得到任何结果。预期结果的索引字段包含:“铃木DL 1000 V-STROM DL1000V-STROM V STROM”
如果我搜索“v-strom”而不搜索“*”,它可以工作,但是如果我只是搜索“v-str”,例如,我没有得到结果。(应该有一个结果,因为它是为了实时搜索网店)
那么,2个预期结果之间有什么区别呢?为什么它适用于“gsx-”而不适用于“v-”?