印度语言的语音搜索
我想在我的Android应用程序中按语音比较字符串。但这里的特例是,我想比较一下用英语写的印度语单词。例如,我想检查“Edhu”,“Adhu”,“Yethu”在语音上是否相等,它们在泰米尔语中的含义都是一样的。但是使用英语脚本编写印度语言的人使用不同的拼写来制作单词。在这种情况下,我如何比较单词?
我尝试了Levenshtein。但我不确定如何将它返回的数字转换为相等。
我尝试了Soundex,当单词的第一个字母更改时,Soundex代码是不一样的。但它能够找出类似的声音部分。我不明白它是如何工作的。
soundex.encode("Yethu") (soundex.encode("Edhu")) (soundex.encode("adhu"))
Y300 E300 A300