如何检测用户输入文本的语言?[已关闭]

2022-09-01 01:33:57

我正在处理一个应用程序,该应用程序正在接受不同语言的用户输入(目前已修复3种语言)。要求是用户可以输入文本,而不必费心通过UI中提供的复选框选择语言。

是否有现有的 Java 库来检测文本的语言?

我想要这样的东西:

text = "To be or not to be thats the question."

// returns ISO 639 Alpha-2 code
language = detect(text);

print(language);

结果:

EN

我不想知道如何自己创建语言检测器(我见过很多博客试图做到这一点)。该库应提供简单的 APi,并且还完全脱机工作。开源或商业封闭并不重要。

我还在SO上发现了这个问题(还有更多):

如何检测语言
如何检测文本的语言?


答案 1

此 Java 语言检测库应为 53 种语言提供超过 99% 的准确率。

或者,还有Apache Tika,这是一个用于内容分析的库,提供的不仅仅是语言检测。


答案 2

推荐