Java 文本分析库

2022-09-04 20:30:09

我正在寻找一个java驱动的解决方案,用于分析句子以记录关键字是正面还是负面使用。

即关键词可能是“卷心菜”和句子:

“我喜欢卷心菜,但不喜欢豌豆”

我想要一个Java文本分析器来记录这个是积极的。Lucene(Hibernate-Search)库可以用于此目的吗?

有什么想法吗?


答案 1

您正在寻找“情感分析”。一种可能性是LingPipe,他们也与竞争对手建立了联系。杰夫·道尔顿(Jeff Dalton)在他的博客中也列出了大量的自然语言处理工具。


答案 2

我怀疑有没有这样的事情。Lucene绝对不能开箱即用。

您如何以一种可以通过编程方式评估的方式定义“关键字是正面还是负面”?为了正确地做到这一点,你必须分析文本的实际含义,这是一个甚至无法远程解决的AI问题。

我想你可以通过对关键字是否更经常地接近正面(如,好,伟大,精彩)或负面(坏,讨厌,蹩脚,该死的)关键字进行统计分析来解决它,但即使在那里,否定,讽刺和复杂的句子结构也会有问题。