stemming
-
产生真实单词的词干算法 我需要取一段文字并从中提取一个“标签”列表。其中大部分都是直截了当的。但是,我现在需要一些帮助来阻止生成的单词列表以避免重复。示例:社区/社区 我使用了Porter Stemmer算法的实现
-
用于从输入文本中提取关键字的 Java 库 [已关闭]数据模型公用事业核心例下一步是什么 我正在寻找一个Java库来从文本块中提取关键字。 该过程应如下所示: 停止单词清理 - >词干 - >根据英语语言学统计信息搜索关键字 - 这意味着如果一个单词在文本中出现
-
用 Lucene 对英语单词进行词干分解 我正在Java应用程序中处理一些英语文本,我需要阻止它们。例如,从文本“设施/便利设施”中,我需要得到“amenit”。 该函数如下所示: 我发现了Lucene分析仪,但它看起来太复杂了,无法
-
分词器,停止词删除,Java中的词干 我正在寻找一个类或方法,该类或方法需要一长串许多100个单词并进行标记化,删除非索引词和词干以在IR系统中使用。 例如: “大肥猫,对袋鼠说'你认识的最有趣的家伙'......” 分词器
标签