用于 Java 的命名实体识别库 [已关闭]
2022-09-01 16:09:31
我正在寻找一个简单但“足够好”的Java命名实体识别库(和字典),我希望处理电子邮件和文档并提取一些“基本信息”,例如:名称,地点,地址和日期
我一直在四处寻找,大多数似乎都是沉重的一面和完整的NLP项目。
有什么建议吗?
我正在寻找一个简单但“足够好”的Java命名实体识别库(和字典),我希望处理电子邮件和文档并提取一些“基本信息”,例如:名称,地点,地址和日期
我一直在四处寻找,大多数似乎都是沉重的一面和完整的NLP项目。
有什么建议吗?
你可能想看看我之前对类似问题的答案之一。
除此之外,大多数较轻的NER系统在很大程度上取决于所使用的领域。例如,你会发现很多关于生物医学NER系统的工具和论文。除了我之前的文章(如果你想做NER,它已经包含了我的主要建议),这里有一些你可能想要研究的工具:
另外一点要说的是:如果没有输入上的标记化,您将无法逃脱。自然语言的标记化有点不平凡,这就是为什么我建议你使用一个为你做这两件事的工具箱。