如何在OpenNLP中创建一个好的NER训练模型?
我刚刚开始使用OpenNLP。我需要创建一个简单的训练模型来识别名称实体。
阅读此处的文档 https://opennlp.apache.org/docs/1.8.0/apidocs/opennlp-tools/opennlp/tools/namefind 我看到这个简单的文本来训练模型:
<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
Mr . <START:person> Vinken <END> is chairman of Elsevier N.V. , the Dutch publishing group .
<START:person> Rudolph Agnew <END> , 55 years old and former chairman of Consolidated Gold Fields PLC ,
was named a director of this British industrial conglomerate .
问题有两个:
-
为什么我必须将人名放在文本(短语)上下文中?为什么不为每行写一个人的名字呢?喜欢:
<START:person> Robert <END> <START:person> Maria <END> <START:person> John <END>
如何向该名称添加额外信息?例如,我想保存每个名字的男性/女性信息。
(我知道有些系统试图理解它阅读最后一个字母,比如女性的“a”等,但我想自己添加它)
谢谢。