gate annie使用中文教程ANNIE是Gate中用于英文信息抽取的插件,可以实现英文中的诸如命名实体识别等任务。今天给大家分享一下gate annie使用中文教程。
工具/原料
无
方法/步骤
2
Gate需要一个索引文件确定词表文件以及类别之间的对应关系,一般为lists.def,内容形如图所示。
3
其中airports.lst为词表文件,location是为词表指定的主要类型,airport为指定的次要类型。这些词表会编译成有限状态机,用于后续过程调用。
4
语法规则指定需要识别的特定类型,以jape为后缀的文件均是存放的语法规则,放置目录为ANNIE\resource\NE,可以根据自己的需要进行扩展。
5
main.jape存放着所需要的所有规则文件名称。
6
具体的代码和执行过程与前一篇中的内容一致,主要区别在于加载ANNIE。
注意事项
经验仅供参考!