手机版

TrieTree服务-组件组成和功能介绍

时间:2021-10-06 来源:互联网 编辑:宝哥软件园 浏览:

在前一篇文章中,我们对TrieTree服务有了一个整体的了解。我不知道你下载后是否真的玩过TrieTree服务。如果你还没玩过,没关系。本文将逐步教您配置和使用TrieTree服务。TrieTree服务由几个组件组成,如下图所示image

字典组件是核心库,主要提供基础数据定义、配置信息定义和数据结构表示,还提供POSType(参考盘古《词性定义》)。由于TrieTree使用内存加载数据,这个组件的设计直接决定了内存占用大小和数据查询性能。字典。Providers组件主要负责提供各种定制的数据提供者,你可以理解为字典数据的加载者。例如,独立的盘古字典提供程序负责加载字典格式的盘古字典。TrieTree服务的加载器是高度可配置的,可以通过配置文件选择需要使用的加载器,如下所示:复制代码如下:dictionary服务提供者名称=' Pangu _ dict ' uri=' f : \ Dropbox \ research \ NLP \ trie tree service \ dictionary ServiCe。UnitTest \ Data \ pangudict . DCT ' type='蓝图。字典. Providers.PanguDictProvider,蓝图。dictionary . Providers/' Providers name=' IKdict ' uri=' f : \ Dropbox \ research \ NLP \ TrietreeServiCe \ dictionary ServiCe。UnitTest \ Data \ Ik dict . dict ' type=' bluetooth . dictionary . providers . txt file提供程序,bluetooth . dictionary . providers '//dictionary服务,为此配置选择了两个加载程序。它们是PanguDictProvider和TxtFileProvider(纯文本格式加载器,可以理解为。csv字典加载器),其中TxtFileProvider用于加载IKAnalyzer中的IKdict.dic文件。服务启动后(调试模式),您将看到类似的提示:image

TrieTree使用log4net的ColoredConsoleAppender,因此可以显示不同颜色的提示信息。您可以在日志中看到pangu_dict和IKdict的加载时间,这里的名称是由app.config中提供者的name属性设置的.实际上,TrieTree也支持加载基于MongoDB的字典,但本文不会对其进行解释,因为它涉及到相对复杂的MongoDB配置和一些概念,我会考虑在下面的教程中提供。DictionaryService组件是TrieTree服务的容器组件,主要包括Windows服务的实现和Windows服务的安装程序。这个组件是一个控制台程序,为用户提供两种运行模式:——调试模式和Service模式。调试方式是直接运行控制台,基于log4net提供日志信息,方便调试和断点;服务模式是Windows服务,主要用于测试和生产环境。由于它是一个控制台程序,切换模式是通过参数完成的,例如,-i表示安装windows服务,-u表示卸载windows服务,-c表示启动控制台模式。这是TrieTree服务的三个核心组件,但是我还打算引入一个非常实用的附加组件,DictionaryQuery。image

虽然它的名字也叫查询分析器,但是和SQL查询分析器不是一个级别的,所以不用对比,没有任何意义。它有两个主要功能。首先,它测试TrieTree服务的操作。第二,加载词典后检查词典中单词的状态。也可以用右边的POS过滤器进行过滤,多选表示或的关系。比如选择一个地名和一个人名,搜索“上海”,结果是“上海,频率:251,类型:地名(A_NS)”。如果找不到,会显示红色“找不到合适的词”,如下图。image

也可以选择匹配方式,即最大正向匹配、最大反向匹配、完全匹配,这个我就不用多解释了。是的,在运行这个东西之前必须打开字典服务,你应该指向你配置的TrieTree服务的端口,默认是7010。图中配置了dict://127.0.0.1:7010。请注意,字典服务的URI以dict3360//开头。

版权声明:TrieTree服务-组件组成和功能介绍是由宝哥软件园云端程序自动收集整理而来。如果本文侵犯了你的权益,请联系本站底部QQ或者邮箱删除。