词典文件设计

阅读(174) 标签: 词典, glxc,

可以使用元数据编辑设计器编辑词典文件,存为.glxc格式,还可以在元数据编辑设计器中使用元数据文件字典文件生成词典文件

在元数据编辑设计器中使用元数据文件和词典文件能进行搜索实验。还可以将词典文件和引擎一起部署在web服务器上,客户端通过输入词典中定义好的搜索词进行汉语查询,,并将查询结果展示给用户。

 

打开元数据编辑设计器,在菜单栏中点击文件>新建,创建词典文件:

 

点击确定,进入词典文件设计界面,接下来用户就可以进行词典设计了。

如下图所示,这是设计好的字典文件demo.glxc后面我们会逐步对词典文件中的配置做详细介绍。

 

词典文件设计完成后,设计器中就可以使用搜索试验功能了,输入词典中定义好的搜索词进行搜索,完成数据的查询。

下面主要对词典文件中的配置做详细介绍。

Ø  量纲

量纲是一种数值的类型,比如:长度、重量、金额等。量词顾名思义是用来表示计量单位的词,比如:公里、吨、元等。一个量纲可设定多个量词。

添加量词后,可在宏字段里直接选择想要设置的量词。在搜索实验中量词还可自动匹配字段词,系统会自动根据搜索语句中输入的量词匹配其所指向的字段词,并且将字段表达式作为条件添加至where语句中。

在量纲的设定中,包括量纲和量词。

打开数据结构tab,选中量纲

可以通过工具栏里的按钮,增删量纲。使用按钮调整量纲的顺序。

选中添加过的量纲,可通过量词栏的按钮,增删量词。使用按钮调整量词的顺序。

同一个量纲里的量词之间有系数关系,比如设置量词元的系数为1,那么量词百元的系数就为100

 

Ø 

表中的内容为可查询的逻辑数据表。

在表的设定中,包括表名、宏字段和字段簇。

打开数据结构tab,切换到表

可以通过工具栏里的按钮,增删表。使用按钮调整表的顺序。

【表名】表名对应元数据文件中DQL表的名称,不可重复。

【宏字段】使用宏字段定义功能可以减少字段词的重复定义。导入元数据时,宏字段的标识和表达式默认为 .字段

【标识】同一个表内,标识具有唯一性。

【广义字段表达式】支持本表字段、多字段组成的表达式、通过外键引用其他表字段等多种方式。同一个表内,广义字段表达式不可重复。

【数据类型】宏字段的数据类型。

【量词】下拉列表框中的量词来自量纲中的量词

【字段簇】可以将同一个表里的一些宏字段定义成一个字段簇。字段簇用于动词。

 

Ø  表词

可以为一个表词添加多个表词名称,通过表词指定表名。

 

切换到编辑tab,点击表词

可通过工具栏里的按钮,增删表词。使用按钮调整表词的顺序。

【表词名称】表名的别名。有字典时,字典中的标题对应词典中的表词名称。可设置多个,多个时以逗号分隔。

【表名】下拉列表框中的表来自数据结构tab中的,即元数据文件中DQL表的名称。

Ø  字段词

一个字段词可对应多个宏字段。

 

切换到编辑tab,点击字段词

可通过工具栏的按钮,增删字段词。使用按钮调整字段词的顺序。

选中添加过的字段词,可通过宏字段栏的按钮,增删宏字段。使用按钮调整宏字段的顺序。

【字段词】可以为一个字段词添加多个字段词名称。有字典时,字典中字段项里的名称对应词典中的字段词名称。可设置多个,多个时以逗号分隔。

【宏字段】下拉列表框中的宏字段标识对应数据结构tab=>=>宏字段的标识。

Ø 

切换到编辑tab,点击维词

可通过工具栏的按钮,增删维词。使用按钮调整维词的顺序。

选中添加过的维词,可通过常数词栏的按钮,增删常数词。使用按钮调整常数词的顺序。

【维词】维词对应元数据文件中的维,一个维词可添加多个维词名称,多个时以逗号分隔。

【常数词】常数词对应维词。真实值缺省为常数词本身,用于关系比较时的实际取值。真实值的取值可以是值、序列或者表达式,值为表达式时需勾选“值是表达式类型”,值为字符串时需使用双引号。

使用批量增加常数词,可通过执行SPL一次性添加多个常数词。

 

Ø  比较词

通过比较词设定表达式的比较关系,可以准确定位快速搜索出符合条件的记录。比较词中包含的关系选项有等于、不等于、大于、小于等。

 

切换到编辑tab,点击比较词

可通过工具栏的按钮,增删比较词。使用按钮调整比较词的顺序。

Ø  排序词

为了将搜索内容有序的显示,产品提供了排序词,用户可通过添加排序词对选出字段进行升序或降序,从而可以更直观的查看搜索数据,排序词必须放在字段词的右边,可对多个词进行排序。

 

切换到编辑tab,点击排序词

可通过工具栏的按钮,增删排序词。使用按钮调整排序词的顺序。

选出指定数量的数据时,需勾选选出排序词。比如:订单金额前5

Ø  动词

可使用动词定义一些具有动作的词语,动词必须有参数。比如:生于、入学等。

 

切换到编辑tab,点击动词

可通过工具栏的按钮,增删动词。使用按钮调整动词的顺序。

Ø  聚合词

聚合词,定义聚集方式的词,将字段进行特殊方式的关联,通过使用该聚合词的聚集方法将查询字段进行求和、计数、平均、最大、最小等操作。可手动选择聚合词在搜索语句中的位置。

 

切换到编辑tab,点击聚合词

可通过工具栏的按钮,增删聚合词。使用按钮调整聚合词的顺序。

【聚集方法】:将当前字段词默认按所选的聚合方式进行聚合。搜索短语不包含维词时则按当前表进行聚集,否则按维词进行分组聚集。

 

Ø  连词

连词是在句子中用来连接词与词、短语与短语或句子与句子的词,不能单独作句子成分,只能起连接作用。连词包括和、或。

 

切换到编辑tab,点击连词

可通过工具栏的按钮,增删连词。使用按钮调整连词的顺序。

 

Ø  宏词

程序发现宏词后会自动替换成定义好的串,再重新解析搜索语句。使用宏词可以提高搜索语句的通用性和易读性,且便于修改。

 

切换到编辑tab,点击宏词

可通过工具栏的按钮,增删宏词。使用按钮调整宏词的顺序。

 

Ø  无效词

为了使得查询词更易读,同时又不会产生错误的结果,在词典中可以设定无效词,无效词在搜索语句中会被忽略。

 

切换到编辑tab,点击无效词

可通过工具栏的按钮,增删无效词。使用按钮调整无效词的顺序。

Ø  导入元数据

词典文件中的内容除了通过菜单逐个添加,还可以直接导入元数据,将元数据中的表、字段和维全部导入到词典中。

导入方法如下所示:

在菜单中执行工具>导入元数据,选择元数据文件,字典文件为可选。

加载并更新词典】加载表、字段和维,并更新词典文件。

删除不在元数据中的内容】删除典中已存在而元数据中不存在的表、字段项和维。

仅加载(辅助编辑)】便于辅助编辑。加载表、字段和维,不更新词典文件。

 

没有字典文件时,导入后,各个表词、字段词、维词的名称默认与其在元数据中定义的名称相同;有字典文件导入后,各个表词、字段词、维词的名称与其在字典中定义的名称相同,字段词名称重复时系统自动合并宏字段

例如导入示例文件demo.glmd,导入后的典文件结构如下: