字段簇

阅读(6) 标签: 字段簇, 标记字段, 簇词,

在同一个表中,可能会有多个宏字段共同描述一个概念,可以将它们组合起来,标记为字段簇。可以在宏字段下方区域中定义字段簇,如:

在定义字段簇时,右侧的标记字段,用来表示当前字段簇的最关键信息。

 

字段簇可以将宏字段分为若干组,在查询时更有效地判断。各个字段簇中的宏字段尽量不要多选,以防止查询时出现歧义。

在口语化的语句,并不一定使用字段词以及它的值这样的名词式查询,还可能会使用动词描述。举个例子,“出生日期是1990年”也可能被描述为“生于1990年”或者“1990年出生”这样的方式。有了字段簇定义,就可以通过定义簇词与字段簇的关联,解决这样的问题。选择字段簇右侧的簇词选项卡,可以定义簇词,如:

与字段词类似,可以同时定义多个簇词,其间用逗号分隔。此时可以在查询语句中使用这种动词类型的簇词了,如:

在这里,将“入职”左侧的条件“2010年之前”作为“左簇”与字段簇“入职”匹配查询。在上面的簇词定义中,“入职”也可能会作为“右簇”使用,如:

这里出现了两个搜索结果,前一个是将“入职”识别为3号簇词,并认为未设左簇,这个并不是我们想要的结果,而下面的结果则将其右侧的条件“超过10年”作为“右簇”与字段簇“入职”匹配查询,此时能够匹配的是字段簇中的“雇用年数”这个宏字段,执行MQL后,结果如下:

因此,在定义簇词时,如非必需,应该避免重名,以避免冗余结果。

为了更多地了解字段簇与簇词,现在把元数据中的各个表全部导入到汉语查询的词典中,并按需要修改宏字段的字段词:

可以看到,订单表ORDERS中,存在很多的“城市”“日期”这样的数据,此时,定义字段簇会更为必要:

通过定义簇词设置查询时动词与字段簇的相关性:

可以看到,类似“发往”这样的簇词,会同时和左簇和右簇匹配,如“A发往B”,A有可能表示发货地或发货时间,B也有可能表示收货地或客户。通过定义字段簇和簇词,都可以完成查询,如: