ETL中导入数据源完成后,就可以对数据源中的数据进行计算列、数据过滤、数据排序、数据分组、选出字段、集合运算以及数据连接等运算了。过滤,排序,分组,集合,连接
功能介绍: 将多个表按照维进行对齐关联,这种对其方式是用户不需要关心表之间的连接关系,可以为每张表独立设定汇总维度。 语法描述: SELECT D.F, T1.f(...), T2.f(...) ON D AS A FROM T1 B连接,多表关联,多字段关联,union
功能介绍: 将多个表按照维进行对齐关联,如果没有相同的维对齐,则自动处理为交叉连接CROSS JOIN。 DQL的对齐方式使得用户不需要关心表之间的连接关系,可以为每张表独立设定汇总维度,降低问题复杂度规模,更符合自然思维。 缺省使用主键作连接,join,by
本章主要展示关于关联分组与连接的代码参考,比如按指定的分类分组、按指定的条件范围分组、范围可能重叠的条件分组、使用等值条件进行连接、按第一个表为基准作连接(左连接) 、连接不能匹配的记录(全连接)、 将多个表按某字段值相等条件对齐、非等值条关联分组,连接
描述: 连接dynamodb外部库。 语法: dyna_open(dyna_url,region) 访问本地DynamoDB。 dyna_open(,region,AccessKey,SecretKey) 访问云端DynamoDB。 备注:连接,dynamodb,游标
描述: 连接Google cloud storage服务。 语法: gcs_open(json) 备注: 外部库函数,外部库的使用请参考《外部库使用指南》。 连接gcs服务所用的json文件是注册Google账号时生成的,文件内容为连接Go连接
描述: 连接hdfs文件系统,返回连接对象hd。 语法: hdfs_open(url,user) 备注: 外部库函数,外部库的使用请参考《外部库使用指南》。 进行hadoop服务器连接,参数都省略时,需要将hadoop的配置文件放在外部库目连接,hdfs文件系统,hadoop服务器
描述: 连接influxdb数据库。 语法: influx_open(url,database,retentionPolicy, username,password) 备注: 外部库函数,外部库的使用请参考《外部库使用指南》。 连接infl连接,influxdb
描述: 连接influxdb2数据库。 语法: influx2_open(url) 备注: 外部库函数,外部库的使用请参考《外部库使用指南》。 连接influxdb2外部库,仅供InfluxDB版本为2.x时使用。 参数: url 连接地址连接,influxdb2
描述: 按位置连接多序列,返回纯序表。 语法: j(Ai:Fi,…) 备注: 将多个序列Ai,… 按照位置连接,产生以Fi,…为字段的纯序表,Fi赋值为Ai对应成员,引用原序列Ai中的记录。 注意,要求序列Ai,…的成员数(记录数)相同。 多序列,连接,位置,纯序表