文档总览
数据类型
操作符
数学
字符串
日期时间
序列
序表
循环函数
关联运算
文件
数据库
游标
程序语句
系统与接口
集群
图形
外部库

阿里云

Avro

Cassandra

Cdc

多维数据库

Dynamodb

ElasticSearch

Financial

Ftp

Gcs

Hbase

Hdfs

Hive

Influxdb

Informix

Kafka

Math

Mongo

Oss

R2dbc

Redis

Report5

ReportLite

S3

Salesforce

Sap

Spark

Was

Webcrawl

Webservice

Ymodel

Zip
组表
远程服务
简单 SQL
Function

#arg

#@

#c

$( d)dql...

$(db)sql;…

${macroExp}

=expression

>statement

[a:b]

@

@x:…

~(i)

A()

A. (x,…)

[a1,…,an]

abs()

acos()

acosh ()

aes()

age()

align()

ali_ open ()

ali_close()

ali_query()

alter()

and ()

append()

argpost

arguments (spl)

array()

asc ()

asin()

asinh()

atan()

atanh()

attach()

avg()

base64 ()

between()

bi()

bits()

bit1(x)

bit1(x,y)

blob ()

bool ()

break {a}

C

Cr()

calc()

call()

call path/spl( … )

calls path/spl( … )

callx()

cand()

canvas()

case()

cdc_collect()

cdc_merge()

ceil()

cellname()

cgroups()

ch. ()

channel()

char()

chardetect()

charencode()

chi_p ()

chi2inv()

chn()

clear()

clipboard ()

close()

cmp()

cmps ()

cor ()

comabs ()

comangle ()

combin()

comconj ()

comexp ()

comimage()

commit()

compair ()

complex()

comreal ()

comsign ()

comstr ()

comunwrap ()

concat()

conj()

connect()

contain()

corskew()

cos()

cosh()

count ()

cov()

covm()

create()

cs.(x)

cuboid()

cum()

cumulate()

cursor()

date()

datederive()

dateinterval()

datetime()

day()

days()

decimal()

delete()

deq()

des ()

desede ()

derive()

det()

diff( )

digits()

directory()

dis()

dism()

dql()

dup()

dynadb.close()

dynadb.execute ()

dyna_open()

dynadb.query()

dynadb.table ()

E()

E()

elapse()

elasticnet()

end s

enum()

env()

eq()

error()

eval()

es_close ()

es_delete ()

es_export ()

es_head ()

es_open ()

es_get ()

es_post ()

es_put ()

exec()

execute()

exists()

exp()

export()

exportavro ()

eye()

f@o(…)

Faccrint()

Faccrintm()

fact()

false

Fcoupcd()

Fcoups()

Fdb()

Fddb()

Fdisc()

Fduration()

fetch()

field()

file()

filename ()

fill()

fillcons ()

fillfun ()

fillmthd()

find()

Fintrate()

finv()

Firr()

fisher_p()

fjoin()

float()

floor()

Fmirr()

fname()

fno()

Fnper ()

Fnpv()

for

fork

format()

Fpmt()

Fprice()

Frate()

Freceived()

freq ()

Fsln()

Fsyd()

ftp_cd()

ftp_open()

ftp_close()

ftp_dir()

ftp_get()

ftp_mget()

ftp_mput()

ftp_put()

func()

Fv()

Fvdb()

Fyield()

get()

gcd()

gcs_ bucket ()

gcs_ close ()

gcs_ copy ()

gcs_ file ()

gcs_ list ()

gcs_ open ()

goto C

group()

groupc()

groupi()

groupn()

groups()

groupx()

gzip ()

hash ()

hbase_close()

hbase_cmp()

hbase_filter()

hbase_filterlist()

hbase_get()

hbase_open()

hbase_rest()

hbase_scan()

hdfs_open()

hdfs_close()

hdfs_dir()

hdfs_download()

hdfs_exists()

hdfs_file()

hdfs_upload()

hdfs_write ()

hive_open ()

hive_close()

hive_cursor()

hive_db ()

hive_execute ()

hive_query()

hive_table ()

hosts()

hour()

htmlparse ()

httpfile()

httpupload()

I ()

i()

icursor()

icount ()

id()

if

if()

ifa()

ifdate()

ifind()

ifn()

ifnumber()

ifpure()

ifr()

ifstring()

ift()

iftime()

ifv()

ifx_close()

ifx_conn()

ifx_cursor()

ifx_listfrag()

ifx_savefrag()

ifx_setfrag()

ifx_takefrag()

import()

importavro ()

impute()

index()

inf()

influx_close ()

influx_insert ()

influx_open ()

influx_query ()

influx2_close()

influx2_delete()

influx2_open()

influx2_query()

influx2_rest()

insert()

int()

interval()

inv()

inverse()

invoke()

isalpha ()

isdigit()

isect()

iselect()

islower()

ismiss ()

ismissm ()

isolate()

isupper()

iterate()

j()

join()

joinx()

json()

jvm()

k()

kafka_close()

kafka_commit()

kafka_offset ()

kafka_open()

kafka_poll()

kafka_send ()

key()

keys()

kmeans()

lasso ()

lcm ()

left()

len()

lg()

like()

linefit()

lineplan ()

ln()

load()

lock()

long()

lower()

m()

mae()

makimamthd()

max()

maxp()

mcumsum()

md5()

median()

memory()

merge()

mergex()

mfind()

mi()

mid()

millisecond()

min()

minp()

minute()

mmean()

mnorm()

mode()

modify()

mongo_close()

mongo_open ()

mongo_shell()

month()

movefile()

movmthd ()

mul()

mse()

mstd()

msum()

mvp()

n.f(x)

name()

new()

news()

next {a}

nodes()

norm()

norminv()

not ()

now()

ntile()

null

number()

numnorm()

nvl()

o()

olap_close()

olap_open ()

olap_query ()

ones()

open()

or()

orc()

oss_ bucket ()

oss_ close ()

oss_ copy ()

oss_ file ()

oss_ list ()

oss_ open ()

output()

p()

pad()

parallel()

parquet()

parse()

paste ()

pca ()

pchipmthd ()

pdate()

pearson ()

penum()

periods()

permut()

pfind()

pi()

pivot()

pjoin()

pls()

pmax()

pmin()

polyfit()

pos()

power()

prior()

proc()

product()

proportion()

property()

pseg()

pselect()

pseudo()

psort()

ptop()

push()

Qconnect()

Qdirectory ()

Qenv()

Qfile()

Qload()

Qlock()

Qmove()

query()

r(T,F)

r.(x,…)

r.F

r.F=x

r2dbc_close()

r2dbc_exec()

r2dbc_open()

r2dbc_query()

rand ()

rands()

range()

rank()

ranki()

rankm ()

ranks()

read()

record()

redis_close ()

redis_command()

redis_open ()

regex()

register()

remainder()

rename()

replace ()

report_config()

report_export()

report_export()

report_insert()

report_open()

report_open()

report_replace()

report_run()

report_write()

reportlite_config()

reportlite_export()

reportlite_export()

reportlite_insert()

reportlite_open()

reportlite_open()

reportlite_replace()

reportlite_run()

reportlite_write()

reset()

result

return xi

rgb()

ridge()

right()

rmmiss ()

rmmissdim ()

rollback()

round()

row()

rsa ()

run()

rvs()

s3_ bucket ()

s3_ close ()

s3_ copy ()

s3_ file ()

s3_ list ()

s3_ open ()

sap_client()

sap_close()

sap_cursor()

sap_execute()

sap_getparam()

sap_table()

savepoint()

sbs()

scriptsave()

se()

second()

segp()

select()

seq()

sert()

setenum()

sf_close()

sf_open ()

sf_query ()

sf_wsdlclose ()

sf_wsdlopen ()

sf_wsdlquery ()

sf_wsdlview ()

sg ()

shift()

sign()

sin()

sinh()

size()

skew ()

skip()

sleep()

smooth()

sort()

sortx()

spark_hudi ()

spark_ open()

spark_close()

spark_query()

spark_read()

spark_shell ()

spearman ()

splinemthd ()

split()

splserver ()

sqlparse()

sqltranslate ()

substr ()

stax_close()

stax_open()

stax_cursor()

stax_query()

sqrt()

step()

string()

structure

sum()

svm()

swap()

switch()

syncfile(hs,p)

system()

T()

tarcorskew()

tan()

tanh()

time()

tinv()

to()

top()

total()

transpose()

trim()

true

try

ttest_p ()

typeof(x)

union( )

update()

upper ()

urlencode()

uuid()

v()

var()

was_ bucket ()

was_ close ()

was_ copy ()

was_ file ()

was_ list ()

was_ open ()

web_crawl()

webhdfs()

webhdfs_file()

words()

workday()

workdays()

write()

ws_call()

ws_client()

xjoin()

xjoinx()

xlscell()

xlsclose()

xlsexport ()

xlsimport ()

xlsmove()

xlsopen()

xlswrite()

xml()

xor()

xunion( )

year()

ym2_close ()

ym2_env ()

ym2_mcfload ()

ym2_model ()

ym2_pcfload ()

ym2_pcfsave ()

ym2_predict()

ym2_result()

zeros()

zip()

zip_add()

zip_close()

zip_compress()

zip_del()

zip_encrypt()

zip_extract()

zip_open()

交列

关系运算

十六进制长整数

取余求整

和列

四则运算

复合赋值

字符串

字符串拼接

对位运算

差列

并列

序列乘

序表常数

记录常数

异或列

循环函数中的表达式书写规则

批运算

标识符

相反数

空列

赋值

赋值计算

转义符

逻辑运算

长整数

单元格类型

代码块类型

代码注释
图元

G.draw()

G.hlink ()

G.plot ()

图元参数

前一篇 | 后一篇

groups()

阅读（2867）点赞（0）标签: groups,

本章介绍groups()函数的多种用法。

A.groups()

描述：

采用累计方式对序表分组聚合。

语法：

A.groups(x:F,…;y:G,…)

备注：

将序表A按照表达式x分组聚合后，形成以F,... G,…为字段的新序表。对A的成员遍历，依次向对应结果集累计，相比先分组再聚合的方式，即函数A.group(x:F,…;y:G,…)，性能更优。

选项：

@o	只和相邻对比，相当于归并，结果集不再排序。
@n	x取值为分组序号，可直接定位，与@o互斥。
@u	结果集不再按x排序；与@o/@n互斥。
@i	x是布尔表达式，如果x的结果为true则开始新的一组。此时只有一个x。
@m	数据量大的复杂运算中，并行计算提升性能，计算次序不确定，与@o/@i互斥。
@0	丢弃x的计算结果为空的组。
@h	用于分段有序的数据，可提高分组效率。
@t	当A的返回值为空，则返回一个保留数据结构的空序表。
@z(…;…)	并行计算时按分组拆分，多线程共享结果集。
@e	返回y的结果组成的序表。其中x为A的字段名，y是A的函数，y的计算结果要求是A的一条记录，当y是聚合函数时仅支持maxp/minp/top@1。

参数：

A	序列。
x	分组表达式。
F	结果序表的字段名。
G	结果序表中的汇总字段名。
y	y是A的函数。当y为聚合函数时:仅支持sum/count/max/min/top/avg/iterate/icount/median/maxp/minp/concat /var ，使用iterate(x,a;G_i,…)时不能有参数Gi。当y为非聚合函数时:只对每组第1条计算。

返回值：

分组后的序表

示例：

	A
1	*=demo.query("select from SCORES where CLASS = 'Class one'")**
2	=A1.groups(STUDENTID:StudentID;sum(SCORE):TotalScore)	单字段分组。
3	*=demo.query("select from SCORES")**
4	=A3.groups(CLASS:Class,STUDENTID:StudentID;sum(SCORE):TotalScore)	多字段分组。
5	=A3.groups@m(STUDENTID:StudentID;sum(SCORE):TotalScore)	数据量大时提升性能。
6	=A3.groups@o(STUDENTID:StudentID;sum(SCORE):TotalScore)	只和相邻的对比归并，结果集不排序。
7	*=demo.query("select from STOCKRECORDS where STOCKID<'002242'")**
8	=A7.groups@n(if(STOCKID=="000062",1,2):StockID;sum(CLOSING):TotalPrice)	x取值为分组序号。
9	*=demo.query("select from EMPLOYEE")**
10	=A9.groups@u(STATE:State;count(STATE):TotalScore)	结果集不按分组字段排序。
11	=A9.groups@i(STATE=="California":IsCalifornia;count(STATE):count)	遇到STATE=="California"则开始新的分组。
12	*=A3.groups(CLASS:Class,STUDENTID:StudentID;iterate(~~2,10): Score1)**	分组的每组内进行iterate运算。
13	=file("D:\\Salesman.txt").import@t()
14	=A13.groups@0(Gender:Gender;sum(Age):Total)	丢弃Gender为空的组。
15	=file("D:/emp10.txt").import@t()	数据文件emp10.txt中，每10条数据根据DEPT进行了一次排序：
16	=A15.groups@h(DEPT:dept;sum(SALARY):bouns)	A15是以DEPT分段有序的数据，使用@h选项提高分组效率：
17	=A1.groups(STUDENTID:StudentID;SUBJECT,sum(SCORE):SUMSCORE)	非聚合函数计算第一条数据：
18	*=demo.query("select from SCORES where CLASS = 'Class three'")**	返回空序表。
19	=A18.groups@t(STUDENTID:StudentID;sum(SCORE):TotalScore)	返回保留数据结构的空序表。

	A
1	*=demo.query("select from SCORES")**
2	=A1.groups@z(STUDENTID:StudentID;sum(SCORE):TotalScore)	并行计算时按组拆分。

	A
1	=demo.query("select EID,NAME,GENDER,DEPT,SALARY from employee")
2	=A1.groups(DEPT;minp(SALARY))	执行聚合函数minp()后返回A3的记录。
3	=A1.groups@e(DEPT;minp(SALARY))	返回由minp(SALARY)结果记录构成的序表。

相关概念：

A.group(xi,…)

A.group(x:F,…;y:G,…)

ch.groups()

描述：

针对管道中的记录分组。

语法：

ch.groups(x:F,…;y:G…;n)

备注：

针对管道ch中的记录按照x分组并排序，形成以F,...G,…为字段的管道。

新管道按分组表达式x排序，G字段值为对每一组执行聚合函数y后的结果。该函数为结果集函数。

选项：

@n	x取值为分组序号，可直接定位。
@u	结果集不再按x排序；与@n互斥。

参数：

ch	管道。
x	分组表达式，x:F省略表示针对全集聚合，此时“；”不可省略。
F	结果序表的字段名。
y	ch的聚合函数，仅支持sum/count/max/min/top /avg/iterate/concat/var，使用iterate(x,a;G_i,…)时不能有参数Gi。
G	结果序表中的汇总字段名。

返回值：

管道

示例：

	A
1	*=demo.cursor("select from EMPLOYEE ")**
2	=channel()	创建管道。
3	=channel()	创建管道。
4	=channel()	创建管道。
5	=channel()	创建管道。
6	=A1.push(A2,A3,A4,A5)	将游标A1中的数据推送到管道A2、A3、A4和A5，此时数据不会立即被推送到管道。
7	=A2.groups(;sum(SALARY):TotalSalary)	省略x:F求所有员工的总工资。
8	=A3.groups(DEPT:dept;sum(SALARY):TotalSalary)	指定字段DEPT分组，并按照指定字段排序。
9	=A4.groups@n(if(GENDER=="F",1,2):SubGroups;sum(SALARY):TotalSalary)	x取值为分组序号，GENDER等于“F”的分到第一组，否则分到第二组，并且每个组聚合。
10	=A5.groups@u(STATE:State;count(STATE):count)	结果集不按分组字段排序。
11	= A1.select(month(BIRTHDAY)==2)
12	=A11.fetch()	游标A11添加了计算。
13	=A2.result()
14	=A3.result()
15	=A4.result()
16	=A5.result()

cs.groups()

描述：

针对集群游标中的记录分组。

语法：

cs.groups(x:F,…;y:G…;n)

备注：

针对集群游标中的记录分组。按分组字段排序，依次向结果集聚合。

按照x分组后，形成以F,...G,…为字段的新序表；新序表按分组表达式x排序，G字段值为对每一组执行聚合函数y后的结果。

选项：

@c	分机独立执行，结果集拼成集群内表，保持游标分布，可用作集群维表。

参数：

cs	集群游标记录。
x	分组表达式，x:F省略表示针对全集聚合，此时“；”不可省略。
F	结果序表的字段名。
y	cs的聚合函数，仅支持sum/count/max/min/top/avg/iterate/concat/var，使用iterate(x,a;G_i,…)时不能有参数Gi。
G	结果序表中的汇总字段名。
n	最大分组数，超过n时停止执行，用于分组数非常大时，防止内存溢出。并且最后的分组数不是确切数n，可能会比n大一些。

返回值：

序表/集群内表

示例：

	A
1	=file("emp1.ctx","192.168.0.111:8281")	emp1.ctx数据文件内容如下：
2	=A1.open()	打开集群组表。
3	=A2.cursor()	返回集群游标。
4	=A3.groups(Dept:dept;count(Name):count)	根据DEPT分组，然后聚合：

	A
1	[192.168.0.110:8281,192.168.18.143:8281]
2	=file("emp.ctx":[1,2], A1)
3	=A2.open()	打开集群组表。
4	=A3.cursor()	获取集群游标。
5	=A4.groups(GENDER:gender;sum(SALARY):totalSalary)	根据GENDER分组后再聚合，返回序表：
6	=A3.cursor()
7	=A6.groups@c(GENDER:gender;sum(SALARY):totalSalary).dup()	游标保持分布，返回集群内表：

cs.groups()

描述：

针对游标中的记录分组。

语法：

cs.groups(x:F,…;y:G…)

备注：

针对游标中的记录分组。按分组字段排序，依次向结果集聚合。

按照x分组后，形成以F,...G,…为字段的新序表；新序表按分组表达式x排序，G字段值为对每一组执行聚合函数y后的结果。

选项：

@n		x取值为分组序号，可直接定位，n为事先设定的总组数，可以直接先生成空间。
@u		结果集不再按x排序；与@n互斥。
@o	只和相邻对比，相当于归并，结果集不再排序。
@i	x是布尔表达式，如果x的结果为true则开始新的一组。此时只有一个x。
@h	用于分段有序的数据，可提高分组效率。
@0	丢弃x的计算结果为空的组。
@t	当游标中的数据返回值为空，则返回一个保留数据结构的空序表。
@z(…;…;n)	并行计算时按分组拆分，多线程共享结果集，此时不会动态调整HASH空间，n为HASH空间长度，可用缺省值。
@e	返回y的结果组成的序表。其中x为cs的字段名，y是cs的函数，y的计算结果要求是cs中的一条记录，当y是聚合函数时仅支持maxp/minp/top@1。

参数：

cs	游标记录。
x	分组表达式，x:F省略表示针对全集聚合，此时“；”不可省略。
F	结果序表的字段名。
y	cs的聚合函数，仅支持sum/count/max/min/top/avg/iterate/minp/maxp/concat/var，使用iterate(x,a;G_i,…)时不能有参数Gi。
G	结果序表中的汇总字段名。

返回值：

序表

示例：

	A
1	*=demo.cursor("select from SCORES where CLASS = 'Class one'")**
2	=A1.groups(;sum(SCORE):TotalScore)	省略x:F求所有学生的总成绩
3	*=demo.cursor("select from FAMILY")**
4	=A3.groups(GENDER:gender;sum(AGE):TotalAge)	指定字段分组，并按照指定字段排序
5	*=demo.cursor("select from STOCKRECORDS where STOCKID<'002242'")**
6	=A5.groups@n(if(STOCKID=="000062",1,2):SubGroups;sum(CLOSING):ClosingPrice)	x取值为分组序号，STOCKID等于“000062”的分到第一组，否则分到第二组，并且每个组聚合
7	*=demo.cursor("select from EMPLOYEE")**
8	=A7.groups@u(STATE:State;count(STATE):Total)	结果集不按分组字段排序
9	*=demo.cursor("select from EMPLOYEE")**
10	=A9.groups@o(STATE:State;count(STATE):Total)	只和相邻的对比，结果不排序
11	*=demo.cursor("select from EMPLOYEE")**
12	=A11.groups@i(STATE=="California":IsCalifornia;count(STATE):count)	遇到STATE=="California"则开始新的分组
13	=file("D:/emp10.txt").cursor@t()	数据文件emp10.txt中，每10条数据根据DEPT进行了一次排序
14	=A13.groups@h(DEPT:DEPT;sum(SALARY):bouns)	A13是以DEPT分段有序的数据，使用@h选项提高分组效率
15	*=demo.query("select from employee")**
16	=A15.cursor@m(3)	返回多路游标
17	=A16.groups(STATE:state;sum(SALARY):salary)	多路游标使用groups并行分组

有空值的情况

	A
1	*=demo.cursor("select from SCORES where CLASS = 'Class three'")**
2	=A1.groups@t(STUDENTID:StudentID;sum(SCORE):TotalScore)	返回保留数据结构的空序表
3	*=demo.cursor("select from DEPT")**	DEPT表数据内容如下：
4	=A3.groups@0(FATHER)	丢弃计算结果为空的组

使用@z选项，并行计算

	A
1	*=demo.cursor("select from SCORES")**
2	=A1.groups@z(STUDENTID:StudentID;sum(SCORE):TotalScore;5)	并行计算时按组拆分，HASH空间长度为5

使用@e选项，返回y的结果组成的序表

=demo.cursor("select * from SCORES")

=A1.groups@e(SUBJECT;maxp(SCORE))

返回由maxp(SCORE)结果记录构成的序表

T.groups()

描述：

针对虚表中的记录分组。

语法：

T. groups(x:F,…;y:G…;n)

备注：

针对虚中的记录分组。按分组字段排序，依次向结果集聚合。

按照x分组后，返回以F,...G,…为字段的序表；序表按分组表达式x排序，G字段值为对每一组执行聚合函数y后的结果。

选项：

@n	x取值为分组序号，可直接定位，n为事先设定的总组数，可以直接先生成空间。
@u	结果集不再按x排序；与@n互斥。
@o	只和相邻的对比，相当于归并，结果集不再排序。
@i	x是布尔表达式，如果x的结果为true则开始新的一组。此时只有一个x。
@h	用于分段有序的数据，可提高分组效率。
@b	返回的结果集中只有聚合数据，没有分组列数据。
@v	组表第一次加载时用列式，提升性能。

参数：

T	虚表。
x	分组表达式，x:F省略表示针对全集聚合，此时；不可省略。
F	结果序表的字段名。
y	聚合函数，仅支持sum/count/max/min/top/avg/iterate/concat/var，使用iterate(x,a;Gi,…)时不能有参数Gi。
G	结果序表中的汇总字段名。
n	最大分组数，超过n时停止执行，用于分组数非常大时，防止内存溢出。并且最后的分组数不是确切数n，可能会比n大一些。

返回值：

虚表

示例：

	A
1	=create(file).record(["D:/file/pseudo/empT.ctx"])
2	=pseudo(A1)	生成虚表。
3	=A2.groups(DEPT:dept;avg(SALARY):AVG_SALARY)	将虚表记录分组，分组字段为DEPT，聚合方式为计算每组SALARY的平均值，结果返回序表，结果序表中的字段名称有dept、AVG_SALARY，结果根据dept排序：
4	=A2.groups@n(if(GENDER=="F",1,2):GenderGroup;avg(SALARY):AVG_SALARY)	将虚表记录根据GENDER是否为F分为两组，并计算每组的SALARY平均值：
5	=A2.groups@u(DEPT:dept;avg(SALARY):AVG_SALARY)	使用@u，分组结果不排序：
6	=A2.groups@o(DEPT:dept;avg(SALARY):AVG_SALARY)	使用@o，只和相邻对比，结果集不排序：
7	=A2.groups@i(GENDER=="M":isMAN;count(EID):Count)	遇到GENDER=="M"则开始新的分组：
8	=A2.groups@b(DEPT:dept;avg(SALARY):AVG_SALARY)	使用@b选项，结果集中只有聚合数据列，无分组数据列：