smooth()

阅读(899) 标签: smooth,

本章节介绍smooth()函数的用法。

A.smooth ()

描述:

建模时,对变A,执行平滑化处理。

语法:

A.smooth(T)

建模时,对于高频分类枚举变量A,执行平滑化处理。返回处理结果和处理记录Rec构成的二值序列。

A.smooth@r(Rec)

预测时,根据处理记录序列Rec对多分类枚举变量A,执行平滑化处理,返回处理结果

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

建模时,对变量A,执行平滑化处理。

参数:

A

序列,高频分类枚举变量。

T

序列,目标变量值。

Rec

处理结果记录序列。

选项:

@c

执行后,原始数据改为处理结果。

@bnie

选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。

返回值:

序列

示例:

 

A

 

1

[a,d,f,g,y,j,y,k,l,v,x,,w,t,j,c,,z,h,y,j,e,e,s,d,q,ad,gr,hy,ki,lo,ss,df,afd,ju,li,ol]

输入一个高频分类变量序列。

2

=A1.len().(rand(100))

生成一个与A1长度相同的整数序列。

3

=A1.setenum@c()

A1映射为整数,并修改原数据。

4

=A1.smooth(A2)

A2为目标变量,对A1进行平滑化处理,返回平滑化结果和平滑化记录Rec

5

=A1.smooth@r(A3(2))

根据A3的平滑化记录对A1进行平滑化,常用于预测数据的平滑化。

 

P.smooth ()

描述:

建模时,对P中的变量,执行平滑化处理。

语法:

P.smooth(cn, T)

建模时,对于高频分类枚举变量cn,执行平滑化处理。返回处理结果和处理记录Rec构成的二值序列。

P.smooth@r(cn, Rec)

预测时,根据处理记录序列Rec对多分类枚举变量cn,执行平滑化处理,返回处理结果。

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

建模时,对P中的变量,执行平滑化处理。

参数:

P

序表/排列。

T

序列,目标变量值。

cn

字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。

Rec

处理结果记录序列。

选项:

@c

执行后,原始数据改为处理结果

@bnie

选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。

返回值:

序列

示例:

 

A

 

1

=file("D:// titanic.csv").import@qtc()

导入建模数据。

2

=file("D:// titanic_t.csv").import@qtc()

导入预测数据。

3

=A1.smooth@ic("Ticket",A1.(Survived))

将变量“Ticket”做平滑化处理,返回平滑化结果和平滑记录Rec

4

=A2.smooth@rc("Ticket",A3(2))

根据A3的平滑化记录,对预测集同一变量进行平滑化。