smooth()

阅读(143) 标签: smooth,

本章节介绍smooth()函数的用法。

A.smooth ()

描述:

外部库函数,外部库的使用请参考《外部库使用指南》。
 
建模时,对变量A,执行平滑化处理

语法:

A.smooth(T)

建模时,对于高频分类枚举变量A,执行平滑化处理。返回处理结果和处理记录Rec构成的二值序列

A.smooth@r(Rec)

预测时,根据处理记录序列Rec对多分类枚举变量A,执行平滑化处理,返回处理结果

 

参数:

A

序列,高频分类枚举变量

T

序列,目标变量值

Rec

处理结果记录序列

选项:

@c

执行后,原始数据改为处理结果

@bnie

选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。

 

返回值:

序列

示例:

 

A

 

1

[a,d,f,g,y,j,y,k,l,v,x,,w,t,j,c,,z,h,y,j,e,e,s,d,q,ad,gr,hy,ki,lo,ss,df,afd,ju,li,ol]

输入一个高频分类变量序列

2

=A1.len().(rand(100))

生成一个与A1长度相同的整数序列

3

=A1.setenum@c()

A1映射为整数,并修改原数据

4

=A1.smooth(A2)

A2为目标变量,对A1进行平滑化处理,返回平滑化结果和平滑化记录Rec

5

=A1.smooth@r(A3(2))

根据A3的平滑化记录对A1进行平滑化,常用于预测数据的平滑化

P.smooth ()

描述:

外部库函数,外部库的使用请参考《外部库使用指南》。
 
建模时,对P中的变量,执行平滑化处理

语法:

P.smooth(cn, T)

建模时,对于高频分类枚举变量cn,执行平滑化处理。返回处理结果和处理记录Rec构成的二值序列

P.smooth@r(cn, Rec)

预测时,根据处理记录序列Rec对多分类枚举变量cn,执行平滑化处理,返回处理结果

参数:

P

序表/排列

T

序列,目标变量值

cn

字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)

Rec

处理结果记录序列

选项:

@c

执行后,原始数据改为处理结果

@bnie

选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。

 

返回值:

序列

示例:

 

A

 

1

=file("D:// titanic.csv").import@qtc()

导入建模数据

2

=file("D:// titanic_t.csv").import@qtc()

导入预测数据

3

=A1.smooth@ic("Ticket",A1.(Survived))

将变量“Ticket”做平滑化处理,返回平滑化结果和平滑记录Rec

4

=A2.smooth@rc("Ticket",A3(2))

根据A3的平滑化记录,对预测集同一变量进行平滑化