本章节介绍smooth()函数的用法。
描述:
语法:
A.smooth(T) |
建模时,对于高频分类枚举变量A,执行平滑化处理。返回处理结果和处理记录Rec构成的二值序列。 |
A.smooth@r(Rec) |
预测时,根据处理记录序列Rec对多分类枚举变量A,执行平滑化处理,返回处理结果 。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,对变量A,执行平滑化处理。
参数:
A |
序列,高频分类枚举变量。 |
T |
序列,目标变量值。 |
Rec |
处理结果记录序列。 |
选项:
@c |
执行后,原始数据改为处理结果。 |
@bnie |
选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。 |
返回值:
序列
示例:
|
A |
|
1 |
[a,d,f,g,y,j,y,k,l,v,x,,w,t,j,c,,z,h,y,j,e,e,s,d,q,ad,gr,hy,ki,lo,ss,df,afd,ju,li,ol] |
输入一个高频分类变量序列。 |
2 |
=A1.len().(rand(100)) |
生成一个与A1长度相同的整数序列。 |
3 |
=A1.setenum@c() |
将A1映射为整数,并修改原数据。 |
4 |
=A1.smooth(A2) |
以A2为目标变量,对A1进行平滑化处理,返回平滑化结果和平滑化记录Rec。 |
5 |
=A1.smooth@r(A3(2)) |
根据A3的平滑化记录对A1进行平滑化,常用于预测数据的平滑化。 |
描述:
建模时,对P中的变量,执行平滑化处理。
语法:
P.smooth(cn, T) |
建模时,对于高频分类枚举变量cn,执行平滑化处理。返回处理结果和处理记录Rec构成的二值序列。 |
P.smooth@r(cn, Rec) |
预测时,根据处理记录序列Rec对多分类枚举变量cn,执行平滑化处理,返回处理结果。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,对P中的变量,执行平滑化处理。
参数:
P |
序表/排列。 |
T |
序列,目标变量值。 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。 |
Rec |
处理结果记录序列。 |
选项:
@c |
执行后,原始数据改为处理结果 |
@bnie |
选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。 |
返回值:
序列
示例:
|
A |
|
1 |
=file("D:// titanic.csv").import@qtc() |
导入建模数据。 |
2 |
=file("D:// titanic_t.csv").import@qtc() |
导入预测数据。 |
3 |
=A1.smooth@ic("Ticket",A1.(Survived)) |
将变量“Ticket”做平滑化处理,返回平滑化结果和平滑记录Rec。 |
4 |
=A2.smooth@rc("Ticket",A3(2)) |
根据A3的平滑化记录,对预测集同一变量进行平滑化。 |