本章介绍corskew()函数的多种用法。
描述:
对数值序列A纠正偏度。
语法:
A.corskew() |
建模时,对于数值变量A,纠正偏度,处理异常值,返回处理后结果序列和处理记录序列Rec。 |
A.corskew@r(Rec) |
预测时,根据处理记录序列Rec对数值变量A,纠正偏度。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
纠偏数据中不允许存在空值。
参数:
A |
数值型序列。 |
Rec |
处理结果记录序列。 |
选项:
@c |
执行后,原始数据改为处理结果。 |
返回值:
序列
示例:
|
A |
|
1 |
[1,2,3,4,5,6,7,8,9,100] |
|
2 |
=A1.skew() |
A1的原始偏度:
|
3 |
=A1.corskew() |
A3(1)为纠偏后结果, A3(2)为纠偏记录Rec。 |
4 |
=A1.corskew@rc(A3(2)) |
根据A3的处理记录Rec对A1进行纠偏,并将原始数据修改为纠偏后结果:
|
5 |
=A1.skew() |
纠偏后A1的偏度:
|
描述:
对数值变量纠正偏度。
语法:
P.corskew(cn) |
建模时,对序表P中的数值变量cn,纠正偏度,处理异常值,返回处理后结果序列和处理记录序列Rec。 |
P.corskew@r(cn, Rec) |
预测时,根据处理记录序列Rec对数值变量cn,纠正偏度。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
纠偏数据中不允许存在空值。
P |
序表/排列。 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。 |
Rec |
处理结果记录序列。 |
@c |
执行后,原始数据改为处理结果。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D: //house_prices_train.csv") |
导入建模数据。 |
2 |
=T("D: //house_prices_test.csv") |
导入预测数据。 |
3 |
=A1.(LotArea).skew() |
计算数值变量”LotArea”的偏度:
|
4 |
=A1.corskew@c("LotArea") |
在建模数据上对数值变量”LotArea”进行纠偏,并修改原始数据, A4(1)纠偏后结果; A4(2)纠偏记录。 |
5 |
=A1.(Ln_LotArea).skew() |
纠偏后的偏度。 |
6 |
=A2.corskew@r(5,A4(2)) |
根据A4的纠偏记录Rec,对预测数据的同一变量进行纠偏处理。 |