描述:
对数值变量纠正偏度。
语法:
P.corskew(cn) |
建模时,对序表P中的数值变量cn,纠正偏度,处理异常值,返回处理后结果序列和处理记录序列Rec。 |
P.corskew@r(cn, Rec) |
预测时,根据处理记录序列Rec对数值变量cn,纠正偏度。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
纠偏数据中不允许存在空值。
P |
序表/排列。 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。 |
Rec |
处理结果记录序列。 |
@c |
执行后,原始数据改为处理结果。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D: //house_prices_train.csv") |
导入建模数据。 |
2 |
=T("D: //house_prices_test.csv") |
导入预测数据。 |
3 |
=A1.(LotArea).skew() |
计算数值变量”LotArea”的偏度: |
4 |
=A1.corskew@c("LotArea") |
在建模数据上对数值变量”LotArea”进行纠偏,并修改原始数据, A4(1)纠偏后结果; A4(2)纠偏记录。 |
5 |
=A1.(Ln_LotArea).skew() |
纠偏后的偏度。 |
6 |
=A2.corskew@r(5,A4(2)) |
根据A4的纠偏记录Rec,对预测数据的同一变量进行纠偏处理。 |