本章介绍corskew()函数的多种用法。
描述:
外部库函数,外部库的使用请参考《外部库使用指南》。
对数值序列A纠正偏度
语法:
A.corskew() |
建模时,对于数值变量A,纠正偏度,处理异常值,返回处理后结果序列和处理记录序列Rec |
A.corskew@r(Rec) |
预测时,根据处理记录序列Rec对数值变量A,纠正偏度 |
备注:
纠偏数据中不允许存在空值
参数:
A |
数值型序列 |
Rec |
处理结果记录序列 |
选项:
@c |
执行后,原始数据改为处理结果 |
返回值:
序列
示例:
|
A |
|
1 |
[1,2,3,4,5,6,7,8,9,100] |
|
2 |
=A1.skew() |
A1的原始偏度 |
3 |
=A1.corskew() |
A3(1)为纠偏后结果 A3(2)为纠偏记录Rec |
4 |
=A1.corskew@rc(A3(2)) |
根据A3的处理记录Rec对A1进行纠偏,并将原始数据修改为纠偏后结果 |
5 |
=A1.skew() |
纠偏后A1的偏度 |
描述:
外部库函数,外部库的使用请参考《外部库使用指南》。
对数值变量纠正偏度
语法:
P.corskew(cn) |
建模时,对序表P中的数值变量cn,纠正偏度,处理异常值,返回处理后结果序列和处理记录序列Rec |
P.corskew@r(cn, Rec) |
预测时,根据处理记录序列Rec对数值变量cn,纠正偏度 |
备注:
纠偏数据中不允许存在空值
参数:
P |
序表/排列 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始) |
Rec |
处理结果记录序列 |
选项:
@c |
执行后,原始数据改为处理结果 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D: //house_prices_train.csv") |
导入建模数据 |
2 |
=T("D: //house_prices_test.csv") |
导入预测数据 |
3 |
=A1.(LotArea).skew() |
计算数值变量”LotArea”的偏度 |
4 |
=A1.corskew@c("LotArea") |
在建模数据上对数值变量”LotArea”进行纠偏,并修改原始数据 A4(1)纠偏后结果 A4(2)纠偏记录 |
5 |
=A1.(Ln_LotArea).skew() |
纠偏后的偏度 |
6 |
=A2.corskew@r(5,A4(2)) |
根据A4的纠偏记录Rec,对预测数据的同一变量进行纠偏处理 |