本章介绍sert()的多种用法。
描述:
建模时,对于数值变量,清理异常值。
语法:
A.sert() |
建模时,对于数值变量A,清理异常值,返回处理结果和处理记录Rec构成的二值序列。 |
A.sert@r(Rec) |
预测时,根据处理记录序列Rec对于数值变量A,清理异常值。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,对于数值变量,清理异常值。
参数:
A |
序列,数值变量。 |
Rec |
处理结果记录序列。 |
选项:
@c |
执行后,原始数据改为处理结果。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
|
2 |
=A1.(LotFrontage) |
数值型变量。 |
3 |
=A2.max() |
原始数据最大值。 |
4 |
=A2.sert@c() |
清理异常值。 |
5 |
=A2.max() |
异常值清理后最大值。 |
描述:
语法:
P.sert(cn) |
建模时,对于数值变量cn,清理异常值,返回处理结果和处理记录Rec构成的二值序列。 |
P.sert@r(cn, Rec) |
预测时,根据处理记录序列Rec对于数值变量cn,清理异常值。 |
描述:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,对于数值变量,清理异常值。
参数:
P |
序表/排列。 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。 |
Rec |
处理结果记录序列。 |
选项:
@c |
执行后,原始数据改为处理结果。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
导入训练数据。 |
2 |
=T("D://house_prices_test.csv") |
导入预测数据。 |
3 |
=A1.max(LotFrontage) |
处理前变量最大值。 |
4 |
=A1.sert@c("LotFrontage") |
对变量“LotFrantage”清理异常值, A2(1)清理结果; A2(2)清理记录Rec。 |
5 |
=A1.max(LotFrontage) |
异常值清理后最大值。 |
6 |
=A2.sert@r("LotFrontage",A4(2)) |
根据A4的清理记录Rec,对预测数据同一变量清理异常值。 |