本章介绍impute()函数的多种用法。
描述:
建模时,对变量A,执行缺失值填补。
语法:
A.impute() |
建模时,对变量A,执行缺失值填补。返回结果为处理结果序列和处理记录序列Rec构成的二值序列。 |
A.impute@r(Rec) |
预测时,根据处理记录序列Rec,对变量A执行缺失值填补。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,对变量A,执行缺失值填补。
参数:
A |
序列。 |
Rec |
处理结果记录序列。 |
@c |
执行后,原始数据改为处理结果。 |
@BNIED |
选项指明变量类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举/日期。 |
返回值:
示例:
|
A |
|
1 |
[1,2,3,,5,6,7,8,9,10] |
|
2 |
=A1.impute@N() |
对A1进行填补, A3(1)返回填补处理后结果; A3(2)处理记录Rec。 @N指明变量类型为数值。 |
3 |
=A1.impute@rc(A2(2)) |
根据A2的填补记录Rec,对A1进行填补。 |
描述:
建模时,对P中的变量,执行缺失值填补。
语法:
P.impute(cn) |
建模时,对变量cn,执行缺失值填补。返回结果为处理结果序列和处理记录序列Rec构成的二值序列。 |
P.impute@r(cn, Rec) |
预测时,根据处理记录序列Rec,对变量cn执行缺失值填补。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,对P中的变量,执行缺失值填补。
参数:
P |
序表/排列。 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。 |
Rec |
处理结果记录序列。 |
选项:
@c |
执行后,原始数据改为处理结果。 |
@BNIED |
选项指明变量类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举/日期。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D: //house_prices_train.csv") |
|
2 |
=A1.impute@I(4) |
对第4列变量进行填补, A2(1)填补后结果; A2(2)填补记录。 @I指明变量类型为整数。 |
3 |
=A1.impute@rc("LotFrontage",A2(2)) |
根据A2的填补记录,对变量进行填补,返回填补结果。 @c执行后,原数据改为填补后结果。 |