描述:
建模时,对P中的变量,执行缺失值填补。
语法:
P.impute(cn) |
建模时,对变量cn,执行缺失值填补。返回结果为处理结果序列和处理记录序列Rec构成的二值序列。 |
P.impute@r(cn, Rec) |
预测时,根据处理记录序列Rec,对变量cn执行缺失值填补。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,对P中的变量,执行缺失值填补。
参数:
P |
序表/排列。 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。 |
Rec |
处理结果记录序列。 |
选项:
@c |
执行后,原始数据改为处理结果。 |
@BNIED |
选项指明变量类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举/日期。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D: //house_prices_train.csv") |
|
2 |
=A1.impute@I(4) |
对第4列变量进行填补, A2(1)填补后结果; A2(2)填补记录。 @I指明变量类型为整数。 |
3 |
=A1.impute@rc("LotFrontage",A2(2)) |
根据A2的填补记录,对变量进行填补,返回填补结果。 @c执行后,原数据改为填补后结果。 |