P.impute ()

阅读(48) 标签: 序表, 排列, 缺失值填补,

描述:

建模时,对P中的变量,执行缺失值填补。

语法:

P.impute(cn)

建模时,对变量cn,执行缺失值填补。返回结果为处理结果序列和处理记录序列Rec构成的二值序列。

P.impute@r(cn, Rec)

预测时,根据处理记录序列Rec,对变量cn执行缺失值填补。

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

建模时,对P中的变量,执行缺失值填补。

参数:

P

序表/排列。

cn

字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。

Rec

处理结果记录序列。

选项:

@c

执行后,原始数据改为处理结果。

@BNIED

选项指明变量类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举/日期。

返回值:

序列

示例:

 

A

 

1

=T("D: //house_prices_train.csv")

 

2

=A1.impute@I(4)

对第4列变量进行填补,

A2(1)填补后结果;

A2(2)填补记录。

@I指明变量类型为整数。

3

=A1.impute@rc("LotFrontage",A2(2))

根据A2的填补记录,对变量进行填补,返回填补结果。

@c执行后,原数据改为填补后结果。