impute()

阅读(1365) 标签: impute,

本章介绍impute()函数的多种用法。

A.impute ()

描述:

建模时,对变量A,执行缺失值填补。

语法:

A.impute()

建模时,对变量A,执行缺失值填补。返回结果为处理结果序列和处理记录序列Rec构成的二值序列

A.impute@r(Rec)

预测时,根据处理记录序列Rec,对变量A执行缺失值填补

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

建模时,对变量A,执行缺失值填补。

参数:

A

序列

Rec

处理结果记录序列

选项:

@c

执行后,原始数据改为处理结果

@BNIED

选项指明变量类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举/日期

返回值:

序列

示例:

 

A

 

1

[1,2,3,,5,6,7,8,9,10]

 

2

=A1.impute@N()

A1进行填补,

A3(1)返回填补处理后结果;

A3(2)处理记录Rec

@N指明变量类型为数值。

3

=A1.impute@rc(A2(2))

根据A2的填补记录Rec,对A1进行填补。

 

P.impute ()

描述:

建模时,对P中的变量,执行缺失值填补。

语法:

P.impute(cn)

建模时,对变量cn,执行缺失值填补。返回结果为处理结果序列和处理记录序列Rec构成的二值序列。

P.impute@r(cn, Rec)

预测时,根据处理记录序列Rec,对变量cn执行缺失值填补。

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

建模时,对P中的变量,执行缺失值填补。

参数:

P

序表/排列。

cn

字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。

Rec

处理结果记录序列。

选项:

@c

执行后,原始数据改为处理结果。

@BNIED

选项指明变量类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举/日期。

返回值:

序列

示例:

 

A

 

1

=T("D: //house_prices_train.csv")

 

2

=A1.impute@I(4)

对第4列变量进行填补,

A2(1)填补后结果;

A2(2)填补记录。

@I指明变量类型为整数。

3

=A1.impute@rc("LotFrontage",A2(2))

根据A2的填补记录,对变量进行填补,返回填补结果。

@c执行后,原数据改为填补后结果。