P.mvp ()

阅读(74) 标签: 缺失值, 指示变量,

描述:

根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。

语法:

P.mvp(cns, T)

建模时,根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。返回二值序列,其中第1个为各个MVP列构成的序表,第2个为处理记录序列Rec。在排列中使用时,如果不指定MI列的列名序列,自动查找缺失值指示列执行计算

P.mvp@r(cns, Rec)

预测时,根据多个缺失值指示变量和处理记录序列Rec,创建各列MVP指示变量构成的序表

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。

参数:

P

序表/排列。

T

序列,目标变量值。

cns

字符串序列,排列中多个变量的列名(或列号,从1开始)。

Rec

处理结果记录序列。

选项:

@bnie

选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举

返回值:

序列

示例:

 

A

 

1

=T("D://house_prices_train.csv")

导入建模数据。

2

=T("D://house_prices_test.csv")

导入预测数据。

3

=A1.mi("LotFrontage")

返回变量”LotFrontage”的缺失值指示变量。

4

=A1.mi("Alley")

返回变量”Alley”的缺失值指示变量。

5

=A1.derive(A3(#).field(1):MI_LotFrontage,A4(#).field(1):MI_Alley)

MI指示变量添加到数据。

6

 

 

=A5.mvp(["MI_LotFrontage","MI_Alley"],A1.(SalePrice))

A6(1):mvp列构成的序表;

A6(2):处理记录Rec

7

=A2.mi("LotFrontage")

 

8

=A2.mi("Alley")

 

9

=A2.derive(A3(#).field(1):MI_LotFrontage,A4(#).field(1):MI_Alley)

 

10

=A9.mvp@r(["MI_LotFrontage","MI_Alley"],A6(2))

预测时,返回各列MVP指示变量构成的序表。