mvp()

阅读(26) 标签: mvp,

本章节介绍mvp()函数的用法。

A.mvp ()

描述:

外部库函数,根据多个缺失值指示变量,创建MVP指示变量并自动后续处理

语法:

A.mvp(T)

建模时,根据多个缺失值指示变量构成的序列A,创建MVP指示变量并自动后续处理。返回二值序列,其中第1个为各个MVP列构成的序表,第2个为处理记录序列Rec

A.mvp@r(Rec)

预测时,根据多个缺失值指示变量构成的序列A和处理记录序列Rec,创建各列MVP指示变量构成的序表。

 

参数:

A

序列

T

序列,目标变量值

Rec

处理结果记录序列

选项:

@bnie

选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。

 

返回值:

序列

示例:

 

 

A

 

1

=T("D://house_prices_train.csv")

导入建模数据

2

=T("D://house_prices_test.csv")

导入预测数据

3

=A1.mi("LotFrontage").field(1)

返回”LotFrontage”的缺失值指示变量序列

4

=A1.mi("Alley").field(1)

返回”Alley”的缺失值指示变量序列

5

=A1.(SalePrice)

目标变量序列

6

=[A3,A4].mvp(A5)

A6(1):mvp列构成的序表

A6(2):处理记录Rec

7

=A2.mi("LotFrontage").field(1)

 

8

=A2.mi("Alley").field(1)

 

9

=[A7,A8].mvp@r(A6(2))

预测时,返回各列MVP指示变量构成的序表

 

P.mvp ()

描述:

外部库函数,根据多个缺失值指示变量,创建MVP指示变量并自动后续处理

语法:

P.mvp(cns, T)

建模时,根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。返回二值序列,其中第1个为各个MVP列构成的序表,第2个为处理记录序列Rec。在排列中使用时,如果不指定MI列的列名序列,自动查找缺失值指示列执行计算。

P.mvp@r(cns, Rec)

预测时,根据多个缺失值指示变量和处理记录序列Rec,创建各列MVP指示变量构成的序表。

参数:

P

序表/排列

T

序列,目标变量值

cns

字符串序列,排列中多个变量的列名(或列号,从1开始)

Rec

处理结果记录序列

选项:

@bnie

选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。

 

返回值:

序列

示例:

 

A

 

1

=T("D://house_prices_train.csv")

导入建模数据

2

=T("D://house_prices_test.csv")

导入预测数据

3

=A1.mi("LotFrontage")

返回变量”LotFrontage”的缺失值指示变量

4

=A1.mi("Alley")

返回变量”Alley”的缺失值指示变量

5

=A1.derive(A3(#).field(1):MI_LotFrontage,A4(#).field(1):MI_Alley)

MI指示变量添加到数据

6

=A5.mvp(["MI_LotFrontage","MI_Alley"],A1.(SalePrice))

A6(1):mvp列构成的序表

A6(2):处理记录Rec

7

=A2.mi("LotFrontage")

 

8

=A2.mi("Alley")

 

9

=A2.derive(A3(#).field(1):MI_LotFrontage,A4(#).field(1):MI_Alley)

 

10

=A9.mvp@r(["MI_LotFrontage","MI_Alley"],A6(2))

预测时,返回各列MVP指示变量构成的序表