本章节介绍mvp()函数的用法。
描述:
外部库函数,外部库的使用请参考《外部库使用指南》。
根据多个缺失值指示变量,创建MVP指示变量并自动后续处理
语法:
A.mvp(T) |
建模时,根据多个缺失值指示变量构成的序列A,创建MVP指示变量并自动后续处理。返回二值序列,其中第1个为各个MVP列构成的序表,第2个为处理记录序列Rec。 |
A.mvp@r(Rec) |
预测时,根据多个缺失值指示变量构成的序列A和处理记录序列Rec,创建各列MVP指示变量构成的序表。 |
参数:
A |
序列 |
T |
序列,目标变量值 |
Rec |
处理结果记录序列 |
选项:
@bnie |
选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
导入建模数据 |
2 |
=T("D://house_prices_test.csv") |
导入预测数据 |
3 |
=A1.mi("LotFrontage").field(1) |
返回”LotFrontage”的缺失值指示变量序列 |
4 |
=A1.mi("Alley").field(1) |
返回”Alley”的缺失值指示变量序列 |
5 |
=A1.(SalePrice) |
目标变量序列 |
6 |
=[A3,A4].mvp(A5) |
A6(1):mvp列构成的序表 A6(2):处理记录Rec |
7 |
=A2.mi("LotFrontage").field(1) |
|
8 |
=A2.mi("Alley").field(1) |
|
9 |
=[A7,A8].mvp@r(A6(2)) |
预测时,返回各列MVP指示变量构成的序表 |
描述:
外部库函数,外部库的使用请参考《外部库使用指南》。
根据多个缺失值指示变量,创建MVP指示变量并自动后续处理
语法:
P.mvp(cns, T) |
建模时,根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。返回二值序列,其中第1个为各个MVP列构成的序表,第2个为处理记录序列Rec。在排列中使用时,如果不指定MI列的列名序列,自动查找缺失值指示列执行计算。 |
P.mvp@r(cns, Rec) |
预测时,根据多个缺失值指示变量和处理记录序列Rec,创建各列MVP指示变量构成的序表。 |
参数:
P |
序表/排列 |
T |
序列,目标变量值 |
cns |
字符串序列,排列中多个变量的列名(或列号,从1开始) |
Rec |
处理结果记录序列 |
选项:
@bnie |
选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
导入建模数据 |
2 |
=T("D://house_prices_test.csv") |
导入预测数据 |
3 |
=A1.mi("LotFrontage") |
返回变量”LotFrontage”的缺失值指示变量 |
4 |
=A1.mi("Alley") |
返回变量”Alley”的缺失值指示变量 |
5 |
=A1.derive(A3(#).field(1):MI_LotFrontage,A4(#).field(1):MI_Alley) |
将MI指示变量添加到数据 |
6 |
=A5.mvp(["MI_LotFrontage","MI_Alley"],A1.(SalePrice)) |
A6(1):mvp列构成的序表 A6(2):处理记录Rec |
7 |
=A2.mi("LotFrontage") |
|
8 |
=A2.mi("Alley") |
|
9 |
=A2.derive(A3(#).field(1):MI_LotFrontage,A4(#).field(1):MI_Alley) |
|
10 |
=A9.mvp@r(["MI_LotFrontage","MI_Alley"],A6(2)) |
预测时,返回各列MVP指示变量构成的序表 |