本章节介绍mvp()函数的用法。
描述:
根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。
语法:
A.mvp(T) |
建模时,根据多个缺失值指示变量构成的序列A,创建MVP指示变量并自动后续处理。返回二值序列,其中第1个为各个MVP列构成的序表,第2个为处理记录序列Rec。 |
A.mvp@r(Rec) |
预测时,根据多个缺失值指示变量构成的序列A和处理记录序列Rec,创建各列MVP指示变量构成的序表。 |
外部库函数,外部库的使用请参考《外部库使用指南》。
根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。
参数:
A |
序列。 |
T |
序列,目标变量值。 |
Rec |
处理结果记录序列。 |
选项:
@bnie |
选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。 |
返回值:
序列
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
导入建模数据。 |
2 |
=T("D://house_prices_test.csv") |
导入预测数据。 |
3 |
=A1.mi("LotFrontage").field(1) |
返回”LotFrontage”的缺失值指示变量序列。 |
4 |
=A1.mi("Alley").field(1) |
返回”Alley”的缺失值指示变量序列。 |
5 |
=A1.(SalePrice) |
目标变量序列。 |
6 |
=[A3,A4].mvp(A5) |
A6(1):mvp列构成的序表; A6(2):处理记录Rec。 |
7 |
=A2.mi("LotFrontage").field(1) |
|
8 |
=A2.mi("Alley").field(1) |
|
9 |
=[A7,A8].mvp@r(A6(2)) |
预测时,返回各列MVP指示变量构成的序表。 |
描述:
根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。
语法:
P.mvp(cns, T) |
建模时,根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。返回二值序列,其中第1个为各个MVP列构成的序表,第2个为处理记录序列Rec。在排列中使用时,如果不指定MI列的列名序列,自动查找缺失值指示列执行计算。 |
P.mvp@r(cns, Rec) |
预测时,根据多个缺失值指示变量和处理记录序列Rec,创建各列MVP指示变量构成的序表。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
根据多个缺失值指示变量,创建MVP指示变量并自动后续处理。
参数:
P |
序表/排列。 |
T |
序列,目标变量值。 |
cns |
字符串序列,排列中多个变量的列名(或列号,从1开始)。 |
Rec |
处理结果记录序列。 |
@bnie |
选项指明目标类型,各选项相斥。无选项时自动判断类型,优先级依次按照二值/数值/整数/枚举。 |
序列
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
导入建模数据。 |
2 |
=T("D://house_prices_test.csv") |
导入预测数据。 |
3 |
=A1.mi("LotFrontage") |
返回变量”LotFrontage”的缺失值指示变量。 |
4 |
=A1.mi("Alley") |
返回变量”Alley”的缺失值指示变量。 |
5 |
=A1.derive(A3(#).field(1):MI_LotFrontage,A4(#).field(1):MI_Alley) |
将MI指示变量添加到数据。 |
6 |
=A5.mvp(["MI_LotFrontage","MI_Alley"],A1.(SalePrice)) |
A6(1):mvp列构成的序表; A6(2):处理记录Rec。 |
7 |
=A2.mi("LotFrontage") |
|
8 |
=A2.mi("Alley") |
|
9 |
=A2.derive(A3(#).field(1):MI_LotFrontage,A4(#).field(1):MI_Alley) |
|
10 |
=A9.mvp@r(["MI_LotFrontage","MI_Alley"],A6(2)) |
预测时,返回各列MVP指示变量构成的序表。 |