本章介绍bi()函数的多种用法。
描述:
建模时,将分类数不高于6的低频分类枚举变量,拆分为多个二值变量。
语法:
A.bi() |
建模时,将分类数不高于6的低频分类枚举变量A,拆分为多个二值变量。返回结果为处理结果序表和处理记录Rec构成的二值序列。 |
A.bi@r(Rec) |
预测时,根据处理记录序列Rec,将分类数不高于6的低频分类枚举变量A,拆分为多个二值变量,返回结果构成序表。 |
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,将分类数不高于6的低频分类枚举变量,拆分为多个二值变量。
参数:
A |
序列,分类数不高于6的低频分类枚举变量。 |
Rec |
处理结果记录序列。 |
返回值:
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
|
2 |
=A1.(MSZoning) |
分类数不高于6的变量 |
3 |
=A2.bi() |
A3(1)拆分结果序表。 A3(2)拆分记录Rec。 |
4 |
=A2.bi@r(A3(2)) |
根据A3的处理记录Rec,将A2拆分为多个变量:
|
描述:
外部库函数,外部库的使用请参考《外部库使用指南》。
建模时,将分类数不高于6的低频分类枚举变量,拆分为多个二值变量。
P.bi(cn) |
建模时,将分类数不高于6的低频分类枚举变量cn,拆分为多个二值变量。返回结果为处理结果序表和处理记录Rec构成的二值序列。 |
P.bi@r(cn, Rec) |
预测时,根据处理记录序列Rec,将分类数不高于6的低频分类枚举变量cn,拆分为多个二值变量,返回结果构成序表。 |
参数:
P |
序表/排列。 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。 |
Rec |
处理结果记录序列。 |
返回值:
序列/序表
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
|
2 |
=A1.bi("MSZoning") |
将MSZoning拆分成多个二值变量, A2(1)拆分结果; A2(2)拆分记录Rec。 |
3 |
=A1.bi@r("MSZoning",A2(2)) |
根据A2的拆分记录对变量进行拆分。 |