本章介绍bi()函数的多种用法。
描述:
外部库函数,建模时,将分类数不高于6的低频分类枚举变量,拆分为多个二值变量
语法:
A.bi() |
建模时,将分类数不高于6的低频分类枚举变量A,拆分为多个二值变量。返回结果为处理结果序表和处理记录Rec构成的二值序列 |
A.bi@r(Rec) |
预测时,根据处理记录序列Rec,将分类数不高于6的低频分类枚举变量A,拆分为多个二值变量,返回结果构成序表。 |
参数:
A |
序列,分类数不高于6的低频分类枚举变量 |
Rec |
处理结果记录序列 |
返回值:
序列/序表
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
|
2 |
=A1.(MSZoning) |
分类数不高于6的变量 |
3 |
=A2.bi() |
A3(1)拆分结果序表 A3(2)拆分记录Rec |
4 |
=A2.bi@r(A3(2)) |
根据A3的处理记录Rec,将A2拆分为多个变量 |
描述:
外部库函数,建模时,将分类数不高于6的低频分类枚举变量,拆分为多个二值变量
语法:
P.bi(cn) |
建模时,将分类数不高于6的低频分类枚举变量cn,拆分为多个二值变量。返回结果为处理结果序表和处理记录Rec构成的二值序列 |
P.bi@r(cn, Rec) |
预测时,根据处理记录序列Rec,将分类数不高于6的低频分类枚举变量cn,拆分为多个二值变量,返回结果构成序表。 |
参数:
P |
序表/排列 |
cn |
字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始) |
Rec |
处理结果记录序列 |
返回值:
序列/序表
示例:
|
A |
|
1 |
=T("D://house_prices_train.csv") |
|
2 |
=A1.bi("MSZoning") |
将“MSZoning”拆分成多个二值变量 A2(1)拆分结果 A2(2)拆分记录Rec |
3 |
=A1.bi@r("MSZoning",A2(2)) |
根据A2的拆分记录对变量进行拆分 |