P.corskew ()

阅读(70) 标签: 序表, 排列, 纠偏,

描述:

对数值变量纠正偏度。

语法:

P.corskew(cn)

建模时,对序表P中的数值变量cn,纠正偏度,处理异常值,返回处理后结果序列和处理记录序列Rec

P.corskew@r(cn, Rec)

预测时,根据处理记录序列Rec对数值变量cn,纠正偏度。

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

纠偏数据中不允许存在空值。

参数:

P

序表/排列。

cn

字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。

Rec

处理结果记录序列。

选项:

@c

执行后,原始数据改为处理结果。

返回值:

序列

示例:

 

A

 

1

=T("D: //house_prices_train.csv")

导入建模数据。

2

=T("D: //house_prices_test.csv")

导入预测数据。

3

=A1.(LotArea).skew()

计算数值变量”LotArea”的偏度:

4

=A1.corskew@c("LotArea")

在建模数据上对数值变量”LotArea”进行纠偏,并修改原始数据,

A4(1)纠偏后结果;

A4(2)纠偏记录。

5

=A1.(Ln_LotArea).skew()

纠偏后的偏度。

6

=A2.corskew@r(5,A4(2))

根据A4的纠偏记录Rec,对预测数据的同一变量进行纠偏处理。