corskew()

阅读(1634) 标签: corskew,

本章介绍corskew()函数的多种用法。

A.corskew ()

描述:

对数值序列A纠正偏度。

语法:

A.corskew()

建模时,对于数值变量A,纠正偏度,处理异常值,返回处理后结果序列和处理记录序列Rec

A.corskew@r(Rec)

预测时,根据处理记录序列Rec对数值变量A,纠正偏度。

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

纠偏数据中不允许存在空值。

参数:

A

数值型序列

Rec

处理结果记录序列

选项:

@c

执行后,原始数据改为处理结果

返回值:

序列

示例:

 

A

 

1

[1,2,3,4,5,6,7,8,9,100]

 

2

=A1.skew()

A1的原始偏度:

3

=A1.corskew()

A3(1)为纠偏后结果,

A3(2)为纠偏记录Rec

4

=A1.corskew@rc(A3(2))

根据A3的处理记录RecA1进行纠偏,并将原始数据修改为纠偏后结果:

5

=A1.skew()

纠偏后A1的偏度:

 

P.corskew ()

描述:

对数值变量纠正偏度。

语法:

P.corskew(cn)

建模时,对序表P中的数值变量cn,纠正偏度,处理异常值,返回处理后结果序列和处理记录序列Rec

P.corskew@r(cn, Rec)

预测时,根据处理记录序列Rec对数值变量cn,纠正偏度。

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

纠偏数据中不允许存在空值。

参数:

P

序表/排列。

cn

字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。

Rec

处理结果记录序列。

选项:

@c

执行后,原始数据改为处理结果。

返回值:

序列

示例:

 

A

 

1

=T("D: //house_prices_train.csv")

导入建模数据。

2

=T("D: //house_prices_test.csv")

导入预测数据。

3

=A1.(LotArea).skew()

计算数值变量”LotArea”的偏度:

4

=A1.corskew@c("LotArea")

在建模数据上对数值变量”LotArea”进行纠偏,并修改原始数据,

A4(1)纠偏后结果;

A4(2)纠偏记录。

5

=A1.(Ln_LotArea).skew()

纠偏后的偏度。

6

=A2.corskew@r(5,A4(2))

根据A4的纠偏记录Rec,对预测数据的同一变量进行纠偏处理。