使用常见数据

阅读(11010) 标签: 数据来源,

在做数据分析处理工作时,首先需要读入原始数据,而最常用的数据就来自文本文件或者数据库。在集算器中,可以很快捷地读入文本或者数据库中的数据。

使用文本数据

集算器可以将文本文件中的数据读入为一个序表,如:文本文件employee.txt中保存了员工的信息,如下:

EID

NAME

SURNAME

GENDER

STATE

BIRTHDAY

HIREDATE

DEPT

SALARY

1

Rebecca

Moore

F

California

1984-09-28

2015-01-18

R&D

7000

2

Ashley

Wilson

F

New York

1990-05-28

2018-01-23

Finance

11000

3

Rachel

Johnson

F

New Mexico

1980-10-25

2020-10-09

Sales

9000

4

Emily

Smith

F

Texas

1995-01-14

2016-06-23

HR

7000

5

Ashley

Smith

F

Texas

1985-03-21

2014-06-08

R&D

16000

6

Matthew

Johnson

M

California

1994-05-16

2015-05-16

Sales

11000

7

Alexis

Smith

F

Illinois

1982-06-25

2012-06-24

Sales

9000

8

Megan

Wilson

F

California

1989-02-25

2014-02-26

Marketing

11000

9

Victoria

Davis

F

Texas

1993-10-15

2019-10-16

HR

3000

 

 

 

 

 

 

 

 

在集算器中,读取文件中的数据,需要使用import函数:

 

A

1

=file("employee.txt ")

2

=A1.import@t()

3

=A1.import()

A2中,import函数使用了@t选项,读入数据时,会将这个文本文件的第一行设置为序表的列名,A2中数据如下:

可以看一下不使用@t选项的情况,A3中的序表如下:

同时由于原标题行数据的干扰,自动判断数据类型时会出现问题,把每个字段都识别为字符串数据。

使用数据库中的数据

集算器可以通过JDBC访问各类数据库,在Tool菜单项中,点击Datasource Connection可以查看数据源管理器:

在数据源管理器中,可以连接或者断开某个数据源,也可以在这里配置需要连接的数据库。其中demo是集算器自带的数据源,可以执行安装目录下的esProc\bin\startDataBase.bat启动。数据源连接后,就可以直接访问数据库,用SQL取出表中的数据:

 

A

1

=demo.query("select * from CITIES")

2

$select * from CITIES

query函数可以获得SQL执行的结果集,并读取为序表,如A1中的示例。当连接了数据库的时候,也可以在$符号后面直接使用SQL语句,如A2A1A2中的结果是相同的,如下:

如果未在数据源管理器中连接数据源,也可以用connect函数连接,此时数据读取后,应该用close将数据库连接关闭:

 

A

1

=connect("demo")

2

=A1.query("select * from CITIES")

3

>A1.close()

A2中读出的城市信息序表,与上面的方法是相同的。