在上一章中已经完成了数据准备,那么接下来可以使用这些数据作为数据源在ETL中执行计算。
ETL中的数据源类型可以是数据库表,文本文件,Excel文件和集文件。以数据库表为例,在打开的etl文件上,点击编辑 – 数据库表,或者点击工具栏中的【数据库表】按钮,进入数据库表配置界面:
名称:定义数据集名称;
结果类型:选择结果集类型,结果类型包含序表和游标两种,不同类型结果集后续的计算方法存在差异;
数据源:选择数据源,在工具-数据连接中配置数据源,数据源为连接状态时,数据源名称则会显示在此处的下拉列表中;
表名:从数据源中选择数据表;
表名加引号:选择表名是否加引号,当表名出现包含特殊字符、与关键字冲突、区分大小写、跨数据库兼容性等特殊情况时,可能需要添加引号系统才能正确取数;
引号类型:选择引号类型,包含双引号、单引号、MYSQL三种。
例如上图配置,点击【确定】按钮,生成数据集内容如下:
ETL中的数据源表结构中会列出前5个字段名称,点击数据源结构表,在右侧的结果集界面中可查看该数据表中的所有数据。
文本文件、Excel文件、集文件类型的数据源分别可通过编辑菜单或直接点击工具栏中的按钮进入导入配置界面,配置方式与复杂打开配置相似,可参考数据准备 – 多样性数据源章节。
在右侧数据集界面中,点击按钮,打开下一层要显示的数据。
在右侧数据集界面中,点击按钮,退回到上一层显示的数据。
在右侧数据集界面中,点击按钮,预览当前选中数据的具体内容。
在右侧数据集界面中,选中字段值后,点击按钮,复制该行数据到剪贴板;未选中任何内容时,点击按钮,复制所有数据到剪贴板。
在右侧数据集界面中,点击按钮,复制所有列的列名称到剪贴板。
在右侧数据集界面中,点击【图形浏览】按钮可以将当前页数据以统计图的形式展示,例如:
图形类型可以选择柱形图、饼图、折线图,用户可以自定义分类字段、系列字段、数值字段等内容,还可以在设置中对统计图属性进行个性化设置:
点击【复制】按钮可以将图片复制到剪贴板中,还可以通过【另存为】按钮将统计图保存为svg格式的图片文件。
在右侧数据集界面中,右击选择【缩放】,可对当前结果集界面设置按比例缩放显示。
例如给SALARY列设置货币格式,右击结果集界面中的SALARY列选择【列格式编辑】:
点击确定,结果如下: