编辑数据源

阅读(2092) 标签: 编辑数据源,

ETL中添加数据源完成后,可以选中数据源表点击编辑按钮,或直接双击数据源表,对数据源进行导入配置。

  数据库表数据源的配置界面如下,可设置数据源名称,选出字段,设置主键:

选中字段后,点击【字段统计】,可以统计当前字段的最大值、最小值、去重计数、总计数,例如统计GENDER字段:

文本数据源配置界面如下,除了数据源名称、选出字段、主键配置、字段统计,还可设置字符集、分隔符号、排序字段:

 

检查有序:检查文本数据内容是否对勾选的有序字段有序;

第一行记录作为字段名:导入后将第一行作为字段名,不勾选时使用_1_2,…作为字段名,默认为勾选状态;

去掉引号:剥离数据两端引号,包括标题;中间的引号不作处理;

引号作为转义符:使用Excel标准转义,数据中有双个引号转成一个引号,其它字符不转义;

保留数据项两端的空白:保留数据两端的空白符,缺省将自动删除两端空白符。

选中所有字段,设置DEPT为主键,并勾选DEPT有序,勾选第一行记录为字段名,点击【检查有序】: