ETL中添加数据源完成后,可以选中数据源表点击编辑按钮,或直接双击数据源表,对数据源进行导入配置。
数据库表数据源的配置界面如下,可设置数据源名称,选出字段,设置主键:
选中字段后,点击【字段统计】,可以统计当前字段的最大值、最小值、去重计数、总计数,例如统计GENDER字段:
文本数据源配置界面如下,除了数据源名称、选出字段、主键配置、字段统计,还可设置字符集、分隔符号、排序字段:
检查有序:检查文本数据内容是否对勾选的有序字段有序;
第一行记录作为字段名:导入后将第一行作为字段名,不勾选时使用_1,_2,…作为字段名,默认为勾选状态;
去掉引号:剥离数据两端引号,包括标题;中间的引号不作处理;
引号作为转义符:使用Excel标准转义,数据中有双个引号转成一个引号,其它字符不转义;
保留数据项两端的空白:保留数据两端的空白符,缺省将自动删除两端空白符。
选中所有字段,设置DEPT为主键,并勾选DEPT有序,勾选第一行记录为字段名,点击【检查有序】: