在工具栏中可以通过打开按钮 快速打开数据文件,数据目录中的文件则可以直接双击打开,对于结构复杂的数据文件,比如带密码的excel文件、使用特殊分隔符的文本文件等,还可通过文件 - 复杂打开的方式自定义导入文件内容。下面我们通过示例来介绍复杂打开方式的用法。
例如导入一个订单信息相关的数据文件orders2020.txt,操作如下:
orders2020.txt:
点击文件 - 复杂打开,选择orders2020.txt文件。进入文件数据集编辑界面,如下图所示:
名称:打开数据文件后显示的结果集名称;
字符集:选择文件对应的字符集类型,默认是缺省(即文件原有的字符集);
分隔符号:选择字段间的分隔符号,txt文件时默认是制表符(TAB),csv文件时默认为逗号;
分段数:将当前数据文件的数据分为几段;
分段号:获取分段后的第几段数据;
导入字段:选择要导入的数据文件中的字段,字段类型及格式;
第一行记录作为字段名:导入后将第一行作为字段名,不勾选时使用_1,_2,…作为字段名,默认为勾选状态;
引号作为转义符:使用Excel标准转义,数据中有双个引号转成一个引号,其它字符不转义;
保留数据项两端的空白:保留数据两端的空白符,缺省将自动删除两端空白符;
去掉引号:剥离数据两端引号,包括标题;中间的引号不作处理;
多线程取数:多线程取数,加快读取文件速度;
列数和第一行不匹配作为错误处理:列数和第一行不匹配时作为错误处理,不匹配的记录行将被抛弃。
配置完成后点击【确定】按钮,一个文本文件就导入完成了:
例如打开Excel文件orders2020.xlsx,该xlsx文件第一行是标题,后面是行数据,数据内容如下:
点击文件 - 复杂打开,选择orders2020.xlsx,界面如下:
名称:打开数据文件后显示的结果集名称;
起始行 / 结束行:设置Excel文件读取的起始行、结束行;
密码:输入Excel文件的打开权限密码;
页面:选择要打开的Excel文件中的sheet页;
刷新:对于带有打开权限密码的Excel文件,输入密码后,需要点击刷新按钮才能显示sheet页名称;
第一行记录作为字段名:导入后将第一行作为字段名,不勾选时使用_1,_2,…作为字段名。该项不勾选时默认导入全部字段;
忽略空白行:读取时去除Excel内容前后的空白行;
忽略两端空白符:读入时去除字符串两端的空白字符。
配置完成后点击【确定】按钮,Excel文件导入完成:
数据文件工具不仅能编辑Excel、txt、csv,还可以编辑集文件(.btx)。更多关于集文件的介绍可参考《教程 – 集文件》,下面以dept.btx文件为例介绍如何打开集文件:
点击文件 - 复杂打开,选择集文件dept.btx:
名称:打开数据文件后显示的结果集名称;
分段数:将当前集文件的数据分为几段;
分段号:获取分段后的第几段数据;
导入字段:选择要导入的数据文件中的字段。
配置完成后点击【确定】按钮,集文件导入完成: