数据集分析

阅读(7216) 标签: 数据集,

多维分析类似于其它OLAP产品。主要是通过自定义左/上表头和指标数据区对数据分组查看,不严格限定维度字段、指标字段,放到表头上的字段自动被认为是维度字段。数据集是多维分析的重要组成部分,界面模型支持多数据集,每个数据集支持多报表。

数据集可以通过数据库的SQL查询获得,也可以来自其他异构的数据文件。多维分析不关心数据集的数据来自哪里,始终基于数据集返回的结果集做分析。

概述

分析控件中提供了几个比较常用的数据集,如数据库查询SQLSPL脚本(SPL脚本和.splx/.spl/.dfx文件),这两种类型的数据集是由客户根据业务需要自行编写对应的脚本来提供数据集进行分析的。在这里,分析控件不关心这个数据集如何计算,只要编写的SQL SPL是可执行的,能返回给分析控件结果集,那么分析控件就能针对这个数据进行分析。所以,对数据源数据处理要求复杂灵活的,可以选择这几种数据集。SPL脚本类型的数据集适合对集算器脚本有一定了解的用户

除了上面提到的这几种数据集类型外,产品还支持直接对已有的txtcsvxlsxlsxctxbtx类型的数据文件或填报表生成的json/btx文件做分析。ctxbtx需使用含有集文件功能点的润乾报表授权。

关于SQL数据集的使用在快速入门章节中已做介绍,这里就不再说了。下面我们来介绍一下如何对常用的Exceljson类型的文件做多维分析。

Excel

Excel文件内容如下:

这个格式很普通,第一行是标题,后面就是一行行的数据了。

润乾报表多维分析界面:

不管Excel数据文件是在应用服务器上还是在本地,多维分析界面都能帮你轻松搞定。当然操作起来也非常简单,点击菜单中的【数据集】,弹出管理数据集窗口,点击【添加数据集】,切换到单表数据集的数据文件,选择数据文件。

点击【导入数据】按钮,读取demo.xls中的数据,返回的结果集缓存入临时文件。

如果文件在本地,可点击【上传数据文件】按钮,选择文件,将文件上传到服务器;

下拉列表缺省读取/WEB-INF/file/fileData目录。如需修改该目录可在[demo应用根目录]\WEB-INF\guideConf.properties文件中修改fileDataFolderOnServer默认值。

 

新建报表:

 

如上图所示,添加报表后拖拽指标就可以对文件数据集做多维分析查询了。

 

除此之外也可以通过在url中添加dataFile参数,来对需要分析的txtcsvxlsxlsxbtxctx等类型的数据文件进行分析,例如:

http://localhost:6868/demo/raqsoft/guide/jsp/olap.jsp?dataFile=WEB-INF/files/fileData/demo.xlsx

dataFile仅支持相对路径,相对于应用根目录。

json

多维分析不仅能对Exceltxtcsv做分析,还可以对json或者二进制文件做分析。这里所说的json/二进制文件可以是用户自己创建的,也可以是使用润乾填报表生成的json/二进制文件。

填报数据做为数据集,主要用于分析数据集需要来源于一个或多个预先准备好的填报文件。比如在实际应用中,不同权限角色的用户已经通过填报表将明细数据保存到了json文件中,在多维分析中想对多个用户保存的明细数据做汇总分析,这种情况则可以选择填报文件类型的数据集。关于填报表的更多介绍可学习《填报教程》。

填报数据文件类型支持.json或二进制文件。本节以json为例,介绍在多维分析中的使用。

例如需要对A班级和B班级的学生成绩做汇总分析,分析两个班级的各科平均分。两个班级的成绩表分别以班主任姓名为文件名,保存在李芳.json和张颖.json,接下来将具体讲解如何分析业务填报数据。

步骤一:

将李芳.json张颖.json放到填报文件数据集的下拉列表加载目录下,路径为[安装根目录]\report\web\webapps\demo\WEB-INF\files\inputFile\

步骤二:

新加填报文件数据集,选择要分析的数据文件并选择表,点击【导入数据】填报文件数据集就创建完成了。

填报数据文件支持选择一个或多个,多个时必须保证填报数据文件中的结构相同。每次选择文件后该文件路径都会自动拼接到编辑框中,如果文件的路径在编辑框中已存在,则不会拼接。

添加数据集时填报文件下拉列表会列出全部json/二进制文件。如需修改下拉列表读取的目录,可在[demo应用根目录]\WEB-INF\guideConf.properties文件中修改inputFileFolderOnServer默认值。

新建报表:

 

如上图所示,添加报表后拖拽指标就可以对任意填报文件的数据集做多维分析查询了。

添加填报文件类型的数据集除了在上图所示的填报文件Tab页中添加,还可通过在jsp中为分析控件的Tag标签添加属性来实现,对应的属性为inputFiles

JSPTag标签发布如下:

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> 

<%@ taglib uri="/WEB-INF/raqsoftAnalyse.tld" prefix="raqsoft" %>

<raqsoft:analysev2 

  inputFiles="李芳.json;张颖.json "  //指定填报数据文件,多个文件用分号隔开

/>

inputFiles属性介绍可参考《程序员参考》DQL分组分析控件详细说明小节。

SPL

SPL文件是通过润乾集算器生成的文件,文件后缀为.splx/.spl/.dfx。在SPL文件中可以执行各类数据分析与结构化计算,也可以自由访问数据库。多维分析使用SPL数据集时,需要选择SPL文件,并且在.dfx/.spl/.splx文件的网格程序中使用return语句将结果集返回,这样就可以对SPL的返回结果做多维分析了。

readExcel.splx文件内容如下

 

A

1

=file(arg1).xlsimport@t()

2

return A1

新建SPL脚本数据集:

选择SPL文件,点击【导入数据】 SPL脚本数据集就创建完成了。

SPL文件下拉列表缺省会将[安装根目录]\report\web\webapps\demo\WEB-INF\files\spl\目录下的SPL文件全部列出。如需修改下拉列表读取的目录,可在[demo应用根目录]\WEB-INF\guideConf.properties文件中修改splFolderOnServer默认值。

新建报表:

 

如上图所示,添加报表后拖拽指标就可以对任意SPL脚本数据集做多维分析查询了。

添加SPL脚本类型的数据集,除了在上图所示的SPL脚本Tab页中添加,还可通过在jsp中为分析控件的Tag标签添加属性来实现,对应的属性为splFilesplParams

JSPTag标签发布如下:

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> 

<%@ taglib uri="/WEB-INF/raqsoftAnalyse.tld" prefix="raqsoft" %>

<raqsoft:analysev2

  splFile="readExcel.splx"

  splParams="arg1=D:/demotest.xlsx"

/>

Tag标签中的splFilesplParams属性介绍可参考《程序员参考》分组分析控件详细说明小节。