- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

多样性数据源报表如何做？

士别三日wyx 发表于 2022/11/23 10:51:03 2022/11/23

【摘要】现代应用已经进入多数据源阶段了，不再是一个单一的数据库包打天下，一个应用中会涉及除关系数据库外各种数据源，如文本文件类数据、NOSQL、多维数据库、HTML Webservice等等，即使是关系数据库，也不止一个。与之对应的，应用中的报表自然也会涉及到多样性的数据源了现在的报表，基本都是用报表工具来做，很多报表工具都号称支持多数据源，是不是能解决这个问题呢？实际上并不能，他们只能搞定一点点...

现代应用已经进入多数据源阶段了，不再是一个单一的数据库包打天下，一个应用中会涉及除关系数据库外各种数据源，如文本文件类数据、NOSQL、多维数据库、HTML Webservice等等，即使是关系数据库，也不止一个。

与之对应的，应用中的报表自然也会涉及到多样性的数据源了

现在的报表，基本都是用报表工具来做，很多报表工具都号称支持多数据源，是不是能解决这个问题呢？

实际上并不能，他们只能搞定一点点

报表工具能轻松搞定的多源数据长什么样

简单来说，来自关系数据库的多源数据都比较好搞定，不管是多表，还是多库，都很简单，用SQL把各个来源的数据都取出来，放到报表中去关联、计算、呈现就可以

这样的多源数据，好一点的报表工具都可以轻松应对

报表工具不好搞定的多源数据长什么样

也可以简单的说，不是单纯的关系数据库的多源数据，报表工具都不太好做

进入大数据时代以来，不仅数据变大了，而且存储的方式也多了，除了传统的关系数据库外，还有

1.TXT/CSV、Excel、JSON/XML 等文件；
2.MongoDB、Cassandra、HBase、Redis 这些 NoSQL 数据库；
3.HDFS 等分布式文件系统；
4.webService；
5.ES、Kafka 等其他数据源形式

文件类的某些报表工具还能搞定，但也只限于读，而不会算，只能先全部读入到报表中，然后再利用报表的计算能力来计算处理，数据量大时，读取的效率和空间容量都可能会成为问题，（极个别的工具可以边读边汇总过滤，还能并行流式读取，会好很多）；其它类的数据源大部分报表工具就连读都不会了，因为没有标准，每家有各自的API，想要读取，大部分都得通过JAVA自定义数据集的方式了

读取都这么费劲，而这些数据常常在业务逻辑上又有关联，做报表的时候大部分时候都会涉及到多个数据源之间的关联混算，单凭报表工具提供的多源关联能力处理起来就变得更困难

报表工具解决不了只能硬编码

虽然报表工具解决不了，但也难不倒工程师，因为工程师会编码，没有什么是编码解决不了的，

工程师可以先把异构的数据变成同构的，比如把文件的数据先导入到RDB中，由RDB计算后再给报表用，而那些不会读的，就只能再一次依靠所有报表工具都提供的所谓自定义数据原接口了用JAVA读入并处理好，再传给报表

项目中，很多困难的多源混算情况，都是这么处理的，都能搞定，但是这么做其实弊端很多

异构变同构，其实大部分时候是把不同的数据强行装入到常见关系数据库中，然后再利用SQL的方式来处理计算，这样做，首先得考虑数据库本身的管理和压力，管理上是否允许这样操作，容量是否够，每次遇到这样的库外数据都要往数据库中放？

除此之外，还有一个最重要的问题：时效。

数据的导入都需要时间，量少的耗时短可能无所谓，量大的可能进度都被耽误了，而且一般业务数据都是实时变动的，导入数据的方式也基本很难保证数据的实时性，还有些变不了或者变起来极困难的，像json/xml多层数据（mongodb也是这种），要建很多表，想变都变不了

JAVA处理的话，要好很多，不用考虑入库的一系列问题，实时性也可以保证，但是开发成本高，还会破坏应用架构

JAVA开发人员的成本本身就高，然后JAVA计算数据的能力还很弱，写起来工作量很大，简单做个求和运算都需要写数行代码的循环来实现，更别说逻辑复杂的运算了，动辄几百行的代码，一个报表还可以承受，报表一多，就承受不了这样的高成本。

另外JAVA代码需要和项目应用一起编译，也会带来报表和应用高耦合的问题，还会影响报表本身热切换的能力

有没有更好的办法

如果报表工具提供处理复杂多样性数据源的能力，那问题就可以迎刃而解了，就不需要再来回倒腾数据或者JAVA硬写了

润乾报表集成SPL集算器以后就具备了这样的能力

SPL 是一款流行的专业的数据计算处理工具，很多项目开发商都在用，因为它不仅好用，而且还免费，开源，是常年做项目，总需要做数据处理的工程师的好帮手

集成 SPL 后，润乾报表相当于多了一个计算层，这个计算层支持常见的各类数据源，可以同时计算来自不同数据源的数据，不管它是同构还是异构

比如JSON和ORACLE混算

	A
1	=json(file("/data/EO.json").read())	JSON数据
2	=A1.conj(Orders)
3	=A2.select(Amount>1000 &&Amount<=3000 && like@c(Client,“s”))	条件过滤
4	=db.query@x(“select ID,Name,Area from Client”)	数据库数据
5	=join(A3:o,Client;A4:c,ID)	关联计算

再比如MongoDB和 CSV关联运算

	A
1	=mongo_open(“mongodb://127.0.0.1:27017/mongo”)
2	=mongo_shell(A1,“Orders.find()”).fetch()
3	=file(“Employee.csv”).import@tc()
4	=mongo_close(A1)
5	=join(A2,SellerId;A3,EId)
6	=A5.new(_1.OrderID,_1.Client,_2.Name,_2.Gender,_2.Dept)

原本要做各种转换把数据导入到库里，或者用大段的JAVA来写，现在简单几行SPL代码就轻松搞定了

说在最后

集成了SPL的润乾报表，简单几行代码就可以搞定多样性数据源的难题，不仅让报表做起来更轻松，更是帮用户省下了大把的人工成本，而且润乾报表本身也好用，润乾一直都是报表行业的头部供应商，各行业的大小软件开发商们都有用润乾，现在的价格又很亲民，1W一套，3W一年随便用，也可以给项目上省出不少费用，有需要的可以收藏一下了

欢迎对润乾报表有兴趣的加小助手（VX号：RUNQIAN_RAQSOFT），进技术交流群

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

多样性数据源报表如何做？

报表工具能轻松搞定的多源数据长什么样

报表工具不好搞定的多源数据长什么样

报表工具解决不了只能硬编码

有没有更好的办法

说在最后

润乾报表资料

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

多样性数据源报表如何做？

报表工具能轻松搞定的多源数据长什么样

报表工具不好搞定的多源数据长什么样

报表工具解决不了只能硬编码

有没有更好的办法

说在最后

润乾报表资料

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品