BW - 03 HANA
文章目录
不知道HANA,那你就太过时了。
SAP吹的牛是 HANA is SAP’s vision for the future是未来。。。🤔
大量实时数据的处理都放到服务器的内存上,因此分析极其迅速。immediate来形容。
以前,我们从来都是把数据放到硬盘上的啊。现在给整内存里了。
那SAP为啥搞这个啊。搞它的两大软件杀器ERP和BW不就行了么?还真是不行,因为数据存储,始终被Oracle和微软卡脖子。它搞数据分析的初衷始终被性能调优给掩盖。原本该发挥数据分析功效的,结果可倒好,整天来搞性能调优,搞聚集,搞模型优化,搞查询优化,这也不能干,那也不能干数据拉出来还超慢。。。
那就往数据库转型吧。。。
别人用硬盘,它用内存。。。管它什么地址总线宽度,什么寻址。直接内存搞起。
一句话,HANA是个数据库。不是像BW和ERP这种软件。
而且由于直接在内存上处理,快到不需要缜密思考模型的优化。这种快不是假的,像tableau宣称自己快,结果我跑个表花了十几分钟。。。
回到BW上面来,BW的源是ECC,但是咱肯定都思考过,从源头到BW的PSA,这是数据的第一层,然后还要往上层去,到DSO,到Cube,这一层层的,为了进行数据的清洗和集成,搞了这么多层冗余。你想想,这都是表啊,这个DSO里有,那个info cube里有。时间越长,表越大。
为了防止表过大,我们可能还要考虑归档数据,把这个DSO的数据给归档到别的地方去,让这个表别看起来太大。
这都是为了啥啊。。。
而且BW作为OLAP系统,是要分析历史数据的,时间越长,数据量越大,当报表性能不够时,又得建索引,建聚集,每建一个都是对系统空间的挤占,是数据的又一次冗余。然而,这对于报表性能只能是杯水车薪。你为了调优,做了所有你能做的,索引和分区都实在不能再搞了。然而报表性能还是差。好了,现在买BWA吧,又把数据给复制一遍,无限复制,这可不就是个死胡同么。
再这么发展下去,SAP BW是没有出路的。。。
HANA怎么来解决呢,剔除这么多层吧。
内存计算引擎就可以把底层数据建模成维度模型,清洗数据以及和外部数据组合都不在话下,也不需要什么索引和聚集了。BWA啥的也不需要了。
直接DSO吧,反正大家都在内存了,都优化了,也就不用infocube了。
作为一个数据库,用起来也没那么简单。需要硬件团队配置和安装。而且要先在HANA上建模,然后再转移数据。然后还要配置BI前台从HANA数据库读数据啊,不是从旧的数据库。
所以说,要买HANA server。然后做一系列设置的。至于你要直接上HANA还是从旧的BW转移到BWonHANA,这都得细细考究。
这里还要提到,HANA上不仅是数据的冗余少了AKA不需要一层层抽取,大大节省时间,而且占的存储空间也少了,因为它搞了列式存储,显著提升读的速度。虽然对于写没那么友好。我在这里写过:行列存储
.
列式存储由于属性的值有很多重复的,压缩一下就可以节省很多空间。而且报表读取的时候,如果只需要读取几个属性,那列式存储效率非常高。
以下是个实施HANA的步骤:
文章来自于网络,如果侵犯了您的权益,请联系站长删除!