这些问题会渗透到BI工具和可视化工具中。例如,一个创建新仪表盘的错误尝试可能会产生复杂的查询,从而使数据仓库陷入困境,导致其他业务线的中断。这些中断对基础设施团队和数据消费者来说都是痛苦和合人沮丧的。
然而,由于商业智能分析师是其领域内数据的主宰者,他们是对数据因复杂性、次抽样、不灵活的工具和基础设施而无法访问的业务影响最感到沮丧的人。
3.可扩展性:对不断增长的数据支持不足
传统的数据库,甚至是分布式系统在支持指数级增长的数据量方面都有困难。传统的数据库可能会在数据扩展方面遇到困难,而分布式数据库则可能在运行连接方面遇到困难,而且更难维护。
对于分布式数据系统,性能问题通常是通过增加节点和重新分配数据来处理的。对于传统的数据仓库,解决性能问题的典型方法是购买一个更大的设备,配备更多的内存和CPU。这两种”解决方案”都不是真正的解决方案,而是一个临时的创可贴,直到数据再次增长。