数据仓库数据集市概念区别


立即下载 v-star*위위
2024-04-19
数据 仓库 建立 集市 企业 数据集市 论文 系统 支持 决策
17.3 KB

数据集市≠数据仓库
NCR公司可扩展数据仓库解决方案小组 王闯舟 编译
我们知道 ,决策支持系统 (DSS)主要有两种实现方式 ,即建立一个数据集市或者一个数
据仓库。到底哪一种更能满足决策支持的要求并且适合企业今后的发展 ,是近两年来学
术界和有关供应商激烈争论的一个话题。
在数据集市领域 ,主要的供应商和拥护者以美国红砖 (Red Brick) 公司为代表 ,其总
裁 Ralph Kimball 在 1997年 12月的一篇论文中提出 ," 数据仓库只不过是一些数据集
市的集合而已 "。认为企业多建立一些数据集市 ,将来自然就形成了数据仓库。而业界
公认的数据仓库之父 Bill Inmon 在今年 1月立即撰文反驳 ,旗帜鲜明地指出 ," 你可以
在大海中捕到很多的小鱼并堆积起来 ,但它们仍然不是鲸 "。在 5月份的《数据管理综
述》 (DataManagement Review)中,Bill Inmon 又发表了 "数据集市不等于数据仓库 "的
论文 ,进一步阐述两者在本质上的区别以及各自的适用场合 ,本文就是根据这篇论文的
主要内容编译而成的。
问题的提出
现在 ,各企业 IT 部门的经理所面临的最主要问题之一是先建立数据仓库还是先建
立数据集市。长期以来 ,数据集市供应商们不断地给他们灌输这样的观念 ,即建立数据
仓库比较复杂 ,投资过大 ,设计与开发周期太长 ,难以集成和管理企业范围内的各种源
数据 ;并认为 ,基于数据仓库的 DSS投资方案难以得到企业管理层的批准。数据集市供
应商们给业界描绘了一幅数据仓库前景暗淡的图画 ,这完全是出于自身的目的 ,是不正
确的。
数据集市供应商们把数据仓库当成其增加营业收入的绊脚石 ,自然要避开和攻击
数据仓库。事实上 ,他们在销售时强调数据集市的建设周期短 ,是以企业信息系统结构
的长期规划为代价的。
持数据集市主张的人认为 ,决策支持系统的成功实现 ,除了数据仓库以外 ,还有更
简便、更有效的其它途径。方法之一就是建立多个数据集市 ,当它们增加得足够大时 ,
那就是所谓的数据仓库了。这些人声称 ,建立数据集市要快得多也便宜得多 ,因为当考
虑建立一个数据集市时 ,不必考虑各部门之间的区别 ,也不必设立部门之间协调的规
则 ,更不存在结构设计上的长期规划问题。


数据/仓库/建立/集市/企业/数据集市/论文/系统/支持/决策/ 数据/仓库/建立/集市/企业/数据集市/论文/系统/支持/决策/
-1 条回复
登录 后才能参与评论
-->