我正在使用Kimball方法(即,数据集市的集合)为我的公司建立一个新的企业数据仓库。我想了解组织数据集市的最佳实践(或通常的实践)。
1)每个数据集市都应该是EDW服务器上的单独数据库吗?或者,每个数据集市应该是单个数据库的架构吗?
2)对于一致的维度(即,适用于2个以上数据集市/主题领域/业务流程的维度),它们应该存在于单独的架构或数据库中吗?或者,因为我们事先不知道要符合哪些维度(因为我们一次要构建一个数据集市),我们是否应该简单地在企业总线矩阵(Excel文件)中标识一致的维度,而不进行分离他们在EDW?
3)
a)是否应在EDW中完全确定事实表和维度表?例如,由于我将维护将与自助BI用户共享的每个星形模式的图表,因此通过某种方法在数据库中标识事实表是否具有任何价值,例如在表名前添加“事实”?
b)如果应在EDW中识别事实和维度表,那么识别机制应该是什么?应该通过表名前缀吗?是否应该通过将表组织成单独的“事实”和“维度”模式?