这是一个难题,因为它涉及客户的人口统计摘要。
你有一个似乎是事实的工作。它有持续时间和工资作为衡量标准。我们知道他们是措施,因为他们有适当的单位。
鉴于工作事实,这个事实的维度是什么?
客户
时间开始了
也许您了解有关工作的其他事项(例如地理,行业)。
时间是一个时间点。这通常是一个表格,其中包含日期和日期所属的各种报告类别:季度,周,财政期间等。
客户是个人;人们没有特别好的维度。他们有很多自己的维度。
选择1.“雪花”架构。将客户视为一种具有很多维度的事实,包括他们自己的地理和学位以及学校和什么不是。
选择2.“人口统计”维度。这是学位课程,GPA范围,学校名称等的摘要。这实际上是正确的工作事实和客户之间的关联。工作属于人口统计类别。许多客户也属于该类别。
我的事实表对每个客户都有一排吗?只有一排?
对于与该事实的各个维度相关联的事实的每个可测量实例,事实表具有一行。
工作事实有两个度量:工资,持续时间和至少对维度的外键引用:开始日期和人口统计。如果您有Job的其他维度属性(如地理位置或行业),则这些属性是作业的外键。
客户人口统计将与一个或多个作业相关联。
地理或工业也是如此。
因为客户端是特殊情况,所以一个或多个客户端会 的 也 强> 将FK引用到相应的客户端人口统计维度行。
我不认为'数据仓库'是你的神奇子弹。
你应该专注于你的结果“耗时”的原因
你问的问题根本不是特别的。
有些事情是令人担忧的...就像你真的有一个弦乐学校的名字作为学校的主要钥匙?
也许发布一个实际的模式子集,以及您遇到困难的特定查询,然后您可以获得有关如何改进它们的实际帮助。