基本架构主要包含的是数据流入流出的过程
分为三层——源数据、数据仓库、数据应用
涉及的主要模块
1、数据仓库的数据来源 2、数据仓库的数据存储 3、数据的聚合4、多维数据模型5、业务模型6、数据仓库的数据应用7、报表展示8、即席查询9、数据分析10、数据挖掘
11、元数据管理
元数据管理:开源工具Apache atlas
用在hadoop上的数据治理和元数据框架工具
涉及相关技术栈:
Hadoop 、 Hive 、Spark、Yarn 、Kafka 、Zookpeer、Apache atlas、hbase、Solr...
数据/仓库/工具/涉及/Solr/java/模型/治理/Apache/架构/
数据/仓库/工具/涉及/Solr/java/模型/治理/Apache/架构/
-->