专项练习
结束做题
 hadoop的TextInputFormat作⽤是什么,如何⾃定义实现?
 hadoop和spark的都是并⾏计算,那么他们有什么相同和区别?
 为什么要⽤flume导⼊hdfs,hdfs的构架是怎样的?
 map-reduce程序运⾏的时候会有什么⽐较常⻅的问题?
 简单说⼀下hadoop和spark的shuffle过程?
知识点: 大数据
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39