专项练习
结束做题
 为什么要进⾏序列化
 介绍⼀下join操作优化经验?
 介绍⼀下cogroup rdd实现原理,你在什么场景下⽤过这个rdd?
 Spark使⽤parquet⽂件存储格式能带来哪些好处?
 Executor之间如何共享数据?
知识点: 大数据
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39