专项练习
结束做题
 上千万或上亿数据(有重复),统计其中出现次数最多的钱N个数据。
 ⼀个⽂本⽂件,⼤约有⼀万⾏,每⾏⼀个词,要求统计出其中最频繁出现的前10个词,请给出思想,给出时间复杂度分析。
 Application isn’t using all of the Cores: How to set the Cores used by a Spark App
 Spark Executor OOM: How to set Memory Parameters on Spark
 Shark Server/ Long Running Application Metadata Cleanup
知识点: 大数据
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39