专项练习
结束做题
 有10个⽂件,每个⽂件1G,每个⽂件的每⼀⾏存放的都是⽤⼾的query,每个⽂件的query都可能重复。要求你按照query的频度排序。
 JVM&垃圾回收机制
 在5亿个整数中找出不重复的整数,注,内存不⾜以容纳这5亿个整数。
 腾讯⾯试题:给40亿个不重复的unsignedint的整数,没排过序的,然后再给⼀个数,如何快速判断这个数是否在那40亿个数当中?
 怎么在海量数据中找出重复次数最多的⼀个?
知识点: 大数据
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39