我正在尝试加入两个大型火花数据帧并继续遇到此错误:
由于超过内存限制而被YARN杀死的容器。使用24 GB的22 GB物理内存。考虑提高火花……
很好地解释了开销选项 配置文件 :
这是一个内存,可以解决诸如VM开销,实习字符串,其他本机开销等问题。这往往会随着执行程序的大小而增加(通常为6-10%)。
如果您使用其中一种非JVM客户语言(Python,R等),这还包括用户对象。