spark性能优化.pdf


立即下载 滔滔江水
2025-03-16
资源    spark 性能 executor 分配     配置 提升 内存
1.2 MB

spark性能优化点
1. 分配更多的资源
 
1.1 分配哪些资源
 
1.2 在哪里可以设置这些资源
 
1.3 参数调节到多大,算是最大
分配更多的资源:
它是性能优化调优的王道,就是增加和分配更多的资源,这对于性能和速度上的提升是显而易见的,    
基本上,在一定范围之内,增加资源与性能的提升,是成正比的;写完了一个复杂的spark作业之后,进行性能调
优的时候,首先第一步,就是要来调节最优的资源配置;在这个基础之上,如果说你的spark作业,能够分配的资源达到
了你的能力范围的顶端之后,无法再分配更多的资源了,公司资源有限;那么才是考虑去做后面的这些性能调优的点。
    
 
相关问题:
(1)分配哪些资源?
(2)在哪里可以设置这些资源?
(3)剖析为什么分配这些资源之后,性能可以得到提升?
    
executor‐memory、executor‐cores、driver‐memory
在实际的生产环境中,提交spark任务时,使用spark‐submit shell脚本,在里面调整对应的参数。
    
 提交任务的脚本:
 spark‐submit \
 ‐‐master spark://node1:7077 \
 ‐‐class cn.itcast.WordCount \
 ‐‐num‐executors 3 \    配置executor的数量
 ‐‐driver‐memory 1g \   配置driver的内存(影响不大)
 ‐‐executor‐memory 1g \ 配置每一个executor的内存大小
 ‐‐executor‐cores 3 \   配置每一个executor的cpu个数
 /export/servers/wordcount.jar
 
 
1.4 为什么调大资源以后性能可以提升
2. 提高并行度
2.1 Spark的并行度指的是什么
 第一种情况:standalone模式
  先计算出公司spark集群上的所有资源 每台节点的内存大小和cpu核数,   
  比如:一共有20台worker节点,每台节点8g内存,10个cpu。   
  实际任务在给定资源的时候,可以给20个executor、每个ex


资源/  /spark/性能/executor/分配/   /配置/提升/内存/ 资源/  /spark/性能/executor/分配/   /配置/提升/内存/
-1 条回复
登录 后才能参与评论
-->