PROSAGA码农传奇-YARN-尽管添加会话设置，查询也需要时间

<div class =“post-text”itemprop =“text”>
  
    这个加入你的查询：
  
   <pre>
 <code>
 JOIN (
 SELECT 
 ... SKIPPED ...
) 
single_use_subq30725 
WHERE (single_use_subq39991.a0 < single_use_subq30725.a0) AND (single_use_subq39991.a1 <= single_use_subq30725.a7)]

</code>
 </pre>
  
    作为CROSS JOIN工作，因为没有指定ON条件。
在此CROSS JOIN之后，使用此过滤数据集
     <code>
 WHERE (single_use_subq39991.a0 < single_use_subq30725.a0) AND (single_use_subq39991.a1 <= single_use_subq30725.a7)
 </code>
  
  
    实际上它不会乘以行并且应该作为MAP-JOIN工作，因为第一个子查询最多返回一行：
  
   <pre>
 <code>
 SELECT MAX(t1.a0) as a0, MAX(t1.a1) as a1

</code>
 </pre>
  
    添加此设置以启用map-join：
     <code>
 set hive.auto.convert.join=true;
 </code>
    
检查map-join是在EXPLAIN输出中。
  
  
    但最大的问题不是这个CROSS（MAP？）加入了自己。当在第二个查询中读取表时，它会阻止谓词下推在加入之前工作。
  
  
    我建议删除连接并计算一次查询并提供
     <code>
 a0
 </code>
     和
     <code>
 a1
 </code>
     作为参数
     <code>
 where
 </code>
     条款。通过这种方式，您将消除不必要的连接，谓词下推可能直接起作用。
  
  
    例如，PPD可以应用于此列：
     <code>
 w5883634877684653839_read_lcl_tlog_raw_2_view__m_ctm_rawtlogdata_target_tbl.CREATE_TS as a0
 </code>
  
  
    检查PPD和其他性能设置：
    <a href="https://stackoverflow.com/a/48296562/2700344">
      https://stackoverflow.com/a/48296562/2700344
    </A>
  
</DIV>