PROSAGA码农传奇-模型可视化-为什么geom_smooth中的斜率不同取决于R中的变量顺序？

<div class =“post-text”itemprop =“text”>
  <H3>
    简短的回答
  </H3>
  
    你打电话的时候
     <code>
 geom_smooth()
 </code>
    ，它计算形式的简单线性回归（或OLS回归）的斜率
     <code>
 y = a + bx
 </code>
    。
  
  
    OLS就是在努力想出最好的预测
     <code>
 y
 </code>
     变量，给定的值
     <code>
 x
 </code>
     变量。这是一个不同的目标，而不是试图提出最好的预测
     <code>
 x
 </code>
     变量，给定的值
     <code>
 y
 </code>
     变量。
  
  
    因此，如果你改变顺序
     <code>
 aes(x = v1, y = v2)
 </code>
     至
     <code>
 aes(x = v2, y = v1)
 </code>
    ，你正在使用
     <code>
 geom_smooth()
 </code>
     实现两个不同的，不同的目标。
  
  <H3>
    插图
  </H3>
  
    想象一下，您有以下数据集：
  
  
    <a href="https://i.stack.imgur.com/xn3MQ.png" rel="nofollow noreferrer">
      <img src =“https://i.stack.imgur.com/xn3MQ.png”alt =“在此处输入图片说明”/>
    </A>
  
  
    当你运行OLS回归时
     <code>
 y ~ x
 </code>
    ，你想出了以下模型
  
   <pre>
 <code>
 y = 0.167 + 1.5*x

</code>
 </pre>
  
    这优化了预测
     <code>
 y
 </code>
     通过进行以下预测，这些预测具有相关的错误：
  
  
    <a href="https://i.stack.imgur.com/Ea4Uh.png" rel="nofollow noreferrer">
      <img src =“https://i.stack.imgur.com/Ea4Uh.png”alt =“在此处输入图片说明”/>
    </A>
  
  
    OLS回归的预测在最右列中的值的总和（即，平方和）尽可能小的意义上是最优的。
  
  
    当你运行OLS回归时
     <code>
 x ~ y
 </code>
    ，你想出了一个不同的模型：
  
   <pre>
 <code>
 x = -0.07 + 0.64*y

</code>
 </pre>
  
    这通过进行以下预测以及相关错误来优化x的预测。
  
  
    <a href="https://i.stack.imgur.com/b1Abh.png" rel="nofollow noreferrer">
      <img src =“https://i.stack.imgur.com/b1Abh.png”alt =“在此处输入图片说明”/>
    </A>
  
  
    同样，这是最佳的，因为最右边的列的值总和尽可能小（等于
     <code>
 0.071
 </code>
    ）。
  
  
    现在，假设您试图反转第一个模型，
     <code>
 y = 0.167 + 1.5*x
 </code>
    ，使用代数，给你模型
     <code>
 x = -0.11 + 0.67*x
 </code>
    。
  
  
    这将为您提供以下预测和相关错误：
  
  
    <a href="https://i.stack.imgur.com/OggRS.png" rel="nofollow noreferrer">
      <img src =“https://i.stack.imgur.com/OggRS.png”alt =“在此处输入图片说明”/>
    </A>
  
  
    最右边一列中的值的总和是
     <code>
 0.074
 </code>
    ，它大于你在y上回归x得到的模型的相应和，即
     <code>
 x ~ y
 </code>
     模型。换句话说，“倒置”模型比简单模型做得更糟糕
     <code>
 x ~ y
 </code>
     回归模型。
  
</DIV>