第十六章 logistic回归分析
logistic回归为概率型非线性回归模型,是研究分类观察结果(y)与一些影响因素(x)之间关系的一种多变量分析方法
问题提出:
医学研究中常研究某因素存在条件下某结果是否发生?以及之间的关系如何?
因素(X) 疾病结果(Y)
x1,x2,x3…XK 发生 Y=1
不发生 Y=0
例:暴露因素 冠心病结果
高血压史(x1):有 或无 有 或 无
高血脂史(x2): 有 或 无
吸烟(x3): 有或无
研究问题可否用多元线性回归方法?
1.多元线性回归方法要求 Y 的取值为计量的连续性随机变量。
2.多元线性回归方程要求Y与X间关系为线性关系。
3.多元线性回归结果 不能回答“发生与否”
logistic回归方法补充多元线性回归的不足
Logistic回归方法
该法研究是
当 y 取某值(如y=1)发生的概率(p)与某暴露因素(x)的关系。
P(概率)的取值波动0~1范围。
基本原理:用一组观察数据拟合Logistic模型,揭示若干个x与一个因变量取值的关系,反映y 对x的依存关系。
第一节 logistic回归
一、基本概念
1.变量的取值
logistic回归要求应变量(Y)取值为分类变量(两分类或多个分类)
自变量(Xi)称为危险因素或暴露因素,可为连续变量、等级变量、分类变量。
可有m个自变量X1, X2,… Xm
2.两值因变量的logistic回归模型方程
一个自变量与Y关系的回归模型
如:y:发生=1,未发生=0 x : 有=1,无=0,
记为p(y=1/x)表示某暴露因素状态下,结果y=1的概率(P)模型。
或
模型描述了应变量p与x的关系
P概率
1
0.5
回归/关系/变量/因素/logistic/模型/取值/方法/分类/暴露/
回归/关系/变量/因素/logistic/模型/取值/方法/分类/暴露/
-->