(完整版)logistic回归分析实例操作
(完整版)logistic回归分析实例操作
编辑整理:
尊敬的读者朋友们:
这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整版)logistic回归分析实例操作)的内容能够给您的工作和学习带来便利。同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快 业绩进步,以下为(完整版)logistic回归分析实例操作的全部内容。
(完整版)logistic回归分析实例操作
(完整版)logistic回归分析实例操作
编辑整理:张嬗雒老师
尊敬的读者朋友们:
这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布到文库,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是我们任然希望 (完整版)logistic回归分析实例操作 这篇文档能够给您的工作和学习带来便利.同时我们也真诚的希望收到您的建议和反馈到下面的留言区,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请下载收藏以便随时查阅,最后祝您生活愉快 业绩进步,以下为 <(完整版)logistic回归分析实例操作〉 这篇文档的全部内容.
(完整版)logistic回归分析实例操作
Logistic回归分析
二分类(因变量Y有(如发病1与未发病0)两种可能出现的结果)资料的Logistic回归分析,至于多分类Logistic回归分析,与二分类操作过程类似,只是在数据编制及分析方法选择处不同。 分析的一般步骤: 变量的编码
哑变量的设置和引入 各个自变量的单因素分析 变量的筛选 交互作用的引入 建立多个模型 选择较优的模型 模型应用条件的评价 输出结果的解释
实例操作
11.1 某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析.
1。各变量及其赋值说明
x1:确诊时患者的年龄(岁)
x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级(1—3)
(完整版)logistic回归分析实例操作
x3:肾细胞癌组织内微血管数(MVC)
x4:肾癌细胞核组织学分级,由低到高共4级 (1-4) x5:肾细胞癌分期,由低到高共4期 (1-4)
y:肾细胞癌转移情况(有转移y=1; 无转移y=0)。为二分类变量.
若作单因素的Logistic回归分析,也就是分别作Y与各自变量间的回归分析,如Y与X1、Y与X2等的单因素Logistic回归分析。 2.建立数据库
(完整版)logistic回归分析实例操作
3。分析步骤 (1)
(2)
(完整版)logistic回归分析实例操作
上图中若为单因素回归分析,只需在Covariates协变量框内导入单一自变量如X1即可。 (3)
(完整版)logistic回归分析实例操作
4。分析结果 (1)数据描述
Case Processing Summary
Unweighted Cases Selected Cases
Included in Analysis Missing Cases Total
Unselected Cases Total
a
N
26 0 26 0 26
Percent
100.0
.0 100.0 。0 100.0
a。 If weight is in effect, see classification table for the total number of cases。
Dependent Variable Encoding Original Value Internal Value 无转移 转移
0 1
(2)Block 1: Method = Forward Stepwise (Likelihood Ratio)
Omnibus Tests of Model Coefficients
Step 1
Step Block Model
Step 2
Step Block Model
Chi—square
15.538 15。538 15。538 6.178 21.716 21。716
df
1 1 1 1 2 2
Sig。
.000 .000 。000 。013 。000 。000
表示两步变量的引入均有统计学意义,方法合理。
Model Summary
-2 Log
Step 1 2
likelihood
18.004 11.826
ba
Cox & Snell R
Square
。450 .566
Nagelkerke R
Square
。621 。781
a。 Estimation terminated at iteration number 6 because parameter estimates changed by less than .001。
b. Estimation terminated at iteration number 7 because parameter estimates changed by less than 。001.
(完整版)logistic回归分析实例操作
可见第二步比第一步变量引入后决定系数有所增加,表明第二步变量引入后模型的拟合效果更好.
(3)
Classification Table
a
Step 1
Predicted
肾细胞癌转移情况
Observed
肾细胞癌转移情况
无转移 转移
Overall Percentage
无转移
15 2
转移
2 7
Percentage Correct
88。2 77。8
无转移 转移
16 0
1 9
84.6
94.1 100.0
Step 2 肾细胞癌转移情况
Overall Percentage
96.2
a。 The cut value is 。500
Variables in the Equation 95% C。I.for B Step 1 aEXP(B) S。E。 。916 2。2 1。196 1.088 Wald 7。829 7。468 4.072 3。713 df 1 1 1 1 Sig. .005 。006 .044 Exp(B) 12。978 。002 11。172 Lower 2.155 Upper 78。154 X2 Constant 2。563 -6。256 2。413 2。096 1。072 116.454 Step 2 bX2 X4 .054 8.136 。965 68。623 .023 。000 Constant -12。328 5。431 5.154 1 a。 Variable(s) entered on step 1: X2. b。 Variable(s) entered on step 2: X4. 模型最后引入X2(肾细胞癌血管内皮生长因子(VEGF))和X4(肾癌细胞核组织学分级)两个变
量,虽然X4引入后的参数检验显示P=0。54>0.05且其OR值的95%CI中包括1,但是考虑到其
(完整版)logistic回归分析实例操作
OR=8.136较大,且由上一表可知引入变量X4后,用模型进行预测时的Percentage Correct从84.6%提高到96.2%,因此综合考虑后还是应将变量X4引入模型。
(4)
Variables not in the Equation
Step 1
Variables
X1 X3 X4 X5
Overall Statistics
Step 2
Variables
X1 X3 X5
Overall Statistics
Score 。806 .188 6.199 3。6 8.876 1。398 .726 1.662 5.097
df
1 1 1 1 4 1 1 1 3
Sig. 。369 .6 。013 。055 .0 。237 。394 .197 。165
可见当其他变量引入模型后的参数检验均无统计学意义。
(5)
(完整版)logistic回归分析实例操作
由以上第一步和第二步的预测判别结果可见,在(Predicted Probability is of Membership for 转移 The Cut Value is .50)中,经第二步后,预测判别发生错误的例数在转移和非转移中均有下降,由此也可以得知引入变量X4是正确且必要的,同上面得出的结论是一致的.