注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘

学习数据挖掘

 
 
 

日志

 
 

累计logistic  

2013-08-05 18:06:14|  分类: SAS |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
原文:http://bbs.pinggu.org/thread-2313625-1-1.html

  1. formula:以因变量为3个水平数为例(p1、p2、p3):
  2. logit(p1/1-p1)=-a_1+b_1*x_1+~~+b_p*x_p,
  3. logit((p1+p2)/1-(p1+p2))=-a_2+b_1*x_1+~~+b_p*x_p
  4. notes:系数不变,截距在变。

  5. 计算概率:
  6. p1=exp(-a_1+b_1*x_1+~~+b_p*x_p)/(1+exp(-a_1+b_1*x_1+~~+b_p*x_p)),
  7. p2=exp(-a_2+b_1*x_1+~~+b_p*x_p)/(1+exp(-a_2+b_1*x_1+~~+b_p*x_p))-p1,
  8. p3=1-p1-p2;
    累积logit模型的建模过程有点特别,看一下formula:是3个取值的因变量对应的概率p1、p2、p3
    等号左边计算的是累积概率,右边的回归截距是不同的,但所有的自变量及其系数都是相同的,下面是计算概率的公式。
    下面是SAS中经常使用的语句:

proc genmod data=temp rorder=data;
class sex area;
model purchase=area consume 
/dist=multinomial 
link=cumlogit
aggregate;
output out=a predicted=p1;
run;

明:1)predicted:计算Pr(Y<=_LEVEL_)的概率,从而可以得到p1、p2、p3的概率。
                       2)dist=multinomial和link=cumlogit指定分布形式和连接函数,这个固定的,不需要改;
                       3)aggregate:报告数据的离散(或集中)信息,广义线性模型均需要提供数据离散信息(devience/df是否等于1),如果有问题可以通过scale调整,也可以贝叶斯的方法处理。

          SAS logistic语句也可以实现这种方法,不过genmod使用的更频繁。
         可以看出该模型对数据有很严格的要求(系数不变,截距在变),经常在使用这种模型的时候,也会将这种分类视为无序分类从而使用其他模型处理。例如无序logistic模型等。
  评论这张
 
阅读(243)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017