近日有朋友在《统计咨询》公众号提问:重复测量资料可以做生存分析吗?应该怎么做?小编苦思良久。回顾一下常见的生存分析资料,最后整理的数据通常是记录了每位研究对象基线或者某个时间点的自变量 (如,年龄、性别、血压等) ,以及最后一次随访的时间以及结局 (如,2年、有无复发或删失) 。而 这些最终分析数据的来源往往是研究者多次随访记录的资料 (即,重复测量资料) 。与生死的结局不一样,有时研究者关心的结局在同一个研究对象中可以反复出现,那么,对于这样的重复测量资料,如何进行分析呢?

对于重复测量资料,最熟悉的应该是因变量为连续型变量的重复测量资料的方差分析,大家可以查阅往期文章《重复测量资料方差分析的超详细步骤》。

如果因变量是二分类等非连续型结局,或者研究者想考虑多个自变量对结局的影响,我们可以采用混合效应模型,大家可以查阅往期文章《强大的混合效应模型Mixed Effect Model》。

按照混合效应的原理,我们只要在模型考虑同一个研究对象不同时间点数据的相关性,作为随机效应纳入模型就能得到“正确”的结果。本文介绍的情况与前述混合效应模型不同的是,因变量为生存结局, 哪个模型能同时考虑“相关性”和“生存结局”的特点呢

R包survival中有一份重复测量的生存分析资料,名字为bladder,记录的是膀胱癌的复发随访资料,共85位研究对象,每位研究对象随访4次,包含的变量如下:

  • id:研究对象的编号,取值1~85
  • rx:治疗方式,1为安慰剂组,2为抗肿瘤药组
  • number:入组时的肿瘤个数,取值1~8
  • size:入组时最大的肿瘤大小 (cm) ,取值1~7
  • stop:随访时间,取值1~59
  • event:研究结局,1为复发,0为删失
  • enum:随访的字数,取值1~4
  • 下面以R代码对上述重复测量的生存分析资料进行Cox回归。

  • #加载R包
  • library(survival)
  • #Cox回归
  • coxph(Surv(stop,event)~rx+size+number+enum+cluster(id),bladder)
  • 上面的程序中,cluster(id) 正是对数据“相关性”进行了考虑。结果的查看与传统的cox回归一样,变量 number 和 enum 具有统计学意义,前者为危险因素,后者为保护因素。 返回搜狐,查看更多

    责任编辑:

    声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。