
关注公众号的朋友都知道郑老师我之前连续4年开设了“30天学会医学统计学”从理论到实操一步一步教会大家统计学、SPSS课程。2026年我们对这门课程进行全新升级课程时间大幅度缩短内容大幅度提升我称为9天实用医学统计学公益训练营。课程介绍“9天实用医学统计学”公益训练营即将启动更高效、更高级的统计课本课程是浙江中医药大学医学统计学教研室的公益、免费公开视频课不是骗人入坑收费的广告。本课程公益视频课定期开课欢迎您参与学习。欢迎报名本公众号“医学论文与统计分析”后台回复“报名”加入微信学习群吧。Day 5-1 定量暴露因素的趋势性分析今天带大家学习我们课程的第四章定量暴露因素的因果推断。在医学研究甚至其他学科里面我们经常看到暴露因素、研究因素是一个定量的指标它不能简单分为二分类或多分类需要从定量角度去分析。因此它的统计策略是有所区别的。这个章节我们就进行这方面的探讨。定量暴露因素的趋势性分析首先我讲讲第一节定量暴露因素的趋势性分析。趋势性研究在我们医学研究场景是非常常见的。现在凡是你的暴露因素是定量的都要去讨论它的趋势性。趋势性主要分为线性趋势和非线性趋势。√线性趋势性分析首先我们介绍一下线性趋势性分析。什么是趋势性呢医学的趋势性是事物的结局指标随着暴露水平发生改变而改变的一个现况。这种改变医学的专业术语叫剂量反应关系也就是暴露指标浓度增加结局指标水平会增加或减少。还有一个叫剂量效应关系暴露指标增加结局的发生率比如死亡率、有效率会提升。这种趋势性分析其实是因果推断的一种方法、一种理念它主要针对定量暴露因素。统计学上的线性趋势主要讨论我们的结局指标(Y)是否会随着定量暴露因素(X)呈现一定的线性或倾向性改变。这个线性就是之前我们学过线性回归里面的那个线性X跟Y的关系是线性的关系而这种线性关系其实就是线性趋势性分析的一种展现。案例血清中Klotho与糖尿病肾病的关系以一项研究血清中某个指标Klotho与糖尿病生病、死亡关系的研究为例。Klotho是一种跟衰老有关的蛋白它的含量增加疾病的进展、疾病的死亡就会增加。文章的结果部分展示了两张图第一幅图展现的是Klotho指标和糖尿病肾病发病的关系第二幅图是Klotho指标与死亡的关系。√与糖尿病生病之间的关系第一幅图X是Klotho浓度Y是OR值OR值反映的是糖尿病肾病的发病强度。我们可以看到两者的关系是非线性的。虽然Klotho含量增加糖尿病肾病的发病不一定就是逐步增加它的发生强度会发生改变一开始强度大后来强度低一点到最后强度又增加了。√与死亡的关系第二幅图与死亡的关系它的趋势大概是一个线性的趋势虽然曲线看起来还是非线性的但总体上趋势是线性的。这里的P非线性大于0.05不成立而第一幅图的P非线性小于0.05非线性状况是成立的。我们把这种关系叫U型曲线U型曲线是非线性关系的一种常见状况。那么随着Klotho含量的不断增加死亡风险不断增加但糖尿病的风险不是直线上升的。√线性与非线性趋势我们以该项研究--糖尿病肾病作为例子进行解释。以最低一组为对照按四分位数分为Q1、Q2、Q3、Q4四组含量低的叫Q1组含量最高的叫Q4组。Q2、Q3、Q4与Q1相比OR值分别是0.53、0.27、0.59先降后升P non-linear是0.003呈现非线性。而糖尿病肾病死亡同样以最低组为对照HR值分别是1.01、0.55、0.48逐步下降P non-linear是0.3484线性趋势存在。所以你们可以看到一个随着Klotho浓度增加发病风险有变化不是逐步上升的另一个随着Klotho指标增加死亡风险是逐步下降的是个线性趋势。√回归方法与P trend从下面的结果图中可以看到我们很多时候线性非线性用的OR值、HR值都是用回归分析算出来的。Logit回归算OR值Cox回归算HR值。一般我们用回归就可以了解定量暴露和结局的线性趋势是怎么样子的。我们这里讲的线性趋势P trend通常情况下默认是线性趋势性的P值即对线性趋势是否存在做统计学假设检验。今后大家可以在文献里看到P trend都是线性趋势的P值如果小于0.05说明线性趋势成立。在观察性研究中如果暴露因素是定量或者有序分类的变量都可以去计算它的P trend。P trend意味着暴露剂量或等级的增加是否会增加结局的发生水平。计算线性趋势P trend常用的方法就是回归方法这是最常见也最灵活的一种方法。用公式展示就是我们今后写文章最基本的方法也是回归线性回归、Logit回归、Cox回归都可以计算P trend。√定量暴露纳入回归的方式那么定量暴露如何放到模型里面开展趋势性分析呢我总结了一下定量暴露因素可以通过多种形式纳入回归进行分析。第一种定量暴露直接进入回归这叫直接趋势性。第二种转化为等级变量进入回归。定量暴露因素可以按剂量大小分为多个等级把这个等级变量作为暴露因素X每平均增加一个等级Y改变的量也是一种方式。第三种选择关键的定量暴露节点进入回归模型。这几种方式算出来的P值就是线性趋势性的P值叫P trend。一般文章里看到的P trend都是通过转为等级变量或者选择关键节点进入模型算出来的。第四种转为分类暴露因素进行哑变量设置分析。先转为分类再设置对照这叫间接趋势性。通过观察HR值是否逐步下降来判断线性趋势是否存在带有一定主观性。√等级法与中位数法下面重点介绍等级法和中位数法。· 等级法就是把定量暴露因素按中位数分为两组按三分位数分为三组按四分位数分为四组按五分位数分为五组。每组都有一个剂量范围和中位数值。那么等级变量比如说分为1234四档直接作为定量自变量纳入模型算出来的趋势性P值就是直接趋势性。· 那么中位数法是怎么回事呢等级变量直接纳入模型有一个问题等级变量赋值为1234但它不等距Q1到Q2的范围和Q2到Q3的范围是不一样的。怎么办呢我们就取各组代表性的值也就是中位数值把它作为定量暴露因素纳入回归方程得到的就是X每改变一个单位Y的改变量。这个结果跟定量暴露直接进入模型的结果是相似的。· 中位数值作为代表性值有一定的优势它的数值比较稳定不受异常值极端值的影响结果更加稳定当然换句话来说也可能更加保守一些。估计一半的趋势性P trend都是按照这种方式来计算的。√固定单位法与标准化法定量暴露因素特殊节点进入模型还有其他两种方式。一种是固定单位法把定量暴露除以某一个值比如除以10那我们讨论的就是X每增加10个单位Y的改变量。除以5或除以20也可以一般取有特殊意义的值比如10、50甚至100。这个结果的P值跟定量暴露直接纳入模型是一样的。另一种是标准化法每改变一个标准差Y改变多少--就是把暴露因素通过Z转换变成标准正态分布再纳入模型。你有些时候可以在文章里看到per SD的写法就是每改变一个标准差的意思。√关于混杂因素的控制以上是定量暴露因素的回归方法。但大家必须注意你把定量因素作为暴露因素之后还必须纳入一些潜在的混杂因素否则结果还是失真的不可能做一个单因素分析就结束了。非线性趋势性分析下面我们看看非线性趋势性分析。常见的非线性趋势性分析方法有几种比如限制性立方样条图、非线性回归、LOESS回归。√限制性立方样条图RCS曲线我们重点介绍限制性立方样条图简称RCS曲线。我们刚才讲的那些图形U型或者线性的就是RCS曲线--它把效应值图形化来展现自变量改变带来的效应改变。Y轴是OR值或者log OR值或者HR值、log HR值。log HR值更能看出线性趋势性。这个图形现在用风暴统计平台或者R都能实现。我们在这里不讨论怎么画反正这个图形可以展现自变量和因变量的线性趋势性当然这是个主观的判定。大家可以看到图里有几个P值P non-linear就是看有没有非线性趋势。P -overall主要看看X和Y的关系有没有存在不太重要。重点是P non-linear如果小于0.05就说明存在非线性如果大于0.05就说明不存在非线性也就是线性的。RCS曲线的分析结果往往和线性趋势的表格一起组成定量自变量统计分析的“一图一表”。今后你们写论文两者都要存在图和表一应俱全。√多项式回归第二种是非线性回归也叫多项式回归。其回归方程为X跟Y的关系不再是线性的因为X可能有一个平方项或者三次项。这种模型可以通过增加X的高次项来逼近某一种非线性的状态可以更加真实地拟合它们之间的关系。多项式回归方法举例给大家举一个例子。某研究分析老年人高血压(二分类变量是或否)的危险因素研究因素包括gender、age、ox-LDL、Adiponectin、ox-LDL IgG和ox-LDL IgM共6个指标。如果把六个自变量全部纳入统计分析发现大部分P值都没有意义说明它们之间的关系不是线性的。但是如果我们把年龄加上一个平方项也就是二次项放到模型里面发现这些关系都有了统计学意义。所以年龄跟血压的关系是非线性的。这种建模方式非常好但是这种非线性方程解释起来比较麻烦特别是既有一次项又有高次项的时候很难解释X到底跟Y是什么关系所以一般也不太用。√loess回归第三种是局部加权回归叫loess回归。它可以拟合非线性曲线是一种用于局部回归分析的非参数方法。它首先把样本分割成多个小小区间对每个区间进行回归拟合最后把区间的回归线连起来就是一个完整的非线性曲线。这种方法一般情况下没有一个方程但是我们可以看到一个曲线来看看X和Y大概的关系而且拟合效果还不错。所以在了解非线性趋势关系的时候LOESS回归用得还是比较多的。· 文章举例我们来看这篇发表在JAMA的文章文章旨在研究不同年份的死亡率、住院率的变化趋势。从结果图中我们可以看到曲线一开始降后来平缓这是一个非线性趋势。还有一篇文章评价新冠患者随着随访时间的增加病毒载量的变化趋势也是非线性的先升后降。这个升和降很难用其他的公式表达用LOESS法其实可以很清晰地看出一个平滑曲线看出它的节奏是升还是降。跟LOESS曲线相似的还有广义加法模型大家有兴趣可以进一步了解。本章小结以上就是我们讲的线性趋势和非线性趋势的理论知识。√线性趋势分析的核心是将定量暴露因素以不同形式纳入回归模型计算P trend来判断线性趋势是否成立常用的方法包括等级法、中位数法、固定单位法和标准化法其中中位数法结果更稳定、应用最广。√非线性趋势分析则需要在线性趋势不成立时进行探讨、最常用的是限制性立方样条图它可以直观呈现暴露与结局之间的剂量反应关系论文中通常要求RCS曲线图和趋势性分析表格同时呈现形成“一图一表”的规范。此外多项式回归和LOESS回归也可用于拟合非线性曲线但多项式回归解释较复杂、应用不多而LOESS回归作为非参数方法能清晰展示平滑曲线在探索性分析中仍有其价值。掌握这些方法我们就可以对定量暴露因素进行规范的因果推断分析。下一节我们将介绍广义倾向性得分在定量暴露因素中的应用。最后提醒要学习本推文的完全对应的课程视频请发送关键词“报名”至公众号加入高校公益免费课程群来学习吧。关于郑老师团队及公众号全国较大的医学统计服务平台专注于医学生、医护工作者学术研究统计支持郑老师团队可以提供诸多统计支持各式统计课程、临床试验设计构建预测模型与真实世界研究“双库”保发表训练营、医学数据库挖掘详情联系助教小董咨询微信号aq566665