
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:物理治疗技术对老年人抑郁症状有效性的系统评价
【字体: 大 中 小 】 时间:2025年09月18日 来源:Frontiers in Public Health 3.4
编辑推荐:
本综述系统评估了物理治疗(Physiotherapy)作为辅助手段改善老年抑郁患者症状的有效性。涵盖8项随机对照试验(RCTs)及1368名参与者,结果表明结合常规治疗的运动疗法(如 aerobic exercise, strength training)可显著降低GDS-15、HDRS等量表评分,为老年抑郁的非药物干预提供循证支持(证据等级:低至非常低)。
引言
全球人口结构变化正重塑现代社会,65岁及以上人口显著增加,在西班牙等发达国家尤为突出。目前西班牙老年人口占比已达20.3%,预计到2035年将升至25%。这一趋势伴随着老年人慢性病患病率的增长,包括高血压(30–45%)、2型糖尿病(10–20%)、骨关节炎(20–30%)和抑郁症(5–20%)。抑郁症是老年人群中最普遍的精神健康障碍之一,约5%的社区老年人和高达25%的机构养老者受其影响。在该人群中,抑郁症常与慢性疾病、功能受损、认知下降及健康相关生活质量降低相关联,后果严重,显著增加死亡风险,是老年人高自杀率的主要因素。此外,抑郁症与认知恶化密切相关,被认为是包括阿尔茨海默病在内的痴呆症发展的风险因素。
老年人抑郁症的标准治疗通常涉及心理治疗和抗抑郁药物的组合,其中药物治疗更常用。然而,这些方法在该人群中存在显著局限和风险。心理治疗费用高昂且需要患者持续参与,对部分老年人可能具有挑战性。同时,抗抑郁药物存在嗜睡、恶心、头晕等副作用,并可能与治疗年龄相关共病常用药物发生不良相互作用。这些因素显著阻碍治疗依从性和合规性。鉴于这些挑战及药物干预的潜在不良反应,探索和实施治疗老年人抑郁症的非药物替代方案至关重要。
尽管身心健康的联系已得到公认,但身体健康对心理幸福感的影响仍未充分探索。在此背景下,物理治疗成为一种有前景的非药物干预手段,已被证明可改善普通人群的心理健康结果——提升情绪、减轻压力和焦虑、促进整体生活质量。此外,在心理健康物理治疗领域内,若干干预措施——如特定的体育锻炼计划、身体基础项目、手法治疗和拉伸技术——已在改善心理幸福感方面显示出有希望的结果。然而,尽管这些益处在更广泛人群中得到充分记录,但关于物理治疗技术缓解老年人抑郁症状的具体证据仍然有限且零散。
因此,本系统评价旨在评估现有科学证据,探讨物理治疗干预作为老年人抑郁症辅助治疗的有效性,呈现当前临床实践发现,并为制定该人群的循证指南贡献力量。
方法
本系统评价遵循系统评价和Meta分析优先报告条目(PRISMA)声明进行。评价方案已在PROSPERO(国际系统评价前瞻注册库)注册(编号CRD420251079161)。
纳入和排除标准基于PICOS(参与者、干预措施、对照、结果和研究设计)框架制定。研究问题在文献回顾前确定:物理治疗技术结合常规治疗是否能有效改善老年患者的抑郁症状?
我们在PubMed、Web of Science (WOS)、Scopus和Cochrane Library等主要生物医学数据库中进行了详尽的科学文献检索。检索截止日期为2025年6月30日。两位独立研究人员进行检索,结果一致,并筛选了西班牙语、英语和法语发表的文章。未应用基于日期或研究类型的其他过滤器或限制。检索词通过结合MeSH(医学主题词)术语和自由文本关键词开发。
我们将从数据库识别出的研究导出至ZOTERO参考文献管理工具以去除重复文献。随后,两位评审员(J.L.P.L.和A.A.G.)将文章标题和摘要独立手动筛选至Excel电子表格中,以识别潜在合格研究。出现分歧时,通过讨论或邀请第三位评审员(R.L.U.)介入以达成共识。符合初始标准的文章被检索全文以进行更详细评估。全文的最终资格评估也由两位评审员独立进行,应用PICOS标准。
对于每项纳入的研究,两位评审员提取了以下数据:主要作者和发表年份、研究设计(确认为RCT)、参与者人口学特征(平均年龄、性别、抑郁症诊断)、物理治疗干预特征(技术类型、持续时间、频率、强度、监督)、对照组特征(干预类型、持续时间)、用于评估抑郁症状的测量量表(如相关,包括截断点)、与改善抑郁症状相关的主要结果。
除了上述变量,我们还考虑了干预环境的不同(社区/家庭基础与老年护理环境)。此外,记录了具体的干预特征,包括物理治疗类型、干预持续时间、疗程数、周期性和参与者依从性。我们特别关注用于评估结果变量的测量方法,即抑郁的症状或严重程度。从这些测量中,记录了基线评分(干预前)以及干预前后评分之间的差异,便于直接比较对照组和干预组。
鉴于所纳入研究中观察到的高度临床和方法学异质性(表现为干预措施、疾病严重程度和结果测量的差异),进行了结构化的叙述性综合,此外干预措施未按类型分组。该策略允许在文献中识别相关模式和一致性,而无需假定不存在的统计同质性。我们通过研究设计的多样性和在许多情况下缺乏可比统计数据来证明采用此方法学方法的合理性。尽管未进行正式的异质性分析(Meta回归或统计亚组分析),但通过研究亚组之间的叙述性比较探索了潜在的变异来源。在此意义上,我们检查了诸如偏倚风险、干预类型、疾病严重程度和环境(机构化与非机构化)等因素。这些比较在讨论和局限性部分进行了探讨,从而可以识别干预有效性的潜在调节因素。
我们应用推荐分级的评估、制定与评价(GRADE)方法来评估抑郁结果证据的确定性。该框架允许对所有纳入研究中该特定结果的证据体进行系统评估。
所纳入研究的方法学质量和偏倚风险由两位评审员独立评估,他们使用Cochrane Rob-2对分析中纳入的每项研究进行了细致的偏倚风险评估。评审员独立进行每项研究的评估,分歧通过讨论或在必要时咨询第三位评审员解决。该工具评估六个关键领域的偏倚风险:随机序列生成、分配隐藏、对参与者和人员的盲法、对结果评估的盲法、不完整的结果数据、结果的选择性报告。每个领域被评为“低偏倚风险”、“高偏倚风险”或“偏倚风险不明确”。我们通过讨论或咨询第三位评审员解决分歧。
为评估因结果缺失(报告偏倚)导致的偏倚风险,核实了每项纳入试验的已发表研究方案的可用性。在没有已发表方案的情况下,我们检查了文章中方法部分描述的所有预期主要和次要结果是否在结果中报告。如果研究方案公开可用和/或报告了所有预期结果,我们认为研究具有低报告偏倚风险。由于干预措施的临床异质性且无法进行Meta分析,未执行检测发表偏倚的特定统计分析(漏斗图)。然而,作为Cochrane RoB 2工具的一部分,对“结果选择性报告”领域的偏倚风险评估进行了操作,我们将所有纳入研究在该领域分类为具有低偏倚风险。
对于所纳入研究结果的解释,我们通过计算Cohen’s d来提取效应大小,统计学显著性设定为p值小于0.05,并使用95%置信区间(95% CI)来指示估计的精确性。我们对Cohen’s d的解释如下:0至0.2之间的值为小效应,0.2–0.5为中等效应,0.5–0.8为大效应,>0.8为极大效应。鉴于临床试验中使用的抑郁测量工具将较低分数分配给较低水平的抑郁,负的Cohen’s d值表示症状改善。计算使用Cambridge Effect Size Calculator软件进行。
结果
研究筛选
在五个数据库的初始检索共识别出607篇文章。使用ZOTERO参考文献管理工具去除112篇重复文献后,495篇文章接受了标题和摘要筛选。在此初步筛选后,我们排除了481篇不符合评价纳入标准的文章。剩余的14篇文章被检索全文以进行更详细评估。其中,我们在全文审查后排除了六篇文章,原因如下:非随机对照试验(n = 1)以及诊断并非 exclusively depression(n = 5)。最终,八项随机对照试验符合所有资格标准并被纳入系统评价。
参与者和研究环境特征
系统评价中纳入的八项研究共涉及1368名参与者。所有研究参与者的平均年龄均超过60岁。一半的研究在社区环境中进行(n = 4),另一半在机构或疗养院中进行(n = 4)。大多数研究中的参与者主要为女性。
关于抑郁症诊断,在五项研究中,人群患有轻度至中度抑郁症诊断,而在其余三项研究中,参与者存在使用量表检测到的抑郁症状,但无正式临床诊断。在所有研究中,允许参与者继续其通常的抗抑郁药物或其他合并症药物治疗。
结果测量量表特征
纳入的研究使用了各种经过老年人群体验证的测量量表来评估抑郁症状。最常用的量表是老年抑郁量表(GDS-15)、汉密尔顿抑郁评定量表(HDRS或HAM-D)、医院焦虑抑郁量表(HADS)和流行病学研究中心抑郁量表(CES-D)。
GDS-15是一个包含15个项目的自评量表,评估过去2周内抑郁症状的存在。通常使用5/15的截断分来指示抑郁的存在,因其简单可靠而成为理想选择。HDRS(或HAM-D)是一个他评量表,由17、21或24个项目组成,评估一系列抑郁症状。分数越高表示抑郁严重程度越高。它是抑郁临床研究中最广泛使用的量表之一。HADS是一个包含14个项目的自评量表,7个用于焦虑,7个用于抑郁。用于检测患有躯体疾病患者的焦虑和抑郁症状。抑郁子量表的截断分8/21提示可能存在抑郁障碍。CES-D是一个包含20个项目的自评量表,设计用于测量普通人群的抑郁症状。分数高于16提示存在显著抑郁症状。
干预措施特征
研究中应用的物理治疗干预措施多种多样,但大多数集中于治疗性运动计划。这些干预措施的主要特征总结如下。
干预类型方面,治疗性运动是最常见的干预措施,存在于8项研究中的6项。计划包括有氧运动(步行、固定自行车)、力量训练(重量、阻力带)、平衡和灵活性(拉伸)的组合。放松技术:一项研究使用了运动与引导放松技术的组合。功能性身体活动:三项研究实施了适应参与者能力的团体功能性身体活动计划。
持续时间和频率方面,计划的持续时间从8周到6个月不等。最常见的频率是每周2–3次。每次训练的持续时间在30到60分钟之间变化。
监督方面,在大多数研究中,物理治疗师监督物理治疗课程。一些研究包括具有定期随访的家庭计划。
对照组条件方面,无干预(n = 5项研究);安慰剂或低强度非治疗性干预(关于一般健康的教育课程,无主动身体成分)(n = 3项研究)。
结果描述
身体干预似乎是减少抑郁症状的一种有前景的方法,尽管研究结果和方法学的可变性凸显了这种关系的复杂性。具体而言,几项研究报告了在运动、有氧运动、运动与放松相结合以及力量训练等计划之后,GDS-15、HDRS和CES-D等抑郁量表评分显著降低。虽然一项关于太极拳的研究在CES-D上显示出临床相关的改善,但未达到完全的统计学显著性。相反,一项物理治疗研究发现HADS评分无显著差异,但确实观察到抑郁子量表有改善趋势。这些发现表明,广泛的身体活动可以对心理健康产生积极影响,尽管效应的幅度和一致性可能因干预类型和研究人群而异。
由于所纳入研究之间存在相当大的临床和方法学异质性,进行Meta分析不可行。相反,我们对结果中潜在异质性来源进行了定性探索。该探索集中于物理治疗干预特征的可变性(技术类型、持续时间或频率)、用于评估抑郁症状的测量量表(GDS-15、HDRS、HADS、CES-D,具有不同的评分范围)以及进行研究的环境(社区/家庭与 residential care facilities)。
每项纳入研究的最相关发现如下所述,重点关注抑郁症状的改善。
然而,使用Cohen’s d计算了所纳入研究中抑郁的效应大小,该计算仅对八项纳入系统评价的研究中的四项可行,因为其余出版物未提供估计所需的统计数据显示出不同的结果。具体而言,Singh等人在HADS量表(?2.77)和GDS-15(?1.89)上的发现表明效应非常大,表明干预组内抑郁症状有实质性改善。Aibar-Almazán等人报告了大效应(?0.86),而G?ksin和Asiret显示了中等效应(?0.52)。另一方面,Underwood等人的研究呈现了微不足道的效应大小(?0.06),表明组间差异极小。这些发现证明了干预积极效应幅度的异质性。
按研究环境划分的结果显示,身体干预的有效性似乎因研究环境而异。在社区环境或参与者家中进行的研究中,一系列干预措施显示出积极效应。例如,关于有氧运动(步行、固定自行车)和力量训练的研究一致报告了GDS-15和HDRS等抑郁量表评分的显著降低。在机构/疗养院环境中,干预措施也显示出积极影响。一项关于有氧步行计划的研究显示CES-D有临床相关的改善,尽管未达到完全的统计学显著性。此外,一项功能性身体活动计划也报告了抑郁症状的显著减少。
按干预类型划分的结果表明,身体活动的范围及其结果如下所述。治疗性运动是最常见的干预措施。包括有氧运动、力量训练以及平衡和灵活性组合的计划一致导致抑郁评分显著降低。例如,具体研究报告了在这些类型的计划之后GDS-15、HDRS和CES-D的显著改善。放松技术:一项将治疗性运动与引导放松技术相结合的研究也报告了抑郁症状的显著减少,表明身心实践可以增强身体运动的有效性。几项研究实施了一项功能性身体活动计划,该计划被证明可有效减少抑郁症状。这些发现表明,适应参与者能力的活动,而非高度结构化的运动,也可以是一种可行的方法。
在所回顾的研究中,并非所有干预措施都产生了显著结果。一项物理治疗研究发现HADS评分无显著差异,但确实观察到抑郁子量表有改善趋势。研究结果表明,效应的幅度和一致性可能因具体的干预类型和研究人群而异。
研究偏倚风险评估
我们在分析所纳入随机对照试验(RCTs)的偏倚风险时使用了Excel工具RoB 2,该工具由Cochrane Library在其系统评价干预措施手册5.1.0版中开发。
使用Cochrane Collaboration工具进行的偏倚风险评估显示,所纳入研究之间存在相当大的变异性。随机序列生成:我们认为大多数研究(n = 6)在该领域具有低偏倚风险,因为它们描述了充分的随机化方法(计算机生成、随机数字表)。两项研究(n = 2)因描述不足而存在一些担忧。分配隐藏:仅四项研究具有低风险,描述了充分的分配隐藏(例如,密封不透明信封)。其余四项存在一些担忧,未指定方法。对参与者和人员的盲法:这是大多数研究(n = 7)中的高风险领域,正如物理治疗干预所预期的那样,由于身体干预难以对参与者和治疗师设盲。一项研究(n = 1)具有低风险,因为它实施了盲法结果评估者的措施,并且参与者不知道他们的确切分配。对结果评估的盲法:五项研究具有低风险,因为结果评估者对分组分配设盲。三项研究存在一些担忧,未指定评估者是否设盲。不完整的结果数据:大多数研究(n = 6)具有低风险, attrition rates低或缺失数据处理得当。两项研究(n = 2)因缺乏关于attrition的信息而存在担忧。结果的选择性报告:我们认为所有研究(n = 8)在该领域具有低风险,因为方案先前已发布;或者所有预期的主要和次要结果均已报告。
总体而言,由于对参与者和人员设盲的高偏倚风险(运动试验中固有的挑战)以及部分研究在其他领域的一些担忧,我们认为证据体的总体偏倚风险存在一些担忧。
证据确定性评估
使用GRADE对各项研究中抑郁结果的证据确定性评估揭示了初始评级和后续降级的 consistent pattern。所有经过评审的研究,作为随机对照试验(RCTs),起始时均具有“高质量”评级。然而,这种初始高质量因导致证据整体确定性降低的因素而系统性地受到损害。
一个经常遇到的挑战是偏倚风险,通常源于缺乏关于随机化程序、分配隐藏以及对参与者或结果评估者设盲的明确细节。这对于自我报告的结果(如抑郁)尤为关键,其中不充分的设盲可能影响反应。
间接性 emerged as another important concern。研究人员 frequently conducted the studies in particular populations(西班牙绝经后妇女、疗养院居民、老年妇女、膝骨关节炎患者或已服用舍曲林药物者)或设计了精确的干预措施。这些事实在评价旨在将研究发现推广到更广泛的“老年人”人群或更广泛的“身体锻炼”范围时引入了间接性。
不精确性是一个反复出现的问题,表现为小样本量或缺乏关键信息(如置信区间或p值),这阻碍了对观察到的效应大小的准确评估。最后,许多研究中缺乏前瞻性试验注册表明存在发表偏倚的可能性。尽管如此,在特定实例中,在诸如ClinicalTrials.gov等数据库中的注册或由NIHR HTA(卫生技术评估)等机构资助已缓解了这些担忧。
虽然RCT提供了强大的基线,但我们 consistently downgraded the certainty of the evidence for depression due to methodological limitations including risk of bias, limited direct applicability to broader populations or interventions (indirectness), imprecision of results, and potential publication bias。研究人员未发现任何明确因素可以证明在任何 analyzed studies中增加证据的确定性是合理的。
讨论
本系统评价旨在分析关于物理治疗技术对老年患者抑郁症状有效性的科学证据。我们纳入了八项随机对照试验,涵盖1368名平均年龄超过60岁的参与者。研究人员在社区环境中进行了大多数研究,允许参与者继续其通常的抗抑郁药物治疗。这反映了与现实世界临床实践相关的务实方法。
本评价的结果表明,通过纳入物理治疗干预,老年人抑郁症状的改善呈现出有希望的趋势。大多数研究(八项中的七项)报告了干预组与对照组相比,在抑郁量表评分(GDS-15、HDRS、HADS、CES-D)方面有一些显著改善或积极趋势。治疗性运动,以其各种形式如有氧运动、力量训练和平衡训练,成为研究最频繁、结果最一致的物理治疗干预措施。该证据与支持运动作为心理健康有效干预措施的一般文献一致,尽管在患有抑郁症的老年人中的具体证据仍然有限。
获得的结果表明,将物理治疗技术纳入老年人抑郁症的常规治疗计划可以改善他们的症状,并将为受影响个体带来更好的生活质量,同时有助于优化医疗系统。一些研究强调了物理治疗师在精神病科单元中的重要角色,因为计划性治疗性运动和肌肉放松技术的益处已得到证实。尽管我们未能确定一个具有足够效度的物理治疗计划来证明老年人抑郁症状的减少,但有明确证据表明物理治疗可能是有益的。先前不限于老年人的研究,如Knubben等人,已通过力量训练显示出物理治疗对抑郁的积极影响,并且像Schimitter等人一样,通过有氧运动计划显示积极影响。
Gildengers等人、Eumura等人和Cang?z等人的研究表明,程序化的物理治疗干预有助于改善同时存在认知缺陷患者的抑郁症状,两项指标均得到显著改善。物理治疗还改善了与其他病理相关的抑郁症状,如与癌症相关的肥胖、慢性疼痛或糖尿病。
然而,由于若干局限性,谨慎解释这些结果至关重要。如上所述,研究人员使用GRADE框架系统评估了物理治疗干预对老年患者抑郁症状有效性的证据确定性。这一 rigorous analysis consistently revealed that researchers rated the overall quality of evidence for almost all included studies as either low or very low。该分类 primarily due to significant methodological concerns, including high risk of bias in multiple domains(缺乏对参与者和人员的盲法、高 attrition rates)、干预方案和结果测量的 substantial heterogeneity,以及有时因小样本量导致的不精确性。因此,这些发现表明,虽然存在有希望的趋势,但迫切需要进一步的高质量研究来增加对所报告效应的信心,并为临床实践建立明确的推荐。
主要局限性之一是物理治疗干预的异质性,正如Hidalgo等人所强调的,他们指出先前关于物理治疗技术(尤其是治疗性运动)有效性的研究高度异质,无法得出 solid conclusion,并突出了进一步研究的必要性。尽管焦点在于运动,但各研究的强度、频率和持续时间差异很大。这限制了进行Meta分析和获得汇总效应估计的能力,从而难以确定最佳治疗方案。
导致抑郁率更大改善的计划是从社区招募人群进行的计划,与在疗养院和老年人护理机构中进行的计划相比。这与Blumenthal等人关于家庭监督干预的发现一致,该干预在力量方面显示出更好的结果和较低的 dropout rate,解决了该人群最大的挑战之一。然而,诸如Pitkala等人的研究,也将这些计划与痴呆相关问题联系起来,并未明确澄清这是否是症状变化的同等核心因素。
另一个重要的局限性是偏倚风险,特别是关于对参与者和人员的盲法。在身体干预中,实现完全盲法本质上是困难的,这可能在一些研究中引入了 performance or detection bias。在大多数低风险研究中,研究人员对结果受试者设盲,但参与者对治疗的感知可能影响报告的结果。这一事实与 several reviews on similar topics一致,例如Sun等人评估了身体运动对老年人认知症状的影响,或Heissel等人评估了普通人群抑郁症状的各种非药物程序。
所纳入研究中人群和干预措施的异质性 emerged as a significant concern, directly impacting on the generalizability of our findings。证据中的这种间接性源于研究人员 frequently conducted studies on very specific populations,例如西班牙绝经后妇女、疗养院居民或膝骨关节炎患者。虽然这些针对性研究为各自队列提供了有价值的见解,但PICO元素间缺乏 uniformity prevents a direct and robust comparison,突出了该领域需要更多标准化研究。因此,得出明确适用于整个异质性老年人群体的结论仍然是一个挑战。未来的研究应侧重于多样化和具有代表性的样本,以增强结果的外部有效性,并为更广泛的患有抑郁症的老年人群体提供更好的临床指南。
此外,使用的抑郁量表的可变性,尽管都经过验证,为结果的直接比较增加了一层复杂性。Pérez Bedoya等人和Zhang等人也指出,这是比较研究时的主要问题之一,这些工具间可变 sensitivity and specificity可能导致不同的效应。这种异质性是一种使结果解释复杂化的来源,正如Li等人在其关于身心运动的评价中所强调的,指出“实验设计、时间、频率、持续时间和结果测量方法的差异会导致不同的结果,造成解释困难”。正式抑郁症诊断与通过量表确定的抑郁症状存在之间的区别也应予以考虑。然而,纳入两种类型的人群增加了研究发现对更广泛存在心理健康问题的老年人的普遍适用性。
尽管由于异质性和缺乏可用数据而无法进行Meta分析,但我们对相关研究中效应大小(Cohen’s d)的分析揭示了一致的趋势。尽管效应幅度各异,但所有发现均表明干预组内抑郁症状有所改善,这是在所使用的抑郁量表背景下而言。效应幅度的这种可变性强化了研究高度异质性的结论,但效应方向的一致性提供了有希望的证据,表明物理治疗干预对老年人抑郁症有益。
尽管存在这些局限性,但本评价的优势包括遵循PRISMA指南的 rigorous methodology、跨多个数据库的 exhaustive search以最小化发表偏倚,以及 exclusively inclusion of randomized controlled trials,这代表了最高水平的证据。纳入来自社区环境的研究以及参与者继续其常规药物的临床相关性强调了研究结果在现实世界实践中的适用性。
物理治疗,尤其是治疗性运动,成为老年人抑郁症常规治疗的一种有前景且安全的补充。鉴于该人群抑郁症的高患病率以及当前治疗的局限性,物理治疗提供了一种非药物替代方案,具有超越心理健康的潜在益处,包括改善身体功能和整体生活质量。迫切需要更多高质量的研究,特别是精心设计的随机对照试验。未来的研究应侧重于标准化物理治疗干预方案(类型、强度、持续时间、频率)以 enable meta-analyses and determine the optimal “dose”;包括主动比较组和适当的安慰剂以更好地控制注意力和期望效应;增加样本量以增强统计效力;进行长期随访以评估效应的可持续性;并探索物理治疗改善老年人抑郁症状的潜在机制(例如,神经生物学变化、心理社会因素)。
结论
本系统评价的结果表明,物理治疗技术对老年人抑郁症状的有效性存在积极趋势,但当前证据有限且 notably heterogeneous。因此,我们 urgently require further rigorous randomized controlled trials。这些未来的研究应旨在标准化物理治疗干预方案(包括类型、强度、持续时间和频率)以 confirm efficacy, enable robust meta-analyses,并最终为该脆弱人群建立 evidence-based clinical guidelines。
生物通微信公众号
知名企业招聘