环境空气污染对美国不同地区黑人上皮性卵巢癌患者生存率的影响研究
《Environmental Epidemiology》:Ambient air pollution and survival among Black women with epithelial ovarian cancer across diverse geographical regions of the United States
【字体:
大
中
小
】
时间:2025年10月18日
来源:Environmental Epidemiology 3.8
编辑推荐:
本研究首次采用多州数据和先进暴露模型,探讨PM2.5与NO2暴露对黑人上皮性卵巢癌(EOC)患者生存率的影响。通过对加州癌症登记处(CCR)和非裔美国人癌症流行病学研究(AACES)两大队列的分析,发现空气污染与生存率之间缺乏显著关联。这一发现为理解黑人女性卵巢癌生存差异提供了重要流行病学证据,并强调了优化暴露测量和探索其他环境因素的必要性。
卵巢癌是美国女性癌症死亡的第六大原因,预计2025年将有20,890例新发病例和12,730例死亡。全美卵巢癌的5年生存率仅为51%,但不同种族和族裔群体之间存在显著差异,其中黑人女性的5年生存率最低,仅为41%。黑人女性接受上皮性卵巢癌(EOC)指南推荐治疗的可能性也较低,而EOC占所有卵巢癌的90%以上。已确定的预后因素,包括临床和肿瘤特征,以及保险和社会经济地位,似乎不能完全解释美国黑人女性EOC死亡风险增加29%的原因。
生存差异的原因尚不完全清楚。尽管越来越多的证据表明结构、环境和邻里环境的不同领域与癌症生存差异相关,但关于这些因素对卵巢癌差异影响的研究仍然有限。迄今为止,只有少数研究评估了邻里因素与卵巢癌结局的关系,重点关注居住隔离、地区剥夺指数、居住州和县、农村程度、到医疗机构的旅行时间以及环境暴露等方面。
空气污染是心血管疾病(CVD)和肺癌以及癌症幸存者CVD相关死亡率的公认风险因素。关于空气污染暴露对卵巢癌发病率或死亡率有害影响的流行病学证据稀疏且尚无定论。已有研究将卵巢癌与各种环境和职业暴露联系起来,包括滑石粉、杀虫剂、除草剂以及柴油或汽油发动机尾气等化学物质。关于环境空气污染,一项大型前瞻性队列研究发现卵巢癌发病率与时间变化的细颗粒物(PM2.5)暴露之间没有统计学显著关联,但报告了与时间变化的二氧化氮(NO2)暴露存在显著关系。几项研究报告了NO2和PM2.5暴露与卵巢癌死亡率或生存率呈正相关,而其他研究则未发现显著关系。此外,在不同地理区域以及社会经济地位、种族和族裔不同的人群中,观察到空气污染暴露存在差异。这引发了一个问题:黑人女性中观察到的低生存率是否可能部分归因于不成比例的空气污染暴露——这种关系在该人群中仍未得到充分研究。
本研究旨在通过利用加州癌症登记处(CCR)、多州非裔美国人癌症流行病学研究(AACES)以及最先进的高分辨率空气污染估计数据,探索长期暴露于环境空气污染(PM2.5和NO2)如何影响美国不同地区黑人女性的EOC生存,以弥补这一证据空白。
研究人群来自两个不同的来源:AACES和CCR,并对每个队列分别进行分析。
AACES是一个自我认同为黑人或非裔美国人的上皮性卵巢癌(EOC)患者队列。本研究利用了AACES研究第一阶段的数据,该阶段通过快速病例确定招募了2010年至2015年间诊断的女性,涵盖了美国11个地点,这些地点是根据拥有大量非裔美国人人口且地理区域多样而选择的。这些地点包括阿拉巴马州、佐治亚州、路易斯安那州、密歇根州大都会底特律、新泽西州、北卡罗来纳州、俄亥俄州、南卡罗来纳州、田纳西州、伊利诺伊州和德克萨斯州。新诊断为EOC并通过地区癌症登记处识别的女性,如果自我认同为非裔美国人或黑人,诊断时年龄在20-79岁(覆盖超过80%的病例),并且能够完成英语访谈,则符合参与条件。诊断到入组的中位时间和平均时间分别约为6个月和7个月。符合条件的参与者需经组织学证实为EOC,并由专家研究病理学家进行集中审查。
CCR是一个全州范围的人口基础癌症登记处,参与美国国家癌症研究所的监测、流行病学和最终结果(SEER)项目。从CCR中,我们识别了2004年至2016年间在加利福尼亚州新诊断出的所有原发性EOC女性。本研究得到了加州大学旧金山分校机构审查委员会批准的Greater Bay Area癌症登记方案覆盖。
排除标准包括非浸润性肿瘤、非首次原发性癌症、基于尸检或死亡证明的诊断,或无法地理编码的地址。我们的主要分析进一步限制在诊断后存活至少10个月的非西班牙裔黑人女性(以下简称黑人女性),以使其更接近AACES人群。在敏感性分析中评估了这种限制的影响,该分析包括了所有女性,无论生存时间如何。
我们从公开可用的社会经济数据和应用中心(SEDAC)健康相关应用空气质量数据集中获取环境PM2.5暴露数据。SEDAC包含使用经过良好验证的基于集合的预测模型在美国本土(2000-2016年)以1公里空间分辨率估算的年度环境PM2.5水平(单位μg/m3)。如Di等人所述,三种机器学习算法(随机森林、神经网络和梯度提升)包含了来自卫星数据、土地利用、气象变量和化学传输模型模拟的各种预测变量来预测PM2.5。然后,集合模型将这些PM2.5预测与一个广义加性模型相结合,该模型允许每种机器学习算法的贡献随位置而变化。该集合模型在美国环保署(EPA)2156个监测器的PM2.5水平上进行训练,通过10折交叉验证进行验证,并产生了高分辨率的年度PM2.5预测,预测值与监测值之间的平均R2为0.89。
2000年至2016年的每日NO2浓度使用经过良好验证的集合机器学习模型在1公里空间分辨率上进行估算,该模型整合了多个预测变量和三种机器学习算法。年度NO2暴露估计模型的性能良好,预测值与监测值之间的平均R2为0.84。
在两个队列中,每位参与者诊断时的地址都进行了地理编码,并使用其经纬度坐标,将其与诊断年份及前4年的平均空气污染物暴露量相关联。我们考虑了三个暴露时期:诊断年份、诊断年份及前2年的平均值(即3年平均)、以及诊断年份及前4年的平均值(即5年平均)。
在这些分析中,感兴趣的结局定义为从诊断到因任何原因死亡或最后一次随访日期的时间(以年为单位)。选择总生存期是因为死因数据不完整,并且绝大多数诊断为卵巢癌的女性死于这种疾病,这限制了此约束的影响。在AACES中,通过癌症登记处、国家死亡指数和LexisNexis Accurint定期收集和更新生命状态。AACES最近一次全研究范围的生命状态更新完成了截至2024年10月发生的死亡,这是存活参与者的删失日期。
对于CCR,生命状态主要通过链接到两个主要来源来确定——加州州死亡率档案和国家死亡指数。CCR队列的死亡随访被认为截至2021年12月31日,该日期被用作删失日期。
AACES通过电话完成的全面调查收集了空气污染与全因死亡率之间关系的潜在混杂因素信息。对于CCR队列,这些数据直接从登记处研究数据集中提取。由于CCR队列内的数据主要从医疗和住院记录中提取,而AACES队列内的数据还通过关于生活行为方式的调查捕获,因此可用于平行分析的重叠变量集有限。以下变量在两个队列中均可获得,并进行了统一处理以供分析考虑:诊断年份和年龄、查尔森合并症指数(基于加权慢性疾病的经过验证的合并症负担衡量标准,分类为0, 1, 2, 3+)、保险类型(无、仅私人、仅医疗保险或医疗保险加私人、医疗补助、其他)、婚姻状况(从未结婚、已婚或家庭伴侣、分居/离婚、或丧偶)、人口普查区级别的Yost/Yang邻里社会经济地位指数(nSES;从美国人口普查数据得出的综合指数,反映邻里层面的教育、家庭收入、贫困、失业、蓝领职业、房屋价值和租金成本;指数得分分为全州范围的五分位数,Q1为最低,Q5为最高nSES)、SEER肿瘤分期分类(局部、区域和远处)以及肿瘤组织型(高级别浆液性、低级别浆液性、子宫内膜样、透明细胞、粘液性、癌肉瘤和其他上皮性)。
吸烟行为未在CCR队列中捕获,因此未纳入主要分析。然而,在AACES队列内进行了调整吸烟状况(从不、当前、曾经)的敏感性分析。
NO2值进行了标准化,使得一个单位的增加相当于增加10 ppb。PM2.5除了1 μg/m3的单位度量外未进行标准化。两种暴露在模型中均作为线性项纳入,因为使用三次样条和Martingale残差评估未发现非线性证据。
我们使用威布尔加速失效时间模型评估PM<>或NO2暴露与EOC女性生存的关联,并生成事件时间比(ETR)和95%置信区间(CI)。威布尔加速失效时间模型非常适合基线风险比例假设被违反的情况,并且它们提供了效应估计的直观解释,反映了协变量驱动的生存时间变化。效应估计代表对生存时间的乘法效应,其中ETR <1表示死亡时间缩短,ETR >1表示死亡时间延长。
为了解释由于未测量的协变量导致的个体间生存时间的异质性,我们在参与者级别拟合了带有脆弱项的模型。脆弱项代表一个随机效应,它为每个参与者缩放生存时间,捕捉了包含的协变量未能解释的事件时间差异,并减少了由未观察到的异质性引起的偏倚。
拟合了三个具有递增协变量数量的嵌套模型。模型1调整了诊断日历年龄和诊断年龄。模型2进一步调整了查尔森合并症指数、保险类型、婚姻状况和nSES。模型3进一步调整了临床协变量,如分期和组织型。通过Akaike信息准则评估模型拟合度。为了恢复调整分析中使用的协变量的缺失数据并保留样本量,我们实施了链式方程的多重插补,生成了50个插补数据集。然后,我们在每个数据集上分别进行调整后的分析,并使用Rubin规则汇总结果以获得最终估计值。
分析使用R版本4.4.1和Stata版本18进行。
为了将我们的发现与之前两项使用CCR数据的研究进行比较,我们扩展了CCR队列以包括所有种族和族裔群体,并取消了生存时间限制,以及材料与方法中比较分析部分概述的其他调整。与我们的主要分析相比,此分析的变化包括:(1)使用Cox比例风险模型评估PM2.5和NO2暴露与EOC特异性生存的关联;(2)标准化暴露,使得单位变化代表四分位距(IQR)的增加(如Villanueva的研究),或从第5百分位数到第95百分位数的增加(如Vieira的研究);(3)将NO2暴露分为三类(<20、20–30和>30 ppb)(如Villanueva的研究);(4)在与Vieira研究比较时,将人群限制在诊断为IIIC期或IV期的女性;(5)使用类似的协变量集,并在某些情况下包含“未知”类别。与我们的主要分析类似,我们使用了诊断年份的PM2.5和NO2测量值。风险比(HR)的解释不同于主要分析中使用的事件时间比(ETR):HR >1表示死亡风险更高,而ETR >1表示生存时间更长。
与之前两项研究相比,此分析仍存在一些差异:(1)使用了不同的数据源和规则来分配空气污染测量数据;(2)纳入的诊断年份是2004-2016年,而非Villanueva研究中的1996-2014年或Vieira研究中的1996-2006年;(3)缺乏对国家综合癌症网络(NCCN)指南依从性的调整;(4)癌症分期描述遵循美国癌症联合委员会(AJCC)而非国际妇产科联盟(FIGO)分期系统;(5)缺乏如Vieira研究中的空间分析。在此比较分析中,我们使用AJCC而非SEER分期系统,因为它更接近FIGO。为了评估研究年份的差异是否可能导致研究结果的变异,我们额外评估了空气污染暴露与诊断年份的交互作用,将后者分为三组:2004-2007年、2008-2012年和2013-2016年。
诊断为EOC的黑人女性研究人群包括来自AACES队列的540名女性和来自CCR队列的766名女性。AACES和CCR队列之间的特征存在显著差异。AACES队列包括2010年至2015年间诊断的女性,而CCR队列涵盖了2004年至2016年的诊断。与CCR相比,AACES队列中年轻女性的比例更高(50-59岁占34% vs. 27%),并且没有80岁或以上的女性(0% vs. 8%)。AACES队列中诊断为局部期疾病的女性也更多(23% vs. 15%),高级别浆液性(68% vs. 57%)和子宫内膜样组织型(10% vs. 7%)的比例更高。相比之下,CCR队列中被分类为“其他”上皮组织型的肿瘤比例更高(22% vs. AACES中的7%)。AACES中更具体的肿瘤分类可能是由于该队列中所有肿瘤记录都经过中心病理学审查。
AACES队列中患有两种或以上合并症的女性比例更高(33% vs. CCR中的18%),已婚或分居而非单身的女性比例也更高(77% vs. 60%)。保险覆盖模式也不同,AACES中更多女性没有保险(9% vs. 2%)或拥有非私人保险(51% vs. 48%)。与AACES相比,CCR中的邻里SES更偏向较高的五分位数,Q4比例更高(17% vs. 14%),Q1比例更低(30% vs. 35%)。
使用前述方法插补的缺失数据比例因人口特征而异,从nSES的2%(AACES)到分期的5%(CCR)不等。
CCR队列女性的PM2.5和NO2的环境浓度均高于AACES队列女性。CCR和AACES女性的5年平均PM2.5暴露分别为12.27 μg/m3(标准差[SD] = 4.04)和10.44 μg/m3(SD = 1.12)。在AACES地点中,来自伊利诺伊州和阿拉巴马州的女性5年平均PM2.5暴露最高,分别为11.88 μg/m3(SD = 0.62)和11.10 μg/m3(SD = 0.94)。相反,来自路易斯安那州和南卡罗来纳州的女性5年平均PM2.5暴露最低,分别为9.64 μg/m3(SD = 0.85)和9.78 μg/m3(SD = 1.06)。CCR和AACES女性的5年平均NO2暴露分别为28.11 ppb(SD = 9.97)和18.30 ppb(SD = 7.21)。在AACES内,芝加哥大都会区和新泽西州的女性5年平均NO2暴露最高,分别为31.86 ppb(SD = 6.26)和29.24 ppb(SD = 7.00),而来自阿拉巴马州和南卡罗来纳州的女性暴露最低,分别为13.14 ppb(SD = 4.29)和13.20 ppb(SD = 3.96)。
在CCR和AACES队列中,平均1年、3年或5年的PM2.5浓度彼此高度相关,NO2也是如此,皮尔逊相关系数r范围从0.83到0.99。PM2.5和NO2之间的相关性在CCR队列中也很强(r范围从0.57到0.66),但在AACES队列中则弱得多(r范围从0.23到0.27)。
在CCR和AACES队列中,PM2.5或NO2空气污染物与全因死亡率的关联基本上为零,无论这些测量中包含多少年的暴露,或者分析中包含哪些协变量。
在AACES队列的最小调整模型中,EOC黑人女性的总死亡时间与诊断年份PM2.5浓度增加1 μg/m3无关(ETR = 0.99, 95% CI = 0.93, 1.06),也与诊断前任何时间段的平均值无关(3年平均PM2.5的ETR = 1.01, 95% CI = 0.93, 1.08;5年平均PM<>的ETR = 0.99, 95% CI = 0.92, 1.07)。调整其他协变量并未改变这种零关联。在CCR黑人女性EOC队列的最小调整模型中,我们观察到与PM2.5浓度增加1 μg/m3相关的生存时间略有增加,尽管存在相当大的不确定性(诊断年份测量的PM2.5的ETR = 1.09, 95% CI = 0.97, 1.21;3年平均PM2.5的ETR = 1.08, 95% CI = 0.97, 1.20;5年平均PM2.5的ETR = 1.07, 95% CI = 0.95–1.20)。调整其他协变量并未改变这种关联。
类似地,在AACES队列的最小调整模型中,EOC黑人女性的总死亡时间与NO2浓度增加10 ppb无关,无论暴露估计的时间窗口如何(诊断年份ETR = 0.97, 95% CI = 0.85, 1.09;3年平均ETR = 0.97, 95% CI = 0.86, 1.09;5年平均ETR = 0.94, 95% CI = 0.84, 1.06)。调整其他协变量并未改变结果。在CCR队列中,结果相似,在最小调整模型中,NO2浓度增加10 ppb的ETR分别为1.03(95% CI = 0.96, 1.11)、1.00(95% CI = 1.00, 1.01)和1.00(95% CI = 1.00, 1.01),分别对应诊断年份、诊断前3年和5年平均的PM2.5测量值。调整其他协变量并未改变这种关联。
将生存时间限制在≥10个月并不影响结果,因为在CCR队列的敏感性分析中(无生存时间限制)估计值保持相似,这表明选择偏倚不太可能解释结果。此外,在AACES模型中调整吸烟状况并未改变结果,这表明在这种情况下吸烟不是一个强混杂因素。
我们扩展了CCR队列以包括所有种族和族裔群体,并取消了生存时间限制,以及材料与方法中概述的其他调整,以检查与之前两项基于CCR的研究结果的可比性。这项比较分析中的大多数人口特征与Villanueva研究报告的特征相似,包括诊断年龄、种族/族裔、nSES、婚姻状况、肿瘤大小和肿瘤分级的分布。然而,观察到一些差异:本研究涵盖不同的时间段(2004-2016年 vs. Villanueva研究中的1996-2014年),中位生存时间更长(48.8个月 vs. 34.5个月),加入医疗补助的女性比例更高(16% vs. 9%),浆液性组织型比例更高(51% vs. 43%),以及更多女性无合并症(61% vs. 48%)。
在这个扩展的CCR队列中,诊断时PM2.5暴露的平均水平为11.0 μg/m3(SD = 3.7),NO2暴露为25.7 ppb(SD = 9.6)。暴露水平因种族和族裔群体而异,非西班牙裔黑人女性暴露于最高的PM2.5浓度(平均值 = 11.4 μg/m3,SD = 3.6)和最高的NO2浓度之一(平均值 = 25.9 ppb,SD = 9.3),与非西班牙裔白人女性相当(平均值 = 26.5 ppb,SD = 9.6)。
在我们的扩展研究人群中,平均PM2.5暴露水平低于Villanueva报告的水平(11.0 vs. 12.2 μg/m3),而平均NO2暴露水平显著更高(25.7 vs. 16.1 ppb)。PM2.5的IQR相似(4.4和4.7),使得能够在两项研究之间直接比较估计值。
在匹配之前两项基于CCR研究的调整分析中,我们发现卵巢癌死亡风险与诊断年份PM2.5浓度增加4.7 μg/m3之间没有关联(HR = 1.00, 95% CI = 0.97, 1.03)。然而,在诊断为IIIC期或IV期EOC的女性中观察到弱关联,PM2.5暴露从第5百分位数增加到第95百分位数与卵巢癌死亡风险增加1.08倍相关(95% CI = 1.00, 1.16)。未观察到与时间(即诊断年份)的统计学显著交互作用。
在类似的NO2暴露调整分析中,我们发现NO2暴露与所有种族和族裔女性的EOC生存之间几乎没有关联证据(NO2 20–30 ppb的HR:0.99, 95% CI = 0.94, 1.04;NO2 >30 ppb的HR:0.97, 95% CI = 0.92, 1.03)。
这些结果仅部分与之前使用CCR数据进行的两项研究一致。与PM2.5浓度从第5百分位数增加到第95百分位数相关的HR为1.08(95% CI = 1.00, 1.16),与Vieira研究中报告的1.10(95% CI = 1.01, 1.19)相当。与Villanueva的研究相反,该研究报告了PM2.5和NO2暴露与卵巢癌生存之间存在强关联,我们未观察到类似结果。
我们利用两个大型的黑人卵巢癌幸存者数据集,应用从经过良好验证的基于集合的预测模型得出的高分辨率空气污染暴露估计,评估了PM2.5和NO2暴露与生存之间的关联。我们发现,在美国不同地区诊断的EOC黑人女性中,室外PM2.5和NO2污染与总生存期之间没有关联,暴露评估基于居住地址,记录在诊断年份或诊断年份及之前3年或5年的平均值。无论数据来源(AACES或CCR)如何,都观察到相同的结果。这种缺乏观察到的关联性在改变协变量或将分析扩展到其他种族和族裔群体时仍然稳健。
本研究有助于检验环境空气污染与卵巢癌生存之间关系的有限研究体系。现有证据仍然好坏参半:虽然一些研究报告了卵巢癌死亡率与特定污染物(如NO2和PM2.5)呈正相关,但包括我们在内的其他研究未发现这种联系。除了这些研究大多基于中国和台湾的数据(那里的空气污染水平高于美国)之外,研究结果的差异也可能源于空气污染暴露估计方法、暴露评估时间、统计建模方法和研究人群特征的差异。我们的研究因使用先进的高分辨率空气污染暴露估计、更大的地理范围以及关注黑人女性人群而脱颖而出。为了进一步探索研究结果的差异,我们与两项阳性研究进行了比较分析,这两项研究检查了来自CCR的类似基础人群,但包括了所有种族和族裔群体。
与我们针对EOC黑人女性的主要分析类似,我们的比较分析(包括所有种族和族裔群体)发现PM2.5或NO2暴露与生存之间几乎没有关联证据。这些发现与之前基于CCR的研究相反,尽管我们努力密切复制他们的建模策略、协变量选择和人群特征。就点估计而言,我们的结果与Vieira的研究一致,该研究报告了在IIIC期和IV期癌症女性中,随着PM2.5浓度从第5百分位数增加到第95百分位数,卵巢癌死亡风险增加(我们的分析中HR为1.08,95% CI = 1.00, 1.16,而Vieira研究中为1.10,95% CI = 1.01, 1.19)。相比之下,我们的结果未能复制Villanueva研究中报告的强关联,该研究发现PM2.5(IQR HR = 1.44, 95% CI = 1.40, 1.47)和NO2(>30 ppb vs. <20 ppb: HR = 2.48, 95% CI = 2.32, 2.66)的风险显著升高。我们的发现强调,即使考虑了研究人群特征和统计建模方法的差异,结果仍然可能不同,这很可能是因为空气污染暴露的估计方式不同。例如,Villanueva研究依赖于链接到人口普查区的稀疏监测站数据,而我们的研究使用了结合了多个预测因子的高分辨率模型估计。另一个重要区别是,在Villanueva的研究中,暴露是在每个个体的生存时间内平均的,这可能会使估计值向上偏倚,因为生存时间较长的个体由于污染水平下降而更可能具有较低的平均暴露。
我们的主要分析集中在黑人女性身上,这是一个历史上处于不利地位的群体,通常居住在受系统性投资不足影响的社区,导致社会、建筑和物理环境较差,包括较差的空气质量。虽然有限,但先前的研究也对此问题提供了一些见解。Villanueva的研究提供了PM2.5和NO2暴露与卵巢癌生存之间关联在不同种族和族裔群体中的分层估计。值得注意的是,在所有种族和族裔群体中,非西班牙裔黑人女性因PM2.5暴露增加导致的卵巢癌死亡风险比最低(IQR HR = 1.21