2型糖尿病患病率估计的等效性:利用电子健康记录数据对相似表型分析算法进行的比较研究

《JMIR Public Health and Surveillance》:Equivalence of Type 2 Diabetes Prevalence Estimates: Comparative Study of Similar Phenotyping Algorithms Using Electronic Health Record Data

【字体: 时间:2025年11月23日 来源:JMIR Public Health and Surveillance 3.9

编辑推荐:

  糖尿病患病率估算的两种计算表型(CP)在印第安纳波利斯都会区的等效性研究。CP1结合诊断代码、实验室数据和药物,CP2仅用诊断代码。结果显示总体等效(4.1% vs 2.4%,差异<2.5%),但Hispanic人群差异显著(5.4% vs 3.0%,P=0.2)。性别、年龄和种族亚组分析显示差异普遍小于2.5%。该方法学对比对公共卫生数据现代化具有参考价值。

  糖尿病作为一种全球性的公共卫生问题,对个体健康、医疗系统和社会经济都带来了重大挑战。随着电子健康记录(EHR)数据在医疗和研究领域的广泛应用,如何利用这些数据进行疾病监测,尤其是对年轻人群中的2型糖尿病(T2D)进行准确的流行率估算,成为公共卫生领域的重要课题。本研究旨在探讨两种独立但概念上相关的计算表型(CP)方法在估算T2D流行率时的等效性,并分析其在不同人群中的表现差异。

研究背景指出,尽管T2D的流行率在不同人群中存在显著差异,但传统的流行病学调查方法在评估年轻人群或特定种族和民族亚群时存在局限。例如,国家健康与营养调查(NHANES)和国家健康访谈调查(NHIS)等调查在估算青少年及年轻成年人中的T2D流行率时,由于样本量较小,难以提供足够精确的统计数据。此外,T2D与肥胖等其他疾病的共存使得在年轻人群中准确区分糖尿病类型变得更加复杂。因此,探索基于EHR数据的计算表型方法成为一种更具潜力的替代方案,以提高对疾病流行率的估算精度。

本研究比较了两种独立的计算表型方法(CP 1和CP 2)在估算T2D流行率时的等效性。CP 1是由多州EHR网络(MENDS)开发的,该网络由美国慢性疾病主任协会领导,覆盖多个地理区域。CP 2则是由糖尿病在儿童、青少年和年轻成年人网络(DiCAYA)开发的,该网络由纽约大学兰贡医学中心协调。两种CP方法都基于EHR数据,但其定义标准存在显著差异。CP 1不仅依赖诊断代码,还结合了实验室检测结果和处方药物信息,而CP 2则主要基于诊断代码进行分类。这种差异可能导致两种方法在估算T2D流行率时出现不同结果。

研究结果表明,2022年在印第安纳波利斯大都会统计区(MSA)中,CP 1估算的T2D流行率为4.1%,而CP 2为2.4%。尽管CP 1的估算值普遍高于CP 2,但两者之间的差异通常不超过2.5个百分点,这一范围被认为在统计学上不具有显著意义。然而,对于某些特定群体,如西班牙裔、男性以及35-44岁年龄段的人群,两者之间的差异略高于这一阈值。值得注意的是,西班牙裔群体的差异达到了2.4个百分点,且其95%置信区间为2.2%-2.6%,表明这一差异在统计学上是显著的。这提示我们,虽然两种CP方法在总体上具有等效性,但在某些亚群中可能存在偏差。

研究还发现,两种CP方法在计算流行率时使用的数据来源和范围有所不同。CP 1的数据主要来自两个大型医疗系统,这些系统覆盖了印第安纳州中央地区超过80%的人口。CP 2的数据则涵盖了整个印第安纳波利斯MSA的所有医疗提供者,包括超过270万人口的范围。因此,CP 1的估算结果可能受到样本代表性的影响,而CP 2则更全面地反映了该地区整体的健康状况。此外,两种CP方法在诊断代码的使用上也存在差异。CP 1不使用E08.x、E09.x和E13.x代码,而CP 2则排除了E14.x代码,这些代码代表其他或未明确分类的糖尿病类型。这种差异可能影响对特定人群的分类准确性,尤其是当某些群体的糖尿病类型与其他疾病特征重叠时。

从方法论角度来看,本研究采用了两种单侧检验(TOST)方法来测试两种CP方法是否在预设的等效范围内。TOST方法是一种常用的等效性检验方法,用于判断两个组之间的差异是否在某个可接受的范围内。本研究设定的等效范围为±2.5个百分点,这一范围被认为适用于流行率低于10%的情况。结果表明,两种CP方法在大多数情况下都达到了这一等效标准,但在某些特定亚群中未能满足,这提示我们需要进一步研究和优化这些计算表型方法,以提高其在不同人群中的适用性和准确性。

研究还探讨了计算表型方法在公共卫生实践中的应用前景。尽管两种CP方法在总体上具有等效性,但它们在实现方式和数据来源上存在差异,这可能影响其在实际应用中的效果。例如,CP 1的定义更为广泛,涵盖了诊断代码、实验室检测和处方药物信息,而CP 2则仅依赖诊断代码。这种差异可能在某些情况下提高CP 1的敏感性和准确性,但同时也增加了复杂性和实施难度。因此,公共卫生机构在选择和应用计算表型方法时,需要权衡其准确性与实施成本之间的关系。

此外,研究还指出了当前计算表型方法在公共卫生领域的局限性。一方面,现有的计算表型方法尚未形成统一的标准,导致不同机构在使用时可能存在差异,影响数据的可比性和一致性。另一方面,部分计算表型方法在实施过程中需要较高的技术支持和数据处理能力,这可能成为一些资源有限的公共卫生机构的障碍。因此,未来的研究应致力于开发更加标准化、易于实施的计算表型方法,并推动其在公共卫生领域的广泛应用。

研究结果对公共卫生实践具有重要的指导意义。首先,它表明基于EHR数据的计算表型方法可以为公共卫生机构提供一种快速、有效的疾病监测手段,尤其是在数据资源有限的情况下。其次,它强调了在不同人群之间进行细致分析的重要性,以确保计算表型方法的准确性和适用性。最后,它为未来的研究提供了方向,即需要进一步优化计算表型方法,以提高其在不同亚群中的表现,并探索更广泛的数据来源和更全面的定义标准。

总的来说,本研究通过比较两种独立的计算表型方法,揭示了它们在估算T2D流行率时的等效性和局限性。研究结果表明,尽管两种方法在大多数情况下能够提供相似的流行率估算,但在某些特定群体中仍存在显著差异。这些差异可能源于数据来源的差异、诊断代码的使用范围以及处方药物信息的纳入程度。因此,公共卫生机构在选择和应用计算表型方法时,需要充分考虑这些因素,并结合自身的需求和资源进行调整和优化。未来的研究应继续探索如何提高计算表型方法的准确性、敏感性和特异性,以更好地支持公共卫生监测和干预措施的实施。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号