综述:通过保护隐私的记录链接结合现实世界数据和临床试验数据:机遇与挑战——一项叙述性综述

《Health Science Reports》:Combining Real-World and Clinical Trial Data Through Privacy-Preserving Record Linkage: Opportunities and Challenges—A Narrative Review

【字体: 时间:2025年09月24日 来源:Health Science Reports 2.1

编辑推荐:

  隐私保护记录链接(PPRL)通过整合随机对照试验(RCT)与真实世界数据(RWD),有效解决两者在数据质量、成本和外部效度上的局限性,提升药物研发和监管决策的准确性。应用包括扩展患者健康历史、优化长期安全监测、验证真实世界终点指标等。挑战涉及数据质量、隐私法规差异及链接偏差控制。

  隐私保护的记录链接(Privacy-Preserving Record Linkage, PPRL)技术正在成为现代临床研究和药物开发领域的重要工具。随着监管机构对真实世界数据(Real-World Data, RWD)和真实世界证据(Real-World Evidence, RWE)的接受度不断提高,PPRL为整合临床试验数据(Randomized Controlled Trials, RCTs)和真实世界数据提供了新的可能性。这一技术不仅能够克服传统RCT和RWD各自存在的局限性,还能在确保患者隐私的前提下,为研究者和监管机构提供更加全面、可靠的数据支持。本文将围绕PPRL在连接RCT与RWD中的应用价值、挑战以及未来发展的潜力展开讨论。

### RCT与RWD的局限性

随机对照试验(RCTs)长期以来被视为评估医疗干预(如药物、疫苗、医疗器械等)风险与收益的“金标准”。在RCT中,研究对象被随机分配到不同干预组,通过严格的控制条件,研究者能够更准确地衡量治疗效果和安全性。然而,RCT也存在诸多局限性,例如参与者的招募难度、高昂的运营成本、严格的纳入/排除标准导致的外部效度受限,以及因患者失访或不依从而导致的内部效度下降。这些因素使得RCT在某些情况下难以全面反映真实世界中的患者体验,尤其是对于罕见疾病或需要长期随访的研究。

相比之下,真实世界数据(RWD)来源于日常临床实践、医疗设备、患者报告结果(Patient Reported Outcomes, PROs)等,能够更广泛地覆盖不同人群的医疗行为和健康状况。RWD的广泛应用使得研究者可以更真实地评估医疗干预在实际环境中的效果,而不仅仅是实验室条件下的表现。然而,RWD也存在其自身的挑战,如数据质量参差不齐、信息不完整、数据来源碎片化等。此外,由于缺乏严格的随机化和标准化的数据采集流程,RWD容易受到选择偏差、信息偏差和测量偏差的影响,这些偏差可能影响研究结果的准确性。

### PPRL的优势与潜力

为了弥补RCT和RWD的不足,PPRL技术应运而生。PPRL的核心理念是通过技术手段将个体的医疗记录从多个数据源中进行连接,同时避免直接分享个人身份信息(Personally Identifiable Information, PII)。这种方法不仅能够提高数据的完整性和全面性,还能在不损害患者隐私的前提下,实现跨数据源的信息整合。PPRL通常采用两种主要方法:确定性链接和概率性链接。确定性链接依赖于精确匹配,适用于数据质量较高的场景;而概率性链接则通过统计方法识别潜在匹配,适用于数据不完整或存在差异的情况。

PPRL的应用可以带来多重好处。首先,它可以扩展对患者健康状况的观察窗口,使研究者能够更全面地了解患者在试验前后的医疗经历。例如,在某些长期随访研究中,PPRL可以将临床试验参与者与长期的RWD记录进行连接,从而识别出药物反应的预测因素或耐受性指标。其次,PPRL有助于提高研究数据的准确性。通过将RCT数据与RWD进行比对,可以验证数据的完整性、一致性以及真实世界中的医疗行为是否与试验中的记录一致。此外,PPRL还能为研究者提供更加丰富的数据集,从而支持更复杂的分析,如评估治疗效果的持续性、识别罕见的长期不良反应等。

### PPRL在实际研究中的应用案例

PPRL在实际研究中的应用已经初见成效。例如,在一项关于新冠疫苗Ad26. COV2.S的临床试验中,研究者利用PPRL技术将参与者在试验前5年和试验后5年的医疗记录进行链接,从而获得更全面的患者健康信息。这种链接不仅帮助研究人员更准确地评估疫苗的长期安全性和有效性,还减少了对患者进行直接随访的负担。另一个案例是TREAT-NMD Neuromuscular registry network(TNMD),该网络利用PPRL技术将来自多个来源的患者数据进行整合,包括临床试验、自然史研究和电子健康记录。通过这种方式,TNMD能够创建一个全面的患者数据仓库,用于支持药物上市后的效果评估和生成外部对照组数据。

此外,PPRL还被用于验证RWD中的算法或终点指标是否与RCT中的“黄金标准”一致。例如,在某些研究中,研究人员可能会使用PPRL将临床试验中的疾病严重程度评分与真实世界中的诊断代码、药物使用情况或医疗资源利用情况进行比较,以评估这些RWD衍生指标的准确性和可靠性。通过这种方式,PPRL能够帮助研究者更好地理解真实世界数据的适用范围,并确保其在不同研究场景中的有效性。

### PPRL面临的挑战

尽管PPRL具有显著的优势,但其应用也面临一系列挑战。首先,PPRL需要获得参与者的明确同意,这在某些情况下可能带来操作上的困难。特别是在需要进行长期随访或跨多个数据源进行链接的研究中,确保数据使用的合法性、透明度和可追溯性至关重要。此外,即使数据经过去标识化或伪标识化处理,PPRL仍可能面临重新识别的风险,因此需要严格的隐私保护措施,如使用加密技术、确保数据完整性、控制数据访问权限等。

其次,PPRL的实施需要面对数据质量问题。真实世界数据往往来源于不同的医疗系统和数据源,这些数据可能存在记录不一致、诊断误分类、缺失值等问题。这些问题可能影响PPRL的准确性,甚至导致研究结果的偏差。因此,在实施PPRL之前,研究团队需要对数据进行充分的预处理和质量评估,以确保最终链接数据的可靠性。

此外,PPRL在不同地区和国家的实施也受到法律和文化因素的影响。例如,在美国,HIPAA等法规允许在一定条件下使用去标识化数据进行研究,而在欧盟,GDPR则对个人数据的处理提出了更严格的要求。这些法律差异可能导致PPRL在某些地区难以推广或实施。同时,数据隐私和公众信任也是PPRL成功应用的关键因素。如果研究者未能充分透明地说明数据的用途、隐私保护措施和潜在风险,可能会损害公众对数据共享和研究的信任,从而影响PPRL的广泛应用。

### 未来发展方向与建议

PPRL在连接RCT与RWD方面具有巨大的潜力,但仍需进一步探索和优化其应用场景。首先,研究者应加强对PPRL方法的深入研究,特别是在数据质量、隐私保护和伦理考量方面。通过建立更完善的验证框架,如使用“黄金标准”进行数据匹配的评估,可以提高PPRL的可靠性和科学性。此外,PPRL的应用需要在不同研究领域和问题中进行灵活调整,以适应不同数据源的特点和研究目标。

其次,PPRL的推广需要依赖于更广泛的数据基础设施建设。目前,许多国家和地区尚未建立统一的医疗数据平台,这限制了PPRL在跨数据源链接中的效率和准确性。因此,政府、医疗机构和科研机构应加强合作,推动数据标准化和互操作性,以促进PPRL的广泛应用。同时,建立明确的数据治理框架,确保数据的使用符合伦理和法律要求,也是实现PPRL可持续发展的关键。

最后,PPRL的应用需要考虑到患者隐私和数据安全。尽管PPRL通过去标识化和加密技术降低了数据泄露的风险,但研究者仍需采取额外的措施,如使用区块链技术、差分隐私等,以进一步加强数据保护。此外,PPRL的实施应始终以患者为中心,确保其在研究过程中获得充分的知情同意,并在数据使用过程中保持透明度和可追溯性。

综上所述,PPRL技术为连接RCT与RWD提供了新的可能性,有助于提高研究数据的全面性、准确性和实用性。然而,其应用仍需克服诸多挑战,包括数据质量、法律合规性、伦理考量以及公众信任等问题。未来,随着技术的进步和数据基础设施的完善,PPRL有望在临床研究和监管决策中发挥更加重要的作用,为药物开发和健康研究带来更深层次的变革。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号