综述:采用节段力学控制性回缩异位尖牙的生物力学策略

【字体: 时间:2025年09月29日 来源:Seminars in Orthodontics 2

编辑推荐:

  本研究评估了DentalMonitoring(DM)人工智能(AI)在检测隐形矫治器附件(attachments)和扣状装置(buttons)脱落方面的性能,结果显示其灵敏度(sensitivity)和特异度(specificity)均极高(分别>98%和>99%),表明AI远程监控(AIDRM)能显著减少未被发现的临床事件,提升隐形矫治(CAT)效率与质量。

  
Abstract
Introduction
本研究旨在通过二元分类(阳性vs阴性)方法评估DentalMonitoring(DM)人工智能(AI)在检测隐形矫治器附件(包括附件和扣状装置)脱落方面的性能,评估其灵敏度和特异度。
Methods
这项多中心回顾性研究分析了719名接受隐形矫治器治疗患者的数据,这些患者由独立第三方从DM的美国临床数据池中随机抽取,以确保获得无偏倚、具有代表性的数据集。对于每位患者,由DM扫描生成的连续口内图像集(≥8个视图)经由DM的AI处理,以检测附件和扣状装置的脱落。三名经过培训、设盲的美国正畸住院医师独立审查每个病例以建立参考结果。在专家共识与AI输出不一致的情况下,由第四位设盲的外部专家裁定最终的基准真相(Ground Truth)。通过评估连续扫描来评估附件和扣状装置的脱落情况。使用广义估计方程(GEE)模型计算了95%置信区间的灵敏度和特异度。
Results
最终数据集包括765个附件脱落参数结果和659个扣状装置脱落参数结果。对于DM的AI检测附件脱落和扣状装置脱落,灵敏度分别为98.2%(95% CI: 94.3%–99.4%)和98.4%(95% CI: 94.0%–99.6%);特异度分别为100%(95% CI: 98.7%–100%)和99.0%(95% CI: 96.9%–99.7%)。
Conclusion
当前结果表明,DM的AI分析系统在检测附件脱落方面具有极高的准确性。因此,DM可能有助于显著减少这些未被发现的临床事件的发生。
Introduction
隐形矫治疗法(CAT)中最具影响力的进步之一是矫治器附件(aligner auxiliaries)的整合,例如复合树脂附件(composite attachments)和扣状装置(buttons)。虽然早期的矫治器系统主要依赖于位移力学,但这些附件的加入引入了针对性的力系统,显著提高了移动精度并扩大了可治疗的正畸病例范围。在最近的系统综述中,Alam等人(2024)强调了矫治器附件的益处,指出其在前牙根转矩、旋转、近远中移动和后牙支抗方面的改善。此外,附件可以减少对辅助正畸装置的需求,例如固定矫治器或头帽。
附件是粘接在特定牙齿上的牙色复合树脂凸起,在改善力传递和产生所需的力偶以实现整体移动和转矩方面起着至关重要的作用。它们被设计成各种形状以应对特定任务和牙齿移动,对矫治器贴合精度、固位、牙齿旋转矫正以及 intrusion(压入)、extrusion(伸长)、尖牙和磨牙的 distalization(远中移动)等移动有显著贡献。
扣状装置与附件类似,但通常与弹性橡皮圈一起使用,对牙齿施加额外的力。橡皮圈与扣状装置结合可以矫正多种正畸问题,包括咬合问题和牙齿旋转。
尽管其有效且应用广泛,附件仍然容易发生脱落、脱粘和磨损。在Li等人(2024)的一项前瞻性临床研究中,对47名接受隐形矫治治疗的患者进行了六个月的监测,发现在772个附件中,脱落率为13.7%,大多发生在治疗初期。下颌牙弓和磨牙上的脱落率显著更高。
导致粘接失败的因素有多种。与矫治器相关的变量,如材料厚度,会影响粘接耐久性。患者行为、频繁摘戴、依从性差和饮食习惯也起作用。操作者的技术,特别是在粘接过程中,至关重要。复合树脂的流动性可能会在附件周围产生多余材料(“飞边”),从而损害其固位和功能。
由于其关键作用,附件的脱落会导致严重的临床问题,可能延长治疗时间,增加复诊次数,并对治疗预后产生负面影响。这些问题在长时间未被发现时尤其突出。针对此类临床事件的高发生率,各种新兴的基础远程正畸系统正在被使用,但缺乏文献中的广泛验证。本研究旨在评估DentalMonitoring (DM),一种新型AI驱动的远程监控软件,在检测隐形矫治器附件和扣状装置脱落方面的准确性。
Material and methods
Study design & rationale
这项多中心、回顾性、定量观察性研究是在向美国食品药品监督管理局(FDA)提交监管申请的背景下进行的。研究共纳入719个患者病例,选自DM的临床数据库,该数据库汇总了全球正畸诊所的数据。本研究仅考虑来自美国诊所的数据,以符合FDA对监管申请范围的要求。尽管数据来源多样,但没有特定的临床站点直接参与。为确保充分代表相关状况,特别是低发生率事件,在预筛过程中使用了系统生成的临床通知,根据预定的纳入和排除标准来识别可能符合条件的病例。最终病例选择由独立第三方通过随机抽样完成,该第三方无法访问DM图像且不参与临床操作,从而确保了数据集的公正性和代表性。
本研究遵循源自《赫尔辛基宣言》的伦理原则。同时也遵循了适用的数据保护法规,即欧盟法规(EU) 2017/745和ISO 14155:2020。WCG IRB根据45 CFR § 46.104(d)(4)授予了豁免。
患者纳入标准包括:接受隐形矫治器治疗且至少有一个附件和一个扣状装置的患者。
患者排除标准包括:有一颗或多颗乳牙的患者,以及非美国患者。关于DM扫描生成的图片集,纳入标准为:去标识化的DM图片集;使用DM应用程序(在至少Android 6及以上或iOS 11及以上的手机上)获取的图片集;使用DM Cheek Retractor(颊拉钩)和DM ScanBox(扫描盒)获取的图片集。所有口内图片集必须包含至少八张可由DM处理的图像,包括至少三张闭口咬合视图(正面、右侧、左侧)、三张开口咬合视图(正面、右侧、左侧)和两张视图(上颌和下颌)。在本分析使用的早期产品版本中,视图不是强制性的。因此,一些图片集缺少这些视图。由于研究团队不控制病例的抽样或选择,并且这些图片集已是随机选择数据集的一部分,因此予以保留以维持样本量。这构成了一项轻微的方案偏离。然而,专家评估和AI评估均使用相同的可用图像进行,确保了分析的一致性。
本研究的目标是评估DM的AI系统在检测附件和扣状装置脱落方面的性能,以专家小组作为参考标准。选择的专家是美国正畸住院医师。最初的方案旨在招募具有丰富临床经验的委员会认证正畸医生,但前十名符合条件的候选人因时间限制而拒绝。因此标准修订为包括住院医师,即正在接受正畸培训的合格牙医学博士(DMD),他们更有空且不易引入解释偏倚。所有专家都接受了标准化培训,并被指示严格根据可见的图像数据进行评估。DM的AI模型是一个在专家标记的口内图像上训练的分类神经网络。算法的确切架构是专有的,未公开披露。附件脱落定义为与先前扫描相比,附件不再存在。扣状装置脱落定义为相对于参考前部图像集,金属、陶瓷或复合树脂扣状装置缺失。对于每个参数,系统生成三种输出之一:未缺失、缺失或无法识别。当AI或参考标准因缺乏可见性而无法生成结果时,这些病例被分类为“无法识别”并从分析中排除。
在研究开始前,DM的临床事务团队向所有参与站点和专家小组成员提供了标准化培训。目的是确保研究方案和诊断定义的应用一致,以及既定阅读量表的标准化使用,该量表广泛用于放射学研究。该培训旨在支持方法学的一致性,而不影响后续的数据收集或分析。
在初步指导后,进行了熟悉阶段以验证调查员进行评估的准备情况。在此阶段,调查员审查了一组十个具有代表性的模拟病例(与研究数据集不同),以练习标记程序、应用研究组定义并根据方案完成数据录入。每位调查员使用具有相同屏幕规格的专用计算机,确保了标准化的评估条件。
每个选定的DM口内图片集(由单次DM扫描生成,包含至少8张口内图片)都通过DM进行分析以生成DM结果。相同的图片集被分配给一个由三名专家组成的小组,他们的任务是生成共识结果。在获得每个参数每个牙齿的三个结果后,比较结果以查看是否达成共识。专家小组对每个病例的最终诊断基于三位专家的一致程度。如果所有三项评估完全相同,则该共识被记录为最终结果。如果答案不同但存在多数一致(即三位专家中有两位提供了相同的回答),则以多数意见作为最终结果。当无法达成一致且每位专家提供了不同的答案时,该病例被标记出来供小组成员讨论以达成共识。然后将共识结果与DM结果进行比较。当共识结果与DM结果相同时,这被视为基准真相(Ground Truth)。当结果不匹配时,增加了一个额外步骤:由一名外部专家(委员会认证的正畸医生)审查 discrepant results( discrepant results)以确定这些病例的最终基准真相。向外部专家提供了每个病例的以下材料:专家小组建立的共识结果、DM生成的相应诊断(DM结果)、正在评估的临床参数的定义以及说明性示例以增强客观性,以及患者完整的口内图片集。
基准真相结果被视为参考结果并用于统计分析。
Statistical analysis
所有统计分析均使用SAS版本9.4进行。使用广义估计方程(GEE)模型计算了95%置信区间的灵敏度和特异度。这种方法考虑了同一患者多个牙齿之间的相关性,确保了稳健的估计。该模型特别适用于本研究,因为每位患者由于包含多个牙齿而贡献了多个结果。
诊断性能基于分类进行评估。为了评估候选方法的诊断性能,使用标准的2×2列联表框架将结果与基准真相进行比较。当方法正确识别出阳性病例时,结果被视为真阳性(TP);当正确识别出阴性病例时,被视为真阴性(TN)。假阳性(FP)表示将阴性病例错误地识别为阳性,而假阴性(FN)指漏掉的阳性病例。
基于此分类,灵敏度计算为TP / (TP + FN),代表方法正确检测出真实阳性发现的能力。特异度计算为TN / (FP + TN),反映方法识别真实阴性的准确性。这些指标用于量化系统在检测临床事件方面的可靠性。
Results
对所有完成研究的受试者进行了年龄(岁)和位置的描述性统计。
最终统计分析中,附件脱落参数纳入338名患者,生成765个结果。对于扣状装置脱落参数,最终统计分析纳入的患者总数为381名,总共生成659个结果。
对于附件脱落,DM正确识别了186个真实阳性病例中的183个以及所有579个真实阴性病例,灵敏度为98.2%(95% CI: 94.3%–99.4%),特异度为100%(95% CI: 98.7%–100%)。
对于扣状装置脱落,准确检测到129个真实阳性中的127个和530个真实阴性中的525个,灵敏度为98.4%(95% CI: 94.0%–99.6%),特异度为99.0%(95% CI: 96.9%–99.7%)。
为确保覆盖全牙列,检查了分析中包含的牙齿分布,验证每个牙号至少占分析总数的1%。大多数牙齿达到了此阈值。少数牙齿的代表性略低。此外,很少放置扣状装置的牙齿在扣状装置脱落分析中没有代表性。
Discussion
迄今为止,多项研究探讨了人工智能驱动远程监控(AIDRM)在隐形矫治治疗中的益处,报告的结果包括更少的复诊、更快的首次 refinement(精调)时间、可能缩短总体治疗时间以及积极的整体患者体验,因为患者表现出使用这些系统以减少预约次数的兴趣。然而,尚无研究评估这些系统在检测矫治器相关问题方面的准确性。这是第一项评估AIDRM在识别隐形矫治治疗过程中附件脱落(特别是附件和扣状装置脱落)准确性的研究。研究方案涵盖了来自美国多个地点的多样化患者队列,跨越不同年龄组并使用不同品牌的矫治器进行治疗。此外,研究确保了分析中所有牙齿的公平代表性,从而提供了真实世界状况的全面描述。
结果显示,两个评估参数都具有很高的准确性,检测附件脱落的灵敏度为98.2%,检测扣状装置脱落的灵敏度为98.4%。这些发现表明,DM是识别CAT期间附件脱粘的高度准确的方法。对于附件而言,这一结果尤其值得注意,因为它们尺寸小,并且通常由与牙齿颜色密切匹配的复合树脂材料制成,这使得它们更难以检测。调查员通过将每个当前照片集与前一个进行比较来识别附件脱落。扣状装置脱落同样通过评估连续图像集来检测。在本研究中,当三位专家评审员达成共识时,结果被视为真阳性或真阴性,在研究方案中称为“基准真相”。专家与AI之间的任何差异均由一名专家解决,该专家确定最终的基准真相。
尽管许多研究报告固定矫治器托槽治疗的急诊率高于CAT,但Lin等人(2021)在临床研究中发现,CAT一年的附件损坏率在9.70%到14.79%之间,具体取决于所使用的复合树脂类型。在我们的调查中,附件脱落的患病率为24.31%,扣状装置脱落的患病率为19.58%。该比率明显高于先前研究报告的 orthodontic brackets(正畸托槽)2.67%至2.8%的损坏率。对于托槽和矫治器,大多数事件发生在治疗初期,这可能表明由技术敏感的粘接程序和患者适应期引起的粘接强度不足。一项包括94名接受CAT患者的 prospective study(前瞻性研究)评估了可能预测附件问题的风险因素。这些因素分为3组:临床变量、操作者相关变量和患者相关变量。该研究得出结论,患者相关的附件脱落原因,包括矫治器摘戴频率和方法、矫治器佩戴时间、使用矫治器就位器、戴着矫治器进食以及咀嚼习惯,占附件脱落的大部分,比例为56.25%。考虑到患者相关原因的复杂性和可变性超出了临床医生的控制范围,人工智能和远程正畸的进步为改善这些问题的管理提供了重要机会,这些问题会极大地影响治疗效率和质量。
本研究有几个局限性。首先,尽管专家小组遵循了标准化的评估方案,但在共识过程中完全设盲不可行,这可能会引入一定程度的解释偏倚。其次,尽管从DM数据库中随机选择了患者,但排除非美国患者可能会限制研究结果在更广泛人群中的普遍性。第三,尽管代表了多个矫治器品牌,但分析中未控制材料特性、附件设计或设备图像质量方面的潜在差异。第四,未通过重复评估相同病例来评估检查者内可靠性,这限制了我们评估专家评估随时间一致性的能力。最后,研究的回顾性性质固有地限制了对某些变量的控制。缺乏作为基准真相一部分的椅旁临床评估可能会影响诊断准确性的整体可靠性。基于图像的评估虽然实用且反映了真实世界的使用,但存在某些局限性,包括可变的图像质量和后牙区可见性受限。此外,基准真相的确定涉及专家判断,尽管是系统性的并有预定义标准指导,但在解释研究结果时应承认其引入了主观性因素。
未来的研究工作应仔细评估AIDRM系统的可靠性,同时研究这种创新方法对患者护理质量、体验和治疗效率的影响。
Conclusion
本研究的主要发现表明,DM算法在检测隐形矫治治疗(CAT)期间附件脱落方面高度准确。使用DM进行远程监控的正畸医生会在患者的扫描中检测到此类临床事件时立即收到警报,从而能够进行即时干预。
考虑到文献中报道的附件脱粘发生率高,AIDRM为早期检测提供了显著优势,有可能改善治疗结果。
Consent for publication
所有作者均同意发表。
CRediT authorship contribution statement
Julie Fahl McCray: 方法论, 调查。 William Dabney: 方法论, 调查。 Tanner Godfrey: 方法论, 调查。 Dylan Handlin: 方法论, 调查。 Logan Smith: 方法论, 调查。 Alexander Besmer: 方法论, 调查。 Ishita Johal: 方法论, 调查。 Rayan Skafi: 写作 – 审阅和编辑, 写作 – 初稿, 项目管理。 Mohammed H. Elnagar: 写作 – 审阅和编辑, 写作 – 初稿。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号