基于强化学习的机械取栓术中脑血管双器械安全自主导航研究

《International Journal of Computer Assisted Radiology and Surgery》:Reinforcement learning for safe autonomous two-device navigation of cerebral vessels in mechanical thrombectomy

【字体: 时间:2025年04月04日 来源:International Journal of Computer Assisted Radiology and Surgery 2.3

编辑推荐:

  为解决机械取栓(MT)中现有强化学习(RL)方法无法到达脑血管、缺乏通用性和安全性等问题,研究人员开展了基于安全双器械 RL 算法的脑血管导航研究。结果显示该算法成功率达 96%,平均力 0.24N。这为 MT 的自动化提供了新方向。

  在医学领域,缺血性中风是一个严重威胁人类健康的疾病,每年在全球范围内导致大量死亡,仅在美国就产生巨额医疗费用。机械取栓(MT)作为急性缺血性中风大血管闭塞的标准治疗方法,能改善患者功能预后、降低死亡率 。然而,目前 MT 的实施面临诸多挑战。一方面,只有少数中风患者能接受 MT 治疗,有限的 MT 中心、漫长的转运时间阻碍了其广泛应用;另一方面,手术过程存在血管损伤和辐射暴露等风险。而且,现有用于 MT 的强化学习(RL)方法存在局限性,多数只能到达颈动脉,无法推广到其他患者血管系统,也未考虑安全性问题。为了解决这些难题,伦敦国王学院(Kings College London)的 Harry Robertshaw、Benjamin Jackson 等研究人员开展了一项极具意义的研究,相关成果发表在《International Journal of Computer Assisted Radiology and Surgery》上。
研究人员主要采用了以下关键技术方法:利用 Simulation Open Framework Architecture 构建模拟环境,来展现脑血管的复杂结构;基于改良的 Soft Actor-Critic RL 算法,首次实现对微导管和微导丝导航的学习;收集 12 例患者的计算机断层血管造影(CTA)扫描数据,处理成三维表面网格用于训练和测试;运用最大熵逆强化学习(IRL)从专家演示数据中学习奖励函数。

研究结果


  1. 相同患者血管训练和测试结果:研究设置了 6 种奖励函数()进行实验。(无力量反馈的密集奖励)和(无力量反馈的组合模型)成功率均为 100%,(有力量反馈的密集奖励)和(有力量反馈的组合模型)成功率分别为 97% 和 96%。添加力量反馈后,的手术时间显著延长,的平均力显著降低 。
  2. 未知患者血管测试结果:对在两个未知患者血管上进行测试。整体上,除平均力外,结果较初始单血管训练 / 测试有所下降。但表现出色,成功率保持在 96%,手术时间、路径比和平均力与单血管测试时相比无显著差异,且添加力量反馈使的手术时间和平均力显著降低。

研究结论与讨论


该研究首次实现了 MT 第二阶段中微导丝和微导管从颈内动脉(ICA)到大脑中动脉(MCA)的自主导航。将器械尖端力反馈纳入奖励函数不仅可行,还能降低血管上的平均力,提高组合奖励模型在未知血管测试中的成功率、缩短手术时间,且模型在不同训练和测试条件下具有良好的通用性。不过,研究也存在一些局限性,如无法测量荧光透视时间、数据集较小、未充分考虑导丝物理特性等。尽管如此,这项研究为 MT 的自动化发展迈出了重要一步,提高了技术准备水平(TRL),有望推动完全自主 MT 在临床的应用,为更多中风患者带来希望。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号