
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于动态数据平衡策略的Xception-双通道LSTM模型在腹腔镜胆囊切除术阶段识别中的应用
【字体: 大 中 小 】 时间:2025年09月16日 来源:International Journal of Computer Assisted Radiology and Surgery 2.3
编辑推荐:
为解决腹腔镜胆囊切除术阶段识别中时序特征学习不足及训练数据类别失衡问题,研究人员提出一种基于动态数据平衡策略的Xception-双通道LSTM(Long Short-Term Memory)融合模型。该模型通过动态调整各手术阶段的欠采样率平衡数据分布,结合Xception的深度可分离卷积(depthwise separable convolutions)与双通道LSTM(含时序映射双向LSTM和序列嵌入LSTM),显著提升时序特征提取能力。实验显示,在Cholec80数据集上该模型F1值全面优于传统单通道LSTM,验证了其在缓解数据失衡、增强检测性能方面的有效性。
在腹腔镜手术的智能化分析领域,精准识别手术阶段是提升医疗AI应用的关键。这项研究创新性地将动态数据平衡策略与深度学习架构结合,通过Xception模型(利用深度可分离卷积技术逐帧提取视觉特征)与双通道长短时记忆网络(LSTM)的协同工作,破解了手术视频分析的两大难题:时序依赖性建模与数据分布失衡。
具体而言,动态平衡策略像一位"智能调度员",针对不同手术阶段(如胆囊分离、夹闭等)的样本量差异,动态调整欠采样率,从原始视频中裁剪出短片段作为均衡化训练样本。而双通道LSTM则如同"时空侦探"——时序映射通道(双向LSTM)负责捕捉前后帧的上下文关联,序列嵌入通道(单向LSTM)专注于潜在特征编码,双路信息最终通过得分融合实现阶段判定。
在Cholec80这个包含80台手术视频的权威测试集上,该模型展现出全面优势:不仅F1值较单通道LSTM提升显著,更难得的是所有手术阶段的识别精度均得到改善。这标志着动态平衡策略成功遏制了模型对多数类的"偏见学习",而双通道架构则让系统真正读懂了手术视频的"时空语法"。这项技术未来或可拓展至其他内镜手术分析,为智能手术导航系统提供核心算法支撑。
生物通微信公众号
知名企业招聘