EasyDIVER+:助力核酸与氨基酸体外进化高通量测序数据分析的前沿利器

《Journal of Molecular Evolution》:EasyDIVER?+?: An Advanced Tool for Analyzing High Throughput Sequencing Data from In Vitro Evolution of Nucleic Acids or Amino Acids

【字体: 时间:2025年04月06日 来源:Journal of Molecular Evolution 2

编辑推荐:

  在体外进化研究中,分析核酸或氨基酸体外进化产生的高通量测序(HTS)数据面临诸多挑战,现有工具难以满足需求。研究人员开发了 EasyDIVER+工具,它集处理、分析和可视化功能于一体,为肽和蛋白质数据的生物信息学分析带来重大进展,有助于推动体外进化研究。

  在生命科学的探索旅程中,体外进化技术如同神奇的魔法棒,能帮助科学家们发现具有特定功能的核酸和肽序列。然而,随着高通量测序(HTS)技术的广泛应用,海量的数据如潮水般涌来,让研究人员陷入了数据处理与分析的困境。在肽选择的研究场景里,现有的生物信息学工具显得捉襟见肘,它们缺乏针对此类数据的特异性,使得研究人员在面对复杂数据集时,犹如在迷宫中徘徊,找不到有效的分析路径。
为了突破这一困境,来自多个研究机构的科研人员携手开展了深入研究。其中,Blue Marble Space Institute of Science、University of California、Stanford University、University of California、University of Minnesota 等机构的研究人员共同发力,开发出了一款名为 EasyDIVER+的先进工具。这一研究成果发表在《Journal of Molecular Evolution》上,为生物信息学领域带来了新的曙光。

在研究过程中,研究人员主要运用了以下关键技术方法:首先,利用 PANDAseq 软件对原始的双端、解复用 Illumina 测序读段文件(FASTQ 格式)进行合并处理;其次,根据用户提供的引物序列对组装后的序列进行修剪;再者,针对氨基酸数据,运用从美国国家生物技术信息中心(NCBI)提取的 27 种替代遗传密码将核苷酸序列翻译成氨基酸序列;最后,通过计算富集值、误差估计以及可视化分析等手段,对数据进行全面深入的分析。

研究结果


  1. 数据处理:EasyDIVER+沿用了原始 EasyDIVER 工具的处理流程,对双端 Illumina 读段文件进行合并、质量过滤、接头修剪等操作,生成去重计数文件和序列长度分布文件。同时,对于氨基酸数据,还会进行翻译和基于密码子冗余的进一步去重处理,并生成详细的日志文件记录处理信息。
  2. 富集分析:这是 EasyDIVER+相较于原始工具的重大突破。当输入的文件对应于连续轮次的体外选择测序数据时,用户可以指定文件分析的时间顺序,并将每个文件按样本类型(即预选择、后选择或阴性对照)进行分类。基于此,EasyDIVER+能够计算每个独特序列在连续选择轮次中的富集指标,同时提供读计数的 95% 置信区间,并为每个序列分配一个在所有样本中一致的唯一名称,方便跟踪和识别。
  3. 序列命名:为了解决在众多文件中难以直观识别和跟踪特定序列的问题,EasyDIVER+采用 Base58 编码方法为每个序列分配独特的短名称。该名称在整个选择实验的所有文件中保持一致,有效提高了数据处理和分析的效率。
  4. 误差估计:由于测序数据存在不确定性,如采样误差、PCR 扩增偏差、测序错误和文库制备的可变性等,EasyDIVER+运用 Bootstrapping 方法估计序列计数的 95% 置信区间,从而为频率和富集指标提供统计范围,帮助用户判断数据的可靠性。
  5. 图形用户界面:EasyDIVER+集成了基于 PyQt5 的图形用户界面(GUI),用户可以方便地输入处理和分析参数。同时,它还提供了一个基于 Plotly Python 库开发的图形生成器,用户可以通过定制化的图表直观地探索处理后的数据,如调整读计数、频率等截止值,实现对数据的聚焦分析。

研究结论与讨论


EasyDIVER+在原始 EasyDIVER 工具的基础上进行了全面升级,为体外进化实验中的高通量测序数据分析提供了一个功能强大、操作简便的平台。它有效解决了肽选择研究中数据处理和分析的难题,能够同时处理核酸和肽数据,并通过富集分析、误差估计等功能,为研究人员提供了更深入、更准确的数据分析结果。

此外,其图形用户界面和交互式图形生成器大大降低了使用门槛,使不同计算水平的研究人员都能轻松上手,便于直观地理解和解释数据,深入探究序列在选择轮次中的动态变化。这一工具的出现,显著提高了高通量测序数据分析的效率和可及性,为体外进化领域的研究提供了有力支持,推动了该领域的进一步发展,有望助力科学家们在核酸和肽功能研究方面取得更多突破。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号