《Journal of Molecular Evolution》:EasyDIVER?+?: An Advanced Tool for Analyzing High Throughput Sequencing Data from In Vitro Evolution of Nucleic Acids or Amino Acids
编辑推荐:
在体外进化研究中,分析核酸或氨基酸体外进化产生的高通量测序(HTS)数据面临诸多挑战,现有工具难以满足需求。研究人员开发了 EasyDIVER+ 工具,它集处理、分析和可视化功能于一体,为肽和蛋白质数据的生物信息学分析带来重大进展,有助于推动体外进化研究。
在生命科学的探索旅程中,体外进化技术如同神奇的魔法棒,能帮助科学家们发现具有特定功能的核酸和肽序列。然而,随着高通量测序(HTS)技术的广泛应用,海量的数据如潮水般涌来,让研究人员陷入了数据处理与分析的困境。在肽选择的研究场景里,现有的生物信息学工具显得捉襟见肘,它们缺乏针对此类数据的特异性,使得研究人员在面对复杂数据集时,犹如在迷宫中徘徊,找不到有效的分析路径。
为了突破这一困境,来自多个研究机构的科研人员携手开展了深入研究。其中,Blue Marble Space Institute of Science、University of California、Stanford University、University of California、University of Minnesota 等机构的研究人员共同发力,开发出了一款名为 EasyDIVER+ 的先进工具。这一研究成果发表在《Journal of Molecular Evolution》上,为生物信息学领域带来了新的曙光。
在研究过程中,研究人员主要运用了以下关键技术方法:首先,利用 PANDAseq 软件对原始的双端、解复用 Illumina 测序读段文件(FASTQ 格式)进行合并处理;其次,根据用户提供的引物序列对组装后的序列进行修剪;再者,针对氨基酸数据,运用从美国国家生物技术信息中心(NCBI)提取的 27 种替代遗传密码将核苷酸序列翻译成氨基酸序列;最后,通过计算富集值、误差估计以及可视化分析等手段,对数据进行全面深入的分析。
研究结果
数据处理 :EasyDIVER+ 沿用了原始 EasyDIVER 工具的处理流程,对双端 Illumina 读段文件进行合并、质量过滤、接头修剪等操作,生成去重计数文件和序列长度分布文件。同时,对于氨基酸数据,还会进行翻译和基于密码子冗余的进一步去重处理,并生成详细的日志文件记录处理信息。
富集分析 :这是 EasyDIVER+ 相较于原始工具的重大突破。当输入的文件对应于连续轮次的体外选择测序数据时,用户可以指定文件分析的时间顺序,并将每个文件按样本类型(即预选择、后选择或阴性对照)进行分类。基于此,EasyDIVER+ 能够计算每个独特序列在连续选择轮次中的富集指标,同时提供读计数的 95% 置信区间,并为每个序列分配一个在所有样本中一致的唯一名称,方便跟踪和识别。
序列命名 :为了解决在众多文件中难以直观识别和跟踪特定序列的问题,EasyDIVER+ 采用 Base58 编码方法为每个序列分配独特的短名称。该名称在整个选择实验的所有文件中保持一致,有效提高了数据处理和分析的效率。
误差估计 :由于测序数据存在不确定性,如采样误差、PCR 扩增偏差、测序错误和文库制备的可变性等,EasyDIVER+ 运用 Bootstrapping 方法估计序列计数的 95% 置信区间,从而为频率和富集指标提供统计范围,帮助用户判断数据的可靠性。
图形用户界面 :EasyDIVER+ 集成了基于 PyQt5 的图形用户界面(GUI),用户可以方便地输入处理和分析参数。同时,它还提供了一个基于 Plotly Python 库开发的图形生成器,用户可以通过定制化的图表直观地探索处理后的数据,如调整读计数、频率等截止值,实现对数据的聚焦分析。
研究结论与讨论
EasyDIVER+ 在原始 EasyDIVER 工具的基础上进行了全面升级,为体外进化实验中的高通量测序数据分析提供了一个功能强大、操作简便的平台。它有效解决了肽选择研究中数据处理和分析的难题,能够同时处理核酸和肽数据,并通过富集分析、误差估计等功能,为研究人员提供了更深入、更准确的数据分析结果。
此外,其图形用户界面和交互式图形生成器大大降低了使用门槛,使不同计算水平的研究人员都能轻松上手,便于直观地理解和解释数据,深入探究序列在选择轮次中的动态变化。这一工具的出现,显著提高了高通量测序数据分析的效率和可及性,为体外进化领域的研究提供了有力支持,推动了该领域的进一步发展,有望助力科学家们在核酸和肽功能研究方面取得更多突破。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》