MethPy采用模块化设计,使用Python编程语言开发,包含七个核心模块。Start模块负责初始化工作环境,创建必要的文件夹结构;Ref模块允许用户输入参考序列并自动生成反向互补序列;Tutorial模块提供示例序列帮助用户熟悉分析流程;Check模块是核心分析模块,通过交互式窗口引导用户完成实验序列与参考序列的比对,自动识别甲基化位点并处理测序错误;Table模块将分析结果整理成表格形式;Plot模块生成可视化图表;Init模块包含软件的基础函数和类。关键技术方法包括:基于Python的序列比对算法、亚硫酸氢盐转换规律的特征识别、交互式图形用户界面(GUI)设计、多格式输出支持(文本、Word、Excel、图表等)。软件已使用实验室先前生成的PSEN1、IL-1β、IL-6等基因启动子区域的甲基化数据进行了验证测试,结果与手动分析完全一致。Start模块Start模块作为软件的初始化入口,负责创建完整的目录结构,包括References、Input、Output in Word、Output in txt、Tables等文件夹,为后续分析提供有序的文件管理基础。Ref模块Ref模块通过弹出窗口接收用户输入的参考序列,自动执行质量控制步骤,包括将小写字符转换为大写、检测非法字符,并生成正向和反向互补序列文件,分别以F和R后缀区分。Tutorial模块Tutorial模块设计用于用户培训,生成模拟的甲基化和非甲基化序列,这些序列故意包含测序错误和截断,模拟真实实验数据,帮助用户快速掌握软件使用流程。Check模块Check模块是软件的核心分析引擎,通过多步骤交互流程实现精确的序列比对。首先,用户通过下拉菜单选择参考序列和实验序列路径;接着,软件通过滑动窗口算法寻找最佳比对起始点,并以可视化方式展示65个碱基的比对区域,用"X"标记匹配或符合亚硫酸氢盐转换规律的位点。当发现无法用甲基化状态解释的序列差异时,模块会启动错误处理机制,弹出窗口提示用户选择错误类型(缺失、插入或碱基替换)。甲基化胞嘧啶用绿色标记,转换后的胸腺嘧啶用黄色标记,各种错误类型均有对应的颜色编码,确保结果直观易懂。Table模块Table模块将多个序列的分析结果整合成结构化表格,支持CSV和Excel两种格式。表格中清晰标注每个胞嘧啶的位置、甲基化状态(0表示未甲基化,1表示甲基化,2表示未知),自动计算总甲基化水平和百分比,并用颜色区分CpG和非CpG位点。Plot模块Plot模块提供高度可定制的可视化功能,用户可自主设置图表标题、分辨率、文件格式、碱基范围、误差线和颜色方案。模块默认生成三种图表:所有胞嘧啶的甲基化百分比(CpG位点用红色突出显示)、仅CpG位点甲基化情况和仅非CpG位点甲基化情况。