
探索DeepPurpose预训练模型10分钟实现SARS-CoV-3CL蛋白酶抑制剂虚拟筛选【免费下载链接】DeepPurposeA Deep Learning Toolkit for DTI, Drug Property, PPI, DDI, Protein Function Prediction (Bioinformatics)项目地址: https://gitcode.com/gh_mirrors/de/DeepPurposeDeepPurpose是一个强大的深度学习工具包专门用于药物-靶点相互作用预测、药物性质预测和蛋白质功能预测等生物信息学任务。今天我们将重点介绍如何利用DeepPurpose的预训练模型在短短10分钟内完成SARS-CoV-3CL蛋白酶抑制剂的虚拟筛选工作。这种快速高效的虚拟筛选方法为药物研发提供了革命性的工具让研究人员能够快速识别潜在的治疗候选药物。 DeepPurpose预训练模型简介DeepPurpose提供了超过10个预训练模型涵盖了多种药物编码和目标编码组合。这些模型已经在大规模数据集上进行了训练包括BindingDB、DAVIS和KIBA等知名数据库。预训练模型可以直接用于预测任务无需从头开始训练大大节省了时间和计算资源。核心功能特点多任务支持支持药物-靶点相互作用预测、药物性质预测、蛋白质-蛋白质相互作用预测等预训练模型库提供丰富的预训练模型覆盖不同的编码策略一键式操作通过简单的API调用即可完成复杂的虚拟筛选任务高性能计算支持GPU加速提高计算效率 SARS-CoV-3CL蛋白酶虚拟筛选实战SARS-CoV-2的3CL蛋白酶是病毒复制过程中的关键酶是抗病毒药物开发的重要靶点。使用DeepPurpose进行虚拟筛选可以快速识别潜在的抑制剂。准备工作环境配置首先需要克隆DeepPurpose仓库并安装必要的依赖git clone https://gitcode.com/gh_mirrors/de/DeepPurpose cd DeepPurpose conda env create -f environment.yml conda activate DeepPurpose步骤一加载预训练模型DeepPurpose提供了多种预训练模型包括MPNN_CNN_BindingDB使用MPNN药物编码和CNN蛋白质编码CNN_CNN_DAVIS使用CNN药物编码和CNN蛋白质编码Morgan_CNN_KIBA使用Morgan指纹药物编码和CNN蛋白质编码加载预训练模型非常简单from DeepPurpose import DTI as models model models.model_pretrained(modelMPNN_CNN_BindingDB)步骤二准备数据DeepPurpose内置了SARS-CoV-2 3CL蛋白酶序列和抗病毒药物数据集from DeepPurpose.dataset import * target, target_name load_SARS_CoV2_Protease_3CL() X_repurpose, drug_names, drug_CID load_antiviral_drugs()步骤三执行虚拟筛选使用oneliner.repurpose()函数可以一键完成虚拟筛选from DeepPurpose import oneliner results oneliner.repurpose(target, target_name, X_repurpose, drug_names) 虚拟筛选结果分析DeepPurpose的虚拟筛选结果会按照结合亲和力评分进行排序输出前30个最有潜力的候选药物。以下是部分筛选结果示例排名药物名称靶点名称结合评分1SofosbuvirSARS-CoV-2 3CL蛋白酶190.252DaclatasvirSARS-CoV-2 3CL蛋白酶214.583VicrivirocSARS-CoV-2 3CL蛋白酶315.704SimeprevirSARS-CoV-2 3CL蛋白酶396.535EtravirineSARS-CoV-2 3CL蛋白酶409.34这些结果提供了重要的参考信息帮助研究人员快速识别潜在的候选药物进行进一步实验验证。 DeepPurpose的核心优势1. 快速部署与使用DeepPurpose提供了简洁的API接口即使是深度学习新手也能快速上手。通过几行代码就能完成复杂的虚拟筛选任务。2. 多种编码策略支持DeepPurpose支持多种药物和蛋白质编码方法药物编码MPNN、CNN、Morgan指纹、Daylight指纹蛋白质编码CNN、AAC氨基酸组成3. 灵活的微调功能除了使用预训练模型DeepPurpose还支持在特定数据集上进行微调提高模型在特定任务上的性能。4. 完整的评估指标DeepPurpose提供了全面的评估指标包括AUROC、AUPRC、F1分数等帮助用户全面评估模型性能。 项目结构与关键文件DeepPurpose的项目结构清晰主要模块包括DeepPurpose/ ├── DTI.py # 药物-靶点相互作用预测模块 ├── oneliner.py # 一键式操作接口 ├── dataset.py # 数据加载和处理模块 ├── encoders.py # 编码器模块 └── DEMO/ # 示例代码目录关键文件路径核心API接口oneliner.py数据加载模块dataset.py预训练模型使用示例DEMO/case-study-I-Drug-Repurposing-for-3CLPro.ipynb快速微调示例DEMO/oneliner-3CLpro-finetuning-AID1706.ipynb 高级功能模型微调对于特定任务DeepPurpose支持在预训练模型基础上进行微调。以SARS-CoV-3CL蛋白酶抑制剂筛选为例from DeepPurpose import oneliner from DeepPurpose.dataset import * # 加载数据和预训练模型 target, target_name load_SARS_CoV_Protease_3CL() train_drug, train_target, train_y load_AID1706_SARS_CoV_3CL(./data) X_repurpose, drug_names, drug_CID load_antiviral_drugs() # 微调并筛选 results oneliner.repurpose( targettarget, target_nametarget_name, train_drugtrain_drug, train_targettrain_target, train_ytrain_y, X_repurposeX_repurpose, drug_namesdrug_names, finetune_epochs10, finetune_LR0.001 ) 最佳实践建议1. 选择合适的预训练模型根据任务类型选择合适的预训练模型BindingDB数据集适用于一般药物-靶点相互作用预测DAVIS数据集适用于激酶抑制剂筛选KIBA数据集适用于多靶点药物筛选2. 数据预处理确保输入数据的格式正确药物使用SMILES字符串表示蛋白质使用氨基酸序列表示标签数据格式统一3. 结果验证虚拟筛选结果需要进一步验证进行分子对接模拟实验验证结合活性考虑ADMET性质 注意事项结果解释虚拟筛选结果仅供参考需要专家进一步评估数据质量输入数据质量直接影响预测结果模型局限性深度学习模型存在一定的局限性需要结合其他方法计算资源大规模筛选需要足够的计算资源 未来发展方向DeepPurpose团队正在不断改进和扩展功能未来计划包括更多预训练模型的发布支持更多药物和蛋白质编码方法集成更多生物信息学工具提供Web界面方便使用 总结DeepPurpose为药物发现研究提供了强大的工具支持特别是其预训练模型功能让研究人员能够在短时间内完成大规模的虚拟筛选任务。通过简单的API调用即使是缺乏深度学习经验的研究人员也能快速上手加速药物研发进程。无论你是药物研发人员、生物信息学研究者还是对AI在生物医药领域应用感兴趣的开发者DeepPurpose都值得你尝试和使用。现在就开始你的药物虚拟筛选之旅吧提示所有代码示例都可以在DeepPurpose的DEMO目录中找到建议从案例研究开始学习。【免费下载链接】DeepPurposeA Deep Learning Toolkit for DTI, Drug Property, PPI, DDI, Protein Function Prediction (Bioinformatics)项目地址: https://gitcode.com/gh_mirrors/de/DeepPurpose创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考