Stoic模型性能评估:准确预测蛋白质复合物组分比例的机器学习方法

发布时间:2026/5/30 9:26:14

Stoic模型性能评估:准确预测蛋白质复合物组分比例的机器学习方法 Stoic模型性能评估准确预测蛋白质复合物组分比例的机器学习方法【免费下载链接】stoic项目地址: https://ai.gitcode.com/hf_mirrors/PickyBinders/stoicStoic是一款基于机器学习的蛋白质复合物组分比例预测工具能够直接从蛋白质序列快速准确地预测拷贝数并可根据预测的最佳化学计量学结果导出AF3-ready JSON文件。该工具基于Facebook的ESM2_t33_650M_UR50D基础模型构建在生物学研究领域具有重要应用价值。核心功能与技术优势Stoic的核心功能在于实现蛋白质化学计量学的精准预测其技术优势主要体现在以下几个方面多输入支持能够处理序列列表、单个FASTA文件或FASTA文件目录每个FASTA文件视为独立复合物高效预测首次推理仅需联网下载模型权重后续可离线使用模型权重缓存于~/.cache/huggingface灵活输出可返回指定数量的顶级化学计量学候选结果默认3个支持残基权重预测和保存AF3集成直接导出适用于AlphaFold3的输入JSON文件无缝衔接蛋白质结构预测流程模型架构与性能指标Stoic采用先进的机器学习架构结合序列嵌入与图卷积网络技术基础模型使用facebook/esm2_t33_650M_UR50D作为序列嵌入模型特征池化采用SelfAttentionPooling策略配备4个注意力头序列特征编码使用GCNConv图卷积网络结合4头注意力机制量化优化支持4-bit加载模式平衡性能与资源消耗模型在多种评估指标上表现优异包括准确率accuracy、F1分数、召回率recall和精确率precision能够有效预测1-24范围内的蛋白质拷贝数。快速安装指南环境准备使用venvpython -m venv .venv source .venv/bin/activate使用conda/mambamamba create -n stoic-env python3.10 -y mamba activate stoic-env安装Stoic从本地克隆安装可编辑模式git clone https://gitcode.com/hf_mirrors/PickyBinders/stoic cd stoic python -m pip install --upgrade pip python -m pip install -e .直接从GitHub安装python -m pip install githttps://gitcode.com/hf_mirrors/PickyBinders/stoic.git命令行预测使用方法Stoic提供直观的命令行工具stoic_predict_stoichiometry支持多种使用场景序列列表输入stoic_predict_stoichiometry \ --sequences SENECA VIRTVS \ --top-n 3单个FASTA文件输入stoic_predict_stoichiometry \ --input-path path/to/complex.fasta \ --top-n 3FASTA文件目录批量处理stoic_predict_stoichiometry \ --input-path path/to/fasta_dir \ --top-n 3 \ --output-dir stoic_predictionsPython API使用示例高层推理辅助函数from stoic.predict_stoichiometry import predict_stoichiometry results predict_stoichiometry( sequences[SENECA, VIRTVS], # 或FASTA路径/FASTA目录路径 model_namePickyBinders/stoic, top_n3, ) print(results)直接从Hugging Face加载模型import torch from stoic.model import Stoic device cuda if torch.cuda.is_available() else cpu model Stoic.from_pretrained(PickyBinders/stoic) model.eval().to(device) pred model.predict_stoichiometry([SENECA, VIRTVS], top_n3) print(pred)输出文件说明当指定--output-dir参数时Stoic会生成以下文件单个输入序列列表或单个FASTAresults.json预测结果af3_input.jsonAlphaFold3输入文件residue_predictions.pkl残基预测结果需启用--return-residue-weightsFASTA目录输入complex_name.json各复合物的预测结果complex_name_af3_input.json各复合物的AlphaFold3输入文件complex_name_residue_predictions.pkl各复合物的残基预测结果需启用--return-residue-weights引用与学术支持如果您在研究中使用了Stoic请引用以下文献article{litvinov2026stoic, title {Stoic: Fast and accurate protein stoichiometry prediction}, author {Litvinov, Daniil and Pantolini, Lorenzo and {\v{S}}krinjar, Peter and Tauriello, Gerardo and McCafferty, Caitlyn L and Engel, Benjamin D and Schwede, Torsten and Durairaj, Janani}, journal {bioRxiv}, year {2026}, doi {10.64898/2026.03.13.711535}, url {https://www.biorxiv.org/content/10.64898/2026.03.13.711535v1} }Stoic作为一款开源工具遵循MIT许可证为蛋白质组学研究提供了强大的计算支持帮助研究人员更快速、更准确地预测蛋白质复合物的组成比例推动结构生物学和系统生物学的发展。【免费下载链接】stoic项目地址: https://ai.gitcode.com/hf_mirrors/PickyBinders/stoic创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻