有关蛋白质计算练习(强烈建议蛋白人一定要尝试的计算工具TOP15)
清明三天小长假结束地猝不及防,早上上班刷到小师妹为了要Elisa试剂盒的标曲在跟供应商理论的票圈才找回点工作状态。如果说上期介绍的多肽类药物是由小分子研发转向大分子药的技术过渡区域,那么本期介绍的能治病的蛋白药在各个方面与化学药相比都可谓是两级反转。
理论上蛋白类药物可用于治疗任何发病机制清楚、病理学靶点明确的疾病。虽然蛋白药的优点众多但其创新研发不可不说是一个非常艰难的过程。研发路漫漫,算伴在身旁。算伴网(scibank.net)一直致力于让更多一线人员通过合适的计算工具实现科研效率的大幅提升。它早已依靠社区的力量完成了对现有计算工具的评分与使用手册梳理,涵盖了生物医药计算及科研的方方面面,只需轻轻一搜,便能快速上手心仪工具。
今天为大家梳理的蛋白领域里数十个亲测好用的最热计算工具也被收录在算伴网里,排名不分先后。双手奉上直达链接:scibank.net
https://www.scibank.net/public
今天推荐的工具涉及数据库、蛋白建模、PPI,蛋白设计等,总有一款适合你!关注我,此系列将开启连载模式,每周三准时推送,绝对不鸽!
01 UniProt
首先介绍的是这个使用频率超级高的国际知名蛋白质数据库。UniProt主要包括UniProtKB知识库、UniParc归档库和UniRef参考序列集三部分。UniProtKB知识库是UniProt的核心,除蛋白质序列数据外,还包括大量注释信息。UniProtKB知识库分Swiss-Prot和TrEMBL两个子库。Swiss-Prot子库中50多万条序列均由人工审阅和注释,而TrEMBL子库中1.4亿多条序列是由核酸序列数据库EMBL中的蛋白质编码序列翻译所得,并由计算机根据一定规则进行注释。UniProt网站为用户提供了高效实用的高级检索系统和大量帮助文档。UniProt是目前国际上序列数据最完整、注释信息最丰富的非冗余蛋白质序列数据库,自本世纪初创建以来,为生命科学领域提供了宝贵资源。
02 RCSB PDB
接着说的也是一个知名网站,PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)2.5维(以二维的形式表示三维的数据)结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。但凡是做生物医药研究的都离不开它。
03 dbPTM
dbPTM 是蛋白质翻译后修饰 (PTM) 的综合资源。由于蛋白质翻译后修饰 (PTM) 在调节生物过程中的重要性,dbPTM 通过整合来自多个数据库的实验验证 PTM 和注释所有 UniProtKB 蛋白质entry的潜在 PTM数据而成为一个综合数据库。dbPTM 已经维护了十多年,旨在为翻译后修饰 (PTM) 提供全面的功能和结构分析。在最近的一次更新中,dbPTM 不仅整合了来自可用数据库和手动文献整理的更多经过实验验证的 PTM,而且还提供了基于非同义单核苷酸多态性 (nsSNP) 的疾病关联。
04 STRING
这是一个可以用来检索已知蛋白和预测蛋白之间相互作用的数据库。除了可以对蛋白生成精美的蛋白-蛋白互相作用(PPI)图,还提供了对输入蛋白的分析,包括常见的功能富集分析(GO、KEGG)和参考出版物等。网站的数据也是可以下载的,点击Download,网站所有的后台数据,包括蛋白互作数据,蛋白附件数据,完整的数据库存储。
05 InterProSurf
该网站用表面残基聚类方法分析残基出现在界面上的倾向性以及溶剂可接触表面积。用户提交PDB代码后网站会自动下载结构并分析四个方面的属性:蛋白界面中的残基、氨基酸的极性和非极性表面积、表面和掩埋原子的数量、单体和多聚体形式的蛋白的总表面积。
06 GPS 5.0
这是一个免费在线预测蛋白的磷酸化位点的实用小工具。GPS 5.0通过开发两种新的位置权重确定 ( PWD ) 和评分矩阵优化 ( SMO ) 方法来提高预测激酶特异性 p 位点的性能。除了丝氨酸/苏氨酸或酪氨酸激酶外,还支持对双特异性激酶特异性 p 位点的预测。在 GPS 5.0 的经典模块中,构建了617个单独的预测器,用于预测479个人类 PK 的 p 位点。为了扩展 GPS 5.0 的应用,实施了一个物种特异性模块来预测161个中44,795 个PK 的激酶特异性 p 位点真核生物。此外,还为预测的 p 位点注释了二级结构、表面可及性和无序区域等结构特征。
07 ClusPro2.0
Cluspro是一款学术免费的蛋白-蛋白刚性对接程序,该程序由波士顿大学开发并部署在服务器上供大家注册后使用,也可以将程序下载到本地进行部署计算。Schrodinger软件的蛋白-对接模块就是使用的该软件,操作简单,可选结果多,准确度高,优点不胜枚举。毫不夸张地说,在AlphaFold2出来之前,ClusPro是预测复合物结构最好用的工具之一。
08 RosettaDock
RosettaDock是蛋白-蛋白对接领域的一名老将,久经CAPRI的考验。特别擅长于蛋白-蛋白复合物局部构象的探索。许多已发表的文章都是使用RosettaDock进行最后的优化,其地位可见一斑。近年来,RosettaDock也发展出了针对特殊蛋白家族提供的算法如针对抗体-抗原对接的SnugDock、同源多聚体组装对接的SymmetricDock、多肽-蛋白对接的FlexPepDock、以及最新的Motif Score打分函数等等。
09 AlphaFold
上面介绍了ClusPro预测蛋白复合物结构的优秀表现,这一地位一直维持到AlphaFold出现,这个DeepMind 开发的最先进的人工智能系统,能够以前所未有的准确度和速度通过计算预测蛋白质结构。这些预测正在与 EMBL 的欧洲生物信息学研究所 (EMBL-EBI) 合作,向全球科学界免费公开提供,开辟了新的令人兴奋的研究途径。
10 SWISS-MODEL
又是一个蛋白人绕不开的宝藏网站,SWISS-MODEL 是一个全自动蛋白质结构同源建模服务器。该服务器的目的是使全球所有生命科学研究人员都可以轻松进行蛋白质建模。只需输入序列便可得到同源度最高的蛋白结构,非常方便快捷,强力推荐!
11 I-TASSER
说到结构预测还不得不提一下这个网站,作为蛋白结构从头预测和基于结构的功能预测在线服务器,它实现了基于 I-TASSER 的蛋白质结构和功能预测算法。允许学术用户从其氨基酸序列中自动生成蛋白质分子的 3D 结构和生物学功能的高质量模型预测。
12 ABACUS2
中科大的刘海燕团队开发的这个网站可以对用户提供的输入 PDB 文件中包含的氨基酸序列和骨架结构之间的兼容性进行评分。给出评估的 ABACUS序列能量。返回包含不同氨基酸位置的不同能量成分的能量贡献结果。
13 CAMEO
CAMEO是全球持续蛋白质结构预测竞赛的英文缩写,由瑞士生物信息研究所和巴塞尔大学联合举办,与CASP被认为是结构预测领域最重要的两项比赛。但不同于CASP的是,CAMEO的参赛者需要每周预测20个由世界范围内的结构生物学家最新破解出结构的蛋白质的结构,比赛的得分与排名也会每周实时更新。另外,与CASP实验相比,预测和参考数据之间的比较是完全自动化的,因此需要对相对域运动具有鲁棒性的数值距离测量。
14 Robetta
这个工具是一个通过 CAMEO 不断进行评估的蛋白质结构预测网站,特征包括相对快速和准确的基于深度学习的方法、RoseTTAFold 和 TrRosetta,以及允许为同源建模、约束、局部片段等进行自定义序列比对的交互式提交界面。它可以使用 RoseTTAFold(用户必须提供配对 MSA)或比较建模 (CM) 对多链复合物进行建模,并提供大规模采样的选项。CM 方法使用每周更新的 PDB100 模板数据库、基于协同进化的模型数据库 (MDB),并且还提供了自定义模板的选项。
15 Proteinsolver
ProteinSolver 是一个深度神经网络,它从训练数据中学习如何解决(定义不明确的)约束满足问题(CSP)。在学习如何解决数独谜题的玩具问题和设计折叠成预定几何形状的蛋白质序列的现实问题上都显示出可喜的结果。这个图形神经网络能够生成新的氨基酸序列,折叠成具有预定拓扑结构的蛋白质。
上面这些工具的详细介绍和使用方法均可在算伴网找到,好不好用试了才知道,记得在工具下方的评论区留下使用反馈哦,每月对社区贡献最高的人员可享高达一千元现金奖励!是不是超级有诚意?千言万语,只等您来体验!
中大唯信头条号与中大唯信公众号、唯信计算订阅号均由中大唯信科技有限公司运营,欢迎关注转发,未经授权禁止转载
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com