新闻

2016年12月13日

蛋白质 - 蛋白质相互作用的数据库打开了系统生物学的新的可能性

PrePPI inputs
preppi预测的可能性,两种蛋白质a和b是能够基于它们的相似性对已知相互作用的其它蛋白质相互作用。这需要集成结构数据(绿色),以及其他种类的信息(蓝色),例如在其他物种的蛋白共活性的证据,以及在类似的细胞功能的参与。 preppi现在提供了前所未有的范围的可搜索的数据库,构成人体细胞的所有蛋白质的相互作用组虚。 (图像礼貌 网上生活。) 

每一个活细胞内的分子机制包括位于许多不同水平的功能部件的巨大数量。像基因组序列,基因表达,蛋白质组谱,和染色质状态的功能都在这个复杂的系统至关重要,但研究一个水平往往不足以解释为什么细胞表现他们的方式。因为这个原因,系统生物学致力于整合不同类型的数据,制定全面的模型,更全面地描述了引起生物性状相互作用的网络。 

尽管交互网络的概念似乎抽象,在其基础上的每个交互是发生在两个蛋白彼此相遇,结合,并造成影响细胞的活性变化的物理事件。为了让这种情况的发生,但是,他们需要有兼容的形状和物理性能。能够预测可能的配对蛋白质 - 蛋白质相互作用的整个宇宙,因此可能是系统生物学的极其宝贵的,因为它可能既用于解释由其他方法提出相互作用的可行性提供了一个框架,并可能揭示网络,其他方法的独特功能可能会错过。 

2012年纸 性质科学家在实验室 巴里霍尼格 首次提出具有里程碑意义的算法和数据库他们叫 preppi(预测蛋白 - 蛋白相互作用)。在当时,preppi使用时与实验产生相比资源用于部署来自结构生物学概念来预测大约300,000蛋白质 - 蛋白质相互作用,在可用的交互的数量的显着增加一个新的计算的策略。

自那时起,霍尼格实验室一直在努力改善preppi的范围和实用性。在 论文近期发表在网上生活 他们现在的一些令人印象深刻的发展情况。以增强他们的算法,并引入了一些新的类型的数据纳入其分析中,preppi数据库现在包含超过135万点的预测蛋白质 - 蛋白质相互作用的,覆盖整个人类蛋白质组的约85%。这使得它的种类最大的资源。在这些改进的同时,研究者也开始以新的方式申请preppi,用它包含提供新的见解种的成蛋白质相互作用网络的组织和功能的信息。

“最终,我们在做什么,”霍尼格说,“就是用蛋白质结构中他们没有正常使用的方式。我们正在利用大量的结构数据的现在存在,并发现它使我们有机会来回答问题,但其不能得到解决。“作为新的文件报道,这包括用于解释遗传数据提供了新的方法,注释蛋白质的功能,并确定治疗人类疾病的有前途的新目标。

新的和改进的preppi

preppi不是预测蛋白质 - 蛋白质相互作用,利用它的第一种方法,虽然结构模型,并结合与其他几个种类的信息,从别人区别开来。该算法的设计依赖于观察,记录在蛋白质数据银行和其他地方,包含结构相似的许多蛋白质。它也需要灵感来自于广泛使用的生物信息学工具高炉 - 标识相似的蛋白质序列鉴定蛋白质具有类似功能 - “疾风结构”构成什么霍尼格实验室是指为在这里,他们利用途径结构称为比对和同源建模确定结构相似性在不同的蛋白质建议将它们有相似的结合性质。

这意味着,在实践中,如果研究人员想知道是否A和B两种蛋白质相互作用,他们首先开发结构蛋白的模型。然后他们寻找他们所谓的“结构邻居,”一个“和b”,具有已知的结构和分布是类似的互动,这些a和b。如果A“和B”是已知相互作用,ESTA提供了一个重要线索,也可能在同一界面a和b的相互作用。 (如需了解更多有关理论在原来preppi的核心,见 团结结构和系统生物学:巴里霍尼格的采访。)

使用蛋白质结构的方式通常不使用他们,回答,但其不能得到解决的问题。

蛋白质对十一ESTA结构相容性进行评分,原来preppi也纳入更多的信息开发更多的信心,预言是真的卫生组织互动。 ESTA包括考虑蛋白A和B(即,无论它们通常一起出现在动物相同种类),和亲缘曲线它们的相似基因本体论(GO)分析,描述在特定蛋白质的功能的数据库细胞。最新一代preppi的增强了这些数据点通过引入多项新功能的效用。 ESTA包括得分直向(可能是A和B相互作用如果模板蛋白质a“和b”是已知的相互作用在其他物种)的表达谱(相似性的基因表达模式之间在蛋白A和B以及那些及其直向同源物的中其他模式生物),合作伙伴冗余(蛋白质的多少密切的结构邻居有迹象表明,蛋白质已知b与互动),和蛋白质 - 肽关系(是否有已知的结构域之间的相互作用上和非结构化肽b中包含了短序列基序,是已知的互动与)。

在管道的端部,这些分数是各种集成到一个等式来计算的似然比即a和b蛋白相互作用。使用 系统生物学的高性能计算集群的部门,在整个人类基因组的霍尼格实验室测试成对蛋白质 - 蛋白质可能采取的行动。 RESULTING preppi数据库现在包含约135万高可信度的预测。 这个资源是公开的通过网站霍尼格实验室.

新的研究报告报道说,除了翻两番预测交互的次数包含在preppi的第一个版本,升级后的版本的集成新种目前的信息提高预测性能,在某种程度上,它的功能现在媲美的高通量实验。研究人员预期的ESTA这将继续提高增加新的数据,并纳入他们每年更新数据库。

实际上,preppi手段的范围增加,它现在提供了蛋白质 - 蛋白质相互作用的虚拟基因组范围的相互作用组。通过查询数据库,能够确定这几乎成为了任何潜在的利益互动卫生组织在细胞发生概率。

“我们觉得我们有一个非常独特的资源,”霍尼格说,“现在,我们希望它是更容易和他人更实用。此外,我们正开始以各种方式申请preppi“,我们使用,因为它和更多的成功,我们有它,更多的人在研究界将要使用它自己的多。

preppi投入到工作对K-ras和其他癌症的蛋白质

其中1个区域,霍尼格实验室有意申请preppi是确定新的战略,抑制K-ras蛋白的破坏作用。突变的K-ras是发挥在多种癌症的已知的作用,但很难找到研究人员有效的治疗方法由于undruggable ITS呈现几乎特性。采用不同的方法,霍尼格和他的同事们感兴趣的是确定是否干扰随着蛋白质交互与K-ras基因能提供其他性病的机会破坏活动。

最近的一次合作 霍震霆与王在消化系统和肝脏疾病的太阳城网站网址医学中心的部门,例如,实验室霍尼格preppi用于研究是否蛋白激酶称为DCLK1很可能与互动K-ras基因。基于在他的实验室等科研,王假设DCLK1可能的K-ras基因在胰腺癌中激活,而当他们在preppi上看,他们发现了DCLK1 / K-ras基因相互作用确实具有了很高的分数。此外,查询透出很强的相似性,以DCLK1特定结构域之间,并且另一种蛋白质称为RALGDS,谁的带K-ras基因相互作用-一直使用蛋白质晶体学确认实验的。根据这个和其它的调查结果,实验室旺DCLK1表明是胰腺癌祖细胞的标志物。因为蛋白激酶是哪种结构信息是目前已知可定向,这一发现也提供了从恶性转向防止这些祖细胞的新战略。

系统建设为已知能处处为癌症研究的宝贵资源所有癌症的蛋白质相互作用组。

从普通医学科学研究所(NIGMS)新批的一部分,该实验室霍尼格有意发挥其作用,K-ras和其他蛋白质的兴趣在癌症的重要一点。通过使用preppi发展相互作用组这些蛋白质在函数,他们的目标是提供与癌症有关的信号通路的蛋白质 - 蛋白质相互作用的综合地图。系统地建立这样相互作用组对所有已知的癌症蛋白质,他们预计,可能成为癌症研究的宝贵资源无处不在。

另外,霍尼格实验室工作紧密结合的实验室 安德烈卡利法诺, 谁 最近公布的算法叫蝮蛇,其中通过在表达的变化寻找的基因调节这些蛋白质推断蛋白的活性。通过preppi,毒蛇集成和 其他工具在实验室卡利法诺网络分析研究人员预计能够获得负责驱动癌症表型的关键蛋白更需要理解,并制定围绕它们的相互作用网络的可靠的模型。

利用结构信息进行分类的SNP

这种做法一个其他实验室正在探索霍尼格是蛋白质 - 蛋白质相互作用数据与遗传数据进行整合。使用下一代测序和统计分析,遗传学家可以在区分健康个体那些疾病微妙的核苷酸序列的差异鉴定身份。然而,所谓的改变由于单核苷酸多态性(SNP)是罕见的,很难往往是从正常的遗传多样性区分,外地来告诉斗争引起疾病是否卫生组织它们仅仅是相关它。

网上生活的提出,可以帮助解决结构生物学ESTA挑战。霍尼格实验室编制包含在两个公开可用的数据库SNP和preppi询问哪些可能将被改建位于蛋白质 - 蛋白质接口的完整列表。他们的分析表明,到位于蛋白质 - 蛋白质接口疾病相关的单核苷酸多态性的可能性远远高于一个偶然的期望。此外,包括在良性千人基因组计划数据库的SNP在蛋白质界面显着不足。

本文认为,这些发现支持越来越多的证据身体蛋白质 - 蛋白质相互作用的破坏在曹景伟重要的疾病中发挥作用。 ,此外,它表明包含在preppi的信息可以帮助从致病的SNPs来区分有用的有那些没有效果。

使用蛋白 - 蛋白相互作用来注释蛋白质功能

除了疾病相关的基因突变识别,可以用来preppi也更好地在其中基因或蛋白参与细胞过程的理解。类似于实验室霍尼格如何接过概念,并将其应用到爆炸蛋白质结构,而且他们使用preppi把基因组富集分析(GSEA)框架开始。

Gene set enrichment analysis using PrePPI

preppi使用基因集富集分析。推断的蛋白质包括,Q功能,则以实验室霍尼格在人类蛋白质组所有蛋白,Li,在一个列表,并将它们排序到交互似然比升之间。根据i 和q。然后,他们用鉴于充实其中q的高得分的作用因子的基因本体注释相关基因组的搜索。在本例中,将丰富而2和3不会是基因9月1日的基因组中,由于蛋白质是均匀分布要么位列整个名单或群集与蛋白质那些集是不可能互动与Q值。在顶部的纸报告排名发现BRCA1基因组和-PEX2。 (图片提供 网上生活。) 

每种蛋白质,他们怀疑preppi构建一个列表的蛋白质使他们的得分谁最有可能与互动,然后,用GSEA,四处找去与各相关方面。他们发现,排名第一的基因组preppi预测,准确地反映它们的功能,如所谓的分子特征(msigdb)的资源数据库文件。 ,此外,通过preppi成为可能自动计算方法,他们预测的大约2000另外的蛋白质是谁的以前被未知功能的功能。

这霍尼格提醒的交互和使用预测功能preppi必然不应该被假定为事实。然而,他的实验室的测试,到目前为止表明它们是可靠的主。 “Preppi是基于统计分析和实验不,这是真正的黄金标准,”我解释道。 “我们正在试图做最后的是这些方法产生的假设可以被交叉引用与其他实验和计算方法。我们兴奋,因为交互次数preppi也就是说范围的发现前所未有的,所以我们希望这将有助于生物学家和其他生物医学系统的研究人员不看,以结构通常能合并有关的这一基本层信息他们的调查活动“。

—  克里斯·威廉姆斯


相关出版物

加尔松ジ,邓L,默里d,S夏皮拉,皮特瑞d,Honig的湾 为人类蛋白质相互作用组的计算和功能注释。网上生活。 2016 10月22日; 5。 PII:e18715。

威斯特法伦CB,竹本和Tanaka T,Macchini米,江Z,伦兹体重,陈X,ormanns S,纳加K,裁缝和May R,町和s阿斯法哈,Worthley DL,早川和Urbanska上午,quante米,赖克特米,J Broyde廉PS,Remotti h时,GH,Rustgi AK,弗里德曼RA,Honig的b,卡利法诺到,Houchen CW,橄榄KP,旺TC。 DCLK1静态定义胰腺祖细胞促进再生和损伤诱导的肿瘤发生。细胞干细胞。 2016 04月07日; 18(4):441-55。

陈TS,皮特瑞d,Garzon的吉,Honig的湾 预测在基因组范围内的肽 - 介导的相互作用。公共科学图书馆·生物学COMPUT。 2015年5月4日; 11(5):e1004248。

张QC,皮特瑞d,邓升,强升,市Y,周四CA,bisikirska B,列弗斐尔C,阿奇利d,猎人吨,马尼亚蒂斯吨,卡利法诺一个,HONIG湾 在全基因组规模蛋白质 - 蛋白质相互作用的结构为基础的预测。性质。 2012年10月25; 490(7421):556-60。 

Alvarez的MJ,沉Y,GIORGI FM,拉赫曼一个,丁BB,咋BH,卡利法诺一个。 使用蛋白活性的基于网络的推理在癌症的体细胞突变的功能特性。纳特遗传学。 2016年8月; 48(8):838-47。