通过观察到的多基因协同变化分析可能产生的整体生理影响,需要建立高精度的分子相互作用网络,在网络上评估基因功能变化的传递与协同。
整合生物学实验室建立了模式植物拟南芥和人类的分子相互作用网络 (Plant Cell, 23:911; Plant Physiology, 151:34; Bioinformatics, 29:2024; Nucleic Acids Research, 39:D1134)。很大一部分基因的功能关联是通过其编码的蛋白质相互作用实现的。因此申请人建立的基因功能关联网络中有一大部分的基因功能关联实际上代表了蛋白质相互作用。如果用网络建成后新发表的蛋白质相互作用来进行评估,这两个网络均能够覆盖大约20%的拟南芥和人类的蛋白质相互作用组,且其中的边有40%代表真实的蛋白质相互作用。一篇第三方权威论文对比了主要的拟南芥预测网络,发现申请人的工作较其它的工作预测能力提高了至少一倍 (Plant Cell, 22:997)。
整合生物学实验室在建立拟南芥和人类分子相互作用网络的过程中,提出了匀质基因功能关联网络的概念和基于匀质网络的“基因集间功能关联的分析方法” (GSLA):首先建立一个匀质基因功能关联网络,网络中每条边代表强度类似的基因功能关联,网络中的所有边代表对真实基因功能关联网络的一个随机取样。在网络大致匀质的前提下,两个基因集之间的功能关联强度大致可以用它们之间的边的密度来度量。利用这一方法,可以分析观察到变化的基因集和哪些生物途径具有紧密的功能关联,从而预测这些观察到的变化可能造成的生理影响 (Bioinformatics, 29:2024)。GSLA方法的特点是,基于高质量的匀质网络和简单的计算方法进行分析;而传统的网络分析方法大多基于简单的网络和较为复杂的计算方法。当前,我们对于生物学规律的认知仍然有限,设计符合生物学实际的计算方法来分析简单网络(如直接由实验得到的蛋白质相互作用网络、基因共表达网络等;虽然其获取较为简单,但其中的每条边代表的意义不同,需要在分析处理时加以区别)仍然非常困难。
GSLA可以用于分析组学数据中观察到变化的基因可能协同造成哪些生理功能改变。在一系列的应用中,GSLA的分析结果体现了与实验结果的高度吻合。使用其它的常用组学数据分析方法(例如GO富集分析、GSEA、Cluster Enrichment、商业软件IPA等)均无法得到其中的关键结论。更多细节请阅读方法应用研究页面。