多语言展示
当前在线:1872今日阅读:97今日分享:45

差异表达蛋白如何进行生物信息学分析

在测序技术发展迅速的今天,相关的生物信息学分析知识也在飞速发展。只有通过对应的生物信息学分析,才能了解细胞中差异表达的蛋白的相关作用,并对此进行相应研究。
工具/原料
1

Swiss-Prot

2

KOBAS

3

DAVID

4

GO富集分析

5

KEGG富集分析

蛋白基本信息统计

对差异表达蛋白的酸碱性,亲水性以及等电点的分析可以通过swiss-prot来实现,从而了解差异表达蛋白的基本性质。

蛋白质功能分析
1

Gene Ontology (GO)项目正是为了能够使对各种数据库中基因产物功能描述相一致的努力结果。这个项目最初是由1988年对三个模式生物数据库的整合开始:: FlyBase (果蝇数据库Drosophila),t Saccharomyces Genome Database (酵母基因组数据库SGD) and the Mouse Genome Database (小鼠基因组数据库MGD)。从那开始,GO不断发展扩大,现在已包含数十个动物、植物、微生物的数据库所谓的 GO,是生物学功能注释的一个标准词汇表术语(GO term),将基因的功能分为三部分:基因执行的分子功能(Molecular Function)基因所处的细胞组分(Cellular Component)基因以及参与的生物学过程(Biological Process)GO分析可以通过http://geneontology.org/网站实现

2

KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是系统分析基因产物在细胞中的代谢途径以及这些基因产物功能的数据库。KEGG该数据库有助于把基因及表达信息作为一个整体的网络进行研究。KEGG整合了基因组、化学分子和生化系统等方面的数据,包括代谢通路(PATHWAY)、药物(DRUG)、疾病(DISEASE)、基因序列(GENES)及基因组(GENOME)等。不同的KEGG富集分析可以反映出差异表达蛋白在不同信号通路,疾病,代谢过程中的富集情况,从而展现可能的调控方式。KEGG富集分析可以通过https://www.kegg.jp/网站实现

3

STRING https://string-db.org/ 是蛋白质相互作用数据库,可用来分析已知蛋白之间和预测蛋白质之间相互作用。网络图是生物信息学中常用的显示不同节点之间关联方向与关联程度的可视化方法。在富集分析中,网络图常被用于表示功能与估计到该功能的基因的联系。在蛋白质互作用网络中,网络图常用于表示编码基因之间的互作用类型与作用强度,基于这些信息,还可以通过某一节点与其他节点的连接数量来判断该节点在整个网络中的贡献度(degree)。

4

为检验所选取的差异表达蛋白质或特征差异表达蛋白质的合理性和准确性,可以通过聚类分析将蛋白按照表达量的趋势聚合在一起,可以实现更为直观的蛋白质组学数据分析。为研究蛋白在不同实验处理下的表达模式,对样品的表达量进行K-means聚类分析,同一类的蛋白在不同的实验处理下具有相似的变化趋势,具有相似变化趋势的蛋白往往具有相似的功能:

5

其余的生物信息学分析工具,可在下述网站获得:https://blog.csdn.net/u/article/details/1?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2

6

同时,也有一些整合的在线分析工具可以使用:DAVID: https://david.ncifcrf.gov/ KOBAS:http://kobas.cbi.pku.edu.cn/anno_iden.php

注意事项
1

根据不同的实验数据以及实验目的选择不同的分析方法。

2

可以运用整合在线分析工具如DAVID为分析提供大概方向

3

会变成的同学可以使用R,Java等语言使用一些高级分析工具

推荐信息