GEO数据挖掘(一)基础介绍

GEO百科知识2个月前发布 GEO研究员
1,331 0

生信技能树学徒学习第二周

一、GEO数据库简介

       GEO全称Gene Expression Omnibus data base,由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库(通过NCBI首页,All Databases下拉框中选择GEO DataSets)。收录了世界各国研究机构提交的高通量基因表达数据。2000年开始建立的时候,主要是表达芯片数据,但是之后随着数据库的流行,逐渐扩展业务到许多其它的高通量数据,比如:甲基化(genome methylation),染色质结构(chromatinstructure),基因组-蛋白交互作用(genome-protein interaction)等。

我们寻找数据集时注意以下三个信息:

GEO Series (GSE):研究项目的ID,我们可以通过搜索研究的id号来找到相关的基因数据集

GEO Sample (GSM) :样本ID号,同一个数据集中每个样品ID是不同的,在后续分析中我们也可以获取到不同样品的处理方式和基本信息

GEOPlatform (GPL) 芯片平台:不同芯片平台的基因注释是有差异的,正确的基因平台注释我有助于下游分析的成功

基因芯片是通过基因探针与序列的结合来,来确定基因的表达

二、GEO数据挖掘的分析思路

1.实验数据设计

实验目的

© 版权声明

相关文章

暂无评论

none
暂无评论...