GEO2R数据分析文档

2022-06-18

我发现分析GEO数据时,使用GEO数据集网页里显示的GEO2R分析十分方便。

GEO数据库,GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。

作为与TCGA数据库齐名的一个大型数据库,GEO数据库是一个储存芯片、二代测序以及其他高通量测序数据的一个数据库。利用这个数据库,我们可以检索到其他一些人上传的一些实验测序数据。

关于定义分组信息,有一处需要特别提醒如下: 定义组的顺序对下游结果有影响。对于两组比较,通常应该先定义试验组,然后定义对照组——这样,log fold变化方向将遵循惯例,与对照组相比,检测样本中基因上调的log fold变化方向为正值,下调的log fold变化方向为负值。(注:此更改于2020年11月实施。如果您需要复制前面的分析,您可以颠倒创建组的顺序)。

参考

  1. About GEO2R
  2. Bioconductor分析基因芯片数据
  3. 一文解决GEO芯片数据分析80%的工作!建议收藏
  4. GEO数据挖掘-第二期-三阴性乳腺癌TNBC