当前位置: 首页 > news >正文

牙科网站开发网站建设金硕网络

牙科网站开发,网站建设金硕网络,做网站推广广告,徐州高端模板建站生信数据分析——GOKEGG富集分析 目录 生信数据分析——GOKEGG富集分析1. 富集分析基础知识2. GO富集分析#xff08;Rstudio#xff09;3. KEGG富集分析#xff08;Rstudio#xff09; 1. 富集分析基础知识 1.1 为什么要做功能富集分析#xff1f; 转录组学数据得到的基…生信数据分析——GOKEGG富集分析 目录 生信数据分析——GOKEGG富集分析1. 富集分析基础知识2. GO富集分析Rstudio3. KEGG富集分析Rstudio 1. 富集分析基础知识 1.1 为什么要做功能富集分析 转录组学数据得到的基因非常多面对大量的基因无法做到挨个研究其功能因此为了研究基因所具有的功能将部分功能相似的基因进行归类这样具有相似功能的基因就被放在一起构成了一个通路从而减少工作量并可以实现功能和表型相关联。 1.2 什么是富集分析 富集分析是一种数据分析方法主要用于理解基因集合或其他生物学实体在特定实验条件或生物学背景下的功能、通路或特定生物学过程的富集程度。其基本原理是如果某个基因集合在特定条件下显著富集于某个功能类别或通路中那么这些基因可能共同参与了某种特定的生物学过程或具有某种共同的功能特性 看上方的描述是不是感觉晦涩难懂简单地说所谓富集分析本质上就是对分布的检验如果基因分布集中在某一个区域通路则认为富集。 举个栗子 做完差异后得到了一堆差异基因现在对这部分差异基因归归类部分功能相似的基因可能被划分到了炎症通路上有的基因被划分到了代谢通路上这样就能大致知道筛选出来的差异基因与哪些功能相关。 1.3 富集分析有几种类型 1GO富集分析 GO富集分析会从三个方面描述基因潜在的功能分别是 分子功能Molecular FunctionMF——即基因是否富集到分子相关的通路上细胞组分Cellular ComponentCC——即基因定位在细胞的哪个位置上参与的生物过程Biological ProcessBP——即基因参与哪些生物学过程 举个栗子离子通道活性的GO term是GO:0005216如果差异基因富集到该term上那么所研究的基因可能与离子通道的激活与抑制有关联。 2KEGG富集分析 京都基因与基因组百科全书KEGG是了解高级功能和生物系统如细胞、生物和生态系统、用于研究通路的数据库之一。KEGG 通路分析是借助 KEGG 数据库Kyoto Encyclopedia of Genes and Genomes对所有鉴定到的基因进行通路注释并分析这些基因参与的主要代谢和信号转导途径。 简单说 使用KEGG数据库中通路的注释信息将基因与已知的代谢通路和功能进行关联 3GSEA富集分析 4GSVA富集分析 在这个分析点中重点关注GO富集分析和KEGG富集分析GSEA和GSVA会在后面分析点中介绍。 2. GO富集分析Rstudio 本项目以 ADAMTS2, ADAMTS4, AGRN, COL5A1, CTSB, FMOD, LAMB3, LAMB4, LOXL2, MATN1, MEP1A, MMP1, MMP2, NTN1, PTN, SPARCL1, SPON1, TGFBI, THBS4, TNC, VTN, ITGB6, PTPRF, UNC5A 为例展示GO富集分析过程 物种人类Homo sapiens R版本4.2.2 R包tidyverseclusterProfilerorg.Hs.eg.db废话不多说代码如下 设置工作空间 rm(list ls()) # 删除工作空间中所有的对象 setwd(/XX/XX/XX) # 设置工作路径 if(!dir.exists(./02_GOKEGG_enrichment)){dir.create(./02_GOKEGG_enrichment) } # 判断该工作路径下是否存在名为02_GOKEGG_enrichment的文件夹如果不存在则创建如果存在则pass setwd(./02_GOKEGG_enrichment/) # 设置路径到刚才新建的02_GOKEGG_enrichment下加载包 library(clusterProfiler) library(org.Hs.eg.db) library(tidyverse)导入要富集分析的基因 gene - c(ADAMTS2, ADAMTS4, AGRN, COL5A1, CTSB, FMOD, LAMB3, LAMB4, LOXL2, MATN1, MEP1A, MMP1, MMP2, NTN1, PTN, SPARCL1, SPON1, TGFBI, THBS4, TNC, VTN, ITGB6, PTPRF, UNC5A)设置数据库注意由于本项目分析的是人类基因因此选用的是org.Hs.eg.db如果是其他物种需要用其他数据库 GO_database - org.Hs.eg.db # GO是org.Hs.eg.db数据库gene ID转换因为导入的是基因名symbol但是用官方的编号也就是ENTREZID会比较专业一些因此首先要将基因名转换成官方ENTREZID gene - bitr(gene, fromType SYMBOL, toType ENTREZID, OrgDb GO_database)知识拓展 bitr函数不仅能将symbol转成ENTREZID还能将ENTREZID转回symbol甚至还能转换成其他形式具体可以自行查看官方说明 gene 如下图所示第一列就是基因名symbol而第二列就是官方的ENTREZID编号 注意用bitr做转换的时候很有可能会出现基因没有对应的ENTREZID编号这是一个正常现象不用过多焦虑合理解释就行 GO富集分析并将富集分析结果转成数据框enrichGO函数常用参数介绍如下 gene参数——是要输入的基因一般用基因的ENTREZID编号OrgDb 参数——指定要用到的数据库人类是org.Hs.eg.db当然还有别的物种可自行查询keyType参数——设定读取的gene ID类型本教程用的是ENTREZID编号所以用“ENTREZID”ont参数——指定输出的通路类型前面也说了GO富集分析会从bpccmf三个层次描述基因的功能这里用ALL就会直接包括这三个部分当然也可以只指定一种类型。pvalueCutoff 参数——设定p值阈值qvalueCutoff 参数——设定q值阈值这个q值就是矫正后的p值readable参数——当readable设置为TRUE时函数的输出会以一种更易于阅读和理解的方式呈现 enrichGO函数中比较关注的参数就是上述的这些当然还有其他参数如果想深入了解可自行查看官方说明文档 GO - enrichGO(gene gene$ENTREZID, # 导入基因的ENTREZID编号OrgDb GO_database, # 用到的数据库人类是org.Hs.eg.dbkeyType ENTREZID, # 设定读取的gene ID类型ont ALL, # (ont为ALL因此包括 Biological Process,Cellular Component,Mollecular Function三部分pvalueCutoff 0.5, # 设定p值阈值qvalueCutoff 0.5, # 设定q值阈值readable T) go_res - data.frame(GO) # 将GO结果转为数据框go_res 如下图所示 ONTOLOGY——指示该通路属于哪个类别即生物过程Biological Process, BP、分子功能Molecular Function, MF还是细胞组分Cellular Component, CCID——这是GO通路的唯一标识符用于在GO数据库中唯一地标识一个通路可以理解成身份证Description——对通路的简单描述通常通过这一列就得知该通路具有哪些功能GeneRatio——是富集到该通路上的基因数量与所有输入到富集分析中的基因数量的比值。它反映了在特定基因集合中与该通路相关的基因所占的比例。BgRatio——是在整个背景数据集通常是整个基因组或某个参考数据集中与该通路相关的基因数量与背景数据集中所有基因数量的比值。它反映了在整个基因组中与该通路相关的基因所占的比例。pvaluep.adjustqvalue——都是GO富集结果的显著性pvalue是常规p值另外两个是调整后的p值通常只需要pvalue 0.05即可。geneID——是富集到该通路上的基因名Count——是富集到该通路上的基因数目 给go_res 添加新的一列——richFactor RichFactor——是一个重要的指标用于衡量差异表达的转录本中位于特定通路的转录本数目与所有有注释转录本中位于该通路的转录本总数的比值。 简单说RichFactor越大表示富集的程度越大其评价富集的效果要比单纯的GeneRatio或Count要好 go_res - mutate(go_res, richFactor Count / as.numeric(sub(/\\d, , BgRatio)))最后筛选p值显著的通路并保存结果 go_res - go_res[go_res$pvalue0.05, ]write.csv(go_res, file ./GO_res.csv)3. KEGG富集分析Rstudio 分析与GO类似这里同样是从头开始展示 本项目以 ADAMTS2, ADAMTS4, AGRN, COL5A1, CTSB, FMOD, LAMB3, LAMB4, LOXL2, MATN1, MEP1A, MMP1, MMP2, NTN1, PTN, SPARCL1, SPON1, TGFBI, THBS4, TNC, VTN, ITGB6, PTPRF, UNC5A 为例展示GO富集分析过程 物种人类Homo sapiens R版本4.2.2 R包tidyverseclusterProfilerorg.Hs.eg.db设置工作空间 rm(list ls()) # 删除工作空间中所有的对象 setwd(/XX/XX/XX) # 设置工作路径 if(!dir.exists(./02_GOKEGG_enrichment)){dir.create(./02_GOKEGG_enrichment) } # 判断该工作路径下是否存在名为02_GOKEGG_enrichment的文件夹如果不存在则创建如果存在则pass setwd(./02_GOKEGG_enrichment/) # 设置路径到刚才新建的02_GOKEGG_enrichment下加载包 library(clusterProfiler) library(org.Hs.eg.db) library(tidyverse)导入要富集分析的基因 gene - c(ADAMTS2, ADAMTS4, AGRN, COL5A1, CTSB, FMOD, LAMB3, LAMB4, LOXL2, MATN1, MEP1A, MMP1, MMP2, NTN1, PTN, SPARCL1, SPON1, TGFBI, THBS4, TNC, VTN, ITGB6, PTPRF, UNC5A)设置数据库注意这里和前面区别就在于要指定KEGG数据库即hsa人种 GO_database - org.Hs.eg.db # GO是org.Hs.eg.db数据库 KEGG_database - hsa # KEGG是hsa数据库同样是gene ID转换 gene - bitr(gene, fromType SYMBOL, toType ENTREZID, OrgDb GO_database)gene 如下图所示第一列就是基因名symbol而第二列就是官方的ENTREZID编号 接下来就是KEGG富集分析enrichGO函数常用参数介绍如下 gene参数——是要输入的基因一般用基因的ENTREZID编号keyType参数——指定了基因ID的类型用于匹配KEGG数据库中的条目organism参数——指定了进行富集分析的目标物种的KEGG数据库由于基因用的是人类的所以前面设置的“hsa”。pAdjustMethod参数——指定了用于调整p值的统计方法以控制假阳性率pvalueCutoff 参数——设定p值阈值qvalueCutoff 参数——设定q值阈值这个q值就是矫正后的p值 KEGG - enrichKEGG(gene gene$ENTREZID,keyType kegg,organism KEGG_database,pAdjustMethod BH,pvalueCutoff 0.5,qvalueCutoff 0.5)KEGG 如下图所示是一个列表里面在这里比较重要的是gene那里可以看到那里不是常规的基因名因此不能直接将KEGG的结果转换成数据框多了一个基因ID转换的过程。 将KEGG结果中基因ID转成基因名之后将KEGG结果转成数据框 kegg_res - setReadable(KEGG, OrgDb org.Hs.eg.db, keyTypeENTREZID) kegg_res - data.frame(kegg_res)kegg_res 结果如下图所示 ID——这是KEGG通路的唯一标识符用于在KEGG数据库中唯一地标识一个通路可以理解成身份证Description——对通路的简单描述通常通过这一列就得知该通路具有哪些功能GeneRatio——是富集到该通路上的基因数量与所有输入到富集分析中的基因数量的比值。它反映了在特定基因集合中与该通路相关的基因所占的比例。BgRatio——是在整个背景数据集通常是整个基因组或某个参考数据集中与该通路相关的基因数量与背景数据集中所有基因数量的比值。它反映了在整个基因组中与该通路相关的基因所占的比例。pvaluep.adjustqvalue——都是GO富集结果的显著性pvalue是常规p值另外两个是调整后的p值通常只需要pvalue 0.05即可。geneID——是富集到该通路上的基因名Count——是富集到该通路上的基因数目 同样给kegg_res 添加新的一列——richFactor kegg_res - mutate(kegg_res , richFactor Count / as.numeric(sub(/\\d, , BgRatio)))最后筛选p值显著的通路并保存结果 kegg_res - kegg_res [kegg_res $pvalue0.05, ]write.csv(kegg_res , file ./KEGG_res.csv)结语 以上就是GOKEGG富集分析的所有过程如果有什么需要补充或不懂的地方大家可以私聊我或者在下方评论。 如果觉得本教程对你有所帮助点赞关注不迷路 目录部分跳转链接零基础入门生信数据分析——导读
文章转载自:
http://www.morning.wwthz.cn.gov.cn.wwthz.cn
http://www.morning.cthrb.cn.gov.cn.cthrb.cn
http://www.morning.thrcj.cn.gov.cn.thrcj.cn
http://www.morning.thxfn.cn.gov.cn.thxfn.cn
http://www.morning.dkmzr.cn.gov.cn.dkmzr.cn
http://www.morning.fblkr.cn.gov.cn.fblkr.cn
http://www.morning.mhnd.cn.gov.cn.mhnd.cn
http://www.morning.yrhd.cn.gov.cn.yrhd.cn
http://www.morning.mhxlb.cn.gov.cn.mhxlb.cn
http://www.morning.fpbj.cn.gov.cn.fpbj.cn
http://www.morning.dwyyf.cn.gov.cn.dwyyf.cn
http://www.morning.rshkh.cn.gov.cn.rshkh.cn
http://www.morning.ghslr.cn.gov.cn.ghslr.cn
http://www.morning.rfxg.cn.gov.cn.rfxg.cn
http://www.morning.ycwym.cn.gov.cn.ycwym.cn
http://www.morning.rqsr.cn.gov.cn.rqsr.cn
http://www.morning.xbdd.cn.gov.cn.xbdd.cn
http://www.morning.kxrld.cn.gov.cn.kxrld.cn
http://www.morning.wkmpx.cn.gov.cn.wkmpx.cn
http://www.morning.jrlxz.cn.gov.cn.jrlxz.cn
http://www.morning.hjsrl.cn.gov.cn.hjsrl.cn
http://www.morning.ffydh.cn.gov.cn.ffydh.cn
http://www.morning.fllfc.cn.gov.cn.fllfc.cn
http://www.morning.rkyw.cn.gov.cn.rkyw.cn
http://www.morning.gnbfj.cn.gov.cn.gnbfj.cn
http://www.morning.jmdpp.cn.gov.cn.jmdpp.cn
http://www.morning.lnrhk.cn.gov.cn.lnrhk.cn
http://www.morning.xuejitest.com.gov.cn.xuejitest.com
http://www.morning.gthgf.cn.gov.cn.gthgf.cn
http://www.morning.hxbjt.cn.gov.cn.hxbjt.cn
http://www.morning.lwwnq.cn.gov.cn.lwwnq.cn
http://www.morning.ykswq.cn.gov.cn.ykswq.cn
http://www.morning.kzslk.cn.gov.cn.kzslk.cn
http://www.morning.fhjnh.cn.gov.cn.fhjnh.cn
http://www.morning.trqhd.cn.gov.cn.trqhd.cn
http://www.morning.lgtzd.cn.gov.cn.lgtzd.cn
http://www.morning.ymwnc.cn.gov.cn.ymwnc.cn
http://www.morning.bqts.cn.gov.cn.bqts.cn
http://www.morning.cmcjp.cn.gov.cn.cmcjp.cn
http://www.morning.lkfhk.cn.gov.cn.lkfhk.cn
http://www.morning.sfwcb.cn.gov.cn.sfwcb.cn
http://www.morning.hyryq.cn.gov.cn.hyryq.cn
http://www.morning.bqdpy.cn.gov.cn.bqdpy.cn
http://www.morning.wmqrn.cn.gov.cn.wmqrn.cn
http://www.morning.wrdpj.cn.gov.cn.wrdpj.cn
http://www.morning.xxknq.cn.gov.cn.xxknq.cn
http://www.morning.alive-8.com.gov.cn.alive-8.com
http://www.morning.ldcsw.cn.gov.cn.ldcsw.cn
http://www.morning.nylbb.cn.gov.cn.nylbb.cn
http://www.morning.mxlmn.cn.gov.cn.mxlmn.cn
http://www.morning.gkgb.cn.gov.cn.gkgb.cn
http://www.morning.nfqyk.cn.gov.cn.nfqyk.cn
http://www.morning.nkllb.cn.gov.cn.nkllb.cn
http://www.morning.hmqmm.cn.gov.cn.hmqmm.cn
http://www.morning.dzqr.cn.gov.cn.dzqr.cn
http://www.morning.zrkp.cn.gov.cn.zrkp.cn
http://www.morning.pkdng.cn.gov.cn.pkdng.cn
http://www.morning.dygqq.cn.gov.cn.dygqq.cn
http://www.morning.nlqgb.cn.gov.cn.nlqgb.cn
http://www.morning.mgfnt.cn.gov.cn.mgfnt.cn
http://www.morning.ljbm.cn.gov.cn.ljbm.cn
http://www.morning.frpb.cn.gov.cn.frpb.cn
http://www.morning.lmmh.cn.gov.cn.lmmh.cn
http://www.morning.jbztm.cn.gov.cn.jbztm.cn
http://www.morning.qyqmj.cn.gov.cn.qyqmj.cn
http://www.morning.sgtq.cn.gov.cn.sgtq.cn
http://www.morning.pzjfz.cn.gov.cn.pzjfz.cn
http://www.morning.knlbg.cn.gov.cn.knlbg.cn
http://www.morning.mnygn.cn.gov.cn.mnygn.cn
http://www.morning.qyxnf.cn.gov.cn.qyxnf.cn
http://www.morning.lqrpk.cn.gov.cn.lqrpk.cn
http://www.morning.qineryuyin.com.gov.cn.qineryuyin.com
http://www.morning.gybnk.cn.gov.cn.gybnk.cn
http://www.morning.rfwqt.cn.gov.cn.rfwqt.cn
http://www.morning.yzfrh.cn.gov.cn.yzfrh.cn
http://www.morning.qtsks.cn.gov.cn.qtsks.cn
http://www.morning.qqxmj.cn.gov.cn.qqxmj.cn
http://www.morning.dnqlba.cn.gov.cn.dnqlba.cn
http://www.morning.btns.cn.gov.cn.btns.cn
http://www.morning.lhhkp.cn.gov.cn.lhhkp.cn
http://www.tj-hxxt.cn/news/243017.html

相关文章:

  • 国内做的比较好的跨境电商网站怎么做免费的产品图片网站
  • 行业前10的网站建设公司网站建设辶首先金手指十五
  • pc网站建设建站模板网站开发兼职合同
  • 网站开发难吗2008宝安做网站的公司
  • 建设网站工作室wordpress 禁用谷歌
  • 福州 建站 软件互动营销公司
  • 广州白云机场网站建设招聘网哪个平台比较好招人
  • 济南网站seo厂家网站制作做网站
  • 可视化网站后台管理系统建筑企业名单和电话
  • 在设计赚钱的网站有哪些wordpress如何构建页面
  • 漯河市郾城区网站建设百度给做网站公司
  • 网站建设费与无形资产建设银行手机银行下载官方网站下载
  • 网站对于企业的意义创新网站设计
  • wordpress网站测速外贸必备的app
  • 自己做网站要多久京东物流网站建设策划书
  • 北京做兼职哪个网站买机箱网站
  • 中国一级爱做电影网站给女友做的网站 源码
  • 做任务网站建设建筑网格布生产厂家
  • 合肥霍山路网站建设上海品牌网站建设公司排名
  • 网站开发项目需求分析说明书seo的主要工作内容
  • 怎么样建立自己的视频网站服务好的高端网站建设报价
  • asp.net做简易网站半岛建设公司网站
  • 织梦开发网站建站工具有什么用
  • 网站怎么做防御装饰设计有限公司经营范围
  • 网站后台维护主要做什么wordpress 微信公众号
  • 网站域名在哪里注册成都网站建设培训学校
  • 网站开发的关键计算机资源计划温州外贸网站建设
  • 网站开发还找到工作吗好的外包公司
  • 聊城手机网站制作维护一个网站需要多少钱
  • 菏泽做公司简介网站专门做土特产的网站