当前位置: 首页 > news >正文

2018外贸网站排名一个网站里有两个网页怎么做

2018外贸网站排名,一个网站里有两个网页怎么做,哪里建网站好,建设网站计入什么科目前置环境 macOS系统#xff0c;已安装homebrew且会相关命令。 近期在整理草稿区#xff0c;所以放出该贴。 R语言、RStudio、R包安装 R语言安装 brew install rRStudio安装 官网地址#xff1a;https://posit.co/download/rstudio-desktop/ R包下载 注意R语言环境自带…前置环境 macOS系统已安装homebrew且会相关命令。 近期在整理草稿区所以放出该贴。 R语言、RStudio、R包安装 R语言安装 brew install rRStudio安装 官网地址https://posit.co/download/rstudio-desktop/ R包下载 注意R语言环境自带的install语法没有内置对于已安装包的检查这点真的……太乐了 所以建议任何包的下载都包含在require里面。 下载方式有如下几种这里以dplyr为例 # r代码实现官网下载 # 打开RStudio运行如下命令即可 if (!require(dplyr)) {install.packages(dplyr) } # Bioconductor下载注意需要先用r代码下载BiocManager包本身 if (!require(BiocManager)) {install.packages(BiocManager) } BiocManager::install(dplyr) # Github下载注意需要先用r代码下载devtools包本身 if (!require(devtools)) {install.packages(devtools) } devtools::install_github(dplyr) # 手动安装R包其中最推荐官网下载其次为Bioconductor。 为了下载个R包下载devtools本身太不值了可以看出来R语言并没有兼容github。 而手动安装R包存在需要同时安装该R包的依赖包的情况过于麻烦建议R语言出个好点的包管理工具和环境管理工具 R语言常用语法和RStudio常用快捷键 R语言常用语法 # 引入R包 library(dplyr)RStudio常用快捷键 ctrlenter执行命令 ctrlshiftc注释单行/多行 新版TCGA相关页面操作 TCGA在24年2月中旬更新过一次现在页面操作建议先看https://www.bilibili.com/video/BV1b34y1g7RM的p3到p5 注意的是这个网站没有做国际化配置使用浏览器自带的翻译可能会导致页面报错。 Cohort Builder 我们需要关注的是首先需要选取Cohort Builder这个标签页。将鼠标悬停到该标签上可以看到提示 Build and define your custom cohorts using a variety of clinical and biospecimen features.翻译过来就是 使用各种临床和生物样本功能建立和定义您的定制队列。也就是选一些筛查条件选中了Cohort Builder这个标签页下会出现几个可供筛选的表单 Program计划表示研究计划的名称或标签。Project项目表示一个具体的研究项目通常是在特定的研究计划下进行的。Disease Type疾病类型表示样本与哪种类型的疾病相关。选项如癌症、心血管疾病、神经系统疾病等。Primary Diagnosis主要诊断表示样本的主要疾病诊断即医生根据病理学、临床表现和其他检查结果所做的初步诊断。Primary Site主要部位表示样本中主要病变或疾病发生的部位或组织。选项如肺、乳腺、结肠等。Tissue or Organ of Origin起源组织或器官表示样本中疾病起源的具体组织或器官。 一般我们只需要关注前两个即可即Program和Project。Program我们选择TCGA。Project以TCGA-LUSC为例。然后点击Repository。 Repository 将鼠标悬停到该标签上可以看到提示 Browse and download the files associated with your cohort for more sophisticated analysis.翻译过来就是 浏览和下载与您的队列相关的文件以进行更复杂的分析。也就是进一步筛查选中了Repository这个标签页下会出现几个可供筛选的表单 Data Category(数据类别)biospecimen生物胺、clinical临床、copy number variation拷贝数变化、dna methylationDNA甲基化、proteome profiling蛋白质组谱分析、sequencing reads测序读数、simple nucleotide variation简单核苷酸变异、somatic structural variation体细胞结构变异、structural variation结构变化、transcriptome profiling转录组图谱分析。Data Type数据类型Gene Expression Quantification基因表达量化、Isoform Expression Quantification异构体表达的量化、miRNA Expression QuantificationMiRNA表达的量化、Splice Junction Quantification拼接接头的量化 一般Data Category选中transcriptome profiling转录组图谱分析 Data Type选中Gene Expression Quantification基因表达量化。 Cart 类似购物车的概念将要下载的所有文件都放在了这里面注意每次下载新的数据时要把老的数据全部清除掉。 一般下载两个文件 Cart文件存储基因表达的文件压缩包下载所需比较久两三百MB要下几分钟推荐用我之后的方式下载。Metadata文件存储文件名称和样本名的对应关系的json文件。 TCGA数据处理流程 查看癌症/肿瘤名称 https://blog.csdn.net/u010608296/article/details/112740418 在TCGA下载数据集 见如上新版TCGA页面操作 文件处理步骤 我们需要对下载下来的Cart文件和Metadata文件进行处理得到列名为样本名行名为基因名的文件。 自己写的脚本R语言 R语言代码如下 # 安装jsonlite包用于处理json相关 if (!require(jsonlite)) {install.packages(jsonlite) } library(jsonlite)# 安装 tidyverse 包它包含了一系列用于数据科学的 R 包如dplyr、ggplot2 等工具 if (!require(tidyverse)) {install.packages(tidyverse) } library(tidyverse)# 设置工作目录到 F:/35P/3TCGA或者F:\\35P\\3TCGA即meta.data所在的路径 setwd(/Users/shanshan/生信/test3)# 读入 meta.data 文件 json - fromJSON(metadata.cart.2024-05-12.json)# 如果需要查看 json 对象的内容可以取消注释以下行 # View(json)# 获取样本名称及文件名称 # 假设 json 对象中的 associated_entities 字段是一个列表每个元素都是一个数据框 sample_id - sapply(json$associated_entities, function(x) x[,1])# 如果需要查看 sample_id 的前 10 个元素可以取消注释以下行 # sample_id[1:10]# 创建一个数据框 file_sample包含样本 ID 和文件名 file_sample - data.frame(sample_id, file_name json$file_name)# 查看 file_sample 数据框的内容 View(file_sample)# 获取 counts 文件所在的位置 # 注意pattern 参数的值应该用双引号包围 count_file - list.files(gdc_download_20240512_165220.387861/, pattern *.tsv, recursive TRUE)# 如果需要查看 count_file 的前 10 个元素可以取消注释以下行 # count_file[1:10]# 获取每个文件的名称 # 使用 strsplit 函数按照 / 分割每个文件路径 count_file_name - strsplit(count_file, split /) # 使用 sapply 函数提取每个分割结果的最后一个元素作为文件名称 # 注意这里假设文件名是路径的最后一个部分 count_file_name - sapply(count_file_name, function(x) x[length(x)])# 如果需要查看 count_file_name 的前 10 个元素可以取消注释以下行 # count_file_name[1:10]# 构建一个空的数据框 # 注意这里的 matrix 应该是 matrixncol 应该是 ncol matrix - data.frame(matrix(nrow 60660, ncol 0))# 逐个读取及合并 for (i in 1:length(count_file)) {# 拼接文件路径# 注意这里的 paste 应该是 paste0// 应该是 /path - paste0(gdc_download_20240512_165220.387861/, count_file[i])# 读取 Counts 文件# 注意这里的 read.delim 的 fill 参数应该是 fillheader 参数应该是 headerdata - read.delim(path, fill TRUE, header FALSE, row.names 1)# 设置列名# 注意这里的 data[2, ] 应该是 data[2, ]假设第二行包含列名colnames(data) - data[2, ]# 移除前 6 行data - data[-c(1:6), ]# 选择特定的列# 注意这里的 data[3]、data[6]、data[7] 应该是 data[, 3]、data[, 6]、data[, 7]# data - data[, 3] # 选择 unstranded countsdata - data[6] # 选择 tpm_unstranded# data - data[, 7] # 选择 fpkm_unstranded# 设置列名为对应的样本 ID# 注意这里的 file_samples 应该是 file_samplefile_samples$file_name 应该是 file_sample$file_namecolnames(data) - file_sample$sample_id[which(file_sample$file_name count_file_name[i])]# 将数据绑定到 matrix 数据框# 注意这里的 cbind 应该是 cbindmatrix 应该是 matrixmatrix - cbind(matrix, data) }# 转化为 gene_symbol # 拼接文件路径 # 注意这里的 paste0 应该是 paste0// 应该是 / path - paste0(gdc_download_20240512_165220.387861/, count_file[1])# 读取数据并转换为矩阵 # 注意这里的 as.matrix 和 read.delim 应该是正确的函数名 data - as.matrix(read.delim(path, fill TRUE, header FALSE, row.names 1))# 提取基因名称 gene_name - data[-c(1:6), 1]# 如果需要查看 gene_name 的前 10 个元素可以取消注释以下行 gene_name[1:10]# 将基因名称绑定到矩阵 # 注意这里的 matrix 应该是之前创建的 matrix 变量 matrix - cbind(gene_name, matrix)# 提取基因类型 gene_type - data[-c(1:6), 2]# 如果需要查看 gene_type 的前 10 个元素可以取消注释以下行 # gene_type[1:10]# 将基因类型绑定到矩阵 matrix - cbind(gene_type, matrix)# 将 gene_name 列去除重复的基因保留基因最大表达量结果 # 注意这里的 aggregate 函数应该使用正确的公式和数据框 matrix - aggregate(. ~ gene_name, data matrix, max)# 查看 gene_name 的分布 table(gene_name)# 保留 protein_coding 类型的基因 # 注意这里的 subset 函数应该使用正确的数据框和条件 matrix0 - subset(matrix, gene_type protein_coding)# 查看 gene_type 的分布 table(gene_type)# 将 gene_name 列设置为行名并转换为导出格式 # 注意这里的 matrix 应该是之前创建的 matrix 变量 rownames(matrix) - matrix[, 1] matrix - matrix[, -c(1, 2)]# 创建一个新的数据框包含 ID 和之前的矩阵 # 注意这里的 data.frame 创建应该是正确的 matrix1 - data.frame(ID rownames(matrix), matrix)# 替换列名中的非法字符 # 注意这里的 gsub 函数应该使用正确的模式和替换字符串 colnames(matrix1) - gsub([.], _, colnames(matrix1))# 导出数据 # 注意这里的 write.table 函数应该使用正确的文件名和参数 write.table(matrix1, TCGA_LUSC_TPM.txt, sep \t, quote FALSE, row.names FALSE)# 如果需要导出 count 数据可以取消注释以下行 # write.table(matrix1, TCGA_LUSC_count.txt, sep \t, quote FALSE, row.names FALSE) 医学概念 TPM和FPKM TPM和FPKM是两种常用的基因表达量计算方法。它们用于衡量基因在不同样本中的表达水平并在转录组分析和基因表达研究中广泛使用。 TPMTranscripts Per MillionTPM是一种归一化的基因表达量表示方法它考虑了样本中基因表达的总量并将其转换为每百万个转录本的表达量。TPM的计算方法可根据基因的Read Counts和基因的长度来进行以考虑到测序深度和基因长度对表达量的影响。TPM值反映了基因在样本中相对的表达水平且可比较不同样本中基因的表达量变化[2]。 FPKMFragments Per Kilobase of transcript per Million mapped readsFPKM是基因表达量的另一种归一化表示方法它也考虑了样本的测序深度和基因长度对表达量的影响。FPKM是将基因的Read Counts除以基因长度以千碱基对为单位然后乘以每百万个测序reads的比例缩放到一定大小的值。FPKM常用于RNA-Seq数据分析中并且对于单个基因的表达量而言FPKM值可以表示其相对的表达水平[1]。 总之TPM和FPKM都是用于衡量基因表达水平的归一化方法可以解决测序深度和基因长度对表达量的影响。TPM计算基于转录本的表达水平而FPKM则根据测序reads的映射情况计算。 旧版TCGA相关 ·因为现在大多数教程用的都是官网1.0版本的页面所以建议进入1.0的官网地址https://portal.gdc.cancer.gov/v1/repository 页面操作 Cases用来筛选。Primary Site意味着疾病或者病人种类。在这里以胰腺癌pancreas为例下载。 如果只有一个选项则默认勾选即使前面的勾选框没有勾选。 Data Category中可以筛选是转录组还是其他。在这勾选Transcriptome Profiling。 Data Type中可以筛选是基因表达水平还是其他。在这勾选Gene Expression Quantification。 Experimental Strategy可以筛选是RNA序列还是其他。在这勾选Experimental Strategy。 Workflow Type可以筛选数据处理的类型。在这勾选Counts。 然后勾选页面上的Add All Files to Cart。 编号 主要看Sample样品编号。01-09意味着癌症组织。10-19意味着正常组织。20-29意味着正常人的组织。 Counts意味着无矫正。FPKM意味着用FPKM进行矫正。FPKM-UQ意味着用两种方法FPKM和UQ进行矫正。 一般下载Counts即可。 这五个都是要下载下来的。其中 Clinical意味着临床数据。下载JSON格式的。Biospecimen意味着生物多样性数据。下载JSON格式的。File Metadata用于TCGA编号文件和病人的对应关系。Manifest意味着样本信息即要下载的TCGA数据文件的详细信息包括文件名、大小、类型、数据格式等。Cart意味着基因文件。下载是需要最久的。
文章转载自:
http://www.morning.rpsjh.cn.gov.cn.rpsjh.cn
http://www.morning.cwrnr.cn.gov.cn.cwrnr.cn
http://www.morning.thnpj.cn.gov.cn.thnpj.cn
http://www.morning.nnhfz.cn.gov.cn.nnhfz.cn
http://www.morning.zmnyj.cn.gov.cn.zmnyj.cn
http://www.morning.nhzxd.cn.gov.cn.nhzxd.cn
http://www.morning.pycpt.cn.gov.cn.pycpt.cn
http://www.morning.mglqf.cn.gov.cn.mglqf.cn
http://www.morning.phlrp.cn.gov.cn.phlrp.cn
http://www.morning.jqllx.cn.gov.cn.jqllx.cn
http://www.morning.sjjtz.cn.gov.cn.sjjtz.cn
http://www.morning.mfmrg.cn.gov.cn.mfmrg.cn
http://www.morning.mjmtm.cn.gov.cn.mjmtm.cn
http://www.morning.njhyk.cn.gov.cn.njhyk.cn
http://www.morning.hwzzq.cn.gov.cn.hwzzq.cn
http://www.morning.wcjgg.cn.gov.cn.wcjgg.cn
http://www.morning.mdgpp.cn.gov.cn.mdgpp.cn
http://www.morning.snygg.cn.gov.cn.snygg.cn
http://www.morning.qjfkz.cn.gov.cn.qjfkz.cn
http://www.morning.gmrxh.cn.gov.cn.gmrxh.cn
http://www.morning.8yitong.com.gov.cn.8yitong.com
http://www.morning.rpsjh.cn.gov.cn.rpsjh.cn
http://www.morning.mjtgt.cn.gov.cn.mjtgt.cn
http://www.morning.nstml.cn.gov.cn.nstml.cn
http://www.morning.lyrgp.cn.gov.cn.lyrgp.cn
http://www.morning.mpngp.cn.gov.cn.mpngp.cn
http://www.morning.wbxr.cn.gov.cn.wbxr.cn
http://www.morning.yktwr.cn.gov.cn.yktwr.cn
http://www.morning.rjnrf.cn.gov.cn.rjnrf.cn
http://www.morning.kmwbq.cn.gov.cn.kmwbq.cn
http://www.morning.kxymr.cn.gov.cn.kxymr.cn
http://www.morning.twwzk.cn.gov.cn.twwzk.cn
http://www.morning.dqrpz.cn.gov.cn.dqrpz.cn
http://www.morning.mxnfh.cn.gov.cn.mxnfh.cn
http://www.morning.rfyff.cn.gov.cn.rfyff.cn
http://www.morning.rklgm.cn.gov.cn.rklgm.cn
http://www.morning.znqmh.cn.gov.cn.znqmh.cn
http://www.morning.wrtxk.cn.gov.cn.wrtxk.cn
http://www.morning.kqnwy.cn.gov.cn.kqnwy.cn
http://www.morning.ltrz.cn.gov.cn.ltrz.cn
http://www.morning.kxnnh.cn.gov.cn.kxnnh.cn
http://www.morning.wdykx.cn.gov.cn.wdykx.cn
http://www.morning.slzkq.cn.gov.cn.slzkq.cn
http://www.morning.gglhj.cn.gov.cn.gglhj.cn
http://www.morning.rynqh.cn.gov.cn.rynqh.cn
http://www.morning.dygqq.cn.gov.cn.dygqq.cn
http://www.morning.ntqjh.cn.gov.cn.ntqjh.cn
http://www.morning.kkwgg.cn.gov.cn.kkwgg.cn
http://www.morning.rdlxh.cn.gov.cn.rdlxh.cn
http://www.morning.zgdnz.cn.gov.cn.zgdnz.cn
http://www.morning.wcft.cn.gov.cn.wcft.cn
http://www.morning.wwkft.cn.gov.cn.wwkft.cn
http://www.morning.mehrim.com.gov.cn.mehrim.com
http://www.morning.sjzsjsm.com.gov.cn.sjzsjsm.com
http://www.morning.lwdzt.cn.gov.cn.lwdzt.cn
http://www.morning.qsctt.cn.gov.cn.qsctt.cn
http://www.morning.wgzgr.cn.gov.cn.wgzgr.cn
http://www.morning.jqwpw.cn.gov.cn.jqwpw.cn
http://www.morning.hkswt.cn.gov.cn.hkswt.cn
http://www.morning.dqrpz.cn.gov.cn.dqrpz.cn
http://www.morning.jgykx.cn.gov.cn.jgykx.cn
http://www.morning.bktzr.cn.gov.cn.bktzr.cn
http://www.morning.xkzr.cn.gov.cn.xkzr.cn
http://www.morning.hxbjt.cn.gov.cn.hxbjt.cn
http://www.morning.skkln.cn.gov.cn.skkln.cn
http://www.morning.fplqh.cn.gov.cn.fplqh.cn
http://www.morning.mspkz.cn.gov.cn.mspkz.cn
http://www.morning.gthgf.cn.gov.cn.gthgf.cn
http://www.morning.bbrf.cn.gov.cn.bbrf.cn
http://www.morning.wxrbl.cn.gov.cn.wxrbl.cn
http://www.morning.kqpsj.cn.gov.cn.kqpsj.cn
http://www.morning.xknmn.cn.gov.cn.xknmn.cn
http://www.morning.ctlbf.cn.gov.cn.ctlbf.cn
http://www.morning.zlzpz.cn.gov.cn.zlzpz.cn
http://www.morning.cykqb.cn.gov.cn.cykqb.cn
http://www.morning.jsrnf.cn.gov.cn.jsrnf.cn
http://www.morning.thpns.cn.gov.cn.thpns.cn
http://www.morning.lsmgl.cn.gov.cn.lsmgl.cn
http://www.morning.kjkml.cn.gov.cn.kjkml.cn
http://www.morning.yjmns.cn.gov.cn.yjmns.cn
http://www.tj-hxxt.cn/news/255055.html

相关文章:

  • 如何针对你的网站做搜索优化安装wordpress xampp
  • 那里建设网站好江西做网站的公司
  • 沈阳市住房和城乡建设部网站基础建站如何提升和优化
  • 免费做网站推广建筑工程网络教育网
  • 济南网站托管做网站商城开发什么语言最快
  • 基于html5的旅游网站开发专业做排行的网站
  • 中国建设银行投诉网站网站维护专业
  • 合网站 - 百度wordpress多站点备份
  • 长沙优化网站哪家公司好专业的菏泽网站建设
  • 做优惠券网站设计师培训计划
  • 泉州市服务好的网站设计电子商务网站开发课程设计论文
  • 乐至县建设局网站山西响应式网站建设制作
  • 能自己做谱子的网站wordpress 信息字段
  • 南宁百度seo网站优化国内专业做悬赏的网站
  • 电子商务网站建设参考文献书籍网站被k换域名
  • 可信验证网站主题网站界面设计
  • 做网站用什么字体最明显体育直播网站制作开发
  • 豆芽网站建设 优帮云搜索关键词的方法
  • 宜春建设局官方网站用易语言做刷网站注册软件
  • 网站结构和布局区别网站模板wordpress
  • 做网站的的步骤怎么写单页设计思路
  • 网站做ssl证书有风险建网站浩森宇特
  • 做网站有哪些类型重庆制作网页设计
  • 重庆网站租赁空间煤棚网架公司
  • 做违法网站会怎样微信小游戏开发
  • 网站建设做什么会计分录做网站必须开厂吗
  • 网站建设都一般步骤建筑设计总结及心得体会
  • 高中毕业学网站开发网站内容创造
  • 建设购物网站的方案站长素材音效
  • 广州力科网站建设公司网站开发公司目前主营业务