胃癌单细胞数据集GSE163558复现(八):拟时序分析
图片
绪论Hello小伙伴们民众好,我是生信妙技树的小学徒”我才不吃蛋黄“。今天是胃癌单细胞数据集GSE163558复现系列第八期。第七期咱们使用AddModuleScore_UCell函数蓄意细胞的增殖和转移评分。本期,咱们将使用monocle2进行拟时序分析。
1.配景先容系列推文前七期,咱们共同学习了单细胞测序的基础分析,从第八期初始,咱们将陆续学习拟时序分析(Pseudo-Temporal Analysis),“Copykat”分析及细胞通信等高档分析。
迷水商城疾病是一个动态变化的过程,在疾病发生发展的过程中,细胞景色随时间束缚变化。现存的单细胞测序技能提供的是某一时刻的“快照”,然则通过拟时序分析,咱们不错推断出细胞的动态变化过程。
拟时序分析(Pseudo-Temporal Analysis)的界说如下:
拟时序分析(Pseudo-Temporal Analysis)是一种分析方法,往往用于磋磨那些在时间上不长入的数据集。它试图通过模拟时间序列的方法来分析数据,即使数据本人并不是按照时间端正采集的。这种分析方法在多个限制齐有应用,比如在生物信息学中,它不错用于分析基因抒发数据,即使这些数据不是在长入的时间点上采集的。拟时序分析的要道在于构建一个虚构的时间轴,然后在这个时间轴上对数据进行排序和分析。这往往波及到以下几个法子:数据预经管:清洗数据,确保数据的质料和一致性。特征采选:识别和采选对分析灵验的特征或变量。时间轴构建:凭证数据的特质构建一个虚构的时间轴,这可能基于生物学过程、施行假想或其他逻辑。排序:将数据按照虚构时间轴进行排序。分析:使用时间序列分析的方法来分析排序后的数据,比如趋势分析、周期性分析等。考据:通过交叉考据或其他方法来考据分析恶果的可靠性。*
迷水商城迷水商城单细胞拟时序分析的主要见解包括:
细胞发展轨迹推断:通过分析细胞景色的变化,推断细胞是奈何从一种景色发展或分化到另一种景色。细胞景色排序:将细胞按照它们在假设的发展轨迹上的位置进行排序,即使这些细胞并非在长入的时间点上被不雅测。生物学过程理会:识别细胞在特定生物学过程中的动态变化,如细胞分化、发育、疾病理会等。要道基因和调控集中识别:发目下细胞景色迤逦中起要道作用的基因和调控集中。细胞异质性探究:揭示细胞群体里面的异质性,以及不同细胞亚群之间的关系。细胞走时研究:基于面前的细胞景色和拟时序轨迹,研究细胞可能的改日发展和分化走时。动态生物学过程建模:构建数学模子来模拟细胞景色的动态变化,为生物学假设提供定量刻画。疾病磋磨和诊疗靶点发现:在疾病磋磨中,拟时序分析不错匡助理会病理景色下细胞的变化,发现潜在的诊疗靶点。发育过程的细胞谱系构建:在发育生物学中,拟时序分析有助于构建细胞谱系树,理会细胞的发源和走时。施行假想指引:通过理会细胞景色的变化,不错指引改日的施行假想,举例采选哪些细胞景色进行进一步的施行考据。Monocle是目下最常用的拟时序分析算法,其中枢技能是一种机器学习算法——反向图形镶嵌(Reversed Graph Embedding)进行降维分析。Monocle2使用DDRtree进行降维分析,而Monocle3则使用UMAP降维,女性催情药网上购买可视化细胞转录特征相通性关系,从而刻画细胞景色过渡轨迹。细胞景色过渡轨迹是“根”到“叶”的树状结构,细胞从根到达分支后,会采选一个分支往辽阔移动,终末到达叶子,每个细胞的psudotime值是它从叶复返根的距离。
迷水商城迷水商城monocle的分析过程与seurat肖似,准备输入文献,创建monocle对象cds(new cell data set),对数据预经管,筛选特定基因,降维,蓄意psudotime值,终末可视化。本期使用monocle2进行拟时序分析。
春药哪里买2.数据分析2.1 导入数据破除系统环境变量,成立责任目次,加载R包,采选作念拟时序的亚群,读取恶性上皮细胞RDS文献:
rm(list=ls())getwd()setwd('')library(tidyverse)library(tinyarray)library(data.table) library(Seurat)library(ggplot2)library(clustree)library(cowplot)library(dplyr)library(monocle)sce.all = readRDS('malignant.rds')sce = sce.alltable(sce$celltype)Idents(sce) = sce$celltype
如若用我方电脑,细胞量太大,不错每个细胞亚群抽样 :
allCells=names(Idents(sce))allType = levels(Idents(sce))# choose_Cells = unlist(lapply(allType, function(x){# cgCells = allCells[Idents(sce)== x ]# cg=sample(cgCells,10)# cg# }))# cg_sce = sce[, allCells %in% choose_Cells]cg_sce = scetable(Idents(cg_sce))2.2 数据准备
monocle构建CDS需要3个矩阵:
expr.matrixphenodata(pd)featuredata(fd)expr.matrix:
Mono_tj<-cg_sceMono_matrix<-as(as.matrix(GetAssayData(Mono_tj,slot = "counts")), 'sparseMatrix')
构建featuredata:
一般需要两个col,一个是gene_id,一个是gene_short_name,row对应counts的rownames:
迷水商城迷水商城feature_ann<-data.frame(gene_id=rownames(Mono_matrix),gene_short_name=rownames(Mono_matrix))rownames(feature_ann)<-rownames(Mono_matrix)Mono_fd<-new("AnnotatedDataFrame", data = feature_ann)
构建phenodata:
Seurat object中的@meta.data一般会存放表型联系的信息如cluster、sample的开始、group等,是以采选将metadata革新为phenodata:
sample_ann<-Mono_tj@meta.datarownames(sample_ann)<-colnames(Mono_matrix)Mono_pd<-new("AnnotatedDataFrame", data =sample_ann)2.3 monocle分析过程
构建new cell data set:
迷水商城迷水商城Mono.cds<-newCellDataSet(Mono_matrix,phenoData =Mono_pd,featureData =Mono_fd,expressionFamily=negbinomial.size())
newCellDataSet函数中,expressionFamily参数用于指定抒发矩阵的数据类型,有几个选项不错采选:稀薄矩阵用negbinomial.size();FPKM值用tobit();logFPKM值用gaussianff()。
检察phenodata、featuredata:
head(pData(Mono.cds))head(fData(Mono.cds))
Mono.cds相称于Seurat V5构建的Seurat对象,随后需要对数据预经管(意料顺序因子、意料突破度):
迷水商城Mono.cds <- estimateSizeFactors(Mono.cds)Mono.cds <- estimateDispersions(Mono.cds)
筛选基因,这里不错凭证我方的需要筛选特定的基因:
disp_table <- dispersionTable(Mono.cds)unsup_clustering_genes <- subset(disp_table, mean_expression >= 0.1)Mono.cds <- setOrderingFilter(Mono.cds, unsup_clustering_genes$gene_id)
用DDRtree进行降维分析:
Mono.cds <- reduceDimension( Mono.cds, max_components = 2, method = 'DDRTree')
蓄意psudotime值:
Mono.cds <- orderCells(Mono.cds)head(pData(Mono.cds))
图片
2.4 monocle可视化展示State轨迹溜达图:
春药的药名,春药QQ群,催清药商城,买媚药网站,迷情药商城,崔倩药推荐plot_cell_trajectory(Mono.cds,cell_size = 1)
图片
展示Cluster/Pseudotime轨迹溜达图:
p1 = plot_cell_trajectory(Mono.cds,color_by="celltype", size=1,show_backbone=TRUE)p2 = plot_cell_trajectory(Mono.cds,color_by="Pseudotime", size=1,show_backbone=TRUE) p1+p2
图片
分面袒露:
plot_cell_trajectory(Mono.cds, color_by = "celltype") + facet_wrap("~sample", nrow = 1)
图片
树形图:
plot_complex_cell_trajectory(Mono.cds,x=1,y=2,color_by="celltype")+ scale_color_manual(values =mycolors)+ theme(legend.title = element_blank())
图片
沿时间轴的细胞密度图:
迷水商城library(ggpubr)df <- pData(Mono.cds)view(df)
图片
迷水商城ggplot(df,aes(Pseudotime, colour = celltype, fill=celltype))+ geom_density(bw=0.5,size=1,alpha =0.5)+theme_classic2()
图片
Monocle基因可视化:
head(unsup_clustering_genes)s.genes <- c("NOC2L","PLEKHN1","HES4","ISG15")p1 <- plot_genes_jitter(Mono.cds[s.genes,], grouping = "State", color_by = "State")p2 <- plot_genes_violin(Mono.cds[s.genes,], grouping = "State", color_by = "State")p3 <- plot_genes_in_pseudotime(Mono.cds[s.genes,], color_by = "State")
图片
图片
图片
拟时联系基因聚类热图:

#高变基因disp.genes <- subset(disp_table, mean_expression >= 0.5&dispersion_empirical >= 1*dispersion_fit)disp.genes <- as.character(disp.genes$gene_id)diff_test <- differentialGeneTest(Mono.cds[disp.genes,], cores = 4, fullModelFormulaStr = "~sm.ns(Pseudotime)")sig_gene_names <- row.names(subset(diff_test, qval < 1e-50))plot_pseudotime_heatmap(Mono.cds[sig_gene_names,], num_clusters=4, show_rownames=T, return_heatmap=T)
图片
2.5 BEAM分析由于细胞基因抒发模式不同,单细胞轨迹中往往包括分支。通过BEAM(Branched expression analysis modeling)分析,咱们可找到以依赖于分支的方法调控的基因。
迷水商城disp_table <- dispersionTable(Mono.cds)disp.genes <- subset(disp_table, mean_expression >= 0.5&dispersion_empirical >= 1*dispersion_fit)disp.genes <- as.character(disp.genes$gene_id)mycds_sub <- Mono.cds[disp.genes,]plot_cell_trajectory(mycds_sub, color_by = "State")beam_res <- BEAM(mycds_sub, branch_point = 1, progenitor_method = "duplicate")beam_res <- beam_res[order(beam_res$qval),]beam_res <- beam_res[,c("gene_short_name", "pval", "qval")]mycds_sub_beam <- mycds_sub[row.names(subset(beam_res, qval < 1e-4)),]plot_genes_branched_heatmap(mycds_sub_beam, branch_point = 1, num_clusters = 3, show_rownames = T)
图片
结语本期,咱们投入了单细胞高档分析系列,使用monocle2进行了拟时序分析。下一期,凭证课程安排,咱们将暂时回到Bulk转录组,诳骗TCGA-STAD数据进行糊口分析。干货满满,接待民众握续追更,谢谢!
图片
本站仅提供存储奇迹,所有这个词本体均由用户发布,如发现存害或侵权本体,请点击举报。