代码库-scRNAseq去除批次效应-260609

发布时间:2026/6/10 19:26:29
代码库-scRNAseq去除批次效应-260609
##系统报错改为英文 Sys.setenv(LANGUAGE = "en") ##禁止转化为因子 options(stringsAsFactors = FALSE) ##清空环境 rm(list=ls()) library(dplyr) library(Seurat) library(ggplot2) library(RColorBrewer) library(patchwork) library(viridis) library(DoubletFinder) setwd("/mnt/DATA/home/jiangxingyu109/新版华哥学习/单细胞批次去除/") ##SCI文章使用SCTransform较多 ##所有的算法都可以使用,只要趋势是符合你的预期的 ##生信分析没有对与错 ##SCTransfrom有专门的网站指导,seurat只用V5的版本,官方认为更优 ##多个样本的整合,adjust批次效应 ##批次效应看有没有均匀分布,均匀是相对的,尽可能的均匀分布,但是有的就是特有的亚群 ##没有绝对值 ##如果不进行批次的去除,各个样本单独分布,UMAP里面看的清楚 ##我喜欢harmony ##主流CCA、harmony,harmony也是有nature文章的 ##整合数据的同时对稀有细胞的敏感性更好。省内存,适用于更复杂的 setwd("/mnt/DATA/home/jiangxingyu109/新版华哥学习/单细胞批次去除/GSE197177_RAW/") x=list.files() ##这个可以输出当前目录下的文件名 dir=c("ZY_1/","ZY_2/","ZY_3/","ZY_4/") names(dir) = c("s1","s2","s3","s4") counts - Read10X(data.dir = dir) scRNAhua= CreateSeuratObject(counts,min.cells = 3,min.features = 200) ##这一步注意不能写错 ##这个方法可以说是通用的了 setwd("/mnt/DATA/home/jiangxingyu109/新版华哥学习/单细胞批次去除/") ##这里采取抽样 scRNAhua = subset(scRNAhua, do