单细胞转录组测序技术进展与应用:全面解析scRNA-seq分析挑战与教程,孝感网站建设行业现状
#网络推广 发布时间: 2025-02-15
单细胞转录组测序正在迅速发展,并伴随着许多内容和讲义,许多课程是长期的。 。 。嗨,像我这样的孩子,没有耐心,只有一个人可以完成完整的阅读 - 细胞RNA-Seq()。我将尝试总结教程内容。您需要做的就是单击以添加书签并慢慢阅读!(i)为什么-cell rna -seq
在整个人体组织中,细胞类型,状态和相互作用都非常多样化。为了更好地了解这些组织中存在的细胞类型,单细胞RNA-SEQ(SCRNA-SEQ)提供了有关单细胞水平表达基因的信息。
单细胞转录组测序可用于:
常见方法包括:
scrna-seq
在进行SCRNA-SEQ之前,我们通常使用大量RNA-Seq进行转录组分析。大量RNA-Seq是一种直接比较细胞平均表达值的方法,这可能是寻找疾病生物标志物的最佳方法,或者不关心样品中大量细胞异质性。
尽管大量RNA-SEQ可以探索不同条件(例如治疗或疾病)之间基因表达的差异,但细胞水平的差异无法充分捕获。例如,在下图中,如果进行了大量分析(左),我们将无法检测到基因A和GeneB的表达之间的正确关联。但是,如果我们通过细胞类型或细胞状态正确分组细胞,我们可以看到基因之间的正确相关性。
SCRNA-SEQ也有一定的局限性。除了样本制备和图书馆构建的高价格外,它在数据分析中还具有一定的复杂性,包括:
大量数据
来自SCRNA-SEQ实验的数据来自捕获的数千个单元格,即数十万个读取,需要更多的记忆和存储空间。
细胞的测序深度低
基于液滴的SCRNA-SEQ方法具有浅的测序深度,通常只能检测到每个细胞的10-50%的转录组。这导致细胞中许多基因的计数为零。但是,在特定细胞中,基因的零计数可能意味着未表达基因,或者简单地表示未检测到转录本。在整个细胞中,具有较高表达水平的基因的测量机会较低。由于此特征,在任何细胞中未检测到许多基因,并且基因表达在细胞之间变化很大。
零 - ?:SCRNA-SEQ数据通常为零; ,它的零不是比给出的深度(博客文章:)的零更重要的。
跨细胞/样品的生物复述性
一些我们不感兴趣的生物学变异可能会导致细胞之间的基因表达与实际生物细胞的类型/状态和掩盖细胞类型更相似/不同。这些变化(除非实验研究的一部分)包括(下面的原始文本):
图像:,A等。 with -cell,nat。 2016(doi:%2FNBT.3711)
细胞/样品之间的技术差异
图片:Hicks SC等,(2015)()
本文充分介绍了由批次不良引起的问题:
您怎么知道实验中有批次?
如果以上任何问题的答案是“否”,则意味着您的实验中有批处理。
批处理的最佳实践:
建议:
(ii) - 细胞RNA -seq数据 - 原始数据计数
根据所使用的库准备方法,RNA序列(也称为读取或标签)将从3'端(或5'端)或成绩单的全长转录(((10x,cel-seq2,drop-seq,) )在此(smart-seq)中获得。
图像:E和R。 -cell RNA到细胞,2018()
不同测序方法的优点:
3'(或5')结束测序:
全长测序:
我们将主要引入3'端测序,重点是基于液滴的方法(,drop-seq,10 x)。
3' -end reads(基于全部)
在3'末端测序中,同一转录本的不同读取片段仅来自转录本的3'末端,同一序列的可能性很高。同时,图书馆构造过程中的PCR步骤可能会导致读取重复,因此为了区分它是生物学还是技术重复,我们使用唯一的标识符(,UMI)对其进行标记。
让我们以下图为例。在下图中,分子ACTB的UMIS是相同的,因此它们只能记录为1,而ARL1的UMIS则不同,因此可以将其记录为2。
图像:来自EZ等。 - 使用细胞的细胞,细胞2015()
在细胞水平上正确定量需要以下条件:
例如,当使用V3库准备方法时,以下所有有关读取的信息:
图片:sarah(),HMS的细胞核
对于不同的基于液滴的SCRNA-SEQ方法,SCRNA-SEQ的分析工作流程相似,但是UMI,单元格ID和样品索引的分析将有所不同。例如,以下是10x序列读取的示意图,其中索引,UMI和位置不同:
图片:sarah(),HMS的细胞核
-cell rna-seq
SCRNA-SEQ方法可以通过测序通过读取分辨率和UMI,这在特定步骤中会略有不同,但是除了该方法之外,该过程大致一致,并且常规的工作流程如下:
图像:,MD和Theis,FJ。最好的校验RNA seq:A,Mol Syst Biol 2019(doi:)
工作流程的步骤是:
无论分析如何,都必须重复生物学!
计数
我们专注于基于液滴的3'末端测序(例如10x和drop-seq),以将原始测序数据转换为计数矩阵。
测序工具将以BCL或FASTQ格式输出原始测序数据,或生成计数矩阵。如果读取为BCL格式,我们将需要转换为FastQ格式。有一个有用的命令行工具可以轻松执行此转换。
注意:我们不在此步骤中。您可能有6个,但是所有内容的读数可能都在同一BCL或FASTQ文件中。
对于许多SCRNA-SEQ方法,从原始测序数据中生成计数矩阵将执行相似的步骤。
Umis()和Zumis()是命令行工具,可用于估计转录本3'末端的SCRNA-SEQ数据的表达。此过程中的步骤包括:
格式读取并过滤嘈杂的细胞;
(通过确定读取源);
对齐/伪比对转录;
折叠UMI和定量读数。
当然,如果您使用10X库构建方法,Cell()将负责执行上述所有步骤。
格式读取和过滤嘈杂的细胞:
可以解析FASTQ文件以获取单元格,UMI和样品。对于基于液滴的方法,某些单元格将对应于低读数(<1000读),因为:
在比较读取之前,您需要从序列数据中过滤过多的条形码。为了执行此过滤,提取并保存了每个细胞的“细胞条形码”和“分子条形码”。例如,如果您使用“ UMIS”工具,则将以以下格式添加信息:
<p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'> <pre class="public-DraftStyleDefault-pre" style="margin-top: 1.4em; margin-bottom: 1.4em; padding: 0.88889em; font-size: 0.9em; word-break: normal; overflow-wrap: normal; overflow: auto; background-color: rgb(246, 246, 246); border-radius: 4px; color: rgb(26, 26, 26);">@HWI-ST808:130:H0B8YADXX:1:1101:2088:2222:CELL_GGTCCA:UMI_CCCT
AGGAAGATGGAGGAGAGAAGGCGGTGAAAGAGACCTGTAAAAAGCCACCGN
+
@@@DDBD>=AFCF+<CAFHDECII:DGGGHGIGGIIIEHGIIIGIIDHII#</pre></p>
库中使用的细胞条形码应已知,并将丢弃未知的条形码,并且已知的细胞条形码可能会有一定程度的不匹配。
这:
如果将多个样本测序以执行此步骤,则这是“ UMIS”工具未处理的步骤,而是由“ Zumis”完成的,该步骤可以解析读取以确定与每个相关相关联的样品的条形码细胞。
比较/伪比较转录:
读取与传统(星)或轻质(/)方法的基因对齐。
折叠UMI和定量读物:
使用类似或仅量化唯一UMI的工具,
图像:来自Lafzi等。 :for -cell RNA,2018()
矩阵中的每个值表示来自相应基因的细胞中的读数数。
(iii)-cell rna-seq:设置
生成计数矩阵后,我们需要对其进行QC分析,并在下一步中将其导入R:
探索样品集
该数据集来自Kang等人,2017(),是来自八名狼疮患者的PBMC(血细胞)数据,分为对照和干扰素β-处理(刺激)组。
图片:Kang等,2017()
原始数据
研究小组发现,Geo(:)缺乏线粒体读取的矩阵,因此从SRA下载了BAM文件(:),然后转换为FastQ文件,并使用Cell()获得了Count 。
注意:这也来自10倍,用作()的一部分。
相关信息也被调用。以下数据如下:
这是您在QC之前的某些单元格类型。如果您有任何具有低(来自几个基因的)或带有OF细胞的细胞类型的细胞类型。这将为这些。
上述细胞类型均未预期具有较低的复杂性或高线粒体含量。
设置R环境
为了更好地管理数据并使整个项目组织起来,首先创建一个名为“”的项目,然后构建以下目录:
<p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'> <pre class="public-DraftStyleDefault-pre" style="margin-top: 1.4em; margin-bottom: 1.4em; padding: 0.88889em; font-size: 0.9em; word-break: normal; overflow-wrap: normal; overflow: auto; background-color: rgb(246, 246, 246); border-radius: 4px; color: rgb(26, 26, 26);">single_cell_rnaseq/
├── data
├── results
└── figures</pre></p>
下载数据
解压缩数据后,创建一个新的R脚本,将其命名为“ .r”,并确保整个工作目录看起来像这样:
加载R软件包
<p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'> <pre class="public-DraftStyleDefault-pre" style="margin-top: 1.4em; margin-bottom: 1.4em; padding: 0.88889em; font-size: 0.9em; word-break: normal; overflow-wrap: normal; overflow: auto; background-color: rgb(246, 246, 246); border-radius: 4px; color: rgb(26, 26, 26);">library(SingleCellExperiment)
library(Seurat)
library(tidyverse)
library(Matrix)
library(scales)
library(cowplot)
library(RCurl)</pre></p>
加载计数矩阵
总共有3个文件,即:单元ID,基因ID和(每个单元的每个基因)。
.tsv
这是一个文本文件,其中包含样品中存在的所有细胞条形码。条形码按照矩阵文件中显示的数据顺序列出(这些是列名)。
.tsv
# 单细胞转录组测序技术进展与应用
# 渭南网站推广排名
# 西丰抖音营销推广
# 浙江网站建设价钱
# 会理市地名网站建设
# 云龙区网站推广制作
# 抖音广告营销推广方法
# 鹤岗百度seo服务
# 苏州网站建设推广哪家好
# 公司网站推广页制作
# 许昌智慧城市网站建设
# 涵海网站建设
# 全面解析scRNA-seq分析挑战与教程
# 郑州seo营销
# 海安企业网站推广
# 海口seo推广经验
# 网站建设与管理期末作品
# 拼多多关键词排名在线
# seo l jin
# 优化公司网站设计教程
# 旅顺外贸网站建设
# seo培训就业班
上一篇 : 探索7纳米技术的神奇应用:纳米技术如何改变我们的生活,临汾关键词排名报价行情
下一篇 : 免费AI写作工具:节省时间、提高内容质量,支持多语言创作,镇江网站建设门户报价
-
SEO外包最佳选择国内专业的白帽SEO机构,熟知搜索算法,各行业企业站优化策略!
SEO公司
-
可定制SEO优化套餐基于整站优化与品牌搜索展现,定制个性化营销推广方案!
SEO套餐
-
SEO入门教程多年积累SEO实战案例,从新手到专家,从入门到精通,海量的SEO学习资料!
SEO教程
-
SEO项目资源高质量SEO项目资源,稀缺性外链,优质文案代写,老域名提权,云主机相关配置折扣!
SEO资源
-
SEO快速建站快速搭建符合搜索引擎友好的企业网站,协助备案,域名选择,服务器配置等相关服务!
SEO建站
-
快速搜索引擎优化建议没有任何SEO机构,可以承诺搜索引擎排名的具体位置,如果有,那么请您多注意!专业的SEO机构,一般情况下只能确保目标关键词进入到首页或者前几页,如果您有相关问题,欢迎咨询!