新闻资讯
看你所看,想你所想

Sage(基因表达系列分析)

Sage(基因表达系列分析)

基因表达系列分析(Sage),1995年Velculescu等提出了基因表达系列分析(Serial Analysis of Gene Expression,SAGE)技术,能同时对上千个转录物进行研究。

基本介绍

  • 中文名:基因表达系列分析
  • 外文名:Serial Analysis of Gene
  • 简称:Sage
  • 作用:同时对上千个转录物进行研究
1. SAGE的原理和实验路线。
1.1 SAGE的原理 SAGE的主要依据有两个。
第一,一个9~10硷基的短核苷酸序列标籤包含有足够的信息,足以特异性地确定某一种转录本。例如,一个9硷基的序列能有四的9次方,即262144种不同的排列组合,而人类基因组估计仅能编码80000种转录本,所以理论上每一个9硷基标籤能够代表一种转录本的特徵序列。
第二,如果将短片段标籤相互连线、集中形成长的DNA分子,则对该克隆进行测序将得到大量连续的单个标籤,并能以连续的数据形式输入计算机中进行处理,这样就可以对数以千计的mRNA转录本进行分析。
第三,各转录本的表达水平可以用特定标籤被测得的次数定量。
1.2 SAGE的实验路线。
如图1所示:
(1) 以biotinylated oligo(dT)为引物反转录合成cDNA,以一种限制性内切酶(锚定酶 Anchoring Enzyme, AE)酶切。锚定酶要求至少在每一种转录物上有一个酶切位点,一般4硷基限制性内切酶能达到这种要求,因为大多数mRNA要长于256硷基(44)。通过链霉抗生物素蛋白珠收集cDNA3′端部分。对每一个mRNA只收集其polyA尾与最近的酶切位点之间的片段。
(2) 将cDNA等分为A和B两部分,分别连线接头A或接头B。每一种接头都含有标籤酶(Tagging Enzyme TE)酶切位点序列(标籤酶是一种Ⅱ类限制酶,它能在距识别位点约20硷基的位置切割DNA双链)。接头的结构为引物A/B序列+标籤酶识别位点+锚定酶识别位点。
(3) 用标籤酶酶切产生连有接头的短cDNA片段(约9~10硷基),混合併连线两个cDNA池的短cDNA片段,构成双标籤后,以引物A和B扩增。
(4) 用锚定酶切割扩增产物,抽提双标籤(Ditga)片段并克隆、测序。一般每一个克隆最少有10个标籤序列,克隆的标籤数处于10~50之间。
(5) 对标籤数据进行处理。在所测序列中的每个标籤间以锚定酶序列间隔,如图1中锚定酶採用Nia Ⅲ限制性内切酶,则以CATG/GTAC序列确定标籤的起始位置和方向。 图1 基因表达系列分析(SAGE)示意 锚定酶(AE)和标籤酶(TE)是NiaⅢ、FokI X和O分别表示不同标籤的核苷酸顺序 由于双标籤体的长度基本相同,不会导致扩增的偏态性,同时数量和种类极大的转录物使同一种标籤连线成双标籤体的可能性极小,这保证了克隆中的每一个标籤代表一种转录物在当前细胞状态下的一个单位的转录产物,因此通过计算机软体的分析能够得到上千种基因表达产物的标籤序列以及丰裕度。
虽然SAGE技术能够儘可能全面地收集生物组织的基因表达信息,但也不能完全保证涵盖所有的低丰度的mRNA。另外标籤体的连线可能因接头的干扰造成克隆所包含的标籤体过少和克隆序列末端不能高效地连入载体。Powell利用磁性生物素珠特异吸附引物,避免了接头的干扰(Powell 1998)。
2. SAGE的优点和套用
SAGE是一项快捷、有效的基因表达研究技术,任何具备PCR和手动测序器具的实验室都能使用这项技术,结合自动测序技术能够在3个小时内完成1000个转录物的分析。另外使用不同的锚定酶(识别5~20硷基的Ⅱ类核酸内切酶),使这项技术更具灵活性。
首先SAGE可套用于人类基因组研究。1995年 Velculescu 等选择Bsm F I和Nia Ⅲ分别作为标籤酶和锚定酶,使用计算机对9硷基标籤数据进行分析并对GenBank检索。在分析的1000个标籤中,95%以上的标籤能够代表唯一的转录物。转录水平依标籤出现频率分为4类:① 超过三次 共380个,占45.2%;② 出现三次 共45个,占5.4%;③ 出现两次 共351个,占7.6%;④ 仅出现过一次 共840个,占41.8%。所以SAGE能够快速、全範围提取生物体基因表达信息,对已知基因进行量化分析。SAGE也能套用于寻找新基因。虽然SAGE的标籤仅包括9个硷基,但加上锚定酶的位点序列(4个硷基)共可确认13硷基序列。如果一个标籤检索已知序列时没有同源序列,13硷基片段就可作为探针筛选cDNA文库得到cDNA克隆。
其次,SAGE可用于定量比较不同状态下的组织细胞的特异基因表达。Stephen L等(1997)利用SAGE技术比较小鼠胚囊纤维细胞基因表达。小鼠胚囊纤维细胞能产生对温度敏感的P53肿瘤抑制蛋白,就可通过SAGE分析,比较两种不同温度下基因表达的差异。从约15 000个分析的基因中,发现有14个基因的表达依赖于P53蛋白,有3个基因的表达与P53蛋白的失活显着相关。Zhang等(1997)比较正常细胞和肿瘤细胞基因表达的300000个转录物发现:在分析的4500种转录物中,至少有500种在两种细胞组织中的表达有显着差异。
第三,由于SAGE能够同时最大限度的收集一种基因组的基因表达信息,转录物的分析数据可用来构建染色体表达图谱(Chromosomal expression map)。Victor等分析了酵母基因组的基因表达,从60633个转录物中发现了4655个基因(表达水平分布在0.3~2.0/细胞),其中1981个基因已被确认了功能,2684个还未被报导过。利用基因的表达信息与基因组图谱融合绘製的染色体表达图谱,使基因表达与物理结构连繫起来,更利于基因表达模式的研究。(Velculescu,1997) SAGE是基因表达定性和定量研究的一种有效工具,非常适合于比较不同发育状态或疾病状态的生物基因表达。
另外SAGE能够接近完整地获得基因组表达信息,能够直接读出任何一种类型细胞或组织的基因表达信息。SAGE技术的套用将大大加快基因组研究的进展,但必须和其它技术相互融合、互为补充,才能最大可能地进行基因组基因表达的全面研究。

转载请注明出处海之美文 » Sage(基因表达系列分析)

相关推荐

    声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:ailianmeng11@163.com