高等真核生物的基因組一般具有80 000~100 000個基因,而每一個細胞大約只表達其中的15%[1]。基因在不同細胞間及不同生長階段的選擇性表達決定了生命活動的多樣性,如發育與分化、衰老與死亡、內環境穩定、細胞周期調控等。比較細胞間基因表達的差異為我們揭示生命活動的規律提供了依據。
由于真核細胞mRNA 3′端一般含有Poly(A)尾,因此現有的方法基本上都是利用共同引物將不同的mRNA反轉錄成cDNA,以cDNA為對象研究基因表達的差異。1992年 Liang等[2]建立了一種差異顯示反轉錄PCR法(differential display reverse transcription PCR,DDRT-PCR),為檢測成批基因表達的差異開辟了新天地。迄今為止已出現了大量應用該技術的研究報道[3,4]。然而,盡管應用DDRT-PCR方法已經取得了不少成果,而且該方法還在不斷改進之中,但它仍然存在幾個難以解決的問題:(1) 重復率低,至少有20%的差異條帶不能被準確重復[5];(2) 假陽性率可以高達90%[6];(3) 獲得的差異表達序列極少包含編碼信息。近年來,針對DDRT-PCR方法的不足,又有幾種新的檢測差異表達基因的方法出現,現僅就這方面的進展做一簡要介紹。
1.基因表達指紋(gene expression fingerprinting,GEF):GEF技術使用標記的引物Bio-T13合成cDNA*鏈,用dGTP對其進行末端加尾,再以富含C的引物引發合成cDNA第二鏈。用限制性內切酶消化雙鏈cDNA,以交聯有抗蛋白的微球捕獲cDNA3′端,以T4DNA連接酶連接同前述內切酶相對應的適配子,并以Bio-T13及適配子中的序列作為新的引物進行特異的PCR擴增,得到大量的特異cDNA片段。適配子末端被32P-dATP標記后,固定于微球上的cDNA片段經過一系列酶切,產生的酶切片段從微球表面釋放出來,其中那些含有標記末端的片段經凝膠電泳后構成mRNA指紋圖譜。通過分析不同細胞間的指紋圖譜就能得到差異表達的序列[7]。GEF技術所需的工作量較DDRT-PCR明顯減少,由于用酶切反應替代了條件不嚴格的PCR反應,其重復性也較好,假陽性率低,并且所獲得的片段中包含有一定的編碼信息。GEF技術zui大的缺點在于電泳技術的局限。由于它的指紋圖譜要顯示在同一塊電泳膠上,經過幾輪酶切之后常會得到1 000~2 000條電泳帶,而現有的PAGE電泳很少能分辨超過400條帶,故只有15%~30%的mRNA能夠被辨認出來,因此得到的只能是高表達基因。如果希望尋找部分新基因,這是一種比較簡單有效的方法;如果希望得到有關某種細胞的基因表達譜,可能比較困難;采用雙向電泳技術可能會有所幫助[8]。
2.基因表達系統分析(serial analysis of gene expression,SAGE):SAGE法的建立基于兩條理論。首先,一段來自某個轉錄子確定位置的核苷酸,其長度只要有9~10個bp,就能夠特異地確認該轉錄子。第二,對短片段標簽的鏈接有利于在同一克隆中對多個標簽測序。SAGE也是用標記的Bio-Oligo(dT)為引物合成雙鏈cDNA,然后以限制酶(錨定酶)進行酶切,捕獲cDNA3′端。在此處產物被分為兩部分,分別與包含有IIS型內切酶(標簽酶)位點的A、B連接子相接。IIS型內切酶的特點是作用位點處于識別位點之外。這樣經過酶切,就有可能得到只有9~10bp的標簽序列。每兩個標簽的鈍端結合后成為PCR的模板,以基于A、B連接子的引物進行PCR反應的結果是得到了大量每條包含兩個不同來源標簽的序列,接下來再用錨定酶酶切、連接,就能將多個不同的標簽鏈接在一起(大約為每條包含數十個不同來源的標簽),克隆至質粒載體中后集中測序[9,10]。SAGE的zui終結果是通過計算機統計得到的,根據某個標簽出現頻率的高低來判斷并計算其所屬基因表達的豐度。對于在數據庫中找不到對應序列的標簽,還可以利用13bp的寡核苷酸探針(9bp加上錨定酶識別位點的4bp)對cdna文庫進行篩選,以尋找新基因。SAGE可以檢測不同細胞間已知基因表達的具體差異,到每個細胞中大約有多少拷貝,可以建立較全面的基因表達譜,系統地分析基因表達的差異。它的缺點在于工作量非常大,有大量的測序及計算機分析任務;而且,對于尋找新基因而言,僅用長度為13bp的寡核苷酸探針篩選cDNA文庫是很不嚴格的,根據我們的經驗,往往是假陽性結果居多。