蚊蟲基因組數(shù)據(jù)分析論文
時間:2022-05-23 02:41:07
導(dǎo)語:蚊蟲基因組數(shù)據(jù)分析論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
蚊蟲基因組序列的揭示為其基因的克隆鑒定和功能分析提供了很好的平臺。由于蚊基因組中高度重復(fù)序列的廣泛存在,給一些基因特別是非編碼序列的分子克隆帶來了困難,而基因組序列的提供給這一問題的解決帶來了福音。利用已獲得的白紋伊蚊基因組序列,我們已順利克隆了其嗅覺結(jié)合蛋白(OBP)和嗅覺受體(OR)基因及其調(diào)控序列,為其嗅覺發(fā)生分子機制的闡明奠定了基礎(chǔ)。Criscione等通過比較斯氏按蚊雌蚊和雄蚊的基因組DNA和RNA樣本的Illumina測序結(jié)果,發(fā)現(xiàn)了一個Y染色體特有的基因GUY1。Hall等則發(fā)明了一種更為有效的染色體熵法,該方法的優(yōu)勢是僅利用高通量測序獲得的基因組和轉(zhuǎn)錄組數(shù)據(jù),而不需要一個固定在染色體上的參考基因組來進行比對。通過比對兩種瘧疾重要傳播媒介斯氏按蚊和岡比亞按蚊的高通量基因組和轉(zhuǎn)錄組數(shù)據(jù),系統(tǒng)性地在斯氏按蚊和岡比亞按蚊中各發(fā)現(xiàn)了3個Y基因。同時通過對鑒定的Y基因進行生物進化分析,結(jié)果表明按蚊的Y染色體進化迅速。隨后,Hall等又使用染色體熵的方法比對了雄性和雌性埃及伊蚊基因組DNA和RNA的Illumina測序數(shù)據(jù),篩選并鑒定了一個新的基因myo-sex。myo-sex基因幾乎只存在于雄蚊的基因組,但是由于基因重組偶爾地能在雌蚊的基因組中發(fā)現(xiàn),具有雄性偏好性,是一個可能具有性別拮抗效應(yīng)的肌球蛋白重鏈基因。蚊蟲基因組數(shù)據(jù)也為蚊蟲性別決定網(wǎng)絡(luò)底部基因dsx的研究提供了依據(jù)。dsx是性別決定網(wǎng)絡(luò)中的調(diào)控核心,主要行使決定體細胞和生殖細胞性別的功能,也可調(diào)控中樞神經(jīng)相關(guān)基因fruitless,進而調(diào)節(jié)性行為。岡比亞按蚊基因組數(shù)據(jù)之后,Scali等率先鑒定了岡比亞按蚊dsx的性別特異性轉(zhuǎn)錄本,其橫跨2號染色體85kb的區(qū)域,通過選擇性拼接產(chǎn)生多個外顯子組成的雌性和雄性特異性轉(zhuǎn)錄本。而隨著2014年斯氏按蚊基因組的,有研究者將Scali等報導(dǎo)的Angdsx與剛的斯氏按蚊基因組和轉(zhuǎn)錄組進行序列比對,發(fā)現(xiàn)一致性達到了97%,而與岡比亞按蚊基因組及轉(zhuǎn)錄組序列一致性僅為85%。Scali等在埃及伊蚊中發(fā)現(xiàn)了兩種雌性特異性的可變剪接方式,這不同于黑腹果蠅和岡比亞按蚊具有的特異性DsxF。
2蚊蟲的轉(zhuǎn)錄組學(xué)研究
轉(zhuǎn)錄組學(xué)(transcriptomics)是一個活細胞所能轉(zhuǎn)錄出來的所有RNA的總和,是研究細胞表型和功能的一個重要手段。傳統(tǒng)上用于轉(zhuǎn)錄組數(shù)據(jù)獲得和分析的方法主要有基于雜交技術(shù)的芯片技術(shù)包括cDNA芯片和寡聚核苷酸芯片,但目前使用最普遍的是RNA-seq即轉(zhuǎn)錄組測序技術(shù)?;贗llumina高通量測序平臺的轉(zhuǎn)錄組測序技術(shù)能夠在單核苷酸水平對任意物種的整體轉(zhuǎn)錄活動進行檢測,在分析轉(zhuǎn)錄本的結(jié)構(gòu)和表達水平的同時,還能發(fā)現(xiàn)未知轉(zhuǎn)錄本和稀有轉(zhuǎn)錄本,精確地識別可變剪切位點以及cSNP(編碼序列單核苷酸多態(tài)性),提供最全面的轉(zhuǎn)錄組信息。相對于傳統(tǒng)的芯片雜交平臺,轉(zhuǎn)錄組測序無需預(yù)先針對已知序列設(shè)計探針,即可對任意物種的整體轉(zhuǎn)錄活動進行檢測,提供更精確的數(shù)字化信號,更高的檢測通量以及更廣泛的檢測范圍,是目前深入研究轉(zhuǎn)錄組復(fù)雜性的強大工具。巨蚊屬是蚊科中三種不吸血的蚊屬之一,其幼蟲階段以同在小型水體中孳生的白紋伊蚊和埃及伊蚊為食,兩性成蚊均不吸血,以植物汁液和花蜜為食。為了探究巨蚊與其它吸血蚊種在搜尋宿主方面的基因水平上有何差異,國外有學(xué)者從巨蚊上分離出觸須、觸角和身體其他部分,分別提取這三部分的RNA,利用RNA-seq技術(shù),將獲得的序列片段從頭組裝,與目前已公布的致倦庫蚊、岡比亞按蚊、埃及伊蚊基因組數(shù)據(jù)進行系統(tǒng)進化樹分析,發(fā)現(xiàn)巨蚊與埃及伊蚊的種屬關(guān)系最近,并且在上述四種蚊種中均發(fā)現(xiàn)了編碼氣味分子受體(odorantreceptor,OR)蛋白和離子轉(zhuǎn)移受體(ionotropicreceptor,IR)蛋白的基因,但值得注意的是,巨蚊受體蛋白的表達量與豐度上較其它蚊種都有所降低[18]。因為這些受體蛋白被認(rèn)為與吸血昆蟲搜尋宿主氣味分子如CO2有關(guān),所以,巨蚊在長期的生物進化過程中,喪失了原本存在的吸血習(xí)性。蚊唾液腺蛋白與其吸血傳病密切相關(guān)。國外有學(xué)者提取白紋伊蚊雌性成蚊的唾液腺RNA后進行轉(zhuǎn)錄組和蛋白質(zhì)組分析,發(fā)現(xiàn)至少有32個基因在雌性成蚊的唾液腺中表達程度或者增高或者降低,另外有17個基因表達在雌性成蚊唾液腺和雄性成蚊中,但不表達在雌性成蚊的其他組織中。通過分析發(fā)現(xiàn),其中大約三分之一的基因功能表現(xiàn)在吸血、消化糖、免疫應(yīng)答等方面,但是并未發(fā)現(xiàn)其余基因的明確功能,所以非常有可能是長期吸血的過程中進化出的新的功能分子。利用同樣的方法,分析岡比亞按蚊、斯氏按蚊、達氏按蚊、埃及伊蚊、白紋伊蚊、致倦庫蚊和致死按蚊(Anophelesfunestus)的唾液蛋白相關(guān)的轉(zhuǎn)錄組,可以將這些蛋白歸納為:
(1)昆蟲唾液腺中普遍存在的唾液蛋白,包括抗原-5蛋白家族、核酸酶、碳水化合物水解酶等;
(2)在吸血的長角亞目昆蟲(包括白蛉、蚋、蠓等)中豐富表達的D7蛋白;
(3)僅在蚊唾液腺中存在的蛋白,包括30000左右的過敏原蛋白家族(allergenfamily)和一些粘蛋白。很多昆蟲都被發(fā)現(xiàn)具有一種獨特的生物學(xué)現(xiàn)象——滯育(diapause)。昆蟲的滯育現(xiàn)象被認(rèn)為是一種休眠的形式,在昆蟲發(fā)育時遇到不適宜的環(huán)境時,就會馬上由體內(nèi)激素調(diào)節(jié)并控制,暫時停止發(fā)育。白紋伊蚊被發(fā)現(xiàn)同樣具有滯育現(xiàn)象,這是它能適應(yīng)環(huán)境氣候變化,實現(xiàn)快速擴張入侵的生物學(xué)基礎(chǔ)之一。白紋伊蚊的雌性成蚊在每日受到較短時間的光照后,產(chǎn)下的卵不會立即孵化,這便是一種滯育的現(xiàn)象。有趣的是,同是伊蚊屬的埃及伊蚊,其雌性成蚊產(chǎn)的卵如果沒有接觸到水,也不會孵化、發(fā)育,這卻被認(rèn)為是一種靜息狀態(tài)(quiescence)。這兩種現(xiàn)象的區(qū)別在于,發(fā)生滯育后,白紋伊蚊的卵即使收到合適的外界環(huán)境的刺激,仍需要經(jīng)過一段時間的恢復(fù)才會孵化,而處于靜息狀態(tài)的埃及伊蚊的卵,只要受到適宜條件的刺激(如接觸到水),就會馬上進入發(fā)育階段。國外有學(xué)者利用RNA-seq技術(shù),對這兩種現(xiàn)象進行分析,發(fā)現(xiàn)這兩種現(xiàn)象在發(fā)育停止的階段,分子水平上是很相近的,不同之處在于滯育現(xiàn)象的早期準(zhǔn)備階段和后期修復(fù)階段,是其所獨有的。關(guān)于滯育現(xiàn)象的早期準(zhǔn)備階段,國外學(xué)者通過RNA-seq技術(shù),比較滯育前階段(pre-diapause)的白紋伊蚊胚胎與同時期非滯育的白紋伊蚊胚胎基因表達水平上的差異,發(fā)現(xiàn)前者在基因表達模式上有非常大的改變。目前,已有學(xué)者歸納和總結(jié)出了一套利用RNA-seq技術(shù)研究白紋伊蚊滯育現(xiàn)象的方法,為今后更全面、徹底地認(rèn)識白紋伊蚊以及其他媒介昆蟲的滯育現(xiàn)象提供了堅實的基礎(chǔ)。利用RNA-seq技術(shù),我們對白紋伊蚊不同發(fā)育時期(卵、幼蟲、蛹、雄蚊、雌蚊)和感染登革病毒前后的轉(zhuǎn)錄組進行了分析。對比分析不同發(fā)育階段特別是雌雄蚊的基因表達譜,我們找到了在胚胎早期對性別分化具有重要作用的候選基因和對雌蚊吸血傳病相關(guān)的性別偏愛基因。對比分析登革病毒感染與否的白紋伊蚊轉(zhuǎn)錄組,我們發(fā)現(xiàn)了可能與蚊媒與病原相互作用有關(guān)的免疫分子(未發(fā)表結(jié)果)。目前,針對這些候選基因的進一步功能分析正在進行之中。另外,對白紋伊蚊抗藥品系和敏感品系的RNA-seq對比分析也在進行中,這對于其抗藥機制的闡明非常重要。
3蚊蟲的小RNA組學(xué)研究
小RNA(smallRNAs)主要指長度在18~30nt的一類非編碼RNA(ncRNAs),在真核生物中,具有基因表達調(diào)控功能的小RNA主要有微小RNA(microRNAs,miRNAs)、內(nèi)源小干擾RNA(endo-siRNAs)和piwi干擾RNA(piRNAs)。piRNA長度集中在26-31nt,目前只在動物的生殖系細胞及干細胞中被發(fā)現(xiàn),其主要功能是參與轉(zhuǎn)座子的沉默。miRNAs和endo-siRNAs長度主要集中在20~24nt。miRNAs在動植物和微生物中都普遍存在,據(jù)估計一個物種中約1/3的基因會受到miRNA的調(diào)控,大量的實驗也表明miRNAs參與了諸多生命過程的調(diào)控,例如細胞周期、細胞分化、組織器官的發(fā)生、營養(yǎng)代謝、信號途徑以及對外界生物的非生物的環(huán)境的反應(yīng);同時,miRNAs在生產(chǎn)實踐與臨床治療上也具有很大的應(yīng)用前景。以往用于尋找miRNAs等小RNA的方法有實驗克隆法、計算機預(yù)測法。克隆法可以直接用于鑒定新小RNA,是初期發(fā)掘小RNA的常用方法,不足之處是實驗周期較長,對低表達的小RNA的發(fā)現(xiàn)能力十分有限。計算機預(yù)測法多是針對某一已知的小RNA特征設(shè)計算法,從全基因組或EST數(shù)據(jù)庫中快速發(fā)掘大量潛在的小RNA,一定程度上彌補了克隆法的缺點,然而,預(yù)測的小RNA最終還需要實驗證明,同時計算機預(yù)測法對新類型小RNA的發(fā)掘能力十分有限。隨著第二代高通量測序技術(shù)的問世,小RNA高通量測序(smallRNA-Seq)技術(shù)開始逐漸取代原始的小RNA發(fā)掘法方法,該法具有速度快、成本低、覆蓋度深等多方面的優(yōu)點,對鑒定與發(fā)現(xiàn)生命體內(nèi)的小分子RNA及其功能與機理研究起極大的推動作用。全世界有超過3000種蚊蟲,目前為止僅有岡比亞按蚊、斯氏按蚊、埃及伊蚊、致倦庫蚊以及白紋伊蚊鑒定出miRNA。一些miRNA的文庫和功能分析表明miRNA對蚊蟲的卵巢發(fā)育和吸血后的血液消化具有調(diào)節(jié)作用。病毒感染可以對宿主細胞miRNA的表達水平產(chǎn)生深遠影響,可能與宿主抗病毒機制及病毒入侵后改變細胞內(nèi)環(huán)境有關(guān),雌蚊中miRNA的表達模式會隨著病原體的感染而發(fā)生變化。Hussain等對登革病毒(DENV)編碼的miRNA或病毒小RNA(vsRNAs)的進行了功能研究,他們發(fā)現(xiàn)6個vsRNAs能通過作用于病毒基因組RNA莖環(huán)結(jié)構(gòu)中的5''''和3''''的UTR區(qū),顯著增加病毒復(fù)制。中腸屏障是蚊蟲防止病原體入侵而建立的重要屏障,Alexander等的研究發(fā)現(xiàn)miR-1174僅在伊蚊和按蚊的中腸中表達,且雌蚊吸血后其表達量明顯上調(diào);而當(dāng)miR-1174表達下調(diào)后,蚊子吸血率明顯降低,壽命明顯縮短。作者認(rèn)為:蚊特異性miRNAs,特別是miR-1174具有重要的生物學(xué)意義,它們可能影響人們今后控制蚊蟲的策略。我們對白紋伊蚊不同發(fā)育時期(卵、幼蟲、蛹、雄蚊、雌蚊、吸血后雌蚊)的小RNA進行了深度測序分析。結(jié)果在白紋伊蚊中篩選出119條已知的miRNA基因,確定了15條novelmiRNA基因,其中11條是伊蚊特異的,并且觀察到許多miRNA呈現(xiàn)期特異表達的特點。經(jīng)過實驗驗證,miR-286、miR-2492和miR-1891分別在白紋伊蚊的卵、幼蟲和成蟲期特異高效表達,敲低/敲除這些miRNA會對蚊蟲的生長發(fā)育造成顯著影響。這些研究為新型生物殺蟲劑的研發(fā)提供了靶標(biāo)。我們還對感染登革病毒前后白紋伊蚊的細胞和成蟲的小RNA進行了深度測序分析。結(jié)果在感染登革病毒的白紋伊蚊中找到了10條表達上調(diào)的miRNA和11條表達下調(diào)的miRNA。通過對這些差顯表達miRNA的功能分析,發(fā)現(xiàn)miR-252通過與E蛋白3''''-UTR區(qū)域的結(jié)合,對登革病毒的復(fù)制起到抑制作用;而miR-281則通過與E蛋白5''''-UTR區(qū)域的結(jié)合,對登革病毒的復(fù)制具有促進作用。這些研究為抗登革病毒藥物的設(shè)計和研發(fā)提供了線索。piRNA來源于轉(zhuǎn)座元件、基因間隔區(qū)和一些編碼蛋白質(zhì)基因的3''''UTRs,對維持基因的完整性和穩(wěn)定性有一定作用,但最近的研究證明它在抗病毒免疫中也有較大作用。Schnettler等的研究證明:對蚊蟲細胞感染蟲媒病毒可以引發(fā)piRNA路徑,而敲除piRNA蛋白質(zhì)會使病毒產(chǎn)生增多。Castellano等確定了多個24-30nt的Piwi相互作用RNAs基因組簇,通過比對到轉(zhuǎn)座元件和蛋白質(zhì)編碼基因的3''''UTRs,發(fā)現(xiàn)許多TEs和一些內(nèi)源性基因的3''''UTR產(chǎn)生大量具有piRNA樣特征的29-nt小RNAs峰。此外,來自岡比亞按蚊和黑腹果蠅TEs的正義和反義piRNAs揭示了piRNA序列偏差的新特征。弗吉尼亞理工大學(xué)的研究人員最近在庫蚊中發(fā)現(xiàn)了一種新型的抗病毒途徑,Morazzani等在無dicer-2和無突變的蚊細胞中進行的實驗表明,病毒產(chǎn)生的piRNA樣小RNA可以在病毒產(chǎn)生siRNA的過程中調(diào)節(jié)病毒感染的發(fā)生。同時也表明新的piRNA途徑存在于蚊媒的體細胞中并且可能發(fā)揮著比siRNA途徑更寬泛的的抗病毒作用,顯示出其為強大的免疫系統(tǒng)。因此,理解病毒如何繞開蚊蟲的雙重抗病毒反應(yīng)對于科學(xué)家來說是越來越有趣的挑戰(zhàn)。
4結(jié)語
隨著新型測序技術(shù)和生物信息學(xué)分析技術(shù)的不斷發(fā)展,生物醫(yī)學(xué)研究也迎來了大數(shù)據(jù)分析時代。近年蚊蟲組學(xué)的快速發(fā)展,給其媒介生物學(xué)、入侵?jǐn)U散的機制研究等提供了廣闊的、深遠的大數(shù)據(jù)分析平臺,也必將為蚊蟲的媒介控制和傳播疾病的防制帶來更多的機遇和指引。
作者:吳恙謝李華劉培文李小聰閆桂云陳曉光單位:南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院病原生物學(xué)系