
廣州市天河區(qū)黃埔大道中124號(hào)2705室
電話:020-29031124
手機(jī):18102256923
Email:[email protected]
Fax:020-85625352
QQ:2913120624
1 miRNA生物信息學(xué)預(yù)測(cè)

圖1 生物信息學(xué)在miRNA研究中的應(yīng)用
當(dāng)開(kāi)始研究一基因是否為一個(gè)miRNA調(diào)控的靶基因時(shí),可以用不同的生物信息學(xué)計(jì)算方法來(lái)分析每個(gè)序列(如mRNA的3'-UTR區(qū)序列),這些計(jì)算方法采用不同的參數(shù)來(lái)預(yù)測(cè)一個(gè)給定的靶mRNA內(nèi)具功能性miRNA結(jié)合位點(diǎn)的可能性。由于每種計(jì)算方法的有效性不同,下面3種計(jì)算方法應(yīng)該被用來(lái)預(yù)測(cè)miRNA結(jié)合位點(diǎn):miRanda、TargetScan和PicTar.這3種計(jì)算方法都允許研究者輸入一個(gè)基因符號(hào),這些計(jì)算方法將計(jì)算此基因內(nèi)所有預(yù)測(cè)的miRNA結(jié)合位點(diǎn)。此外,這些計(jì)算方法可測(cè)定一個(gè)給定的miRNA所有的靶mRNA.因?yàn)椴煌挠?jì)算方法會(huì)預(yù)測(cè)出不同的miRNA結(jié)合位點(diǎn),所以同時(shí)使用多種計(jì)算方法進(jìn)行預(yù)測(cè)非常必要。值得注意的是,盡管miRNA結(jié)合位點(diǎn)在不同物種間的保守性是各種不同計(jì)算方法的組成部分,但并不是一個(gè)功能性位點(diǎn)所必需的。由于不同計(jì)算方法預(yù)測(cè)的結(jié)果存在很大的差異,如何確定哪些預(yù)測(cè)的結(jié)合位點(diǎn)需要進(jìn)一步的實(shí)驗(yàn)驗(yàn)證成為研究者要面臨的一個(gè)難題。作者認(rèn)為至少這3種計(jì)算方法中的2種計(jì)算方法均預(yù)測(cè)到的miRNA結(jié)合位點(diǎn),有必要進(jìn)一步用實(shí)驗(yàn)驗(yàn)證。
因?yàn)楹芏嘟?jīng)種子序列匹配預(yù)測(cè)的miRNA靶經(jīng)體內(nèi)驗(yàn)證實(shí)驗(yàn)證實(shí)并不是真的miRNA靶,為了起始一步減少預(yù)測(cè)到的抑制一給定的靶mRNA表達(dá)的miRNA的數(shù)量,進(jìn)一步的程序分析是有必要的。結(jié)構(gòu)特征控制著miRNA/mRNA間的相互作用的觀點(diǎn)已被越來(lái)越多的人所接受。例如,一個(gè)RNA分子的大部分結(jié)構(gòu)是高度復(fù)雜性的,只有特定的單鏈區(qū)域允許miRNAs接近并與互補(bǔ)位點(diǎn)結(jié)合。因此,復(fù)雜的RNA二級(jí)結(jié)構(gòu)可能阻止miRNA/mRNA的相互作用。最近有研究證實(shí),絕大部分已證實(shí)的靶的一個(gè)共同特征是優(yōu)先與基于熱動(dòng)力學(xué)在RNA分子中容易接近且沒(méi)有復(fù)雜二級(jí)結(jié)構(gòu)的3’-UTR區(qū)中的位點(diǎn)。由于RNA可接近性可能是靶識(shí)別的一個(gè)關(guān)鍵特征,所以有必要采用mFold軟件測(cè)定預(yù)測(cè)到的miRNA結(jié)合位點(diǎn)5’端和3’端各70個(gè)核苷酸的自由能,當(dāng)其低于平均隨機(jī)自由能時(shí)提示此位點(diǎn)允許miRNA接近并結(jié)合[20].這些允許miRNA接近并結(jié)合起來(lái)的位點(diǎn),有必要進(jìn)一步用實(shí)驗(yàn)進(jìn)行驗(yàn)證。
在不同物種中成熟miRNA均是從具有莖環(huán)狀二級(jí)結(jié)構(gòu)的前體加工而來(lái),具有較大的序列同源性??寺〉降?/span>miRNA序列通過(guò)檢索基因組數(shù)據(jù)庫(kù)找到在基因組中的位置,在和周?chē)蚪M序列比較中發(fā)現(xiàn)他們同樣具有相似的前體結(jié)構(gòu),多位于編碼基因間或內(nèi)含子反向重復(fù)區(qū)域。一些miRNA基因在進(jìn)化上具有高度保守性,此為生物信息學(xué)篩選的基礎(chǔ)。該方法根據(jù)比較基因組學(xué)原理,并結(jié)合生物信息軟件在已測(cè)序基因組中進(jìn)行搜索比對(duì),根據(jù)同源性的高低再進(jìn)行RNA二級(jí)結(jié)構(gòu)預(yù)測(cè),將符合條件的候選miRNA與已經(jīng)通過(guò)試驗(yàn)鑒定的miRNA分子進(jìn)行比較分析,最終確定該物種miRNA的分步及數(shù)量。目前國(guó)際上較為普遍使用的兩個(gè)計(jì)算機(jī)分析工具是miRseeker和miRscan,前者已用于果蠅及昆蟲(chóng)基因組候選基因的系統(tǒng)分析,后者則用于線蟲(chóng)和脊椎動(dòng)物候選基因的分析。這兩個(gè)工具已經(jīng)成功鑒定出了大量的miRNA基因并通過(guò)了實(shí)驗(yàn)證實(shí)。由于miRseeker和miRscan的高靈敏度,它們已用于人類(lèi)miRNA基因的尋找。由于該方法只能用于已完成基因組測(cè)序的物種,而那些未完成測(cè)序的物種就無(wú)能為力,而且由于miRNA前體長(zhǎng)度的可變性,故用計(jì)算機(jī)方法尋找新基因具有一定的遺漏性,所以目前大多數(shù)實(shí)驗(yàn)室將計(jì)算機(jī)分析與實(shí)驗(yàn)方法結(jié)合使用,使得miRNA的發(fā)現(xiàn)量成幾何級(jí)數(shù)增長(zhǎng)。目前日益發(fā)展的微陣列技術(shù)也在篩選miRNA基因方面顯示了極大的潛力。
隨著疾病特異性的miRNAs不斷被鑒定,對(duì)感興趣的疾病通路中的新靶基因進(jìn)行驗(yàn)證可能催生新的治療策略。因此,能夠鑒定和驗(yàn)證miRNA/mRNA靶配對(duì)具有極其重要的意義。盡管生物信息學(xué)方法和自由能分析并不完美,但可使作者能夠?qū)ν茰y(cè)的miRNA/mRNA靶配對(duì)進(jìn)行鑒定。一旦生物信息學(xué)方法預(yù)測(cè)成功,可以通過(guò)以下4條標(biāo)準(zhǔn)驗(yàn)證miRNA/mRNA靶配對(duì)的真實(shí)性。(1)miRNA/mRNA靶相互作用得到驗(yàn)證。(2)miRNA/mRNA共表達(dá)。(3)給定miRNA對(duì)其蛋白表達(dá)有可預(yù)測(cè)的影響。即用此miRNA的類(lèi)似物可減少靶基因表達(dá)水平,而用此miRNA特異性抑制劑可增加靶基因的表達(dá)水平。(4)miRNA介導(dǎo)靶基因表達(dá)的調(diào)控導(dǎo)致相應(yīng)的生物學(xué)功能的改變。
2 LncRNA的生物信息學(xué)預(yù)測(cè)
對(duì)lncRNA進(jìn)行鑒定時(shí),采取的策略是收集不同類(lèi)型的數(shù)據(jù)(包括polyA RNA sequencing、nonpolyA RNA sequencing、表觀遺傳信號(hào)值、編碼可能性、保守性和RNA結(jié)構(gòu)等),并對(duì)其進(jìn)行分析。例如CDS的RNA-seqpolyA的表達(dá)值比較高,而ncRNA的RNA-seqnon-polyA表達(dá)值比較高。通過(guò)對(duì)不同類(lèi)型數(shù)據(jù)的整合,還可以進(jìn)一步得到不同類(lèi)型基因元素的網(wǎng)絡(luò)調(diào)控關(guān)系。
對(duì)lncRNA進(jìn)行綜合分析的一般流程如下:(1)將基因組劃分成小的單位(bin),根據(jù)Gencode的注釋信息對(duì)每個(gè)bin進(jìn)行注釋?zhuān)唬?/span>2)分別計(jì)算每個(gè)bin的特征值,這些特征值包括序列保守性、結(jié)構(gòu)穩(wěn)定性、RNA表達(dá)值、組蛋白修飾、轉(zhuǎn)錄因子結(jié)合等;(3)利用機(jī)器學(xué)習(xí)的模型,將lncRNA與其他基因類(lèi)別區(qū)分開(kāi),并且對(duì)新的lncRNA進(jìn)行預(yù)測(cè)。

圖2 利用數(shù)據(jù)整合對(duì)lncRNA進(jìn)行鑒定

圖3 lncRNA綜合分析方法流程示例
有的時(shí)候我們的專(zhuān)業(yè)知識(shí)不足以完成分析和預(yù)測(cè)。尤其在面對(duì)高通量數(shù)據(jù)時(shí),從中挖掘有用的信息尤為關(guān)鍵。這時(shí)可以用到機(jī)器學(xué)習(xí)(machinelearning)的方法,令機(jī)器自動(dòng)分析數(shù)據(jù),比如特征提取或是分類(lèi)。機(jī)器學(xué)習(xí)應(yīng)用在生物信息學(xué)主要有兩大分支,即監(jiān)督學(xué)習(xí)(supervisedlearning)和非監(jiān)督學(xué)習(xí)(unsupervisedlearning)。在監(jiān)督學(xué)習(xí)問(wèn)題中,每個(gè)數(shù)據(jù)擁有一個(gè)對(duì)應(yīng)標(biāo)簽,我們希望通過(guò)數(shù)據(jù)建立一個(gè)模型,根據(jù)數(shù)據(jù)預(yù)測(cè)標(biāo)簽。傳統(tǒng)的監(jiān)督學(xué)習(xí)方法包括線性判別分析(LDA)、決策樹(shù)(decisiontree)、最近鄰法(nearestneighbor)和神經(jīng)網(wǎng)絡(luò)(neuralnetwork)。20世紀(jì)90年代后,誕生了一批很有影響力的工作,包括支持向量機(jī)(SVM)、Adaboosting和隨機(jī)森林(randomforest),相比于傳統(tǒng)的方法,上述方法更好地處理了過(guò)擬合(overfitting)的問(wèn)題,從而在實(shí)際應(yīng)用中有很好的預(yù)測(cè)效果。
LncRNA研究是基因組時(shí)代重要的科學(xué)前沿,因?yàn)樗锌赡芙沂疽粋€(gè)全新的由RNA介導(dǎo)的遺傳信息表達(dá)調(diào)控網(wǎng)絡(luò),從不同于蛋白質(zhì)編碼基因的角度來(lái)注釋和闡明基因組的結(jié)構(gòu)與功能,并為人類(lèi)的疾病研究和治療提供新的思路和方法。同時(shí),新一代測(cè)序技術(shù)的發(fā)展也為鑒定lncRNA的計(jì)算機(jī)方法提供了強(qiáng)大的支持。以下是整理的長(zhǎng)非編碼RNA(lncRNA,lincRNA)數(shù)據(jù)庫(kù)資源列表(按字母排序)。國(guó)內(nèi)外長(zhǎng)非編碼RNA的研究剛剛興起,希望這資源對(duì)國(guó)內(nèi)的非編碼RNA的研究者有所幫助。
(1) ChIPBase:提供長(zhǎng)鏈非編碼RNA的表達(dá)圖譜和轉(zhuǎn)錄調(diào)控的全面鑒定和注釋。整合了高通量的RNA-seq鑒定的lncRNA及其表達(dá)圖譜和ChIP-Seq實(shí)驗(yàn)技術(shù)鑒定的轉(zhuǎn)錄因子結(jié)合位點(diǎn)。
網(wǎng)站:http://deepbase.sysu.edu.cn/chipbase/
更新:2012年11月
(2)LNCipedia:對(duì)人類(lèi)的長(zhǎng)鏈非編碼RNA的序列和結(jié)構(gòu)全面的注釋。
網(wǎng)站:http://www.lncipedia.org
更新:2012年7月
(3)lncRNAdb:提供有生物學(xué)功能的長(zhǎng)鏈非編碼RNA的全面注釋。這是長(zhǎng)鏈非編碼RNA研究領(lǐng)域的大牛John mattick實(shí)驗(yàn)室構(gòu)建的網(wǎng)站。
網(wǎng)站:http://www.lncrnadb.org/
更新:2011年7月
(4)LncRNADisease:提供了文獻(xiàn)報(bào)道的疾病相關(guān)的長(zhǎng)鏈非編碼RNA的注釋。
網(wǎng)站:http://cmbi.bjmu.edu.cn/lncrnadisease
更新:2012年7月
(5)NONCODE:提供對(duì)長(zhǎng)鏈非編碼RNA的全面注釋?zhuān)ū磉_(dá)和該團(tuán)隊(duì)開(kāi)發(fā)的ncFANs計(jì)算機(jī)軟件預(yù)測(cè)的lncRNA功能。這是非編碼RNA研究的知名數(shù)據(jù)庫(kù),已經(jīng)更新到第三版。
網(wǎng)站:http://www.noncode.org
更新:2012年1月
(6)NRED: 提供人和小鼠的長(zhǎng)鏈非編碼RNA在芯片數(shù)據(jù)的表達(dá)信息。這也是John mattick實(shí)驗(yàn)室構(gòu)建的網(wǎng)站。
網(wǎng)站:http://jsm-research.imb.uq.edu.au/nred/
更新: 2009年
- 1 . miRNA的概述
- 2 . lncRNA的概述
- 3 . miRNA與lncRNA研究策略
- 4 . miRNA與lncRNA研究實(shí)驗(yàn)
- 4.1. RNA 結(jié)合蛋白免疫沉淀技術(shù)(RIP)Model Figures
- 4.2. RNA結(jié)合蛋白免疫沉淀技術(shù)(RIP)實(shí)驗(yàn)流程
- 4.3. RNA結(jié)合蛋白免疫沉淀技術(shù)(RIP)實(shí)驗(yàn)常見(jiàn)問(wèn)題
- 4.4. RNA pull - down Model Figures
- 4.5. RNA pull- down實(shí)驗(yàn)流程
- 4.6. RNA pull- down實(shí)驗(yàn)常見(jiàn)問(wèn)題
- 4.7. 熒光素酶檢測(cè)技術(shù)(Luciferase)Model Figures
- 4.8. 熒光素酶檢測(cè)技術(shù)(Luciferase)實(shí)驗(yàn)流程
- 4.9. 熒光素酶檢測(cè)技術(shù)(Luciferase)實(shí)驗(yàn)常見(jiàn)問(wèn)題
