相關(guān)文獻
轉(zhuǎn)錄因子靶基因預(yù)測,不用到處搜了,都在這了
我們在做分子機制時,確定了某些分子比如circ、lnc、或者mRNA時,希望知道他的上游調(diào)控分子是什么,是哪個轉(zhuǎn)錄因子調(diào)控他的表達,需要預(yù)測轉(zhuǎn)錄因子-靶基因調(diào)控關(guān)系?;蛘?,我們確定了一個重要蛋白,要看看他調(diào)控的蛋白是什么,再者我們研究ceRNA機制,我們希望miRNA的靶基因是一個轉(zhuǎn)錄因子,比如Myc,因為轉(zhuǎn)錄因子的改變極容易引起一系列基因的表達變化,進而引起通路變化,輕松導(dǎo)致細胞表型發(fā)生改變。
在與老師討論高通量測序的結(jié)果時,我們不得不去面對一個嚴酷的事實。老師們原以為,做了表達譜篩選實驗,篩選出部分差異基因/lnc/circRNA,然后進行驗證不就可以了嘛。拿到數(shù)據(jù)時會發(fā)現(xiàn)沒那么簡單。
因為,如果您樣品準(zhǔn)備的合適,測序?qū)嶒灢僮饕矝]問題時,您可能會找到幾百個,一兩千個差異基因,腫瘤樣品高達三四千個差異表達基因??吹綌?shù)據(jù)時的老師要蒙了,怎么這么多差異基因/lnc/circRNA,我要挑哪個分子驗證,我要挑哪個分子做機制。哪個分子才是這個處理下的核心分子,關(guān)鍵分子呢?其實想一想,既然觀察到細胞表型(比如增殖、凋亡、遷移)或者組織有明顯的改變,想必中間定不是幾個基因或者一二十個差異基因能改變的了的,恐怕真的要幾百、上千個基因的變化才足以引起細胞/組織可觀察的表型變化吧。
老師問我哪個基因是最重要的,可以用來研究的、說實話,我不知道,該挑哪個分子。我會開始自責(zé),作為一個分析人員,怎么能不會這個問題,收了老師的錢,怎么能不幫他們解決呢,良心何安啊。不久,心情恢復(fù),想想,我可以幫老師做各樣能做的分析,比如各類數(shù)據(jù)庫的挖掘,出各種能出的圖(備注:不額外收費),幾乎隨叫隨到,從不知疲倦。想想有些老師在別的公司受到的非人的待遇,我應(yīng)該可以自我安慰了。想想沒有哪個公司的分析人員能告訴你,挑哪個分子做,就能做出機制。然而,這個問題總不能一直困擾我們。與其抓鬮碰運氣的選一個,不如尋找更多的信息提供一下參考也好嘛。于是,我覺得是不是可以結(jié)合一些數(shù)據(jù)庫進行一下數(shù)據(jù)的整合預(yù)測呢。
今天談轉(zhuǎn)錄因子。轉(zhuǎn)錄因子靶基因預(yù)測最有效的實驗還是ChIP-seq。In brief, 使用轉(zhuǎn)錄因子的抗體,抓取與其可以結(jié)合的DNA片段,通過分析檢測這些DNA片段定位到哪個基因上,即可以推斷,該轉(zhuǎn)錄因子可能調(diào)控哪個基因。
有些網(wǎng)站可以輔助進行預(yù)測,比如http://bioinfo.life.hust.edu.cn/hTFtarget#!/。今天我們介紹的GTRD http://gtrd.biouml.org/數(shù)據(jù)庫。該數(shù)據(jù)庫為俄羅斯某學(xué)者整理,論文發(fā)表于2016年,數(shù)據(jù)持續(xù)更新中。不知道他們是為了發(fā)文章,還是覺得應(yīng)該為科研出份力,但他們做的工作我很喜歡,在SRA、ENCODE、GEO等資源庫收集一切可以下載的ChIP-seq數(shù)據(jù),然后在自己服務(wù)器上跑程序鑒定結(jié)合位點,并將數(shù)據(jù)公開下載。
這個庫主要收集各個模式物種轉(zhuǎn)錄因子。以下是該數(shù)據(jù)庫目前收錄物種、樣品量、轉(zhuǎn)錄因子數(shù)量統(tǒng)計表。
從表中看出人共有7239個ChIP-seq數(shù)據(jù),涉及852個轉(zhuǎn)錄因子(約占已知轉(zhuǎn)錄因子一半)。數(shù)據(jù)量還是很可觀的,而且我相信,您在苦苦尋找的轉(zhuǎn)錄因子或者正在研究的轉(zhuǎn)錄因子很可能就在其中。
該數(shù)據(jù)給出了簡單的網(wǎng)頁搜索,可以查詢轉(zhuǎn)錄因子的靶基因,搜索方式如圖:
然,本人感覺并不好用,于是將其鑒定結(jié)果進行下載,并重新注釋。您可以在后臺回復(fù)相應(yīng)數(shù)字、獲取轉(zhuǎn)錄因子靶基因下載鏈接。直接在對應(yīng)表格中尋找。
該數(shù)據(jù)老師可以直接找到對應(yīng)的轉(zhuǎn)錄因子,去查看涉及到哪些靶基因。需要說明的是轉(zhuǎn)錄因子與靶基因的結(jié)合具有時空動態(tài)性。這里列出的靶基因也是在當(dāng)時的實驗條件下是這樣的,是不是在您的實驗中也發(fā)生這樣的靶基因關(guān)系呢,或許是,或許不是,但別的實驗條件/細胞可以發(fā)生,至少證明這個關(guān)系對理論上是可以的,您的實驗中也很有可能存在這樣的關(guān)系。
回到最初的話題,篩選到大量的差異基因,該如何評估基因的重要性呢。假如您想要確定一個轉(zhuǎn)錄因子,可以在差異基因中篩選差異表達的轉(zhuǎn)錄因子,而后分別預(yù)測他們的靶基因,當(dāng)然靶基因也是有差異表達的,進一步可以預(yù)測這些靶基因涉及到的pathway通路或生物學(xué)過程等,這時我們或許會更能了解,哪個轉(zhuǎn)錄因子在所有差異基因是關(guān)鍵的,地位是重要的,據(jù)此可以挑選出這個重要基因,而后進行后續(xù)機制研究。(看起來簡單,操作很難?找我們就好了。)
那么其他差異基因能否可以依照此辦法進行功能重要性評估呢?But,普通基因沒有這種明顯的靶基因關(guān)系。不容易去尋找他們的靶基因,但問題總要解決的,其他基因的分析我們在后續(xù)討論,有需要可以關(guān)注我們公眾號??!
上海生因生物專業(yè)提供基因組測序、微生物測序、轉(zhuǎn)錄組測序(RNAseq)、外外泌體RNA測序,高通量測序數(shù)據(jù)標(biāo)準(zhǔn)分析、個性化分析,各類圖表繪制,及GEO、TCGA數(shù)據(jù)挖掘服務(wù)。有需要的聯(lián)系我們。
微信掃描二維碼關(guān)注公眾號回復(fù)數(shù)字 “1811141” 獲取轉(zhuǎn)錄因子靶基因預(yù)測列表
其他相關(guān)文獻解讀
文獻解讀:轉(zhuǎn)錄因子→circRNA表達→吸附miRNA→腫瘤基因 2
文獻解讀:cSMARCA5 --> 吸附miR-17-3p/miR-181b-5p --> TIMP3 --> 抑制HCC (IF:14)
文獻解讀:轉(zhuǎn)錄因子 --> circRNA表達 --> 吸附miRNA --> 促進靶基因表達 --> 上皮-間質(zhì)轉(zhuǎn)化
文獻解讀:circRNA翻譯蛋白質(zhì),并抑制腫瘤進展
