基因功能富集分析已經(jīng)成為生物信息學(xué)中幾乎每篇文章的必備套路。
差異表達(dá)得到的顯著的基因做一個(gè)基因功能富集分析,看看是否富集在一些感興趣的功能上;共表達(dá)分析得到的基因模塊,做一個(gè)基因功能富集分析,看看這個(gè)模塊主要跟哪些功能相關(guān);相關(guān)分析得到的候選基因,做一個(gè)基因功能富集分析,看看這些與性狀相關(guān)的基因的有一些什么功能。
此外基因功能富集分析還可以用來(lái)幫助篩選基因,確定未知功能的基因簇的潛在功能等作用。
今天就給大家安利一個(gè)好用的基因功能富集分析網(wǎng)站 WebGestalt 。
相比應(yīng)用較為廣泛的 DAVID (https://david.ncifcrf.gov/ )WebGestalt 具有以下優(yōu)勢(shì):
1. 結(jié)果可視化更漂亮,比如可以得到 GO 注釋的有向無(wú)環(huán)圖,直接放在文章中,高大上又直觀;疾病注釋的結(jié)構(gòu)圖等;
2. 操作更方便,點(diǎn)一點(diǎn)鼠標(biāo),就可以下載下來(lái)整理好的數(shù)據(jù),而 DAVID 里面下載出來(lái)的東西還需要轉(zhuǎn)化之后用其他的軟件進(jìn)行繪圖,甚是麻煩;
3. 輸入更優(yōu)化,表現(xiàn)在對(duì)輸入的 gene symbol 數(shù)目沒(méi)有限制,DAVID 的數(shù)據(jù)庫(kù)目前不能接受大于 3 000 個(gè) gene symbol 的輸入,基因數(shù)目一大就麻煩,還需要輸入幾次,還能夠識(shí)別的輸入類型更多樣;
4. 2017 年的更新版本還嵌入了第二代的功能富集分析方法 GSEA,拓?fù)渚W(wǎng)絡(luò)分析算法等。
接下來(lái)是手把手進(jìn)行一次功能富集分析的操作教程,廢話不多說(shuō),上圖。
01
打開(kāi)網(wǎng)站
界面介樣 ↓
02
選擇目標(biāo)物種
目前 WebGestalt 網(wǎng)站支持 12 個(gè)不同的物種,具體包括 athaliana(擬南芥), btaurus(牛), celegans(線蟲(chóng)), cfamiliaris(狗), dmelangaster(黑腹果蠅),drerlo(斑馬魚(yú)), ggallus(原雞), hsapiens(人類), mmusculus(小鼠), morvegicus(褐鼠),scerevisiae(釀酒酵母), sscrofa(野豬)。
03
選擇要使用的方法
2017 年 WebGestalt 進(jìn)行了更新后,可以進(jìn)行 overrepresentation enrichment analysis(ORA),Gene Set Enrichment Analysis(GSEA)和 Network Topology based analysis(NTA),其中 ORA 即我們常說(shuō)的一代的功能富集分析,基于超幾何分布的思想,進(jìn)行感興趣的基因列表和參考總集合的富集分析,也是今天我們主要操作的內(nèi)容。
04
選擇進(jìn)行功能富集分析的數(shù)據(jù)庫(kù)
在 ORA 的方法下,可以進(jìn)行 gene ontology 基因本體即 GO 分析,pathway 通路分析包括 KEGG pathway,Wiki pathway, pathway common;network 網(wǎng)絡(luò)分析包括共表達(dá)分析,PPI 分析,micoRNA 靶基因分析,TF 的靶基因分析;disease 疾病的候選基因富集分析包括 DisgeNET 和 PharmGKB 數(shù)據(jù)庫(kù)提供的數(shù)據(jù);phenotype 表型分析包括 Human Phenotype Ontology 和 Mammalian Phenotype Ontology 的數(shù)據(jù);
durg 藥物靶標(biāo)的富集分析等。
05
輸入基因列表
1. 選擇上傳的基因 ID 類型:
目前 WebGestalt 可以識(shí)別 324 中 ID 類型,你想要的都在這里 ^_^
2. 輸入 ID
輸入方式,可以直接復(fù)制粘貼,基因之間以換行符間隔,也可以直接上傳文件。
06
選擇參考集
根據(jù)自己的需求不同,選擇上傳參考集,或者選擇已經(jīng)有的參考集。
這個(gè)時(shí)候,你就可以 Submit 啦……
結(jié)果是介樣的↓,點(diǎn)擊 Result Download 即可下載所有的結(jié)果啦。
這個(gè)鬼畜的模塊,其實(shí)就是 GO 的有向無(wú)環(huán)圖,可以把 GO term 之間的關(guān)系展現(xiàn)處理,現(xiàn)在網(wǎng)站用 Java Script 進(jìn)行了在線交互,當(dāng)你把鼠標(biāo)放在上面的時(shí)候,可以看到每個(gè)里面的詳細(xì)參數(shù)。
另外啰嗦兩句在 advanced parameters 里面的參數(shù)設(shè)置問(wèn)題,簡(jiǎn)單說(shuō)就是利用統(tǒng)計(jì)值進(jìn)行篩選的參數(shù),這在結(jié)果試圖也有體現(xiàn),詳解如下:
好了,你也快去試一試吧!
我們長(zhǎng)期為科研用戶提供前沿資訊、實(shí)驗(yàn)方法、選品推薦等服務(wù),并且組建了 70 多個(gè)不同領(lǐng)域的專業(yè)交流群,覆蓋PCR、細(xì)胞實(shí)驗(yàn)、蛋白研究、神經(jīng)科學(xué)、腫瘤免疫、基因編輯、外泌體、類器官等領(lǐng)域,定期分享實(shí)驗(yàn)干貨、文獻(xiàn)解讀等活動(dòng)。
添加實(shí)驗(yàn)菌企微,回復(fù)【】中的序號(hào),即可領(lǐng)取對(duì)應(yīng)的資料包哦~
【2401】論文寫(xiě)作干貨資料(100 頁(yè))
【2402】國(guó)內(nèi)重點(diǎn)實(shí)驗(yàn)室分子生物學(xué)實(shí)驗(yàn)方法匯總(60 頁(yè))
【2403】2024 最新最全影響因子(20000+ 期刊目錄)
【2404】免疫學(xué)信號(hào)通路手冊(cè)
【2405】PCR 實(shí)驗(yàn) protocol 匯總
【2406】免疫熒光實(shí)驗(yàn) protocol 合集
【2407】細(xì)胞培養(yǎng)手冊(cè)
【2408】蛋白純化實(shí)驗(yàn)手冊(cè)
【2501】染色體分析方法匯總
【2502】國(guó)自然中標(biāo)標(biāo)書(shū)模板
【2503】WB 實(shí)驗(yàn)詳解及常見(jiàn)問(wèn)題解答
【2504】DeepSeek 論文寫(xiě)作常用口令
【2505】中國(guó)科學(xué)院期刊分區(qū)表(2025 年最新版)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.