Generelt er det to alternativer for å identifisere mål for transkripsjonsfaktorer: eksperimentell (ChIP-seq) og sekvensbasert prediksjon.
TF-binding fra eksperimentelle data
The are flere prosjekter som produserer bindende data om transkripsjonsfaktorer og kvantifiserer toppene deres gjennom genomet. Fordelen her er at du vet at binding faktisk skjer, i motsetning til motivspådommer. Men du trenger de tilsvarende eksperimentene.
Du nevnte allerede KODER, som sannsynligvis er den største produsenten av slike data. NIHs veikart Epigenomics er en annen, men det fokuserer mindre på TF.
Hvis du har en genliste og vil vite hvilken transkripsjonsfaktor som sannsynligvis var involvert, kan du gjøre en anrikningstest av genet ditt i kjente TF-mål. ChEA (ChIP Enrichment Analysis) -databasen gjør dette.
Prediksjon ved hjelp av motiver
En annen mulighet er å se på bindende motiver og se om genlisten din er beriket med disse. Disse vil imidlertid være inaktive i en gitt vevs- eller celletype hvis kromatinet er pakket eller metyleringstilstanden til promotoren er ugunstig.
Eksempler på disse er JASPAR og TRANSFAC -databaser, eller MSigDB-motivgenet (som burger nevnt). Du kan også spørre om disse funksjonene ved hjelp av Ensembl-genomdatabasen ( BioMart, REST).
Beregning av berikelse i gensett
Mest sannsynlig er en analyse du vil utføre, å beregne berikelsen i genlisten din, f.eks som du fikk fra differensialuttrykk under to forhold.
Den mest praktiske måten er å bruke Enrichr-plattformen, som er en webside som godtar en genliste og vil beregne berikelse i ChEA, JASPAR, TRANSFAC, etc. Du kan også laste ned gensettene deres.