Spørsmål:
Klassifisering av prøver basert på markørgenekspresjon
GWW
2017-05-24 20:41:28 UTC
view on stackexchange narkive permalink

Jeg har noen sett med markørgener som jeg kan klassifisere RNA-seq-prøver ved hjelp av semi-overvåket gruppering. Jeg vil gjerne automatisere prosessen, men jeg sliter med å finne den ideelle algoritmen som kan generere en slags poengsum for markørgen sett fra en gitt prøve.

Jeg antar at dette er en standardanalyse i mange grupper, men jeg er ikke sikker på hvilken eller hvilke metoder som gir gode resultater i praksis.

Det var nylig et lignende spørsmål om Biostars som ikke ga svar: https://www.biostars.org/p/239228/
Jeg er overrasket. Det virker som et så viktig problem. Spesielt når scRNA-seq får popularitet.
Siden du nevnte scRNA-seq-data, kan du være interessert i [Buettner * & al. *] (Https://www.nature.com/nbt/journal/v33/n2/full/nbt.3102.html): “ Beregningsanalyse av celle-til-celle-heterogenitet i encellede RNA-sekvenseringsdata avslører skjulte delpopulasjoner av celler ”. Det tar ikke helt opp problemet ditt, men det viser noen av problemene knyttet til å identifisere cellepopulasjoner i spesielt scRNA-seq, som i stor grad glattes ut i bulk RNA-seq.
En svar:
Peter Humburg
2017-05-25 04:32:41 UTC
view on stackexchange narkive permalink

Jeg vil vurdere å bruke genuttrykkssignaturer til å klassifisere prøver (spesielt kreftundertyper, men de samme prinsippene gjelder andre problemer av denne typen), et av de klassiske problemene med bioinformatikk. Ganske mye arbeid er gjort med metoder for å utlede gensett som gir god klassifiseringsytelse. Dette er litt annerledes enn problemet ditt, siden du allerede har en gensignatur, men det kan fremdeles være nyttig.

Disse metodene passer vanligvis til en modell som velger et (lite) antall gener fra eksempeldata fra hele genomet som skiller mellom de aktuelle celletyper / tilstander, dvs. at de får en gensignatur. Den resulterende modellen tillater deretter klassifisering av nye prøver. Jeg har hatt suksess med å bruke GeneRave til dette formålet (men vær oppmerksom på at dette var designet for mikroarraydata, jeg har ikke brukt det med RNA-seq-data og vet ikke hvor godt det holder der oppe ). En nyere artikkel om dette problemet finner du her.

Så hvordan hjelper det deg? Et alternativ vil være å tilpasse en av disse klassifiseringsmidlene til genuttrykkingsdata for genene du allerede kjenner for å få en modell som deretter automatisk kan brukes på nye prøver.

Det er veldig nyttig, tusen takk. Jeg vil prøve dem eller i det minste se hvordan jeg kan tilpasse metodene deres.
Ved å følge @Peter Humbergs advarsel om at GeneRave er designet for microarray-data, kan du "voom" transformere tellingen din ved å bruke "limma" for å gjøre dem * microarray-like *.
Når jeg trenger å sammenligne cDNASeq-uttrykk med microarray, bruker jeg en transkripsjonslengdens normalisering brukt på DESeqs VST-transformasjon (som jeg kaller 'VSTPk'). Flere detaljer om det finner du i metodedelen i Th2 RNASeq-papiret: http: //dx.doi.org/10.1084/jem.20160470


Denne spørsmålet ble automatisk oversatt fra engelsk.Det opprinnelige innholdet er tilgjengelig på stackexchange, som vi takker for cc by-sa 3.0-lisensen den distribueres under.
Loading...