Spørsmål:
differensial genuttrykk kompleks design ingen replikater
novicebioinforesearcher
2017-07-25 22:23:52 UTC
view on stackexchange narkive permalink

Vi har en eksperimentell design som vist nedenfor

Hvor vi administrerte medikament ved 0 min for hver musegenotype og tok dem ned med gitte intervaller. wt- og ko-musemodeller ble bare administrert med kjøretøyet som ville være vår negative kontroll.

Utført rnaseq (total rna) truseq strandet protokoll vil gjerne se forskjeller mellom hvert tidspunkt i forhold til kjøretøyet, brukt stjerne justerer for å justere til mm9, htseq for genteller.

  prøvetype tidWT Kjøretøy 30 minKO Kjøretøy 30 minWT Legemiddel 30minKO Medikament 30minWT Legemiddel 1 timeKO Legemiddel 1 timeWT Legemiddel 2 timeKO Legemiddel 2time Vi har ingen replikater og kan derfor ikke bruke noen av de statistiske verktøyene for differensialuttrykk (stilte dette spørsmålet på bioleder hvor Dr. Love selv svarte  lenke til spørsmål som ble stilt) der han foreslo en lineær modell.  

vi lurte på om noen kunne hjelpe oss med noe slikt design (papirer / tidligere utført analyse). Det vi ønsker å se er sammenligning / forskjeller (signifikant) mellom disse gruppene (veh vs 30min, veh vs 1 time, beh vs 2 timer, veh vs 3 timer)

Hva er designet ditt, akkurat? Hva skal vi forstå fra det vage bordet? Hva er tidene? Tiden du administrerte stoffet? Hvor lang tid stoffet måtte handle før det ble gitt en antagonist? Tiden du brukte på å observere det? Hvordan er dette relatert til bioinformatikk? Vennligst [rediger] spørsmålet ditt og forklar hva du gjør og hva du forventer av et godt svar.
Det er lite sannsynlig at du finner noen papirer som gjør dette fordi det ville være vanskelig å få en godkjent hvis den i stor grad var basert på et slikt eksperiment. Jeg må lure på hvorfor du brukte tid / ressurser på dette eksperimentet da du måtte vite at dette kom til å bli et stort problem.
@DevonRyan vi har eksperimentelle (våte laboratorieresultater som støtter) dette, innså at det vil være vanskelig å gå videre med rna seq først etter at jeg la det ut på deseq forum (bioleder), vi er ikke sikre på om dette er en blindvei eller vi kan i det minste se noen grunnleggende forskjeller ved å bruke veldig grunnleggende statistikk
@terdon takk for tilbakemelding jeg har redigert spørsmålet, vennligst gi meg beskjed hvis ytterligere informasjon er nødvendig
Så du administrerte stoffet og drepte musene etter den angitte tiden. Hva så? Utførte du rna seq? Av hva? Hele transkripsjonen? Hva prøver du å vise? Hvilke data har du? Prøver du virkelig å trekke konklusjoner basert på et enkelt individ i hver tilstand?
To svar:
benn
2017-07-26 12:38:17 UTC
view on stackexchange narkive permalink

Selv om det ikke anbefales å bruke ingen replikater, gir de i edgeR-manualen noen råd om hvordan du kan fortsette uten replikatdesign. Se side 21 i brukerens guide. Du kan f.eks. estimere en BCV-verdi. Selvfølgelig er det fortsatt et triks og ikke god statistikk.

Ian Sudbery
2017-07-26 16:42:12 UTC
view on stackexchange narkive permalink

Mike Love har rett. Hvis svaret du leter etter, er lineært når det gjelder endring per minutt, vil den mest produktive tilnærmingen trolig passe en lineær modell. Du kan få noe ut av dette fordi forskjellen mellom påfølgende tidspunkter representerer flere målinger av endringshastigheten over tid. Det største problemet er at tidspunktene ikke er uavhengige. Du må passe på en modell som estimerer den hastigheten for både WT og KO og deretter teste forskjellen i priser.

Jeg ser tre veier fremover, i alle tilfeller vil du teste den siste termen i modellen ~ tid + genotype + tid: genotype

  1. Ideelt sett ønsker du å tilpasse en negativ binomial lineær modell til lesetallene. Men det kommer til å bli vanskelig, ettersom du ikke har noen replikater som du kan vurdere spredningen fra. Dermed kan du generere leseteller ved hjelp av favorittrørledningen din (STAR ​​+ featureCounts / Salmon / Kallisto) og ta tilnærmingen i edgeR-guiden bemerket av b.nota, og bruk deretter edgeR for å teste den monterte modellen .

  2. Du kan bruke noe som laks eller kallisto til å estimere TPM-ene antar at logg-TPM-er normalt distribueres og modellere dem med vanlig lm i R, ved å bruke noe som kost for å modellere hvert gen separat. En opplæring av David Robinson, forfatteren av kost om å gjøre denne typen ting, finner du her

  3. Du kan bruk laks- eller Kallisto-bootstraps for å estimere teknisk variasjon (men ikke biologisk), og da mistenker jeg at du kan bruke Sleuth til å passe modellen.

Uansett skal disse resultatene behandles med skepsis og mest behandles som hypotesegenererende. Du kan finne gener du vil gå tilbake og bekrefte, og du kan se noen mønstre av interesse hvis du ser på noen berikelser osv. Som du deretter kan designe eksperimenter for å teste.

takk for informasjonen er det en veiledning for lm og kost metoder du har nevnt vil hjelpe meg å forstå det bedre, da R er noe jeg nettopp har begynt å bruke, setter pris på det.
Jeg har lagt til en lenke til en kostesopplæring.
det er virkelig en fantastisk ressurs mange takk !! (Jeg ville ikke ha funnet dette), og hold alle oppdatert forhåpentligvis kan jeg hente på å bruke R og finne ut av dette i løpet av et par dager.


Denne spørsmålet ble automatisk oversatt fra engelsk.Det opprinnelige innholdet er tilgjengelig på stackexchange, som vi takker for cc by-sa 3.0-lisensen den distribueres under.
Loading...