Spørsmål:
Enkleste måte å trene strukturell varianttype på?
SmallChess
2018-07-16 17:57:37 UTC
view on stackexchange narkive permalink

I VCF 4.2 kan en strukturell variant (SV) beskrives med nøkkelordet BND i SVTYPE . For eksempel er følgende eksempel en innsetting (fra https://samtools.github.io/hts-specs/VCFv4.2.pdf):

  # CHROM POS ID REF ALT QUAL FILTER INFO2 321682 bnd VT] 13: 123456] AGTNNNNNCAT 6 PASS SVTYPE = BND; MATEID = bnd U13 123456 bnd UC CAGTNNNNNCA [2: 321682 [6 PASS SVTYPE = BND; MATEID = bnd 

Nøkkelordet kan brukes til å beskrive alle SV-hendelser.

Jeg vil finne ut hvordan jeg kan finne ut om en hendelse er en innsetting, sletting, duplisering, inversjon, etc. Algoritmen / programmet vil fortelle meg at eksemplet ovenfor er en innsetting.

Jeg kan ikke finne et verktøy som kan gjøre konverteringen for meg.

PS: Programmet jeg bruker er GRIDSS. Dette programmet vil bare generere BND i SVTYPE-feltet. Det er ikke strengt tatt en feil (BND kan brukes til ethvert SV-arrangement), men det er irriterende i analysen.

hva med å 'bare' bruke attributtet `INFO / SVTYPE`?
@Pierre SVTYPE er BND.
@Pierre Noen SV-programmer, for eksempel GRIDSS, sender bare BND til SVTYPE. Ellers ville jeg ikke vært her og spurt.
fra VCF-spesifikasjonen: `INFO = Verdien skal være en av DEL, INS, DUP, INV, CNV, BND. '. Så BND (break end) er IKKE en INDEL, og IKKE en innsetting.
@Pierre Eksemplet mitt ovenfor tok fra spesifikasjonen.
"Noen SV-programmer som GRIDSS sender bare BND til SVTYPE" åh, skjønner jeg
Kan jeg foreslå at du ganske enkelt ikke bruker GRIDSS og i stedet bruker et verktøy som gir gyldig utdata?
@terdon Hva mener du? GRIDSS er et publisert SV-program. BND er en gyldig VCF-utgang?
Hvis den bruker 'BND' for å indikere en innsetting, følger den ikke VCF-spesifikasjonene, siden 'SVTYPE' for innføring skal være 'INS' og 'BND' bare skal brukes til pause.
En svar:
SmallChess
2018-07-19 10:01:35 UTC
view on stackexchange narkive permalink

GRIDSS forfatter hadde lagt ut sin egen løsning på Github. Koden er:

  simpleEventType <- function (gr) {return (ifelse (seqnames (gr)! = Seqnames (partner (gr)), "ITX", # inter-chromosomosal ifelse ( gr  $ insLen > = abs (gr $  svLen) * 0.7, "INS", ifelse (strand (gr) == strand (partner (gr)), "INV ", ifelse (xor (start (gr) < start (partner (gr)), strand (gr) ==" - ")," DEL "," DUP "))))}  
Kan du utdype dette svaret? Hva er gr? Ser ut som R, hvilket bibliotek skal jeg bruke til dette?


Denne spørsmålet ble automatisk oversatt fra engelsk.Det opprinnelige innholdet er tilgjengelig på stackexchange, som vi takker for cc by-sa 4.0-lisensen den distribueres under.
Loading...