Hvordan bestemmer kmer-tellere hvilken kmer som er 'kanonisk'?

conchoecia

2018-02-04 22:24:36 UTC

view on stackexchange narkive permalink

Når man teller kanoniske kmers, dvs. kmers der både fremover og bakover komplement av en sekvens blir behandlet som identiske, hvordan bestemmer kmer-telleprogrammer hvilken kmer som skal brukes som den kanoniske sekvensen? Fungerer de alle på samme måte?

For å undersøke laget jeg en streng med GAGTGCGGAATACCACTCTT som inneholder alle de 16 mulige 2merne. Jeg brukte deretter kmc for å finne ut hvordan de bestemmer hvilken kmer som brukes. Bare kmers i filtrert kolonnen nedenfor dukket opp. Så det ser ut som KMCs '' kanoniske 'kmers er de som først forekommer alfabetisk.

  ╔════════════════╦═══ ══╦════════════════════╦══════════╗║ Mulige Kmers ║ RC-er ║ RC oppstår tidligere? ║ filtrert ║╠════════════════╬═════╬════════════════════╬══ ════════╣║ TT ║ AA ║ JA ║ TA ║║ TG ║ CA ║ JA ║ GC ║║ TC ║ GA ║ JA ║ GA ║║ TA ║ TA ║ ║ CG ║║ GT ║ AC ║ JA ║ CC ║║ GG ║ CC ║ JA ║ CA ║║ GC ║ GC ║ ║ AT ║║ GA ║ TC ║ ║ AG ║║ CT ║ AG ║ JA ║ AC ║║ CG ║ CG ║ ║ AA ║║ CC ║ GG ║ ║ ║║ CA ║ TG ║ ║ ║║ AT ║ AT ║ ║ ║║ AG ║ CT ║ ║ ║║ AC ║ GT ║ ║ ║║ AA ║ TT ║ ║ ║╚════════════ ════╩═════╩════════════ ════════╩══════════╝

Bruker alle kmer-telleprogrammer de samme kanoniske kmers, og i så fall har du dokumentasjon som forklarer dette? Jeg kunne ikke finne noe i papirene for maneter eller kmc .