Spørsmål:
samtools mpileup hopper lese
aerijman
2019-08-22 05:51:18 UTC
view on stackexchange narkive permalink

Jeg kjører kommandoen:

  samtools mpileup -O -s -q20-B -Q20 -f hg19.fa -r chr1: 569929-569931 myFile.bam  

og få:

  chr1 569929 G 7 ... ,,., EEEEEEE NTTVTTU 53,48,42,60,30,29,27chr1 569930 C 6 .. .,., EEAEEE NTTTTU 54,49,43,31,30,28chr1 569931 G 6 ...,., EEEEEE NTTTTU 55,50,44,32,31,29  

Jeg er interessert i posisjon 569930 .

Jeg inspiserer bam med:

  samtools view myFile.bam chr1: 569929-569931  

og jeg ser:

  NS500355: NS500355: HHYN5BGXB: 2: 21 311: 2303: 9255 99 chr1 569869 0 76M = 569900 107 CTCCATAACGCTCCTCATACTAGGCCTACTAACCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGA AAAAAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE<EEEEEEEAEEEEEEE NM: i: 2 MD: Z: 5C3C66 MC: Z: 76M AS: i: 66 XS: i: 71 RG: Z: ../ H2O XA: Z: chrM, + 9321,76M, 1; NS500355: NS500355: HHYN5BGXB: 4: 22603 : 25857: 2799 99 chr1 569877 45 76M = 569896 95 CGCTCCTCATACTA GGCCTACTAACCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCAC AAAAAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE NM: i: 1 MD: Z: 1C74 MC: Z: 74: 7: 6: NS500355: HHYN5BGXB: 1: 12105: 11868: 12011 99 chr1 569882 51 76M = 569900 94 CTCATACTAGGCCTACTAACCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACC / AAAAEEEEEAEEEEEEEEEEEEEEEEEEEEEAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEAEEEEEA NM: i: 0 MD: Z: 76 MC: Z: 76M AS: i: 76 XS: i: 71 RG: Z : ../ H2O XA: Z: chrM, + 9334,76M, 1; NS500355: NS500355: HHYN5BGXB: 2: 13301: 2681: 6114 99 chr1 569888 9 76M = 569952 140 CTAGGCATACTAACCAACACACACACACATATACCAAGACAGACAGACA // EEAEEE / E / EEEE ///// A / EE / EE / EE / E // EE / EEEE / E / AEA #### NM: i: 4 MD: Z: 6C19C15C29G3 MC: Z: 76M AS : i: 57 XS: i: 52 RG: Z: ../ H2O XA: Z: chrM, + 9340,76M, 5;
NS500355: NS500355: HHYN5BGXB: 2: 23 110: 10 125: 9334 99 569888 51 chr1 76M = 569904 92 CTAGGCCTACTAACCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCC AAA / AEE6EEEE6E /// E / A / AAE / E / AEEEEEEE / EE / EEEAEEEEAEE // EEEEEEAEEEAEEAE / AEE / AEE< NM: i: 0 MD: Z: 76 MC: Z: 76M AS: i: 76 XS: i: 71 RG: Z: ../ H2O XA: Z: chrM, + 9340,76M, 1; NS500355: NS500355: HHYN5BGXB: 1: 13209: 10692: 11045 83 chr1 569888 53 18S58M = 569888-58 CGTGTGCTCTTCCGATCTCTAGGCCTACTAACCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGAG EE<A / EE // E //E // E //E // E //E //E / / EE A / E / E // AEAEEEEE6A6AAA NM: i: 0 MD: Z: 58 MC: Z: 59M17S AS: i: 58 XS: i: 53 RG: Z: ../ H2O XA: Z: chrM, -9340, 18S58M, 1; NS500355: NS500355: HHYN5BGXB: 1: 21304: 26480: 15673 569 890 11 83 chr1 76M = 569 796 -170 AGGCCTACTAACCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCAC AEEEEEEEAAEEEEEEEEEEEE / EEEEEEEEEEAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEAAAAA NM: i: 0 MD: Z: 76 MC: Z: 76M AS: i: 76 XS: i: 71 RG: Z: ../ H2O XA: Z: CHRM -9342,76M, 1; NS500355: NS500355: HHYN5BGXB: 4: 11 602: 21 237: 3028 83 569900 51 chr1 76M = 569900 -76 ACCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCACCACACACCAC EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEAAAAA NM: i: 0 MD: Z: 76 MC: Z : 76M AS: i: 76 XS: i: 71 RG: Z: ../ H2O XA: Z: chrM, -9352,76M, 1; NS500355: NS500355: HHYN5BGXB: 3: 13504: 4369: 8812 99 chr 569901 51 76M = 569901 76 CCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCACCACACACCACC AAAAAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE6EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE NM: i: 0 MD: Z: 76 MC: Z: 76M AS: i: 76 XS: i: 71 RG: Z: ../ H2O XA: Z: CHRM + 9353,76M, 1;
NS500355: NS500355: HHYN5BGXB: 2: 11203: 19774: 18704 99 chr1 569904 11 76M = 569952 124 ACACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCACCACACACCACCTGT 6AAAAEEEEEEEEEEEEEAEEEEEEEEEEEEEEEE6EEEEAEEEAEEEEEEEEEEEEEEEEEEAE / E6EEAEEEEA NM: i: 0 MD: Z: 76 MC: Z: 76M AS: i: 76 XS: i: 71 RG: Z: ../ H2O XA: Z: CHRM + 9356,76M, 1; NS500355: NS500355: HHYN5BGXB: 2: 11 309: 13 954: 17 567 569 905 11 99 chr1 76M = 569972 143 CACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCACCACACACCACCTGTC AAAAAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEAEEEEEEEEEEE NM: i: 0 MD : Z: 76 MC: Z: 76M AS: i: 76 XS: i: 71 RG: Z: ../ H2O XA: Z: chrM, + 9357.76M, 1; NS500355: NS500355: HHYN5BGXB: 1: 21202: 13 252: 14 049 569 905 11 99 chr1 76M = 569927 98 CACACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCACCACACACCACCTGTC AAAAAEE6EEEEEEEEEEEEEAEEEEEEEEEEEEEEEEEEE6EEEEEEEEEEEEEEEEE / EEEE<EEEEEEEEEEE NM: i: 0 MD: Z: 76 MC: Z: 76M AS: i: 76 XS: i: 71 RG: Z: ../ H2O XA: Z: chrM, + 9357,76M, 1 ; NS500355: NS500355: HHYN5BGXB: 1: 22311: 21964: 12072 569 908 52 83 chr1 5S71M = 569908 -71 GATCTACTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCACCACACACCACCTG <AEEEA6EEE6EEEEEEEEEEEEEE / EEEEEEEEEEEEEEEEE / EEEEEEEEEEEEEEEEEEAAEEEAEEEAA6AA NM: i: 0 MD: Z: 71 MC: Z: 71M5S AS: i: 71 XS : i: 66 RG: Z: ../ H2O XA: Z: CHRM -9360,5S71M, 1; NS500355: NS500355: HHYN5BGXB: 4: 12 602: 7858: 19 418 569 909 15 99 chr1 76M = 569917 84 CTAACCATATACCAATGATGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCACCACACACCACCTGTCCAAA AAAAAEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEAEE / AAEEEEEEEEEEEEEEE NM: i: 1 MD: Z: 74G1 MC: Z: 76M AS: i: 74 XS: i: 71 RG: Z: ../ H2O XA: Z: chrM, + 9361.76M, 1;
NS500355: NS500355: HHYN5BGXB: 2: 12 205: 19 456: 7598 83 chr1 569927 0 76M = 569907 -96 TGGCGCGATGTAACACGAGAAAGCACATACCAAGGCCACCACACACCACCTGTCCAAAAAGGCCTTCGATACGGGA EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEAA / EEEEEEEEEAAAAA NM: i: 1 MD: Z: 56G19 MC: Z: 76M AS: i: 71 XS: i: 76 RG: Z: ../ H2O XA: Z: chrM, -9379,76M, 0;  

Basert på mapq og posisjoner (respekt for 569930) Jeg ser at avlesningen med sigar = 18S58M hoppes over av mpileup.

HVORFOR? Det myke klippet er langt fra posisjon chr1: 569930

To svar:
finswimmer
2019-08-22 09:20:27 UTC
view on stackexchange narkive permalink

Hvorfor tror du det er lest med cigar = 18S58M ? Kartleggingskvaliteten som er gitt i sam-filer, er forskjellig fra de i mpileup-utdataene. Jeg antar at samtools gjør noen ny beregning.

Du bruker parametrene -q20 -Q20 . Så du hopper over alle lesninger med kartkvalitet <20. Dette vil resultere i 7 lesninger som fikk mpileup. Videre hopper du over baser med basiskvalitet <20. Ta en titt på basisegenskapene for avlesningen som starter ved posisjon 569904 . Hvis jeg teller det riktig, ender du opp med kvaliteten / på posisjon 569930 som betyr 14 . Så jeg antar at denne lesingen blir droppet.

BTW: samtools mpileup er avviklet (bare når du oppretter bcf / vcf) og bør erstattes av bcftools mpileup .

Takk, jeg savnet '/' kvaliteten for en 'E'. Nå forstår jeg.
Underkommandoen `mpileup` er delt mellom de to kommandoene. Tekstuell “mpileup-utgang” forblir i samtools (og vil alltid), men VCF / BCF-utgang har flyttet til bcftools. Dette grupperer sistnevnte sammen med de andre VCF-relaterte fasilitetene, og betyr spesielt at begge halvdelene av den anropende rørledningen `bcftools mpileup ... | bcftools call ... `er i samme program, som forenkler oppdateringer og forbedringer av dette paret kommandoer som fungerer sammen.
John Marshall
2019-08-22 14:16:48 UTC
view on stackexchange narkive permalink

Å undersøke mpileup-utgangen for en enkeltlesning alene er en god måte å finne ut hvorfor baser ikke ser ut som forventet.

Så hvis du mistenker at sigaren = 18S58M kode> lese er den manglende (du har rett), lag en SAM-fil som inneholder akkurat den som er lest:

  @SQ SN: chr1 LN: 248956422NS500355: NS500355: HHYN5BGXB: 1: 13209: 10692 : 11045 83 chr1 569888 53 18S58M = 569888 -58 CGTGTGCTCTTCCGATCTCTAGGCCTACTAACCAACACACTAACCATATACCAATGATGGCGCGATGTAACACGAG EE<A / EE // AE / AA /// AAE /// // AEAEEEEE6A6AAA NM: i: 0 MD: Z: 58 MC: Z: 59M17S AS: i: 58 XS: i: 53RG: Z: ../ H2O XA: Z: chrM, -9340,18S58M, 1;  kode> 

og kjør den gjennom mpileup:

  $ samtools mpileup -Q0 -B oneread.sam  

Dette vil vise deg at denne lesningens grunnleggende kvalitet synker under 20 i den posisjonen du er interessert i. Dermed fjerner -Q20 det på denne posisjonen, som finswimmer mistenker.



Denne spørsmålet ble automatisk oversatt fra engelsk.Det opprinnelige innholdet er tilgjengelig på stackexchange, som vi takker for cc by-sa 4.0-lisensen den distribueres under.
Loading...