Jeg ønsker å utføre en genom-sammenligning på en gruppe isolater. Jeg vil se på to brede grupper av taxa og sammenligne tilbehørsgenomet i hver gruppe. Jeg har brukt prokka (v1.12) og roary (v3.8.2) for å gjøre dette, men det ser ut til at filen accessory_binary_genes.fa faktisk er en usann representasjon.
Merk: gene_presence_absence.Rtab inneholder all den fulle tilstedeværelsen / fraværet for tilbehørssett til genet. Til tross for dette er jeg fremdeles misfornøyd med nenklaturen til gengruppene [utgave for en annen dag]
[github issue 335] Ditt beste å ignorere filen accessory_binary_genes.fa. Det er bare for å lage et raskt og skittent tre med FastTree. Selve filen er filtrert for å fjerne veldig vanlig og ikke vanlig variasjon for å øke tregenerasjonen, derav forskjellen i tall.
De øverste 5% og de nederste 5% er ekskludert. Det er avkortet ved 4000 gener.
Jeg har sett på alternative rørledninger og en ny programvare BPGA ser lovende ut. Er det noen som har erfaring med dette?
Jeg vil egentlig ha et verktøy som vil gi meg kjerne- og tilbehørssettene uten støy fra delvis genstreff.