Mitt arbeid innebærer å søke etter markørgener / fragmenter i metagenomiske databaser (som Sequence Read Archive). Når jeg har funnet disse sekvensene, vil jeg gjerne vite mer om den nærliggende genomiske regionen.
Er det en måte jeg bare kunne sette sammen sekvenser som lager en contig som inneholder regionen min av interesse? Contigs som ikke inneholder denne regionen er ikke nyttig for meg. Min interesseorganisme kan representere et mindretall av metagenomenet, og å samle alt i datasettet vil bruke mye datakraft.