Spørsmål:
Kan FASTA-filer inneholde nukleotid- og proteinsekvenser; eller må de bare ha 1 type?
user1510
2017-09-21 07:13:38 UTC
view on stackexchange narkive permalink

Kan FASTA-filer inneholde nukleotid- og proteinsekvenser; eller må de bare ha 1 type? For eksempel har en FASTA-fil to sekvenser. Kan den første kode for aminosyrer mens den andre koder for baser?

Takk

En svar:
gringer
2017-09-21 09:28:55 UTC
view on stackexchange narkive permalink

Selv om det ikke er noe som hindrer noen i å gjøre det med FASTA-formatet (det er tross alt bare en tekstfil med '>' som definerer overskriftslinjer), jeg vet ikke om noen programvare som støtter en slik filstruktur. I beste fall vil det tolke nukleotidsekvensene som proteinsekvenser (A / C / G / T er alle gyldige proteinkoder på 1 bokstav).

Et bedre spørsmål å stille ville være "Er ultra-kul- bioinformatics-tool X støtte kombinerte nukleotid- og proteinsekvenser i samme FASTA-fil? " I så fall vil svaret mest sannsynlig være "Nei"

Jepp. FASTA-formatet er veldig tilgivende. Verktøy som bruker data i FASTA-format er ... mindre tilgivende.
Hvis programvaren din derimot er dum og vil prøve å lese en sekvens som nukleider, vil det komme "morsomme" ting. Kan jeg foreslå at du bruker nexus-format i dette tilfellet?
Den eneste åpenbare brukssaken jeg kan tenke meg er å bare bruke fasta-filen til å lagre alle sekvensene dine og deretter trekke ut det du vil behandle fra den. Ethvert verktøy som kan trekke ut spesifikke sekvenser fra en multi-fasta-fil, bør ikke bry seg om disse sekvensene er protein eller nukleotid.
@terdon teknisk sett ja, men det er veldig dårlig praksis. Du ville bokstavelig talt ikke kunne overføre denne filen til noen andre uten ytterligere metadata. Det er ingen standard for å spesifisere om sekvensen er DNA eller protein, og det bør derfor ikke forventes at noen programvarepakke skal kunne skille de to fra hverandre.


Denne spørsmålet ble automatisk oversatt fra engelsk.Det opprinnelige innholdet er tilgjengelig på stackexchange, som vi takker for cc by-sa 3.0-lisensen den distribueres under.
Loading...