Πληροφορίες

Τι είναι το "contigs" στο ReorderSAM της Picard;

Τι είναι το


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Έχω χρησιμοποιήσει το BWA για να αντιστοιχίσω τις αναγνώσεις του NGS με το γονιδίωμα hg38 και έχω ένα αρχείο BAM. Δεν κάνω συναρμολόγηση γονιδιώματος και το αρχείο γονιδιώματος αναφοράς μου έχει τα ανθρώπινα χρωμοσώματα. Επομένως, δεν θα έπρεπε να έχω "contigs". Αλλά…

https://broadinstitute.github.io/picard/command-line-overview.html#ReorderSam

και παραθέτω:

ReorderSam επαναπαραγγελίες διαβάζεται σε ένα αρχείο SAM/BAM για να ταιριάζει με τη σειρά contig σε ένα παρεχόμενο αρχείο αναφοράς, όπως καθορίζεται από την ακριβή αντιστοίχιση ονόματος των contigs

Ε: Τι κάνεισυνεχής παραγγελίαΔηλαδή, για το πείραμά μου για την αλληλουχία ολόκληρου του γονιδιώματος; Συγκεκριμένα, τι σημαίνει η αντιστοίχιση του contig με ένα αρχείο αναφοράς;


Δεν είμαι εξοικειωμένος με το picard και τη λειτουργία reorderSam τους, αλλά από όσο γνωρίζω/καταλαβαίνω από την τεκμηρίωσή τους εννοούν αυτό:
Η σειρά των contigs ενώ χρησιμοποιείται μια ακολουθία αναφοράς. Σαν αυτό:

Εικόνα 5: Ανατομία συναρμολόγησης ολόκληρου του γονιδιώματος. Στη συναρμολόγηση ολόκληρου του γονιδιώματος, τα θραύσματα BAC (τμήματα κόκκινης γραμμής) και οι αναγνώσεις από πέντε άτομα (τμήματα μαύρης γραμμής) συνδυάζονται για να παράγουν μια αλληλουχία contig και μια συναινετική αλληλουχία (πράσινη γραμμή). Τα contigs συνδέονται σε ικριώματα, που φαίνονται με κόκκινο, με ζευγάρωμα ακραίων ακολουθιών, που ονομάζονται επίσης mate. Εάν υπάρχει κενό μεταξύ διαδοχικών contigs, έχει γνωστό μέγεθος. Στη συνέχεια, τα ικριώματα χαρτογραφούνται στο γονιδίωμα (γκρίζα γραμμή) χρησιμοποιώντας πληροφορίες τοποθεσίας με ετικέτα ακολουθίας (STS), που αντιπροσωπεύονται από μπλε αστέρια. © 2001 American Association for the Advancement of Science Venter, C. et al. Η αλληλουχία του ανθρώπινου γονιδιώματος. Science 291, 1304-1351 (2001). Ολα τα δικαιώματα διατηρούνται. (πηγή)

Αναπαραγγελία SAM (Picard) Έτσι στο Picard έχετε το δικό σαςINPUT (Αρχείο), οι αναγνώσεις σε αυτό το αρχείο αντιστοιχίζονται στη συνέχεια στοΑΝΑΦΟΡΑ (Αρχείο). Αυτό φαίνεται και στον κώδικά τους:

// γράψτε τις αναγνώσεις με συνεχή σειρά 109 για (final SAMSequenceRecord contig : refDict.getSequences() ) { 110 final SAMRecordIterator it = in.query(contig.getSequenceName(), 0, 0, false); 111 writeReads(out, it, newOrder, contig.getSequenceName()); 112 }

(πηγή κώδικα)

ReorderSam επαναπαραγγελίες διαβάζει σε ένα αρχείο SAM/BAM για να ταιριάζει με τη συνεχή παραγγελία σε ένα παρεχόμενο αρχείο αναφοράς

Λίγο παραπάνω φόντο
Υπάρχουν δύο κύριες προσεγγίσεις, δύο για να λάβουμε μια αλληλουχία γονιδιώματος:

υπάρχουν δύο «κύριες» προσεγγίσεις για αυτό:
σολ. Οι τεχνολογίες αλληλούχισης δεύτερης γενιάς παράγουν εκατομμύρια σύντομες (μερικές εκατοντάδες bp) σειρές νουκλεοτιδίων (αναγνώσεις), οι οποίες είναι ιδανικές για επαναπροσδιορισμό αλληλουχίας όταν οι αναγνώσεις αντιστοιχίζονται σε ένα γονιδίωμα αναφοράς (συναρμολόγηση που βασίζεται σε αναφορά). De novo συγκρότημα γονιδιώματος που βασίζεται στην αλληλουχία δεύτερης γενιάς είναι δύσκολη λόγω δυσκολιών με πλούσιες σε GC ή AT και ομονουκλεοτιδικά τεντώματα DNA, τα οποία υποεκπροσωπούνται στην έξοδο προσδιορισμού αλληλουχίας (πηγή)

Τα χαρακτηριστικά αυτών είναι:
de novo

  • καμία προκατάληψη προς ένα γονιδίωμα αναφοράς
  • κανένα πρότυπο για προσαρμογή
  • το συγκρότημα είναι συνήθως πιο κατακερματισμένο
  • κανονικά λειτουργεί καλύτερα για διαφορές μεγάλης/μέσης κλίμακας (πηγή)


χαρτογράφηση αναφοράς

  • λιγότερα contigs
  • Στις περισσότερες μεθόδους οι αναγνώσεις που δεν αντιστοιχίζονται δεν χρησιμοποιούνται στην τελική σειρά (αυτό συμβαίνει επίσης με την αναπαραγγελίαSAM:Οι αναγνώσεις που αντιστοιχίζονται σε contigs που απουσιάζουν στη νέα αναφορά απορρίπτονται
  • βλέπετε τι είναι παρόμοιο με το γονιδίωμα αναφοράς σας
  • Τα SNP και οι πολύ μικρές επαληθεύσεις τοποθετούνται και συγκρίνονται πιο εύκολα μεταξύ των ομάδων (πηγή)

Θα συνιστούσα ανεπιφύλακτα να παρακολουθήσετε αυτό το σύντομο animation για να διαφοροποιήσετε αυτά τα δύο και να κατανοήσετε τι είναι η χαρτογράφηση γονιδιώματος αναφοράς.