Πληροφορίες

Ποια είναι η προέλευση του junk DNA;

Ποια είναι η προέλευση του junk DNA;


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Οι περισσότεροι ευκαρυώτες διαθέτουν μια ορισμένη ποσότητα ανεπιθύμητου DNA στους πυρήνες των κυττάρων τους. Ποια είναι (είναι) η προέλευση (ες) αυτού του άχρηστου DNA και είναι πραγματικά σκουπίδια (περιττά);


Το "Junk DNA" ονομάζεται πιο εύστοχα μη κωδικοποιημένο DNA. Αυτό ορίζεται ως οποιαδήποτε περιοχή DNA που δεν κωδικοποιεί ένα γονίδιο ή ακριβέστερα δεν βρίσκεται σε ανοιχτό πλαίσιο ανάγνωσης. Στο ανθρώπινο γονιδίωμα πάνω από το 98% αποτελείται από μη κωδικοποιημένο DNA. Ωστόσο, όσο περισσότερα μαθαίνουμε για τη μοριακή βιολογία, τόσο περισσότερο κατανοούμε τη βιολογική λειτουργία και τη σημασία του μη κωδικοποιητικού DNA. Παραδείγματα σημαντικών λειτουργιών είναι:

  1. Ρυθμιστικές περιοχές που ελέγχουν την έκφραση ενός γονιδίου
  2. Περιφέρειες που κωδικοποιούν ρυθμιστικό RNA
  3. Περιφέρειες όπου λαμβάνει χώρα επιγενετική ρύθμιση

Ωστόσο, υπάρχουν επίσης περιοχές που πιθανότατα δεν έχουν ευεργετική βιολογική λειτουργία, οι οποίες δικαιωματικά μπορούν να ονομαστούν σκουπίδια:

  1. Τα τρανσποζόνια είναι γενετικές περιοχές που μπορούν να αντιγραφούν (είτε μέσω ενζυματικά ενεργού RNA είτε με κωδικοποίηση της πρωτεϊνικής τρανσποζάσης). Πιστεύεται ότι έχουν εξελιχθεί ως «εγωιστικά γονίδια» και υπάρχουν αρκετοί γνωστοί αμυντικοί μηχανισμοί κατά των απατεώνων τρανσποσονίων (siRNA, RNAi). Τα τρανσποζόνια και οι αμυντικοί μηχανισμοί έχουν γίνει πλέον ισχυρά εργαλεία στην έρευνα της μοριακής βιολογίας.
  2. Ενδογενείς αλληλουχίες ρετροϊών οι οποίες είναι υπολείμματα ρετροϊών που έχουν εισαχθεί στη γραμμή των μικροβίων και γίνονται ανενεργές μέσω μετάλλαξης.

Ωστόσο, ακόμη και αυτές οι «ανεπιθύμητες» περιοχές πιστεύεται ότι έχουν σημαντικές εξελικτικές λειτουργίες όπως η προστασία από μετάλλαξη μέσω ρετροϊών: Επειδή υπάρχουν μεγάλες περιοχές DNA όπου η ακριβής σειρά και λειτουργία δεν είναι σημαντική, ένας ρετροϊός που εισάγεται σε τυχαίες θέσεις του γονιδιώματος είναι λιγότερο πιθανό να προκαλέσει μόνιμη ζημιά.


Εν συντομία, γνωρίζουμε πολλούς μηχανισμούς με τους οποίους τα γονιδιώματα μπορούν να γίνουν μεγαλύτερα. Τα τετράποδα είχαν τουλάχιστον δύο πλήρεις διπλασιασμούς γονιδιώματος στην ιστορία τους. τα τρανσπόζον επεκτείνονται. ένθετο ρετροϊών? μερικοί διπλασιασμοί οδηγούν σε ψευδογονίδια. Και αυτοί οι μηχανισμοί επέκτασης μπορεί να είναι γρήγοροι -- οι διπλασιασμοί πλήρους γονιδιώματος σε μία μόνο γενιά.

Γνωρίζουμε όμως πολύ λίγους μηχανισμούς με τους οποίους τα γονιδιώματα μπορούν να γίνουν μικρότερα, και τα περισσότερα από αυτά είναι πολύ αργά και πολύ λίγα στοχεύονται.

Από μηχανιστική άποψη, είναι πολύ δύσκολο να φανταστεί κανείς έναν στοχευμένο τρόπο αφαίρεσης άχρηστου αλλά ακίνδυνου DNA γρήγορα και με 100% ακρίβεια. Εάν η ακρίβεια δεν είναι 100%, τότε το μονοπάτι θα είναι πιο επιβλαβές από το DNA που επιδιώκει να αφαιρέσει.

Το κλειδί είναι ότι εάν το επιπλέον DNA είναι είτε ακίνδυνο, είτε σχεδόν ακίνδυνο, δεν υπάρχει λόγος να το εξαλείψετε και υπάρχουν λόγοι (σφάλματα κατά την αφαίρεση) για να μην προσπαθήσετε να το αφαιρέσετε.

Έτσι, η σύντομη και απλή απάντηση είναι ότι τα γονιδιώματα μπορούν να συσσωρεύσουν άχρηστο DNA πολύ πιο εύκολα από ό,τι μπορούν να απαλλαγούν από αυτό. Είναι απλώς κοινή λογική, που ταιριάζει με 30 χρόνια πειραματισμού.


Το «Junk DNA» ανακαλύπτει τη φύση των αρχαίων προγόνων μας

Το κλειδί για την επίλυση ενός από τους μεγάλους γρίφους στην εξελικτική βιολογία, την προέλευση των σπονδυλωτών --ζώων με εσωτερικό σκελετό από κόκαλο -- αποκαλύφθηκε σε νέα έρευνα από το Dartmouth College και το Πανεπιστήμιο του Μπρίστολ.

Τα σπονδυλωτά είναι το πιο ανατομικά και γενετικά πολύπλοκο από όλους τους οργανισμούς, αλλά η εξήγηση πώς πέτυχαν αυτή την πολυπλοκότητα έχει ενοχλήσει τους επιστήμονες. Η μελέτη, που δημοσιεύτηκε σήμερα [20 Οκτωβρίου] στο Πρακτικά της Εθνικής Ακαδημίας Επιστημών ισχυρίζεται ότι έχει λύσει αυτό το επιστημονικό αίνιγμα αναλύοντας τη γονιδιωματική των πρωτόγονων ζωντανών ψαριών όπως οι καρχαρίες και οι λάμπες, και των άσπονδων συγγενών τους, όπως τα θαλάσσια squirts. 

Η Alysha Heimberg του Dartmouth College και οι συνεργάτες της μελέτησαν τις οικογενειακές σχέσεις των πρωτόγονων σπονδυλωτών. Η ομάδα χρησιμοποίησε microRNAs, μια κατηγορία μικροσκοπικών μορίων που ανακαλύφθηκαν μόλις πρόσφατα και κατοικούν σε αυτό που συνήθως θεωρείται «άχρηστο DNA», για να δείξει ότι οι λάμπες και τα slime eels είναι μακρινοί συγγενείς των σπονδυλωτών με γνάθο.

Η Alysha είπε: “Μαθαίνουμε από τα αποτελέσματά μας ότι το lamprey και το hagfish σχετίζονται εξίσου με σπονδυλωτά με γνάθο και ότι το hagfish δεν είναι αντιπροσωπευτικό ενός πιο πρωτόγονου σπονδυλωτού, κάτι που υποδηλώνει ότι το προγονικό σπονδυλωτό ήταν πιο περίπλοκο από ό, τι πίστευε κανείς στο παρελθόν.

“Τα σπονδυλωτά εξελίσσονται για εκατοντάδες εκατομμύρια χρόνια, αλλά εξακολουθούν να εκφράζουν τα ίδια γονίδια microRNA στα ίδια όργανα όπως όταν εμφανίστηκαν και τα δύο για πρώτη φορά.”

Η ομάδα συνέχισε να δοκιμάζει την ιδέα ότι επρόκειτο για τα ίδια ‘ junk DNA ’ γονίδια, microRNA, τα οποία ήταν υπεύθυνα για την εξέλιξη της προέλευσης των ανατομικών χαρακτηριστικών των σπονδυλωτών. Διαπίστωσαν ότι η ίδια σειρά microRNAs εκφράστηκε στα ίδια όργανα και ιστούς, σε λάμπες και ποντίκια.

Ο συν-συγγραφέας, καθηγητής Philip Donoghue του University of Bristol ’s School of Earth Sciences, δήλωσε: “Η προέλευση των σπονδυλωτών και η προέλευση αυτών των γονιδίων δεν είναι τυχαία. ”

Ο καθηγητής Kevin Peterson του Dartmouth College είπε: “Αυτή η μελέτη όχι μόνο δείχνει τον δρόμο για την κατανόηση της εξελικτικής προέλευσης της δικής μας γενεαλογίας, αλλά μας βοηθά επίσης να κατανοήσουμε πώς το δικό μας γονιδίωμα συναρμολογήθηκε σε βάθος χρόνου.”


Περιεχόμενα

  1. ^ Pennisi E (Σεπτέμβριος 2012). Το έργο "Genomics. ENCODE" γράφει εγκώμιο για το junk DNA". Επιστήμη. 337 (6099): 1159–1161. doi: 10.1126/science.337.6099.1159. PMID22955811.
  2. ^
  3. Η κοινοπραξία έργου ENCODE (Σεπτέμβριος 2012). "Μια ολοκληρωμένη εγκυκλοπαίδεια στοιχείων DNA στο ανθρώπινο γονιδίωμα". Φύση. 489 (7414): 57–74. Βιβλιοκώδικας: 2012Natur.489. 57Τ. doi:10.1038/nature11247. PMC3439153. PMID22955616. Το
  4. ^ Σφάλμα παράθεσης: Η αναφερόμενη αναφορά Costa non-coding επικαλέστηκε αλλά δεν ορίστηκε ποτέ (δείτε τη σελίδα βοήθειας).
  5. ^ ένασι
  6. Carey M (2015). Junk DNA: A Journey Through the Dark Matter of the GenomeΤο Columbia University Press. ISBN9780231170840.
  7. ^
  8. McKie R (24 Φεβρουαρίου 2013). «Οι επιστήμονες δέχθηκαν επίθεση για τον ισχυρισμό ότι το «άχρηστο DNA» είναι ζωτικής σημασίας για τη ζωή». Ο Παρατηρητής.
  9. ^
  10. Eddy SR (Νοέμβριος 2012). "Το παράδοξο της αξίας C, το junk DNA και το ENCODE". Τρέχουσα Βιολογία. 22 (21): R898-9. doi: 10.1016/j.cub.2012.10.002. PMID23137679. S2CID28289437.
  11. ^
  12. Doolittle WF (Απρίλιος 2013). "Είναι το junk DNA κουκέτα; Μια κριτική του ENCODE". Πρακτικά της Εθνικής Ακαδημίας Επιστημών των Ηνωμένων Πολιτειών της Αμερικής. 110 (14): 5294–300. Bibcode:2013PNAS..110.5294D. doi: 10.1073/pnas.1221376110. PMC3619371. PMID23479647.
  13. ^
  14. Palazzo AF, Gregory TR (Μάιος 2014). «Η υπόθεση για το junk DNA». PLOS Γενετική. 10 (5): e1004351. doi: 10.1371/journal.pgen.1004351. PMC4014423. PMID24809441.
  15. ^
  16. Graur D, Zheng Y, Price N, Azevedo RB, Zufall RA, Elhaik E (2013). "Για την αθανασία των τηλεοπτικών συσκευών:" λειτουργία "στο ανθρώπινο γονιδίωμα σύμφωνα με το ευαγγέλιο χωρίς εξέλιξη του ENCODE". Βιολογία και Εξέλιξη του Γονιδιώματος. 5 (3): 578–90. doi: 10.1093/gbe/evt028. PMC3622293. PMID23431001.
  17. ^
  18. Ponting CP, Hardison RC (Νοέμβριος 2011). «Ποιο κλάσμα του ανθρώπινου γονιδιώματος είναι λειτουργικό;». Έρευνα γονιδιώματος. 21 (11): 1769–76. doi: 10.1101/gr.116814.110. PMC3205562. PMID21875934.
  19. ^ ένασι
  20. Kellis M, Wold B, Snyder MP, Bernstein BE, Kundaje A, Marinov GK, et al. (Απρίλιος 2014). "Ορισμός λειτουργικών στοιχείων DNA στο ανθρώπινο γονιδίωμα". Πρακτικά της Εθνικής Ακαδημίας Επιστημών των Ηνωμένων Πολιτειών της Αμερικής. 111 (17): 6131–8. Bibcode:2014PNAS..111.6131K. doi: 10.1073/pnas.1318948111. PMC4035993. PMID24753594.
  21. ^
  22. Rands CM, Meader S, Ponting CP, Lunter G (Ιούλιος 2014). "Το 8,2% του ανθρώπινου γονιδιώματος είναι περιορισμένο: διακύμανση στα ποσοστά εναλλαγής μεταξύ των κατηγοριών λειτουργικών στοιχείων στην ανθρώπινη καταγωγή". PLOS Γενετική. 10 (7): e1004525. doi:10.1371/journal.pgen.1004525. PMC4109858. PMID25057982.
  23. ^
  24. Mattick JS (2013). «Η έκταση της λειτουργικότητας στο ανθρώπινο γονιδίωμα». Το περιοδικό HUGO. 7 (1): 2. doi: 10.1186/1877-6566-7-2. PMC4685169.
  25. ^
  26. Morris K, επιμ. (2012). Μη κωδικοποιητικά RNA και επιγενετική ρύθμιση της γονιδιακής έκφρασης: Οδηγοί φυσικής επιλογήςΤο Norfolk, Ηνωμένο Βασίλειο: Caister Academic Press. ISBN978-1904455943.

Η ποσότητα του συνολικού γονιδιωματικού DNA ποικίλλει σημαντικά μεταξύ των οργανισμών και η αναλογία του κωδικοποιητικού και μη κωδικοποιητικού DNA εντός αυτών των γονιδιωμάτων ποικίλλει επίσης πολύ. Για παράδειγμα, προτάθηκε αρχικά ότι πάνω από το 98% του ανθρώπινου γονιδιώματος δεν κωδικοποιεί πρωτεϊνικές αλληλουχίες, συμπεριλαμβανομένων των περισσότερων αλληλουχιών εντός εσωνίων και του περισσότερου διαγονιδιακού DNA, [2] ενώ το 20% ενός τυπικού γονιδιώματος προκαρυωτικού είναι μη κωδικοποιητικό. [3]

Στα ευκαρυωτικά, το μέγεθος του γονιδιώματος, και κατ 'επέκταση η ποσότητα του μη κωδικοποιητικού DNA, δεν συσχετίζεται με την πολυπλοκότητα του οργανισμού, μια παρατήρηση γνωστή ως αίνιγμα C-value. [4] Για παράδειγμα, το γονιδίωμα του μονοκύτταρου Polychaos dubium (επίσημα γνωστός ως Amoeba dubia) έχει αναφερθεί ότι περιέχει πάνω από 200 φορές την ποσότητα DNA στους ανθρώπους. [5] Το φουσκωτό ψάρι Ραμπρίπες Τακιφούγκου Το γονιδίωμα είναι μόνο περίπου το ένα όγδοο του μεγέθους του ανθρώπινου γονιδιώματος, ωστόσο φαίνεται ότι έχει συγκρίσιμο αριθμό γονιδίων περίπου το 90% του Τακιφούγκου το γονιδίωμα είναι μη κωδικοποιητικό DNA. [2] Επομένως, το μεγαλύτερο μέρος της διαφοράς στο μέγεθος γονιδιώματος δεν οφείλεται στη διακύμανση της ποσότητας του κωδικοποιητικού DNA, αλλά μάλλον στη διαφορά στην ποσότητα του μη κωδικοποιητικού DNA. [6]

Το 2013, ανακαλύφθηκε ένα νέο «ρεκόρ» για το πιο αποτελεσματικό ευκαρυωτικό γονιδίωμα Utricularia gibba, ένα φυτό ουροδόχου κύστης που έχει μόνο 3% μη κωδικοποιητικό DNA και 97% κωδικοποιητικό DNA. Τμήματα του μη κωδικοποιητικού DNA διαγράφονταν από το φυτό και αυτό υποδηλώνει ότι το μη κωδικοποιητικό DNA μπορεί να μην είναι τόσο κρίσιμο για τα φυτά, παρόλο που το μη κωδικοποιητικό DNA είναι χρήσιμο για τον άνθρωπο. [1] Άλλες μελέτες σε φυτά έχουν ανακαλύψει κρίσιμες λειτουργίες σε τμήματα μη κωδικοποιητικού DNA που προηγουμένως θεωρούνταν αμελητέες και είχαν προσθέσει ένα νέο στρώμα στην κατανόηση της γονιδιακής ρύθμισης. [7]

Cis- και trans-ρυθμιστικά στοιχεία Επεξεργασία

Τα στοιχεία ρύθμισης Cis είναι αλληλουχίες που ελέγχουν τη μεταγραφή ενός κοντινού γονιδίου. Πολλά τέτοια στοιχεία εμπλέκονται στην εξέλιξη και τον έλεγχο της ανάπτυξης. [8] Τα στοιχεία Cis μπορεί να βρίσκονται σε μη μεταφρασμένες περιοχές 5' ή 3' ή εντός εσωνίων. Τα διαρυθμιστικά στοιχεία ελέγχουν τη μεταγραφή ενός απομακρυσμένου γονιδίου.

Οι υποκινητές διευκολύνουν τη μεταγραφή ενός συγκεκριμένου γονιδίου και είναι συνήθως ανάντη της περιοχής κωδικοποίησης. Οι αλληλουχίες ενισχυτών μπορεί επίσης να ασκούν πολύ μακρινές επιδράσεις στα επίπεδα μεταγραφής των γονιδίων. [9]

Introns Edit

Τα ιντρόνια είναι μη κωδικοποιητικά τμήματα ενός γονιδίου, που μεταγράφονται στην πρόδρομη αλληλουχία mRNA, αλλά τελικά απομακρύνονται με συγκόλληση RNA κατά τη διάρκεια της επεξεργασίας σε ώριμο RNA αγγελιοφόρου. Πολλά ιντρόνια φαίνεται να είναι κινητά γενετικά στοιχεία. [10]

Μελέτες των ιντρονίων της ομάδας Ι από Τετραχήμενα Τα πρωτόζωα υποδεικνύουν ότι ορισμένα εσώνια φαίνεται να είναι εγωιστικά γενετικά στοιχεία, ουδέτερα για τον ξενιστή επειδή απομακρύνονται από τα πλευρικά εξόνια κατά την επεξεργασία του RNA και δεν προκαλούν προκατάληψη έκφρασης μεταξύ αλληλόμορφων με και χωρίς το εσώνιο. [10] Ορισμένα εσώνια φαίνεται να έχουν σημαντική βιολογική λειτουργία, πιθανώς μέσω της λειτουργικότητας του ριβοένζυμου που μπορεί να ρυθμίζει τη δραστηριότητα tRNA και rRNA καθώς και την έκφραση γονιδίου που κωδικοποιεί πρωτεΐνη, εμφανής σε ξενιστές που έχουν εξαρτηθεί από τέτοια ιντρόνια για μεγάλες χρονικές περιόδους, για παράδειγμα. ο trnL-ιντρόνιο βρίσκεται σε όλα τα πράσινα φυτά και φαίνεται να έχει κληρονομηθεί κάθετα για αρκετά δισεκατομμύρια χρόνια, συμπεριλαμβανομένων περισσότερων από ένα δισεκατομμύριο χρόνια εντός χλωροπλαστών και επιπλέον 2-3 δισεκατομμύρια χρόνια πριν στους κυανοβακτηριακούς προγόνους των χλωροπλαστών. [10]

Pseudogenes Edit

Τα ψευδογόνα είναι αλληλουχίες DNA, που σχετίζονται με γνωστά γονίδια, που έχουν χάσει την ικανότητα κωδικοποίησης πρωτεϊνών ή αλλιώς δεν εκφράζονται πλέον στο κύτταρο. Τα ψευδογονίδια προκύπτουν από ρετρομεταφορά ή γονιδιωματικό διπλασιασμό λειτουργικών γονιδίων και γίνονται «γονιδιωματικά απολιθώματα» που είναι μη λειτουργικά λόγω μεταλλάξεων που εμποδίζουν τη μεταγραφή του γονιδίου, όπως στην περιοχή του προαγωγέα γονιδίου, ή μεταβάλλουν θανάσιμα τη μετάφραση του γονιδίου, όπως π.χ. πρόωρη διακοπή κωδικώνων ή αλλαγές πλαισίων. [11] Τα ψευδογονίδια που προκύπτουν από την ρετρομεταφορά ενός ενδιάμεσου RNA είναι γνωστά ως επεξεργασμένα ψευδογονίδια που προκύπτουν από τα γονιδιωματικά υπολείμματα διπλών γονιδίων ή τα υπολείμματα απενεργοποιημένων γονιδίων είναι μη επεξεργασμένα ψευδογονίδια. [11] Οι μεταθέσεις κάποτε λειτουργικών μιτοχονδριακών γονιδίων από το κυτταρόπλασμα στον πυρήνα, επίσης γνωστές ως NUMTs, χαρακτηρίζονται επίσης ως ένας τύπος κοινού ψευδογονιδίου. [12] Οι αριθμοί εμφανίζονται σε πολλά ευκαρυωτικά ταξινομικά.

Ενώ ο νόμος του Dollo προτείνει ότι η απώλεια της λειτουργίας στα ψευδογόνα είναι πιθανώς μόνιμη, τα σιωπηλά γονίδια μπορούν να διατηρήσουν τη λειτουργία τους για αρκετά εκατομμύρια χρόνια και μπορούν να "επανενεργοποιηθούν" σε αλληλουχίες κωδικοποίησης πρωτεϊνών [13] και ένας σημαντικός αριθμός ψευδογόνων μεταγράφονται ενεργά. [11] [14] Επειδή τα ψευδογόνα θεωρείται ότι αλλάζουν χωρίς εξελικτικούς περιορισμούς, μπορούν να χρησιμεύσουν ως χρήσιμο μοντέλο για τον τύπο και τις συχνότητες διαφόρων αυτόματων γενετικών μεταλλάξεων. [15]

Επαναλάβετε αλληλουχίες, τρανσποζόνια και ιικά στοιχεία Επεξεργασία

Τα τρανσποζόνια και τα ρετροτρανσποζόνια είναι κινητά γενετικά στοιχεία. Επαναλαμβανόμενες αλληλουχίες Retrotransposon, οι οποίες περιλαμβάνουν μακρά διάσπαρτα πυρηνικά στοιχεία (LINEs) και μικρά διάσπαρτα πυρηνικά στοιχεία (SINE), αντιπροσωπεύουν ένα μεγάλο ποσοστό των γονιδιωματικών αλληλουχιών σε πολλά είδη. Οι αλληλουχίες Alu, που ταξινομούνται ως ένα σύντομο διάσπαρτο πυρηνικό στοιχείο, είναι τα πιο άφθονα κινητά στοιχεία στο ανθρώπινο γονιδίωμα. Έχουν βρεθεί ορισμένα παραδείγματα SINE που ασκούν μεταγραφικό έλεγχο ορισμένων γονιδίων που κωδικοποιούν πρωτεΐνες. [16] [17] [18]

Οι ενδογενείς αλληλουχίες ρετροϊών είναι το προϊόν της αντίστροφης μεταγραφής των γονιδιωμάτων του ρετροϊού στα γονιδιώματα των γεννητικών κυττάρων. Η μετάλλαξη σε αυτές τις ρετρο-μεταγραφόμενες αλληλουχίες μπορεί να αδρανοποιήσει το γονιδίωμα του ιού. [19]

Πάνω από το 8% του ανθρώπινου γονιδιώματος αποτελείται από (κυρίως αποσυντεθειμένες) ενδογενείς αλληλουχίες ρετροϊών, ως μέρος του κλάσματος άνω του 42% που προέρχεται αναγνωριστικά από ρετροτρανσποζόνια, ενώ ένα άλλο 3% μπορεί να αναγνωριστεί ότι είναι τα υπολείμματα των τρανσποσονίων DNA. Μεγάλο μέρος του υπόλοιπου μισού γονιδιώματος που δεν έχει διευκρινισμένη προέλευση αναμένεται να έχει βρει την προέλευσή του σε μεταφερόμενα στοιχεία που ήταν ενεργά τόσο καιρό πριν (& gt 200 εκατομμύρια χρόνια) ώστε τυχαίες μεταλλάξεις να τα καθιστούν αγνώριστα. [20] Η διακύμανση του μεγέθους του γονιδιώματος σε τουλάχιστον δύο είδη φυτών είναι ως επί το πλείστον αποτέλεσμα αλληλουχιών ρετροτρανσποζονίων. [21] [22]

Telomeres Επεξεργασία

Τα τελομερή είναι περιοχές επαναλαμβανόμενου DNA στο τέλος ενός χρωμοσώματος, οι οποίες παρέχουν προστασία από τη χρωμοσωμική αλλοίωση κατά την αντιγραφή του DNA. Πρόσφατες μελέτες έχουν δείξει ότι τα τελομερή βοηθούν στη σταθερότητά τους. Τελομερές επαναλαμβανόμενο RNA (TERRA) είναι μεταγραφές που προέρχονται από τελομερή. Το TERRA έχει αποδειχθεί ότι διατηρεί τη δραστηριότητα της τελομεράσης και επιμηκύνει τα άκρα των χρωμοσωμάτων. [23]

Ο όρος "junk DNA" έγινε δημοφιλής τη δεκαετία του 1960. [24] [25] Σύμφωνα με τον T. Ryan Gregory, η φύση του junk DNA συζητήθηκε για πρώτη φορά ρητά το 1972 από έναν γονιδιωματικό βιολόγο, τον David Comings, ο οποίος εφάρμοσε τον όρο σε όλα τα μη κωδικοποιητικά DNA. [26] Ο όρος επισημοποιήθηκε το ίδιο έτος από τον Susumu Ohno, [6] ο οποίος σημείωσε ότι το μεταλλακτικό φορτίο από επιβλαβείς μεταλλάξεις έθεσε ένα ανώτατο όριο στον αριθμό των λειτουργικών τόπων που θα μπορούσαν να αναμένονται δεδομένου ενός τυπικού ρυθμού μετάλλαξης. Ο Ohno υπέθεσε ότι τα γονιδιώματα θηλαστικών δεν θα μπορούσαν να έχουν πάνω από 30.000 τόπους υπό επιλογή πριν το «κόστος» από το μεταλλακτικό φορτίο προκαλέσει μια αναπόφευκτη πτώση της ικανότητας και τελικά εξαφάνιση. Αυτή η πρόβλεψη παραμένει ισχυρή, με το ανθρώπινο γονιδίωμα να περιέχει περίπου (κωδικοποιώντας πρωτεΐνες) 20.000 γονίδια. Μια άλλη πηγή για τη θεωρία του Ohno ήταν η παρατήρηση ότι ακόμη και στενά συγγενικά είδη μπορούν να έχουν ευρέως (τάξεις μεγέθους) διαφορετικά μεγέθη γονιδιώματος, τα οποία είχαν ονομαστεί παράδοξο C-value το 1971. [27]

Ο όρος "junk DNA" αμφισβητήθηκε με το σκεπτικό ότι προκαλεί μια ισχυρή εκ των προτέρων την πλήρη μη λειτουργικότητα και ορισμένοι έχουν συστήσει τη χρήση πιο ουδέτερης ορολογίας, όπως "μη κωδικοποιητικό DNA". [26] Ωστόσο, το "άχρηστο DNA" παραμένει μια ετικέτα για τα τμήματα μιας αλληλουχίας γονιδιώματος για τα οποία δεν έχει εντοπιστεί καμία ευδιάκριτη λειτουργία και που μέσω της συγκριτικής γονιδιωματικής ανάλυσης δεν εμφανίζονται χωρίς λειτουργικούς περιορισμούς που υποδηλώνουν ότι η ίδια η αλληλουχία δεν παρείχε προσαρμοστικό πλεονέκτημα.

Από τα τέλη της δεκαετίας του '70 έγινε φανερό ότι η πλειοψηφία του μη κωδικοποιητικού DNA σε μεγάλα γονιδιώματα βρίσκει την προέλευσή του στον εγωιστικό πολλαπλασιασμό στοιχείων, για τα οποία οι W. Ford Doolittle και Carmen Sapienza το 1980 έγραψαν στο περιοδικό Φύση: "Όταν ένα δεδομένο DNA, ή μια κατηγορία DNA, μη αποδεδειγμένης φαινοτυπικής λειτουργίας μπορεί να αποδειχθεί ότι έχει αναπτύξει μια στρατηγική (όπως η μεταφορά) που εξασφαλίζει τη γονιδιωματική του επιβίωση, τότε δεν απαιτείται άλλη εξήγηση για την ύπαρξή του." [28] Η ποσότητα του άχρηστου DNA μπορεί να αναμένεται να εξαρτάται από τον ρυθμό ενίσχυσης αυτών των στοιχείων και τον ρυθμό με τον οποίο χάνεται το μη λειτουργικό DNA. [29] Στο ίδιο τεύχος του Φύση, οι Leslie Orgel και Francis Crick έγραψαν ότι το ανεπιθύμητο DNA έχει «λίγη ειδικότητα και μεταφέρει ελάχιστο ή καθόλου επιλεκτικό πλεονέκτημα στον οργανισμό». [30] Ο όρος εμφανίζεται κυρίως στη δημοφιλή επιστήμη και με καθομιλουμένο τρόπο στις επιστημονικές δημοσιεύσεις και έχει προταθεί ότι οι συνειρμοί του μπορεί να έχουν καθυστερήσει το ενδιαφέρον για τις βιολογικές λειτουργίες του μη κωδικοποιητικού DNA. [31]

Ορισμένα στοιχεία υποδεικνύουν ότι ορισμένες αλληλουχίες "άχρηστου DNA" είναι πηγές για (μελλοντική) λειτουργική δραστηριότητα στην εξέλιξη μέσω της εξαγωγής του αρχικά εγωιστικού ή μη λειτουργικού DNA. [32]

ENCODE Επεξεργασία έργου

Το 2012, το πρόγραμμα ENCODE, ένα ερευνητικό πρόγραμμα που υποστηρίχθηκε από το Εθνικό Ινστιτούτο Έρευνας Ανθρώπινου Γονιδιώματος, ανέφερε ότι το 76% των μη κωδικοποιητικών αλληλουχιών DNA του ανθρώπινου γονιδιώματος μεταγράφηκαν και ότι σχεδόν το ήμισυ του γονιδιώματος ήταν κατά κάποιο τρόπο προσβάσιμο σε γενετικές ρυθμιστικές πρωτεΐνες όπως παράγοντες μεταγραφής. [33] Ωστόσο, η πρόταση του ENCODE ότι πάνω από το 80% του ανθρώπινου γονιδιώματος είναι βιοχημικά λειτουργικό έχει επικριθεί από άλλους επιστήμονες, [34] που υποστηρίζουν ότι ούτε η προσβασιμότητα τμημάτων του γονιδιώματος σε παράγοντες μεταγραφής ούτε η μεταγραφή τους εγγυάται ότι αυτά τα τμήματα έχουν βιοχημική λειτουργία και ότι η μεταγραφή τους είναι επιλεκτικά πλεονεκτική. Άλλωστε, μη λειτουργικές τομές του γονιδιώματος μπορούν να μεταγραφούν, δεδομένου ότι οι μεταγραφικοί παράγοντες συνήθως συνδέονται με σύντομες αλληλουχίες που βρίσκονται (τυχαία) σε ολόκληρο το γονιδίωμα. [35]

Επιπλέον, βασίστηκαν οι πολύ χαμηλότερες εκτιμήσεις λειτουργικότητας πριν από το ENCODE γονιδιωματική διατήρηση εκτιμήσεις για τις γενεαλογίες θηλαστικών. [27] [36] [37] [38] Η ευρεία μεταγραφή και συγκόλληση στο ανθρώπινο γονιδίωμα έχει συζητηθεί ως ένας άλλος δείκτης γενετικής λειτουργίας εκτός από τη γονιδιωματική διατήρηση που μπορεί να παραλείπει κακώς διατηρημένες λειτουργικές αλληλουχίες. [39] Επιπλέον, μεγάλο μέρος του φαινομενικού ανεπιθύμητου DNA εμπλέκεται στην επιγενετική ρύθμιση και φαίνεται να είναι απαραίτητο για την ανάπτυξη πολύπλοκων οργανισμών. [40] [41] [42] Γενετικές προσεγγίσεις μπορεί να χάσει λειτουργικά στοιχεία που δεν εκδηλώνονται σωματικά στον οργανισμό, εξελικτικές προσεγγίσεις δυσκολεύονται να χρησιμοποιήσουν ακριβείς ευθυγραμμίσεις αλληλουχιών πολλών ειδών, επειδή τα γονιδιώματα ακόμη και στενά συγγενικών ειδών ποικίλλουν σημαντικά βιοχημικές προσεγγίσεις, αν και έχουν υψηλή αναπαραγωγιμότητα, οι βιοχημικές υπογραφές δεν σημαίνουν πάντα αυτόματα μια συνάρτηση. [39] Kellis et al. σημείωσε ότι το 70% της κάλυψης μεταγραφής ήταν μικρότερη από 1 μεταγραφή ανά κελί (και επομένως μπορεί να βασίζεται σε ψευδή μεταγραφή φόντου). Από την άλλη πλευρά, υποστήριξαν ότι το 12-15% του ανθρώπινου DNA μπορεί να είναι υπό λειτουργικούς περιορισμούς και μπορεί να εξακολουθεί να είναι υποτιμητικό όταν περιλαμβάνονται περιορισμοί που σχετίζονται με τη γενεαλογία. Τελικά γενετικές, εξελικτικές και βιοχημικές προσεγγίσεις μπορούν να χρησιμοποιηθούν με συμπληρωματικό τρόπο για τον εντοπισμό περιοχών που μπορεί να είναι λειτουργικές στην ανθρώπινη βιολογία και ασθένειες. [39] Ορισμένοι κριτικοί υποστήριξαν ότι η λειτουργικότητα μπορεί να αξιολογηθεί μόνο σε σχέση με μια κατάλληλη μηδενική υπόθεση. Σε αυτήν την περίπτωση, η μηδενική υπόθεση θα ήταν ότι αυτά τα μέρη του γονιδιώματος είναι μη λειτουργικά και έχουν ιδιότητες, είτε με βάση τη διατήρηση είτε τη βιοχημική δραστηριότητα, που θα αναμενόταν από τέτοιες περιοχές με βάση τη γενική κατανόηση της μοριακής εξέλιξης και βιοχημεία. Σύμφωνα με αυτούς τους επικριτές, μέχρι να αποδειχθεί ότι μια εν λόγω περιοχή έχει πρόσθετα χαρακτηριστικά, πέρα ​​από αυτό που αναμένεται από τη μηδενική υπόθεση, θα πρέπει προσωρινά να χαρακτηρίζεται ως μη λειτουργική. [43]

Ορισμένες αλληλουχίες DNA που δεν κωδικοποιούν πρέπει να έχουν κάποια σημαντική βιολογική λειτουργία. Αυτό υποδεικνύεται από συγκριτικές μελέτες γονιδιωματικής που αναφέρουν εξαιρετικά διατηρημένες περιοχές μη κωδικοποιητικού DNA, μερικές φορές σε χρονικές κλίμακες εκατοντάδων εκατομμυρίων ετών. Αυτό σημαίνει ότι αυτές οι μη κωδικοποιητικές περιοχές βρίσκονται υπό ισχυρή εξελικτική πίεση και θετική επιλογή. [44] Για παράδειγμα, στο γονιδίωμα των ανθρώπων και των ποντικών, που απέκλιναν από έναν κοινό πρόγονο πριν από 65-75 εκατομμύρια χρόνια, οι αλληλουχίες DNA που κωδικοποιούν πρωτεΐνες αντιπροσωπεύουν μόνο περίπου το 20% του διατηρημένου DNA, με το υπόλοιπο 80% του διατηρημένου DNA αντιπροσωπεύονται σε μη κωδικοποιητικές περιοχές. [45] Η χαρτογράφηση συνδέσμων συχνά προσδιορίζει χρωμοσωμικές περιοχές που σχετίζονται με μια ασθένεια χωρίς στοιχεία λειτουργικών κωδικοποιητικών παραλλαγών γονιδίων εντός της περιοχής, υποδηλώνοντας ότι γενετικές παραλλαγές που προκαλούν ασθένειες βρίσκονται στο μη κωδικοποιητικό DNA. [45] Η σημασία των μη κωδικοποιητικών μεταλλάξεων του DNA στον καρκίνο διερευνήθηκε τον Απρίλιο του 2013. [46]

Οι μη κωδικοποιητικοί γενετικοί πολυμορφισμοί παίζουν ρόλο στην ευαισθησία σε μολυσματικές ασθένειες, όπως η ηπατίτιδα C. [47] Επιπλέον, οι μη κωδικοποιητικοί γενετικοί πολυμορφισμοί συμβάλλουν στην ευαισθησία στο σάρκωμα Ewing, έναν επιθετικό παιδικό καρκίνο των οστών. [48]

Ορισμένες συγκεκριμένες αλληλουχίες μη κωδικοποιητικού DNA μπορεί να είναι χαρακτηριστικά απαραίτητα για τη δομή των χρωμοσωμάτων, τη λειτουργία των κεντρομερών και την αναγνώριση των ομόλογων χρωμοσωμάτων κατά τη διάρκεια της μείωσης. [49]

Σύμφωνα με μια συγκριτική μελέτη πάνω από 300 προκαρυωτικών και πάνω από 30 ευκαρυωτικών γονιδιωμάτων, [50] ευκαρυωτικά φαίνεται ότι απαιτούν μια ελάχιστη ποσότητα μη κωδικοποιητικού DNA. Το ποσό μπορεί να προβλεφθεί χρησιμοποιώντας ένα μοντέλο ανάπτυξης για ρυθμιστικά γενετικά δίκτυα, υπονοώντας ότι απαιτείται για ρυθμιστικούς σκοπούς. Στους ανθρώπους το προβλεπόμενο ελάχιστο είναι περίπου το 5% του συνολικού γονιδιώματος.

Πάνω από το 10% των 32 γονιδιωμάτων θηλαστικών μπορεί να λειτουργήσει μέσω του σχηματισμού ειδικών δευτερογενών δομών RNA. [51] Η μελέτη χρησιμοποίησε συγκριτική γονιδιωματική για τον εντοπισμό αντισταθμιστικών μεταλλάξεων DNA που διατηρούν ζεύγη βάσεων RNA, ένα διακριτικό χαρακτηριστικό των μορίων RNA. Πάνω από το 80% των γονιδιωματικών περιοχών που παρουσιάζουν εξελικτικά στοιχεία για τη διατήρηση της δομής του RNA δεν παρουσιάζουν ισχυρή διατήρηση αλληλουχίας DNA.

Το μη κωδικοποιητικό DNA μπορεί να χρησιμεύσει ίσως για να μειώσει την πιθανότητα διάσπασης γονιδίων κατά τη διάρκεια της χρωμοσωμικής διασταύρωσης. [52]

Στοιχεία από Polygenic Scores και GWAS Edit

Μελέτες συσχετίσεων σε γενετικό επίπεδο (GWAS) και ανάλυση μηχανικής μάθησης μεγάλων γονιδιωματικών συνόλων οδήγησαν στην κατασκευή πολυγονικών προγνωστικών για ανθρώπινα χαρακτηριστικά όπως το ύψος, η πυκνότητα των οστών και πολλοί κίνδυνοι ασθενειών. Παρόμοιοι προγνωστικοί παράγοντες υπάρχουν για είδη φυτών και ζώων και χρησιμοποιούνται στη γεωργική εκτροφή. [54] Η λεπτομερής γενετική αρχιτεκτονική των ανθρώπινων προγνωστικών έχει αναλυθεί και σημαντικές επιδράσεις που χρησιμοποιούνται στην πρόβλεψη σχετίζονται με περιοχές DNA πολύ έξω από τις περιοχές κωδικοποίησης. Το κλάσμα της διακύμανσης αντιπροσωπεύει (δηλ. Το κλάσμα της προγνωστικής ισχύος που συλλαμβάνεται από τον προγνωστικό παράγοντα) στην κωδικοποίηση έναντι των μη κωδικοποιητικών περιοχών ποικίλλει ευρέως για διαφορετικά σύνθετα χαρακτηριστικά. Για παράδειγμα, η κολπική μαρμαρυγή και ο κίνδυνος στεφανιαίας νόσου ελέγχονται κυρίως από παραλλαγές σε μη κωδικοποιητικές περιοχές (μη κωδικοποιητικό κλάσμα διακύμανσης άνω του 70 τοις εκατό), ενώ ο διαβήτης και η υψηλή χοληστερόλη εμφανίζουν το αντίθετο μοτίβο (μη κωδικοποιητική διακύμανση περίπου 20-30 τοις εκατό ). [53] Οι ατομικές διαφορές μεταξύ των ανθρώπων επηρεάζονται σαφώς με σημαντικό τρόπο από μη κωδικοποιητικούς γενετικούς τόπους, γεγονός που αποτελεί ισχυρή απόδειξη για λειτουργικές επιδράσεις. Οι γονότυποι ολόκληρου του εξωτικού (δηλαδή, που περιέχουν πληροφορίες που περιορίζονται μόνο στις κωδικοποιητικές περιοχές) δεν περιέχουν αρκετές πληροφορίες για τη δημιουργία ή ακόμη και την αξιολόγηση πολυγονικών προγνωστικών για πολλά καλά μελετημένα πολύπλοκα χαρακτηριστικά και κινδύνους ασθενειών.

Το 2013, υπολογίστηκε ότι, γενικά, έως και το 85% των θέσεων GWAS έχουν μη κωδικοποιητικές παραλλαγές ως πιθανή αιτιακή συσχέτιση. Οι παραλλαγές είναι συχνά κοινές σε πληθυσμούς και είχε προβλεφθεί ότι επηρεάζουν τους κινδύνους ασθενειών μέσω μικρών φαινοτυπικών επιδράσεων, σε αντίθεση με τις μεγάλες επιδράσεις των παραλλαγών του Μεντελιανού. [55]

Ορισμένες αλληλουχίες DNA που δεν κωδικοποιούν καθορίζουν τα επίπεδα έκφρασης διαφόρων γονιδίων, τόσο εκείνων που μεταγράφονται σε πρωτεΐνες όσο και εκείνων που οι ίδιοι εμπλέκονται στη γονιδιακή ρύθμιση. [56] [57] [58]

Παράγοντες μεταγραφής Επεξεργασία

Ορισμένες αλληλουχίες DNA που δεν κωδικοποιούν καθορίζουν πού συνδέονται οι παράγοντες μεταγραφής. [56] Ένας μεταγραφικός παράγοντας είναι μια πρωτεΐνη που συνδέεται με συγκεκριμένες αλληλουχίες DNA που δεν κωδικοποιούν, ελέγχοντας έτσι τη ροή (ή μεταγραφή) των γενετικών πληροφοριών από το DNA στο mRNA. [59] [60]

Επεξεργασία χειριστή

Ένας χειριστής είναι ένα τμήμα του DNA στο οποίο συνδέεται ένας καταστολέας. Ο καταστολέας είναι μια πρωτεΐνη που δεσμεύει το DNA και ρυθμίζει την έκφραση ενός ή περισσότερων γονιδίων δεσμεύοντας τον χειριστή και εμποδίζοντας τη σύνδεση της πολυμεράσης RNA στον προαγωγέα, αποτρέποντας έτσι τη μεταγραφή των γονιδίων. Αυτό το μπλοκάρισμα της έκφρασης ονομάζεται καταστολή. [61]

Ενισχυτές Επεξεργασία

Ένας ενισχυτής είναι μια σύντομη περιοχή του DNA που μπορεί να συνδεθεί με πρωτεΐνες (παράγοντες διαδραστικής δράσης), όπως και ένα σύνολο παραγόντων μεταγραφής, για να ενισχύσει τα επίπεδα μεταγραφής των γονιδίων σε μια ομάδα γονιδίων. [62]

Σιγαστήρες Επεξεργασία

Ο σιγαστήρας είναι μια περιοχή του DNA που αδρανοποιεί την γονιδιακή έκφραση όταν συνδέεται με μια ρυθμιστική πρωτεΐνη. Λειτουργεί με παρόμοιο τρόπο ως ενισχυτές, διαφέροντας μόνο στην αδρανοποίηση των γονιδίων. [63]

Επεξεργασία προωθητών

Ένας προαγωγέας είναι μια περιοχή του DNA που διευκολύνει τη μεταγραφή ενός συγκεκριμένου γονιδίου όταν ένας μεταγραφικός παράγοντας δεσμεύεται σε αυτό. Οι υποκινητές βρίσκονται συνήθως κοντά στα γονίδια που ρυθμίζουν και ανάντη τους. [64]

Μονωτήρες Επεξεργασία

Ένας γενετικός μονωτής είναι ένα οριακό στοιχείο που παίζει δύο ξεχωριστούς ρόλους στην γονιδιακή έκφραση, είτε ως ενισχυτικό αποκλεισμό κώδικα, είτε σπάνια ως φράγμα έναντι της συμπυκνωμένης χρωματίνης. Ένας μονωτήρας σε μια ακολουθία DNA είναι συγκρίσιμος με ένα γλωσσικό διαιρέτη λέξεων, όπως ένα κόμμα σε μια πρόταση, επειδή ο μονωτήρας υποδεικνύει πού τελειώνει μια ενισχυμένη ή καταπιεσμένη ακολουθία. [65]

Evolution Edit

Οι κοινόχρηστες αλληλουχίες του φαινομενικά μη λειτουργικού DNA είναι μια σημαντική απόδειξη κοινής καταγωγής. [66]

Οι ψευδογονικές αλληλουχίες φαίνεται να συσσωρεύουν μεταλλάξεις πιο γρήγορα από τις κωδικοποιητικές αλληλουχίες λόγω απώλειας επιλεκτικής πίεσης. [15] Αυτό επιτρέπει τη δημιουργία μεταλλαγμένων αλληλόμορφων που ενσωματώνουν νέες λειτουργίες που μπορεί να ευνοούνται από τη φυσική επιλογή, επομένως, τα ψευδογονίδια μπορούν να χρησιμεύσουν ως πρώτη ύλη για την εξέλιξη και μπορούν να θεωρηθούν "πρωτογονίδια". [67]

Μια μελέτη που δημοσιεύθηκε το 2019 δείχνει ότι νέα γονίδια (που ονομάζονται de novo γέννηση γονιδίου) μπορεί να διαμορφωθεί από περιοχές που δεν κωδικοποιούν. [68] Ορισμένες μελέτες δείχνουν ότι τουλάχιστον το ένα δέκατο των γονιδίων θα μπορούσε να δημιουργηθεί με αυτόν τον τρόπο. [68]

Συσχετισμοί μεγάλης εμβέλειας Επεξεργασία

Έχει βρεθεί μια στατιστική διάκριση μεταξύ κωδικοποιητικών και μη κωδικοποιητικών αλληλουχιών DNA. Έχει παρατηρηθεί ότι τα νουκλεοτίδια σε αλληλουχίες DNA που δεν κωδικοποιούν εμφανίζουν συσχετισμούς νόμου ισχύος μεγάλης εμβέλειας ενώ οι αλληλουχίες κωδικοποίησης όχι. [69] [70] [71]

Εγκληματολογική ανθρωπολογία Επιμέλεια

Η αστυνομία μερικές φορές συλλέγει DNA ως αποδεικτικό στοιχείο για σκοπούς ιατροδικαστικής ταυτοποίησης. Όπως περιγράφεται στο Μέριλαντ κατά Βασιλιά, απόφαση του Ανώτατου Δικαστηρίου των ΗΠΑ το 2013: [72]

Το τρέχον πρότυπο για τον εγκληματολογικό έλεγχο DNA βασίζεται σε μια ανάλυση των χρωμοσωμάτων που βρίσκονται στον πυρήνα όλων των ανθρώπινων κυττάρων. «Το υλικό του DNA στα χρωμοσώματα αποτελείται από περιοχές« κωδικοποίησης »και« μη κωδικοποίησης ». Οι κωδικοποιητικές περιοχές είναι γνωστές ως γονίδια και περιέχουν τις απαραίτητες πληροφορίες για ένα κύτταρο να παράγει πρωτεΐνες. Το Το Το Περιοχές που δεν κωδικοποιούν πρωτεΐνες . Το Το δεν σχετίζονται άμεσα με την παραγωγή πρωτεϊνών, [και] έχουν αναφερθεί ως «άχρηστο» DNA». Το επίθετο "junk" μπορεί να παραπλανήσει τον λαϊκό, γιατί στην πραγματικότητα αυτή είναι η περιοχή του DNA που χρησιμοποιείται με σχεδόν σιγουριά για την ταυτοποίηση ενός ατόμου. [72]


The Case for Junk DNA

Τα γονιδιώματα είναι σαν τα βιβλία της ζωής. Αλλά μέχρι πρόσφατα, τα εξώφυλλα τους ήταν κλειδωμένα. Τέλος, μπορούμε τώρα να ανοίξουμε τα βιβλία και να τα ξεφυλλίσουμε. Αλλά έχουμε μόνο μια μέτρια κατανόηση του τι πραγματικά βλέπουμε. Ακόμα δεν είμαστε σίγουροι πόσο το γονιδίωμά μας κωδικοποιεί πληροφορίες που είναι σημαντικές για την επιβίωσή μας και πόσο είναι απλώς μια ακατάστατη επένδυση.

Σήμερα είναι μια καλή μέρα για να μπείτε στη συζήτηση για το από τι αποτελείται το γονιδίωμα, χάρη στη δημοσίευση ενός ενδιαφέροντος σχολίου από τους Alex Palazzo και Ryan Gregory στο PLOS ΓενετικήΤο Ονομάζεται "The Case for Junk DNA".

Η συζήτηση για το γονιδίωμα μπορεί να γίνει ιλιγγιώδης. Θεωρώ ότι το καλύτερο αντίδοτο στον ίλιγγο είναι μια μικρή ιστορία. Αυτή η ιστορία ξεκινά στις αρχές του 1900.

Εκείνη την εποχή, οι γενετιστές γνώριζαν ότι φέρουμε γονίδια –παράγοντες που μεταβιβάστηκαν από τους γονείς στους απογόνους και επηρεάζουν το σώμα μας– αλλά δεν ήξεραν από τι αποτελούνται τα γονίδια.

Αυτό άλλαξε από τη δεκαετία του 1950. Οι επιστήμονες αναγνώρισαν ότι τα γονίδια ήταν φτιαγμένα από DNA και στη συνέχεια ανακάλυψαν πώς τα γονίδια διαμορφώνουν τη βιολογία μας.

Το DNA μας είναι μια σειρά από μονάδες που ονομάζονται βάσεις. Τα κύτταρά μας διαβάζουν τις βάσεις σε ένα τμήμα DNA - ένα γονίδιο - και χτίζουν ένα μόριο που ονομάζεται RNA με αντίστοιχη αλληλουχία. Τα κύτταρα στη συνέχεια χρησιμοποιούν το RNA ως οδηγό για τη δημιουργία μιας πρωτεΐνης. Το σώμα μας περιέχει πολλές διαφορετικές πρωτεΐνες, οι οποίες τους δίνουν δομή και εκτελούν εργασίες όπως η πέψη των τροφίμων.

Αλλά στη δεκαετία του 1950, οι επιστήμονες άρχισαν επίσης να ανακαλύπτουν κομμάτια DNA εκτός των περιοχών που κωδικοποιούν τις πρωτεΐνες που ήταν επίσης σημαντικά. Αυτά τα επονομαζόμενα ρυθμιστικά στοιχεία λειτούργησαν ως διακόπτες για γονίδια που κωδικοποιούν πρωτεΐνες. Μια πρωτεΐνη που κλειδώνει σε έναν από αυτούς τους διακόπτες θα μπορούσε να ωθήσει ένα κύτταρο να παράγει πολλές πρωτεΐνες από ένα δεδομένο γονίδιο. Or θα μπορούσε να κλείσει τελείως το γονίδιο.

Εν τω μεταξύ, οι επιστήμονες βρήκαν επίσης κομμάτια DNA στο γονιδίωμα που φαίνεται ότι δεν ήταν ούτε γονίδια που κωδικοποιούν πρωτεΐνες ούτε ρυθμιστικά στοιχεία. Στη δεκαετία του 1960, για παράδειγμα, ο Roy Britten και ο David Kohne βρήκαν εκατοντάδες χιλιάδες επαναλαμβανόμενα τμήματα DNA, καθένα από τα οποία αποδείχθηκε ότι είχε μήκος μόλις μερικές εκατοντάδες βάσεις. Πολλές από αυτές τις επαναλαμβανόμενες αλληλουχίες ήταν το προϊόν του DNA που μοιάζει με ιούς. Αυτά τα κομμάτια «εγωιστικού DNA» έκαναν αντίγραφα του εαυτού τους που εισήχθησαν πίσω στο γονιδίωμα. Οι μεταλλάξεις στη συνέχεια τα μείωσαν σε αδρανή θραύσματα.

Άλλοι επιστήμονες βρήκαν επιπλέον αντίγραφα γονιδίων που είχαν μεταλλάξεις που τους εμποδίζουν να παράγουν πρωτεΐνες – αυτό που έγινε γνωστό ως ψευδογονίδια.

Το ανθρώπινο γονιδίωμα, που γνωρίζουμε τώρα, περιέχει περίπου 20.000 γονίδια που κωδικοποιούν πρωτεΐνες. Αυτό μπορεί να ακούγεται σαν πολύ γενετικό υλικό. Αλλά αποτελεί μόνο περίπου το 2 τοις εκατό του γονιδιώματος. Μερικά φυτά είναι ακόμα πιο ακραία. Ενώ έχουμε περίπου 3,2 δισεκατομμύρια βάσεις στα γονιδιώματά μας, τα κρεμμύδια έχουν 16 δισεκατομμύρια, τα οποία αποτελούνται κυρίως από επαναλαμβανόμενες αλληλουχίες και DNA που μοιάζει με ιό.

Το υπόλοιπο γονιδίωμα έγινε μια μυστηριώδης ερημιά για τους γενετιστές. Θα πήγαιναν σε αποστολές για να χαρτογραφήσουν τις περιοχές που δεν κωδικοποιούσαν και προσπαθούσαν να καταλάβουν από τι αποτελούνταν.

Ορισμένα τμήματα του DNA αποδείχθηκαν ότι έχουν λειτουργίες, ακόμη και αν δεν κωδικοποιούσαν πρωτεΐνες ή χρησίμευαν ως διακόπτες. Για παράδειγμα, μερικές φορές τα κύτταρά μας δημιουργούν μόρια RNA που δεν χρησιμεύουν απλά ως πρότυπα για πρωτεΐνες. Αντ 'αυτού, έχουν δικές τους δουλειές, όπως ανίχνευση χημικών στο κύτταρο. Επομένως, εκείνα τα τμήματα του DNA θεωρούνται γονίδια, όχι μόνο γονίδια που κωδικοποιούν πρωτεΐνες.

Με την εξερεύνηση του γονιδιώματος ήρθε μια άνθηση ετικετών, μερικές από τις οποίες άρχισαν να χρησιμοποιούνται με μπερδεμένους –και μερικές φορές απρόσεκτους– τρόπους. Το «μη κωδικοποιητικό DNA» έγινε συντομογραφία για το DNA που δεν κωδικοποιούσε πρωτεΐνες. Αλλά το μη κωδικοποιητικό DNA θα μπορούσε να έχει μια λειτουργία, όπως η απενεργοποίηση γονιδίων ή η παραγωγή χρήσιμων μορίων RNA.

Οι επιστήμονες άρχισαν επίσης να αναφέρονται στο «άχρηστο DNA». Διαφορετικοί επιστήμονες χρησιμοποίησαν τον όρο για να αναφερθούν σε διαφορετικά πράγματα. Ο Ιάπωνας γενετιστής Susumu Ohno χρησιμοποίησε τον όρο όταν ανέπτυξε μια θεωρία για το πώς μεταλλάσσεται το DNA. Ο Ohno οραματίστηκε ότι τα γονίδια που κωδικοποιούν πρωτεΐνες θα διπλασιαστούν κατά λάθος. Αργότερα, οι μεταλλάξεις θα χτυπήσουν τα νέα αντίγραφα αυτών των γονιδίων. In a few cases, the mutations would give the new gene copies a new function. In most, however, they just killed the gene. He referred to the extra useless copies of genes as junk DNA. Other people used the term to refer broadly to any piece of DNA that didn’t have a function.

And then–like crossing the streams in ΚΥΝΗΓΟΙ ΦΑΝΤΑΣΜΑΤΩΝ–junk DNA and non-coding DNA got mixed up. Sometimes scientists discovered a stretch of non-coding DNA that had a function. They might clip out the segment from the DNA in an egg and find it couldn’t develop properly. BAM!–there was a press release declaring that non-coding DNA had long been dismissed as junk, but lo and behold, non-coding DNA can do something after all.

Given that regulatory elements were discovered in the 1950s (the discovery was recognized with Nobel Prizes), this is just illogical.

Nevertheless, a worthwhile questioned remained: how of the genome had a function? How much was junk?

To Britten and Kohne, the idea that repeating DNA was useless was “repugnant.” Seemingly on aesthetic grounds, they preferred the idea that it had a function that hadn’t been discovered yet.

Others, however, argued that repeating DNA (and pseudogenes and so on) were just junk–vast vestiges of disabled genetic material that we carry down through the generations. If the genome was mostly functional, then it was hard to see why it takes five times more functional DNA to make an onion than a human–or to explain the huge range of genome sizes:

In recent years, a consortium of scientists carried out a project called the Encyclopedia of DNA Elements (ENCODE for short) to classify all the parts of the genome. To see if non-coding DNA was functional, they checked for proteins that were attached to them–possibly switching on regulatory elements. They found a lot of them.

“These data enabled us to assign biochemical functions for 80% of the genome, in particular outside of the well-studied protein-coding regions,” they reported.

Επιστήμη translated that conclusion into a headline, “ENCODE Project writes eulogy for junk DNA.”

A lot of defenders of junk have attacked this conclusion–or, to be more specific, how the research got translated into press releases and then into news articles. In their new review, Palazzo and Gregory present some of the main objections.

Just because proteins grab onto a piece of DNA, for example, doesn’t actually mean that there’s a gene nearby that is going to make something useful. It could just happen to have the right sequence to make the proteins stick to it.

And even if a segment of DNA does give rise to RNA, that RNA may not have a function. The cell may accidentally make RNA molecules, which they then chop up.

If I had to guess why Britten and Kohne found junk DNA repugnant, it probably had to do with evolution. Darwin, after all, had shown how natural selection can transform a population, and how, over millions of years, it could produce adaptations. In the 1900s, geneticists turned his idea into a modern theory. Genes that boosted reproduction could become more common, while ones that didn’t could be eliminated from a population. You’d expect that natural selection would have left the genome mostly full of functional stuff.

Palazzo and Gregory, on the other hand, argue that evolution πρέπει produce junk. The reason has to do with the fact that natural selection can be quite weak in some situations. The smaller a population gets, the less effective natural selection is at favoring beneficial mutations. In small populations, a mutation can spread even if it’s not beneficial. And compared to bacteria, the population of humans is very small. (Technically speaking, it’s the “effective population size” that’s small–follow the link for an explanation of the difference.) When non-functional DNA builds up in our genome, it’s harder for natural selection to strip it out than if we were bacteria.

While junk is expected, a junk-free genome is not. Palazzo and Gregory based this claim on a concept with an awesome name: mutational meltdown.

Here’s how it works. A population of, say, frogs is reproducing. Every time they produce a new tadpole, that tadpole gains a certain number of mutations. A few of those mutations may be beneficial. The rest will be neutral or harmful. If harmful mutations emerge at a rate that’s too fast for natural selection to weed them out, they’ll start to pile up in the genome. Overall, the population will get sicker, producing fewer offspring. Eventually the mutations will drive the whole population to extinction.

Mutational meltdown puts an upper limit on how many genes an organism can have. If a frog has 10,000 genes, those are 10,000 potential targets for a harmful mutation. If the frog has 100,000 genes, it has ten times more targets.

Estimates of the human mutation rate suggest that somewhere between 70 to 150 new mutations strike the genome of every baby. Based on the risk of mutational meltdown, Palazzo and Gregory estimate that only ten percent of the human genome can be functional.* The other ninety percent must be junk DNA. If a mutation alters junk DNA, it doesn’t do any harm because the junk isn’t doing us any good to begin with. If our genome was 80 percent functional–the figure batted around when the ENCODE project results first came out–then we should be extinct.

It may sound wishy-washy for me to say this, but the junk DNA debates will probably settle somewhere in between the two extremes. Is the entire genome functional? No. Is everything aside from protein-coding genes junk? No–we’ve already known that non-coding DNA can be functional for over 50 years. Even if “only” ten percent of the genome turns out to be functional, that’s a huge collection of DNA. It’s six times bigger than the DNA found in all our protein-coding genes. There could be thousands of RNA molecules scientists have yet to understand.

Even if ninety percent of the genome does prove to be junk, that doesn’t mean the junk hasn’t played a role in our evolution. As I wrote last week in the Νιου Γιορκ Ταιμς, it’s from these non-coding regions that many new protein-coding genes evolve. What’s more, much of our genome is made up of viruses, and every now and then evolution has, in effect, harnessed those viral genes to carry out a job for our own bodies. The junk is a part of us, and it, too, helps to make us what we are.

*I mean functional in terms of its sequence. The DNA might still do something important structurally–helping the molecule bend in a particular way, for example.

[Update: Fixed caption. Tweaked the last paragraph to clarify that it’s not a case of teleology.]


Γλωσσάριο

DNA: Deoxyribonucleic acid is the chemical that stores genetic information in our cells. Shaped like a double helix, DNA passes down from one generation to the next.

RNA: Ribonucleic acid is a type of molecule used in making proteins in the body.

Genome: The complete genetic makeup of an organism, which contains all the biological information to build and keep it alive.

Gene: A stretch of DNA that tells a cell how to make specific proteins or RNA molecules.

Enzyme: A molecule that promotes a chemical reaction inside a living organism.

Stem cell: A biological master cell that can multiply and become many different types of tissue. They can also replicate to make more stem cells.


Functions for the Useless

Nearly a decade after the completion of the Human Genome Project, which gave us the first full read of our genetic script at the start of the century, a team of over 400 scientists released what they called the Encyclopedia of DNA Elements , or ENCODE for short. The international collaboration explored the function of every letter in the genome. The results of the massive undertaking called for a reassessment of junk DNA. Though less than two percent of the genome makes proteins, around 80 percent carries out some sort of function.

What fell into ENCODE’s definition of functionality was pretty broad, however. Any “biochemical activity” was fair game — getting transcribed into RNA, even if chopped later in the process, qualified sequences as functional. But many of the “junk” sections do have important roles, including regulating how DNA is transcribed and translated from there into proteins. If protein-coding sequences are the notes of a symphony, then some of the non-coding sequences act like the conductor, influencing the pace and repetitions of the masterpiece.

But not every bit of junk DNA might have a functional use. In a study published in Molecular Biology of the Cell in 2008, scientists cleaned junk DNA from yeast’s genome. For particular genes, they got rid of introns — the sections that get chopped away after DNA transcription. They reported the intron removal had no significant consequences for the cells under laboratory conditions, supporting the notion that they don’t have any function.

But studies published in Nature this year argued otherwise. When food is scarce, researchers found these sequences are essential for yeast survival. The usefulness of these introns might depend on the context, these studies argue — still a far cry from being junk.


Research team finds important role for junk DNA

Scientists have called it "junk DNA." They have long been perplexed by these extensive strands of genetic material that dominate the genome but seem to lack specific functions. Why would nature force the genome to carry so much excess baggage?

Now researchers from Princeton University and Indiana University who have been studying the genome of a pond organism have found that junk DNA may not be so junky after all. They have discovered that DNA sequences from regions of what had been viewed as the "dispensable genome" are actually performing functions that are central for the organism. They have concluded that the genes spur an almost acrobatic rearrangement of the entire genome that is necessary for the organism to grow.

It all happens very quickly. Genes called transposons in the single-celled pond-dwelling organism Oxytricha produce cell proteins known as transposases. During development, the transposons appear to first influence hundreds of thousands of DNA pieces to regroup. Then, when no longer needed, the organism cleverly erases the transposases from its genetic material, paring its genome to a slim 5 percent of its original load.

Laura Landweber (Photo: Denise Applewhite)

"The transposons actually perform a central role for the cell," said Laura Landweber, a professor of ecology and evolutionary biology at Princeton and an author of the study. "They stitch together the genes in working form." The work appeared in the May 15 edition of Science.

In order to prove that the transposons have this reassembly function, the scientists disabled several thousand of these genes in some OxytrichaΤο The organisms with the altered DNA, they found, failed to develop properly.

Other authors from Princeton's Department of Ecology and Evolutionary Biology include: postdoctoral fellows Mariusz Nowacki and Brian Higgins 2006 alumna Genevieve Maquilan and graduate student Estienne Swart. Former Princeton postdoctoral fellow Thomas Doak, now of Indiana University, also contributed to the study.

Landweber and other members of her team are researching the origin and evolution of genes and genome rearrangement, with particular focus on Oxytricha because it undergoes massive genome reorganization during development.

In her lab, Landweber studies the evolutionary origin of novel genetic systems such as Oxytricha'sΤο By combining molecular, evolutionary, theoretical and synthetic biology, Landweber and colleagues last year discovered an RNA (ribonucleic acid)-guided mechanism underlying its complex genome rearrangements.

"Last year, we found the instruction book for how to put this genome back together again -- the instruction set comes in the form of RNA that is passed briefly from parent to offspring and these maternal RNAs provide templates for the rearrangement process," Landweber said. "Now we've been studying the actual machinery involved in the process of cutting and splicing tremendous amounts of DNA. Transposons are very good at that."

The term "junk DNA" was originally coined to refer to a region of DNA that contained no genetic information. Scientists are beginning to find, however, that much of this so-called junk plays important roles in the regulation of gene activity. No one yet knows how extensive that role may be.

Instead, scientists sometimes refer to these regions as "selfish DNA" if they make no specific contribution to the reproductive success of the host organism. Like a computer virus that copies itself ad nauseum, selfish DNA replicates and passes from parent to offspring for the sole benefit of the DNA itself. The present study suggests that some selfish DNA transposons can instead confer an important role to their hosts, thereby establishing themselves as long-term residents of the genome.


Is 75% of the Human Genome Junk DNA?

By the rude bridge that arched the flood,
Their flag to April’s breeze unfurled,
Here once the embattled farmers stood,
And fired the shot heard round the world.

–Ralph Waldo Emerson, Concord Hymn

Emerson referred to the Battles of Lexington and Concord, the first skirmishes of the Revolutionary War, as the “shot heard round the world.”

While not as loud as the gunfire that triggered the Revolutionary War, a recent article published in Genome Biology and Evolution by evolutionary biologist Dan Graur has garnered a lot of attention, 1 serving as the latest salvo in the junk DNA wars—a conflict between genomics scientists and evolutionary biologists about the amount of functional DNA sequences in the human genome.

Clearly, this conflict has important scientific ramifications, as researchers strive to understand the human genome and seek to identify the genetic basis for diseases. The functional content of the human genome also has significant implications for creation-evolution skirmishes. If most of the human genome turns out to be junk after all, then the case for a Creator potentially suffers collateral damage.

According to Graur, no more than 25% of the human genome is functional—a much lower percentage than reported by the ENCODE Consortium. Released in September 2012, phase II results of the ENCODE project indicated that 80% of the human genome is functional, with the expectation that the percentage of functional DNA in the genome would rise toward 100% when phase III of the project reached completion.

If true, Graur’s claim would represent a serious blow to the validity of the ENCODE project conclusions and devastate the RTB human origins creation model. Intelligent design proponents and creationists (like me) have heralded the results of the ENCODE project as critical in our response to the junk DNA challenge.

Junk DNA and the Creation vs. Evolution Battle

Evolutionary biologists have long considered the presence of junk DNA in genomes as one of the most potent pieces of evidence for biological evolution. Skeptics ask, “Why would a Creator purposely introduce identical nonfunctional DNA sequences at the same locations in the genomes of different, though seemingly related, organisms?”

When the draft sequence was first published in 2000, researchers thought only around 2–5% of the human genome consisted of functional sequences, with the rest being junk. Numerous skeptics and evolutionary biologists claim that such a vast amount of junk DNA in the human genome is compelling evidence for evolution and the most potent challenge against intelligent design/creationism.

But these arguments evaporate in the wake of the ENCODE project. If valid, the ENCODE results would radically alter our view of the human genome. No longer could the human genome be regarded as a wasteland of junk rather, the human genome would have to be recognized as an elegantly designed system that displays sophistication far beyond what most evolutionary biologists ever imagined.

ENCODE Skeptics

The findings of the ENCODE project have been criticized by some evolutionary biologists who have cited several technical problems with the study design and the interpretation of the results. (See articles listed under “Resources to Go Deeper” for a detailed description of these complaints and my responses.) But ultimately, their criticisms appear to be motivated by an overarching concern: if the ENCODE results stand, then it means key features of the evolutionary paradigm can’t be correct.

Calculating the Percentage of Functional DNA in the Human Genome

Graur (perhaps the foremost critic of the ENCODE project) has tried to discredit the ENCODE findings by demonstrating that they are incompatible with evolutionary theory. Toward this end, he has developed a mathematical model to calculate the percentage of functional DNA in the human genome based on mutational load—the amount of deleterious mutations harbored by the human genome.

Graur argues that junk DNA functions as a “ sponge ” absorbing deleterious mutations, thereby protecting functional regions of the genome. Considering this buffering effect, Graur wanted to know how much junk DNA must exist in the human genome to buffer against the loss of fitness—which would result from deleterious mutations in functional DNA—so that a constant population size can be maintained.

Historically, the replacement level fertility rates for human beings have been two to three children per couple. Based on Graur’s modeling, this fertility rate requires 85–90% of the human genome to be composed of junk DNA in order to absorb deleterious mutations—ensuring a constant population size, with the upper limit of functional DNA capped at 25%.

Graur also calculated a fertility rate of 15 children per couple, at minimum, to maintain a constant population size, assuming 80% of the human genome is functional. According to Graur’s calculations, if 100% of the human genome displayed function, the minimum replacement level fertility rate would have to be 24 children per couple.

He argues that both conclusions are unreasonable. On this basis, therefore, he concludes that the ENCODE results cannot be correct.

Response to Graur

So, has Graur’s work invalidated the ENCODE project results? Μετά βίας. Here are four reasons why I’m skeptical.

1. Graur’s estimate of the functional content of the human genome is based on mathematical modeling, not experimental results.

An adage I heard repeatedly in graduate school applies: “Theories guide, experiments decide.” Though the ENCODE project results θεωρητικά don’t make sense in light of the evolutionary paradigm, that is not a reason to consider them invalid. A growing number of studies provide independent πειραματικός validation of the ENCODE conclusions. (Go here and here for two recent examples.)

To question experimental results because they don’t align with a theory’s predictions is a “ Bizarro World ” approach to science. Experimental results and observations determine a theory’s validity, not the other way around. Yet when it comes to the ENCODE project, its conclusions seem to be weighed based on their conformity to evolutionary theory. Simply put, ENCODE skeptics are doing science backwards.

While Graur and other evolutionary biologists argue that the ENCODE results don’t make sense from an evolutionary standpoint, I would argue as a biochemist that the high percentage of functional regions in the human genome makes perfect sense. The ENCODE project determined that a significant fraction of the human genome is transcribed. They also measured high levels of protein binding.

ENCODE skeptics argue that this biochemical activity is merely biochemical noise. But this assertion does not make sense because (1) biochemical noise costs energy and (2) random interactions between proteins and the genome would be harmful to the organism.

Transcription is an energy- and resource-intensive process. To believe that most transcripts are merely biochemical noise would be untenable. Such a view ignores cellular energetics. Transcribing a large percentage of the genome when most of the transcripts serve no useful function would routinely waste a significant amount of the organism’s energy and material stores. If such an inefficient practice existed, surely natural selection would eliminate it and streamline transcription to produce transcripts that contribute to the organism’s fitness.

Apart from energetics considerations, this argument ignores the fact that random protein binding would make a dire mess of genome operations. Without minimizing these disruptive interactions, biochemical processes in the cell would grind to a halt. It is reasonable to think that the same considerations would apply to transcription factor binding with DNA.

2. Graur’s model employs some questionable assumptions.

Graur uses an unrealistically high rate for deleterious mutations in his calculations.

Graur determined the deleterious mutation rate using protein-coding genes. These DNA sequences are highly sensitive to mutations. In contrast, other regions of the genome that display function—such as those that (1) dictate the three-dimensional structure of chromosomes, (2) serve as transcription factors, and (3) aid as histone binding sites—are much more tolerant to mutations. Ignoring these sequences in the modeling work artificially increases the amount of required junk DNA to maintain a constant population size.

3. The way Graur determines if DNA sequence elements are functional is questionable.

Graur uses the selected-effect definition of function. According to this definition, a DNA sequence is only functional if it is undergoing negative selection. In other words, sequences in genomes can be deemed functional μόνο if they evolved under evolutionary processes to perform a particular function. Once evolved, these sequences, if they are functional, will resist evolutionary change (due to natural selection) because any alteration would compromise the function of the sequence and endanger the organism. If deleterious, the sequence variations would be eliminated from the population due to the reduced survivability and reproductive success of organisms possessing those variants. Hence, functional sequences are those under the effects of selection.

In contrast, the ENCODE project employed a αιτιώδης συνάφεια definition of function. Accordingly, function is ascribed to sequences that play some observationally or experimentally determined role in genome structure and/or function.

The ENCODE project focused on experimentally determining which sequences in the human genome displayed biochemical activity using assays that measured

  • transcription,
  • binding of transcription factors to DNA,
  • histone binding to DNA,
  • DNA binding by modified histones,
  • DNA methylation, and
  • three-dimensional interactions between enhancer sequences and genes.

In other words, if a sequence is involved in any of these processes—all of which play well-established roles in gene regulation—then the sequences must have functional utility. That is, if sequence Q performs function σολ, then sequence Q is functional.

So why does Graur insist on a selected-effect definition of function? For no other reason than a causal definition ignores the evolutionary framework when determining function. He insists that function be defined exclusively within the context of the evolutionary paradigm. In other words, his preference for defining function has more to do with philosophical concerns than scientific ones—and with a deep-seated commitment to the evolutionary paradigm.

As a biochemist, I am troubled by the selected-effect definition of function because it is theory-dependent. In science, cause-and-effect relationships (which include biological and biochemical function) need to be established experimentally and observationally, independent of any particular theoryΤο Once these relationships are determined, they can then be used to evaluate the theories at hand. Do the theories predict (or at least accommodate) the established cause-and-effect relationships, or not?

Using a theory-dependent approach poses the very real danger that experimentally determined cause-and-effect relationships (or, in this case, biological functions) will be discarded if they don’t fit the theory. And, again, it should be the other way around. A theory should be discarded, or at least reevaluated, if its predictions don’t match these relationships.

What difference does it make which definition of function Graur uses in his model? A big difference. The selected-effect definition is more restrictive than the causal-role definition. This restrictiveness translates into overlooked function and increases the replacement level fertility rate.

4. Buffering against deleterious mutations is a function.

As part of his model, Graur argues that junk DNA is necessary in the human genome to buffer against deleterious mutations. By adopting this view, Graur has inadvertently identified function for junk DNA. In fact, he is not the first to argue along these lines. Biologist Claudiu Bandea has posited that high levels of junk DNA can make genomes resistant to the deleterious effects of transposon insertion events in the genome. If insertion events are random, then the offending DNA is much more likely to insert itself into “junk DNA” regions instead of coding and regulatory sequences, thus protecting information-harboring regions of the genome.

If the last decade of work in genomics has taught us anything, it is this: we are in our infancy when it comes to understanding the human genome. The more we learn about this amazingly complex biochemical system, the more elegant and sophisticated it becomes. Through this process of discovery, we continue to identify functional regions of the genome—DNA sequences long thought to be “ junk. ”

In short, the criticisms of the ENCODE project reflect a deep-seated commitment to the evolutionary paradigm and, bluntly, are at war with the experimental facts.

Bottom line: if the ENCODE results stand, it means that key aspects of the evolutionary paradigm can’t be correct.


Perennial Problem of C-Value

Information and Structure.

The junk idea long predates genomics and since its early decades has been grounded in the “C-value paradox,” the observation that DNA amounts (C-value denotes haploid nuclear DNA content) and complexities correlate very poorly with organismal complexity or evolutionary “advancement” (10 ⇓ ⇓ ⇓ –14). Humans do have a thousand times as much DNA as simple bacteria, but lungfish have at least 30 times more than humans, as do many flowering plants and some unicellular protists (14). Moreover, as is often noted, the disconnection between C-value and organismal complexity is also found within more restricted groups comprising organisms of seemingly similar lifestyle and comparable organismal or behavioral complexity. The most heavily burdened lungfish (Protopterus aethiopicus) lumbers around with 130,000 Mb, but the pufferfish Τακιφούγκου (προηγουμένως Fugu) rubripes gets by on less than 400 Mb (15, 16). A less familiar but better (because monophyletic) animal example might be amphibians, showing a 120-fold range from frogs to salamanders (17). Among angiosperms, there is a thousandfold variation (14). Additionally, even within a single genus, there can be substantial differences. Salamander species belonging to Πλήθοδων boast a fourfold range, to cite a comparative study popular from the 1970s (18). Sometimes, such within-genus genome size differences reflect large-scale or whole-genome duplications and sometimes rampant selfish DNA or transposable element (TE) multiplication. Schnable et al. (19) figure that the maize genome has more than doubled in size in the last 3 million y, overwhelmingly through the replication and accumulation of TEs for example. If we do not think of this additional or “excess” DNA, so manifest through comparisons between and within biological groups, as junk (irrelevant if not frankly detrimental to the survival and reproduction of the organism bearing it), how then are we to think of it?

Of course, DNA inevitably does have a basic structural role to play, unlinked to specific biochemical activities or the encoding of information relevant to genes and their expression. Centromeres and telomeres exemplify noncoding chromosomal components with specific functions. More generally, DNA as a macromolecule bulks up and gives shape to chromosomes and thus, as many studies show, determines important nuclear and cellular parameters such as division time and size, themselves coupled to organismal development (11 ⇓ –13, 17). The “selfish DNA” scenarios of 1980 (20 ⇓ –22), in which C-value represents only the outcome of conflicts between upward pressure from reproductively competing TEs and downward-directed energetic restraints, have thus, in subsequent decades, yielded to more nuanced understandings. Cavalier-Smith (13, 20) called DNA’s structural and cell biological roles “nucleoskeletal,” considering C-value to be optimized by organism-level natural selection (13, 20). Gregory, now the principal C-value theorist, embraces a more “pluralistic, hierarchical approach” to what he calls “nucleotypic” function (11, 12, 17). A balance between organism-level selection on nuclear structure and cell size, cell division times and developmental rate, selfish genome-level selection favoring replicative expansion, and (as discussed below) supraorganismal (clade-level) selective processes—as well as drift—must all be taken into account.

These forces will play out differently in different taxa. González and Petrov (23) point out, for instance, that Δροσόφιλα and humans are at opposite extremes in terms of the balance of processes, with the minimalist genomes of the former containing few (but mostly young and quite active) TEs, whereas at least one-half of our own much larger genome comprises the moribund remains of older TEs, principally SINEs and LINEs (short and long interspersed nuclear elements). Such difference may in part reflect population size. As Lynch notes, small population size (characteristic of our species) will have limited the effectiveness of natural selection in preventing a deleterious accumulation of TEs (24, 25).

Zuckerkandl (26) once mused that all genomic DNA must be to some degree “polite,” in that it must not lethally interfere with gene expression. Indeed, some might suggest, as I will below, that true junk might better be defined as DNA not currently held to account by selection for any sort of role operating at any level of the biological hierarchy (27). However, junk advocates have to date generally considered that even DNA fulfilling bulk structural roles remains, in terms of encoded information, just junk. Cell biology may require a certain C-value, but most of the stretches of noncoding DNA that go to satisfying that requirement are junk (or worse, selfish).

In any case, structural roles or multilevel selection theorizing are not what ENCODE commentators are endorsing when they proclaim the end of junk, touting the existence of 4 million gene switches or myriad elements that determine gene expression and assigning biochemical functions for 80% of the genome. Indeed, there would be no excitement in either the press or the scientific literature if all the ENCODE team had done was acknowledge an established theory concerning DNA’s structural importance. Rather, the excitement comes from interpreting ENCODE’s data to mean that a much larger fraction of our DNA than until very recently thought contributes to our survival and reproduction as organisms, because it encodes information transcribed or expressed phenotypically in one tissue or another, or specifically regulates such expression.

A Thought Experiment.

ENCODE (5) defines a functional element (FE) as “a discrete genome segment that encodes a defined product (for example, protein or non-coding RNA) or displays a reproducible biochemical signature (for example, protein binding, or a specific chromatin structure).” A simple thought experiment involving FEs so-defined is at the heart of my argument.

Suppose that there had been (and probably, some day, there will be) ENCODE projects aimed at enumerating, by transcriptional and chromatin mapping, factor footprinting, and so forth, all of the FEs in the genomes of Τακιφούγκου and a lungfish, some small and large genomed amphibians (including several species of Πλήθοδων), plants, and various protists. There are, I think, two possible general outcomes of this thought experiment, neither of which would give us clear license to abandon junk.

The first outcome would be that FEs (estimated to be in the millions in our genome) turn out to be more or less constant in number, regardless of C-value—at least among similarly complex organisms. If larger C-value by itself does not imply more FEs, then there will, of course, be great differences in what we might call functional density (FEs per kilobase) (26) among species. FEs spaced by kilobases in Arabidopsis would be megabases apart in maize on average. Averages obscure details: the extra DNA in the larger genomes might be sequestered in a few giant silent regions rather than uniformly stretching out the space between FEs or lengthening intragenic introns. However, in either case, this DNA could be seen as a sort of polite functionless filler or diluent. At best, such DNA might have functions only of the structural or nucleoskeletal/nucleotypic sort. Indeed, even this sort of functional attribution is not necessary. There is room within an expanded, pluralistic and hierarchical theory of C-value (see below) (12, 27) for much DNA that makes no contribution whatever to survival and reproduction at the organismal level and thus is junk at that level, although it may be under selection at the sub- or supraorganismal levels (TEs and clade selection).

If the human genome is junk-free, then it must be very luckily poised at some sort of minimal size for organisms of human complexity. We may no longer think that mankind is at the center of the universe, but we still consider our species’ genome to be unique, first among many in having made such full and efficient use of all of its millions of SINES and LINES (retrotransposable elements) and introns to encode the multitudes of lncRNAs and house the millions of enhancers necessary to make us the uniquely complex creatures that we believe ourselves to be. However, were this extraordinary coincidence the case, a corollary would be that junk would not be defunct for many other larger genomes: the term would not need to be expunged from the genomicist’s lexicon more generally. As well, if, as is commonly believed, much of the functional complexity of the human genome is to be explained by evolution of our extraordinary cognitive capacities, then many other mammals of lesser acumen but similar C-value must truly have junk in their DNA.

The second likely general outcome of my thought experiment would be that FEs as defined by ENCODE increase in number with C-value, regardless of apparent organismal complexity. If they increase roughly proportionately, FE numbers will vary over a many-hundredfold range among organisms normally thought to be similarly complex. Defining or measuring complexity is, of course, problematic if not impossible. Still, it would be hard to convince ourselves that lungfish are 300 times more complex than Τακιφούγκου or 40 times more complex than us, whatever complexity might be. More likely, if indeed FE numbers turn out to increase with C-value, we will decide that we need to think again about what function is, how it becomes embedded in macromolecular structures, and what FEs as defined by ENCODE have to tell us about it.


What's the origin of junk DNA? - Βιολογία

NIST-led Research De-Mystifies Origins Of 'Junk' DNA

One man's junk, is another's treasure
Washington - Mar 26, 2004
A debate over the origins of what is sometimes called "junk" DNA has been settled by research involving scientists at the Center for Advanced Research in Biotechnology (CARB) and a collaborator, who developed rigorous proof that these mysterious sections were added to DNA "late" in the evolution of life on earth--after the formation of modern-sized genes, which contain instructions for making proteins.

A biologist with the Commerce Department's National Institute of Standards and Technology (NIST) led the research team, which reported its findings in the March 10 online edition of Molecular Biology and Evolution.

The results are based on a systematic, statistically rigorous analysis of publicly available genetic data carried out with bioinformatics software developed at CARB.

In humans, there is so much apparent "junk" DNA (sections of the genome with no known function) that it takes up more space than the functional parts. Much of this junk consists of "introns," which appear as interruptions plopped down in the middle of genes.

Discovered in the 1970s, introns mystify scientists but are readily accounted for by cells: when the cellular machinery transcribes a gene in preparation for making a protein, introns are simply spliced out of the transcript.

Research from the CARB group appears to resolve a debate over the "early versus late" timing of the appearance of introns. Since introns were discovered in 1978, scientists have debated whether genes were born split (the "introns-early" view), or whether they became split after eukaryotic cells (the ones that gave rise to animals and their relatives) diverged from bacteria roughly 2 billion years ago (the "introns-late" view).

Bacterial genomes lack introns. Although the study did not attempt to propose a function for introns, or determine whether they are beneficial or harmful, the results appear to rule out the "introns-early" view.

The CARB analysis shows that the probability of a modern intron's presence in an ancestral gene common to the genes studied is roughly 1 percent, indicating that the vast majority of today's introns appeared subsequent to the origin of the genes.

This conclusion is supported by the findings regarding placement patterns for introns within genes. It long has been observed that, in the sequences of nitrogen-containing compounds that make up our DNA genomes, introns prefer some sites more than others. The CARB study indicates that these preferences are side effects of late-stage intron gain, rather than side effects of intron-mediated gene formation.

The CARB results are based on an analysis of carefully processed data for 10 families of protein-coding genes in animals, plants, fungi and their relatives (see sidebar for details of the method used). A variety of statistical modeling, theoretical, and automated analytical approaches were used while most were conventional, their combined application to the study of introns was novel.

The CARB study also is unique in using an evolutionary model as the basis for inferring the presence of ancestral introns. The research was made possible in part by the increasing availability, over the past decade, of massive amounts of genetic sequence data.

The lead researcher is Arlin B. Stoltzfus of NIST collaborators include Wei-Gang Qiu, formerly of CARB and the University of Mayland and now at Hunter College in New York City, and Nick Schisler, currently at Furman University, Greenville, S.C.

CARB is a cooperative venture of NIST and the University of Maryland Biotechnology Institute.

CARB's Approach to Understanding the Origins of 'Junk' DNA

Scientists long have compared the sequences of chemical compounds in different proteins, genes and entire genomes to derive clues about structure and function.

The most sophisticated comparative methods are evolutionary and rely on matching similar sequences from different organisms, inferring family trees to determine relationships, and reconstructing changes that must have occurred to create biologically relevant differences.

This type of analysis is usually done with one sequence family at a time. The Center for Advanced Research in Biotechnology (CARB), a cooperative venture of the Commerce Department's National Institute of Standards and Technology (NIST) and the University of Maryland Biotechnology Institute, developed software to automate the analysis of dozens--and perhaps hundreds, eventually--of sequence families at a time.

The automated methods also assess the reliability of all the information, so that conclusions are based on the most reliable parts of the analysis.

The CARB method has two parts. The first part consists of a combination of manual and automated processing of gene data from public databases. The data are clustered into families through matching of similar sequences, first in pairs and then in groups.

Then family trees are developed indicating how the genes are related to each other. A file is developed for each family that includes data on sequence matches, intron locations, family trees and reliability measures.

These datasets then are loaded into the second part of the system, which is fully automated. It consist of a relational database combined with software that computes probabilities for introns being present in ancestral genes using a method developed at CARB.

Each gene is assigned to a kingdom (plants, animals, fungi and others), and a matrix of intron presence/absence data is determined for each family based on the sequence alignments. This matrix, along with the family tree, is used to estimate ancestral states of introns, as well as rates of intron loss and gain. Additional software is used for analysis and visualization of results.

The CARB study analyzed data for 10 families of protein-coding genes in multi-celled organisms, encompassing 1,868 introns at 488 different positions.

Life-Seeking Chip Will Join Space Probes
Pasadena (UPI) Mar 23, 2004
U.S. scientists said Tuesday they have developed a miniature laboratory that can spot a tell-tale chemical signature of life.

With the rise of Ad Blockers, and Facebook - our traditional revenue sources via quality network advertising continues to decline. And unlike so many other news sites, we don't have a paywall - with those annoying usernames and passwords.


Δες το βίντεο: What is Junk DNA? Why is it important? (Φεβρουάριος 2023).