Omul posedă un bagaj genetic de cinci ori mai mic decât cel al cepei și doar puţin mai mare decât cel al unui șoarece. Ar folosi un creator al vieţii pentru o ceapă de cinci ori mai multă informaţie genetică decât pentru un om? Sau ar fi creat El omul doar puţin mai complex decât un șoarece, din punct de vedere genetic? Nu sunt procesele evolutive, îndelungate și fără scop, o explicaţie mai bună pentru aceste observaţii?

Enigma valorii C

Se știe deja de mult timp că nu se poate găsi o corelaţie bună între dimensiunea genomurilor organismelor și gradul lor aparent de complexitate. Ne-am aștepta ca omul, cu cele 3,2 miliarde de nucleotide din genomul său, să fie cumva special în comparaţie cu celelate specii de pe planetă.

Realitatea este diferită: protozoarele, o clasă de organisme microscopice cu celule nespecializate, pot avea genomuri foarte mari. De exemplu, Amoeba Dubia are 670 de miliarde de nucleotide, adică de peste 200 de ori mai multe decât genomul uman. Amoeba Proteus are 290 de miliarde de nucleotide, de aproape 90 de ori mai multe decât omul[1]. Un genom amfibian, al unei broscuţe, de exemplu, este de cel puţin 2 ori mai mare decât cel al omului, dar poate fi chiar și de 10 ori mai mare. Și plantele au genomuri care variază enorm de la foarte mic la gigantic. Paris Japonica, o floare simplă, dar rară din Japonia deţine recordul, cu un genom de 50 de ori mai mare decât cel uman.

Exemplele de mai sus atrag atenţia asupra a ceea ce, în biologia moleculară, este cunoscută ca „enigma valorii C“. „Valoarea C“ se referă la dimensiunea genomului, iar problema valorii C constă în dificultatea de a găsi o explicaţie pentru discrepanţele majore care apar între dimensiunile genomurilor diferitelor specii și complexitatea lor aparentă.

Totuși nu se poate vorbi de o lipsă totală de corelare între dimensiunea genomului și complexitatea speciei. Dacă împărţim organismele pe familii și categorii se observă că, în cadrul aceleiași categorii, variaţiile de dimensiune ale genomului sunt în general mult mai mici.

Dacă dăm la o parte plantele[2], amfibienii și alte câteva categorii, restul familiilor de organisme prezintă variaţii mai mici de dimensiune a genomului și se și ordonează, în mare, de la simplu la complex, în funcţie de dimensiunea genomului (vezi graficul). Este interesant că familia mamiferelor, din care facem și noi parte, are un interval de dimensiuni remarcabil de compact. O corelare se poate, deci, observa, dar ea este totuși slabă și prezintă contradicţii. Așadar, problema valorii C este legată atât de slaba corelare între dimensiunea genomului și complexitatea speciei, cât, mai ales, de contradicţiile flagrante care se cunosc faţă de aceasta.

Funcţiile ADN-ului

În articolul precedent am arătat cum genomul uman poate fi vizualizat mental ca o înșiruire de peste 3 miliarde de litere (A, C, G sau T). Doar o mică proporţie din acest șir reprezintă gene. Genele sunt subșiruri ce pot varia în lungime de la câteva sute la câteva zeci de mii de litere dispuse aparent la întâmplare în înlănţuirea genomului, fără să se suprapună[3].

Secvenţele de ADN din gene produc proteine prin intermedierea unei molecule asemănătoare ADN-ului, numită ARN. Proteinele sunt considerate a fi „scopul“ funcţional al genelor și scopul celulei în general, iar sinteza ADN > ARN > proteine este „dogma centrală a biologiei moleculare“.

ADN-ul din genom poate fi împărţit în două mari categorii, și anume în funcţional și nefuncţional, după cum cred cercetătorii că anumite secvenţe servesc unui scop în celulă sau că, dimpotrivă, ele nu servesc niciunui scop. Secvenţele ADN ce definesc proteine în cadrul genelor se cheamă secvenţe codificatoare și, împreună cu secvenţele ce sunt implicate în controlarea expresiei acestor gene, sunt denumite secvenţe funcţionale (în ideea că funcţia unei celule este în principal producerea de proteine). Celelalte secvenţe sunt numite, prin excludere, nefuncţionale. La organismele multicelulare complexe peste 95% din genom este, în general, considerat nefuncţional. La om, procentul ADN-ului nefuncţional în genom este de peste 90%, iar procentul ADN-ului necodificator urcă până la 98%.

Este interesant că nu numai dimensiunea generală a genomului nu se corelează bine cu complexitatea organismului, ci și numărul de gene din genom. De fapt, numărul de gene al unui organism nu are aproape nicio corelare cu complexitatea organismului. Am fi tentaţi să credem că, dacă oamenii au aproximativ 22.000 de gene, alte organisme ar avea mult mai puţine. Dar orezul are aproape dublu, 41.000 de gene, iar un vierme rotund folosit des în studii genetice, C. Elegans, are 20.000 de gene, aproape la fel de multe ca un om. Oricum, dimensiunea genomului funcţional (care include și genele) fiind considerată atât de mică, problema valorii C este, practic, o problemă a zonelor vaste din genom, considerate nefuncţionale.

Dumnezeu și testul cepei

Conform teoriei evoluţiei, enigma valorii C este deja soluţionată: nu există o corelare bună între dimensiunea genomurilor și complexitatea organismelor deoarece genomurile sunt, în proporţie covârșitoare, formate din ADN fără funcţie, un fel de „gunoi“ evolutiv lăsat în urmă de sute de milioane de ani de copieri și mutaţii la întâmplare. Iar acest gunoi poate fi prezent în orice cantitate, fără legătură cu complexitatea organismului. Prezenţa ADN-ului nefuncţional, și mai ales cantitatea acestuia, este o idee combătută de cei care susţin necesitatea unui Creator inteligent al vieţii, dar și de numeroși cercetători evoluţioniști.

Pentru a cataliza dezbaterea, biologul evoluţionist T. Ryan Gregory a imaginat un test simplu și direct pentru oricine crede că a găsit o funcţie universală a ADN-ului nefuncţional. Testul este acesta: indiferent care ar fi funcţia vizată pentru ADN-ul nefuncţional, cel care o propune trebuie să justifice de ce o ceapă necesită de cinci ori mai mult ADN nefuncţional decât un om[4]. Nu este nimic special legat de ceapă, este doar un exemplu la întâmplare, dar familiar oricui, care ilustrează importanţa problemei valorii C în contextul controverselor asupra ADN-ului nefuncţional. Acest așa-zis test al cepei a căpătat rapid expunere și popularitate în comunitatea știinţifică evoluţionistă și a devenit de referinţă în privinţa teoriilor legate de „funcţiile“ ADN-ului nefuncţional. „Testul cepei“ este unul dintre cele mai puternice și mai des invocate argumente genetice aduse în favoarea evoluţiei.

Perspectiva evoluţiei

Un concept foarte important cu care lucrează teoria evoluţiei pentru a identifica secvenţele ADN care pot fi funcţionale este cel al conservării. Să presupunem că o anumită secvenţă ADN se găsește, identic sau asemănător, atât în genomul omului, cât și în cel al șoarecelui. Gândirea evoluţionistă presupune că aceasta a fost prezentă cu mult timp în urmă într-un strămoș comun, de la care au moștenit-o atât omul, cât și șoarecele. Și dacă această secvenţă a fost reţinută atât de mult timp în genomurile  omului și ale șoarecelui, în pofida acţiunii continue de degradare produse de mutaţiile aleatorii, atunci ea trebuie să fie și folositoare la ceva. Aceasta se numește presiune selectivă negativă: o secvenţă care are o funcţie folositoare rezistă, peste generaţii, degradării cauzate de mutaţiile aleatorii pentru că pierderea funcţiei respective ar duce la o posibilitate scăzută a organismului de a supravieţui și de a lăsa urmași.

Cu alte cuvinte, atunci când analizează două secvenţe ADN asemănătoare provenind de la două specii diferite, teoria evoluţiei „vede“: un strămoș comun, mult timp trecut de la acel strămoș comun, presiune selectivă negativă și, cel mai important, „funcţionalitate“. Deși poate părea greoi și contraintuitiv acest fel de a interpreta asemănarea, este greu de supraestimat rolul acestui concept în teoria evoluţiei și în interpretarea evolutivă a genomului. Este unul din cele mai „sacre“ concepte ale evoluţiei în genetică.

Paris Japonica, o plantă rară din Japonia, secvenţializată recent, are un genom de 50 de ori mai mare decât cel uman.

O observaţie generală foarte interesantă legată de ADN-ul nefuncţional vizează faptul potrivit căruia el este „conservat“ între specii într-o măsură mult mai mică decât ADN-ul care codifică proteine și decât cel care reglementează expresia genelor. Aici se găsește un alt argument important al teoriei evoluţiei în afară de testul cepei: dacă funcţional înseamnă „conservat“, atunci ADN-ul nefuncţional este pe drept cuvânt numit așa deoarece el este, în mare măsură, neconservat, adică reprezintă o rămășiţă a evoluţiei peste zone inactive din genom.

Recent, revista Nature a publicat un studiu al unui grup internaţional de 29 de cercetători, despre Utricularia Gibba, o plantă carnivoră asemănătoare cu orhideele[5]. Faptul remarcabil este că această plantă are un genom cu extrem de puţin ADN nefuncţional. Această descoperire a fost atât de neașteptată, încât a fost imediat publicată într-una dintre cele mai prestigioase reviste știinţifice. Deși conţine mai multe gene decât genomul unui om, genomul U. Gibba este, în tota,l de peste 40 de ori mai mic decât cel uman, iar procentul de ADN nefuncţional este estimat la doar 3%.

Mai mult, o analiză comparativă a ADN-ului U. Gibba în raport cu cel al altor plante considerate înrudite, de la roșii la orhidee și tradiţionalele „gura leului”, arată că U. Gibba a reușit cumva să taie din genom bucăţi importante fără să-și fi pierdut viabilitatea. Cu alte cuvinte, iată o plantă care reușește să supravieţuiască fără mare parte din genomul nefuncţional prezent la plantele înrudite cu ea. Deși lista nu este completă, acestea sunt câteva dintre argumentele cele mai semnificative care sprijină teoria evoluţiei în ceea ce privește nefuncţionalitatea unei mari părţi din genomul organismelor.

O problemă de paradigmă

Relaţia dintre asemănare și conservare. După cum am văzut, teoria evoluţiei vede în asemănarea dintre două secvenţe ADN mai mult decât atât, vede o descendenţă dintr-un strămoș comun, timp îndelungat și o presiune selectivă negativă. Bineînţeles, însă, că două secvenţe pot fi asemănătoare și pentru simplul motiv că un Creator a folosit componente asemănătoare pentru a îndeplini funcţii asemănătoare în organisme diferite. Ce explicaţie este mai plauzibilă prin simplitate și în experienţa de zi cu zi?

Citește și:

Perspectiva informatică. Pentru că atunci când vorbim despre genom vorbim de informaţie în formă activă, executabilă, se poate face o analogie legitimă cu un alt domeniu în care cunoașterea este mult mai amplă, și anume cu informatica (programele de calculator). În primul rând, dacă am observa funcţionarea unui program de calculator, am vedea că sub 10% din cod acaparează peste 90% din timpul de rulare al programului. Aceasta este o observaţie general valabilă, cunoscută de mult timp, însă, chiar dacă 90% din cod este activ foarte rar, asta nu înseamnă că nu este important sau funcţional. Dimpotrivă, acesta poate fi critic pentru integritatea procesului. Structuri specifice din ADN-ul nefuncţional (secvenţe repetitive, transpozoni) se pot găsi și în codul executabil al unui program de calculator și au un rol funcţional clar. Codul poate, de asemenea, să fie înţesat de porţiuni foarte rar folosite (de exemplu secţiuni pentru compatibilităţi cu diverse sisteme vechi sau rar întâlnite), dar aceasta, iarăși, nu îl face nefuncţional. Codul în forma executabilă poate părea o adunătură aleatorie de litere, iar inspecţia funcţionării lui poate releva zone extinse care nu sunt „folosite“ mai deloc. Această situaţie este deloc ieșită din comun pentru un program de calculator, care este, de fapt, cât se poate de funcţional și nealeator. Același tip de comportament, observat în cazul genomului organismelor, este interpretat radical diferit.

Cunoașterea limitată. Biologia moleculară contemporană susţine că procesele de dezvoltare și coordonare ale unui organism multicelular sunt puse în scenă de o simfonie de proteine și interacţiuni, imposibil de cuprins în complexitatea ei, în care cascade de reacţii și condiţionări reciproce între concentraţiile de proteine pe plan local produc organizare și coordonare intercelulară pe plan global. Privind la această abordare, sentimentul unui informatician este că se încearcă înţelegerea scopului și funcţionării unui software complex, precum un sistem de operare, analizând statistic tiparele de semnale electrice transmise între diferitele componente electronice ale calculatorului. Este adevărat că un calculator funcţionează cu semnale electrice și este adevărat că, „teoretic“, se poate construi un model fidel al sistemului de operare pornind de la această abordare, dar acest lucru nu este practic realizabil, inteligibil sau folositor. Există niveluri de abstractizare care sunt foarte folositoare pentru ca mintea umană să poată înţelege ceva așa de complex precum funcţionarea unui calculator: nivelul principiilor fizice de bază, nivelul componentelor electronice de bază, nivelul componentelor mari, nivelul arhitecturii sistemului și așa mai departe, până la nivelul software, unde găsim în final comportamentul și funcţia sistemului. Oare încercarea de a descrie funcţionalitatea unui organism în termeni de interacţiuni moleculare între proteinele produse de celule nu este, până la urmă, la fel de absurdă ca descrierea un sistem de operare Windows în termeni de impulsuri electrice prin tranzistori?

„Capriciile“ Creatorului. Ne așteptăm ca un Dumnezeu Creator să facă lucruri care să urmărească în general un scop cu maximă eficienţă. El are însă și privilegiul de a avea „capricii“ creative care să nu se supună imperativului de eficienţă sau de funcţionalitate, și este minunat că se întâmplă așa. Avem motive să ne îndoim că acest privilegiu al Creatorului nu se manifestă la toate nivelurile, inclusiv la cel genetic? De aceea, din perspectiva unui Dumnezeu Creator, deși ne așteptam să găsim cât mai multă funcţionalitate în genomurile organismelor, este nerezonabil să pretindem să găsim si să înţelegem o funcţionalitate completă. Dumnezeu are prerogativele Sale.

Universul ARN

În articolul precedent am menţionat proiectul ENCODE[6], un efort de cercetare masiv asupra ADN-ului nefuncţional uman. Spre surprinderea multor biologi, acest proiect a relevat existenţa unei activităţi biochimice frenetice în, practic, tot genomul care se considera nefuncţional până atunci. Desigur, activitate intensă nu înseamnă neapărat și funcţionalitate utilă, la fel cum valurile mării, deși sunt foarte active, nu înseamnă nimic. Totuși, cercetătorii ENCODE au făcut mai mult decât să catalogheze activitatea ADN-ului nefuncţional uman. Ei au descoperit semne clare că această activitate nu este nici pe departe întâmplătoare și că mare parte din ea poate fi legată de procese celulare bine stabilite. Această sugestie, că ADN-ul nefuncţional poate să fie până la urmă funcţional, a iritat comunitatea știinţifică evoluţionistă, care a reacţionat prin numeroase articole critice. Unul dintre biologii evoluţioniști care a sărit însă în apărarea rezultatelor ENCODE este John Mattick, un respectat om de știinţă specializat în ARN-ul necodificator.

După cum am menţionat, molecula ARN este acea moleculă intermediară între ADN și proteină, conform dogmei centrale a biologiei moleculare. Însă ADN-ul este transcris în ARN în cadrul celulei în mult mai multe scenarii în afară de producţia de proteine. Practic, ce a găsit ENCODE este că întreg genomul nefuncţional al omului este acoperit de zone care sunt, în diverse condiţii, transcrise în ARN.

Mattick observă, pentru început, că atât numărul, cât și tipurile de gene care codifică proteine sunt relativ constante pentru majoritatea animalelor. C. Elegans, un vierme de doar 1.000 de celule, are aproape același număr de gene precum cel întâlnit la om, dar cel mai uimitor este că majoritatea genelor care produc proteine sunt asemănătoare dacă ne raportăm la cele două specii, inclusiv aproape toate proteinele-cheie ce reglementează dezvoltarea embrionară și creșterea. Mai mult decât atât, majoritatea organismelor vii au un număr foarte mare de gene comune, în timp ce genele unice sunt extrem de puţine în natură, de ordinul a 10.000, după estimările curente. Rezultă că, cel puţin pentru animale, setul de componente de bază, adică de gene, este comun în cea mai mare parte.

Este însă important de reţinut că numărul genelor care codifică proteine (ADN-ul funcţional, în general) nu se corelează în niciun fel cu complexitatea unui organism. Singura parte a genomului a cărei dimensiune se corelează cât de cât cu complexitatea organismelor, deși slab și cu numeroase excepţii, după cum am văzut, este partea considerată nefuncţională. Exact această parte a genomului, deși netranspusă în proteine, este totuși intens transcrisă în molecule ARN. Iar producerea acestui ARN necodificator este precis diferenţiată după factori de mediu, de specificitate de ţesut sau de stadiu de dezvoltare a organismului. Această activitate specifică poate reprezenta unul din două lucruri: zgomot de fond aleatoriu dat de un genom nefuncţional sau funcţionalitate reală. Toate experimentele de până acum relevă însă că producerea de ARN necodificator este extrem de precisă în ceea ce privește localizarea celulei în corp, tipul celulei și stadiul de dezvoltare al organismului. Mai mult, se observă că zonarea și transportul acestor molecule în interiorul celulei este de asemenea extrem de precis.  Aceste caracteristici sunt indicii importante ale faptului că nu ne confruntăm cu un zgomot de fond.

Mattick se întreabă dacă teoria actuală nu cumva reprezintă în mod fundamental greșit structura programării genetice în organismele multicelulare din cauza modelului prea simplist după care se crede că este reglementată exprimarea genelor. Există indicii clare ale unui nivel vast și ascuns de reţele de control al genelor, bazat pe ARN-ul necodificator, care sunt implicate în direcţionarea dezvoltării embrionare și a creșterii, iar acest ARN derivă din ADN-ul considerat nefuncţional. Mai mult decât atât, aproape întregul ADN nefuncţional uman este transcris de celule în molecule ARN. Deja se cunoaște cu certitudine că o clasă răspândită de ARN necodificator, numită micro-ARN, este implicată profund în direcţionarea proceselor de dezvoltare multicelulară atât la plante, cat și la animale. De asemenea, abia încep să fie descoperite roluri complexe pentru secvenţele lungi și foarte lungi de ARN necodificator.

Evoluţie sau Creaţie

Suntem în măsură, acum, să formulăm atât răspunsuri, cât și critici la adresa perspectivei evoluţioniste asupra ADN-ului nefuncţional și a enigmei valorii C.

Din perspectiva teoriei evoluţiei, corelarea foarte slabă dintre dimensiunea genomului și complexitatea organismului (enigma valorii C) este indusă de prezenţa ADN-ului nefuncţional în genom, în cantităţi vaste și arbitrare. Asta ar însemna însă ca dimensiunea părţii funcţionale a genomului să se coreleze bine cu complexitatea organismelor. Acest lucru nu se observă în realitate. Numărul de gene dintr-un organism nu are nicio legătură cu complexitatea sa, iar o mare parte din acestea sunt gene comune pentru o mare varietate de alte organisme. Majoritatea mamiferelor au cam același număr de gene, iar amfibienii au, în general, mult mai multe gene decât mamiferele. Dacă o muscă are 15.000 de gene, unde se regăsește diferenţa de complexitate până la om, care are abia 22.000 de gene? Cum poate un ovul fecundat să se dezvolte într-un om adult printr-un proces ghidat de doar 22.000 de gene, mai ales când peste 70% din acestea sunt identice sau foarte apropiate ca secvenţă de genele omoloage ale unui șoarece, de exemplu? Ceva pare profund în neregulă cu viziunea noastră asupra a ceea ce este funcţional și a ceea ce este nefuncţional în genom.

Nici conservarea mult mai pronunţată a genelor faţă de ADN-ul nefuncţional nu are nevoie de o explicaţie evolutivă dacă privim genele ca niște piese componente ale unui mecanism. Din același set de piese poţi să construiești mecanisme radical diferite. Acestea vor fi foarte asemănătoare din punctul de vedere al pieselor folosite, dar foarte diferite din punctul de vedere al combinării lor.

O problemă suplimentară pentru teoria evoluţiei ţine de dinamica ADN-ului nefuncţional. Teoria este că acesta se poate acumula în voie deoarece nu are efect asupra organismului, mai bine zis nu-i aduce acestuia niciun prejudiciu. Dar toată energia irosită cu replicarea și întreţinerea și toată mulţimea de reacţii în care este implicat un genom cu 95% mai mare decât e nevoie, adică această risipa fantastică, nu reprezintă în sine un handicap major? Și dacă se insistă că nu este un handicap și că ADN-ul nefuncţional este, într-adevăr, produsul a milioane de ani de copieri greșite, de mutaţii și secvenţe ADN egoiste, ce factori limitează acumularea de astfel de gunoi la infinit? Și de ce unele organisme, precum U. Gibba, par că nu au acumulat aproape deloc „gunoi“ în ADN?

Dar dacă ADN-ul nefuncţional nu este de fapt lipsit de funcţie, ce se poate spune despre U. Gibba, acea plantă rară din Japonia care supravieţuiește foarte bine cu ADN aproape deloc nefuncţional? În primul rând, trebuie remarcat că vorbim de o plantă foarte simplă, așa că un genom mic nu este surprinzător. Apoi, am putea de asemenea să ne întrebăm, dacă din genomul verzei sălbatice eliminăm acele zone de ADN care sunt „active“ doar pentru kale, brocoli și conopidă, oare planta rezultată nu ar rămâne tot o varză sălbatică, perfect viabilă, dar cu un genom mai mic? Poate că această remarcabilă U. Gibba ne oferă un indiciu despre limita extremă la care se poate duce un asemenea proces de „slăbire“, dar nu ne spune nimic despre cât de funcţionale sau nefuncţionale sunt părţile eliminate în cadrul procesului respectiv.

Așadar, de ce are ceapa de cinci ori mai mult material genetic decât un om? În primul rând, cred că cel mai sigur răspuns este că încă nu știm asta, în stadiul cunoașterii actuale. Teoria evoluţiei nu are un răspuns convingător la această chestiune, iar din perspectiva unui Creator inteligent al vieţii avem cel puţin niște indicii interesante: oare ce variaţii de forme și gusturi putem obţine cu răbdare, prin selecţie artificială, din banala ceapă, dacă dintr-o varza sălbatică, cu un genom mult mai mic, putem obţine atât de multe?

Concluzii

În concluzie, atât din perspectiva evoluţionistă, cât și din perspectiva creaţionistă, compararea complexităţii organismelor nu este o chestiune simplă ce se poate reduce la a număra litere sau gene în genom. Dimensiunea genomului unui organism nu este un indicator de complexitate aparentă, iar un genom supradimensionat nu este un indicator de nefuncţionalitate. Atât cât s-a putut studia la nivelul genomului uman și al altor câtorva organisme model, genomul este un furnicar de activitate. Însă, după cum există și genomuri cu dimensiuni foarte mari, este rezonabil să nu excludem categoric posibilitatea ca părţi însemnate de ADN să nu aibă un rol funcţional. Dumnezeu are prerogativele sale de Creator, acţiunile Sale nu trebuie să fie întotdeauna clare pentru noi, iar noi nu trebuie să uităm că nu trăim în lumea pe care El a creat-o iniţial. Totuși, chiar dacă alegerile precise de design ale lui Dumnezeu pot să ne fie neclare, ceea ce trebuie să fie clar, analizând dovezile, este că vorbim de design, și nu de hazard în alcătuirea genetică a organismelor.

Footnotes
[1]„Estimări mai recente indică o dimensiune a genomurilor acestor protozoare de aproape 10 ori mai mică. Chiar și așa, genomurile în cauză rămân însă extrem de mari.”
[2]„Plantele sunt supuse la nivel extins fenomenului de poliploidizare, prin care cromozomi întregi sunt reţinuţi în mai multe copii în genom. Aceasta este principala explicaţie pentru variaţia extremă de dimensiune genomică între plante.”
[3]„ Exista cazuri rare iî care genele se pot suprapune, dar, pentru simplitate, le vom ignora în acest articol.”
[4]„T. Ryan Gregory, „The onion test“, Genomicron, 25 aprilie 2007.”
[5]„Ibarra-Laclette et al, „Architecture and evolution of a minute plant genome“, Nature, 498, p. 94–98, 6 iunie 2013.”
[6]„The ENCODE Project Consortium, „A User’s Guide to the Encyclopedia of DNA Elements (ENCODE)“, PLoS Biol 9(4), 2011.”

„Estimări mai recente indică o dimensiune a genomurilor acestor protozoare de aproape 10 ori mai mică. Chiar și așa, genomurile în cauză rămân însă extrem de mari.”
„Plantele sunt supuse la nivel extins fenomenului de poliploidizare, prin care cromozomi întregi sunt reţinuţi în mai multe copii în genom. Aceasta este principala explicaţie pentru variaţia extremă de dimensiune genomică între plante.”
„ Exista cazuri rare iî care genele se pot suprapune, dar, pentru simplitate, le vom ignora în acest articol.”
„T. Ryan Gregory, „The onion test“, Genomicron, 25 aprilie 2007.”
„Ibarra-Laclette et al, „Architecture and evolution of a minute plant genome“, Nature, 498, p. 94–98, 6 iunie 2013.”
„The ENCODE Project Consortium, „A User’s Guide to the Encyclopedia of DNA Elements (ENCODE)“, PLoS Biol 9(4), 2011.”