¿Cuál es el porcentaje real de superposición de ADN entre los humanos y nuestros primos los primates más altos?

Sabía que Joshua Engel se las arreglaría para explicar esto muy bien antes de que pudiera hacerlo. Los porcentajes no te dicen mucho porque realmente se trata de cómo alineas tus secuencias. Simplemente agregaré algunos datos más, ya que me pidieron que respondiera esto y luego describiera lo que realmente estudió el documento vinculado. En primer lugar, el artículo vinculado no es muy relevante en cuanto a la similitud de los genomas humanos y los chimpancés en general, así que en vez de eso, señalaré un estudio sobre las diferencias genéticas en humanos y homínidos del laboratorio de Wen-Hsiung Li que realmente aborda la cuestión. 1] A continuación se presentan algunas de sus estimaciones de similitudes genéticas entre humanos y chimpancés.

Las diferencias promedio entre el ADN de los humanos y los chimpancés para varios “tipos” de secuencias de ADN . [1]
Codificación del ADN:

  • Sustituciones sinónimas (silenciosas) en el ADN que codifica proteínas: 1.11%
  • Sustituciones no sinónimas (alteración de aminoácidos) en el ADN que codifica proteínas: 0,80%
  • Cambios de aminoácidos: 1.34%

ADN no codificante:

  • ADN autosómico intergenico (ADN no codificante entre genes y no en cromosomas sexuales): 1.24%
  • ADN intergénico del cromosoma X: 1,16%
  • ADN intergénico del cromosoma Y: 1,68%
  • ADN intrónico (ADN dentro de los exones que se elimina antes de transcribir el ARNm): 1.03%
  • Psuedogenes (genes que han perdido sus funciones debido a mutaciones, deleciones o elementos transponibles): 1.56%
  • Diferencias en Alus (el elemento móvil / retrotransposones más abundantes en primates que comprenden aproximadamente el 10% de su genoma): 2%

Obtienen estos datos al elegir esencialmente una muestra aleatoria del “tipo” de secuencia de ADN deseado en humanos y en BLAST contra el genoma del chimpancé. Ellos comparan las coincidencias y asignan un porcentaje de similitud de secuencia entre ellos. Esta alineación eliminó repeticiones e ignoró inserciones y eliminaciones. El porcentaje se calcula a partir de sustituciones de un solo par de bases en secuencias de ADN alineadas, aunque no siempre secuencias alineadas de ADN codificante. Cuando observa una secuencia de ADN en un ser humano y la compara con la secuencia correspondiente en un chimpancé, excluyendo inserciones, eliminaciones y repeticiones que ocurrieron desde el último ancestro común, el 1-2% de los pares de bases habrá mutado y así 98-99% de los pares de bases serán idénticos. Esto es cierto tanto para el ADN codificador como para el no codificado. Incluso para las regiones del genoma que no son tan importantes y generalmente pueden soportar mutaciones, no ha habido suficientes generaciones entre este momento y nuestro último ancestro común para enmascarar la sorprendente similitud entre el chimpancé y el ADN humano. Según la similitud de secuencia, las tasas de mutación y los tiempos de generación, los autores estiman el último ancestro común de los chimpancés y humanos que vivió entre 4,6 y 6,2 millones de años.

Joshua se vincula a un documento con una forma diferente de describir la similitud entre los genomas de chimpancé y humano que explica las inserciones y eliminaciones (INDEL) y el número se acerca al 95%. La diferencia adicional de ~ 3.5% proviene de los INDEL que se encuentran principalmente en las regiones no codificantes del ADN. Este 3.5% adicional es el tema del artículo vinculado en los blogs, más sobre esto más adelante. No importa cómo se corte, las diferencias de secuencia entre humanos y chimpancés no son grandes.

¿Qué dice realmente el artículo discutido en el blog?

Los números anteriores de Chen et al. muestran una alta similitud de secuencia en todas las variedades de secuencias de ADN, tanto en las regiones codificantes como en las no codificantes. Quizás no sorprendentemente, las mutaciones que cambian la secuencia de aminoácidos son más raras que las de las regiones no codificantes, pero no mucho. Es importante recordar que mientras cada célula tiene el genoma de ADN completo que codifica todas las proteínas, diferentes células regulan en gran medida si transcriben el ARNm que se convierte en proteínas o no. Cuando transcriben el ARNm de un gen específico, están “expresando” ese gen. A pesar de que las secuencias de genomas humanos y de chimpancé son notablemente similares, los patrones de expresión génica entre humanos y chimpancés en varios tejidos no lo son.

Un estudio de expresión diferencial de genes utilizando microarrays encontró que, dependiendo del tipo de tejido, la cantidad mediana de genes con diferencias estadísticamente significativas en los niveles de expresión es algo así como ~ 30% (cerebro) a ~ 70% (testículos), y aproximadamente 85% de todos los genes se expresan diferencialmente en al menos uno de los cinco tejidos analizados. [2] El mensaje para llevar es que una pequeña variación en la secuencia general del genoma puede producir una variación mucho mayor en los patrones de expresión génica. Cuando y donde se expresa un gen, la mayoría de las formas en que se desarrollan, se ven y se comportan las células y, en consecuencia, cómo se desarrollan, se ven y se comportan los tejidos / órganos y, de manera más general, cómo se desarrollan, se ven y se comportan los diferentes organismos. No se necesitan grandes cambios en el genoma para cambiar las vías reguladoras lo suficiente para alterar cuándo y dónde se expresan los diferentes genes.

Finalmente llegamos al artículo citado en la publicación del blog (que es, en mi opinión, el menos significativo de los tres que he mencionado). Los autores querían estudiar si los INDEL (cerca del 3,5% de la diferencia entre humanos y chimpancés mencionados anteriormente) cerca de los genes podrían explicar algunas de las diferencias en la expresión de genes entre chimpancés y humanos. Recopilan una base de datos de los INDEL que difieren entre humanos y chimpancés y comparan estos genes con los datos de expresión de micromatrices de Khaitovich et al. Los INDEL dentro de 5 kb de un gen se consideraron “asociados” con ese gen. De todos los genes expresados ​​en los tejidos (~ 15,000), 30% (~ 4,000) se asociaron con un INDEL cercano y el 70% restante (~ 11,000) no se asociaron con un INDEL. De los aproximadamente 4.000 genes asociados a INDEL, aproximadamente el 54% (promediado en todos los tejidos) se expresaron diferencialmente y de los restantes 11.000 genes no asociados con INDEL, solo el 50% se expresaron diferencialmente. En otras palabras, si un gen está ubicado cerca de una diferencia de inserción o eliminación entre humanos y chimpancés, es en promedio un 7-8% más probable que se exprese de manera diferente en chimpancés y tejidos humanos. [3] Los INDEL pueden explicar una cantidad modesta y estadísticamente significativa, pero no toda la variación en los patrones de expresión génica entre humanos y chimpancés.

Los autores concluyen que los retrotransposones que crean inserciones y deleciones en los genomas humanos y de chimpancé (los más significativos de los cuales son las inserciones en el genoma humano) pueden explicar algunos de los cambios relativamente recientes en la regulación de los genes que dan lugar a diferencias fisiológicas entre chimpancés y humanos. .

[1] Chen, FC y Li, WH Divergencias genómicas entre humanos y otros hominoides y el tamaño efectivo de la población del ancestro común de humanos y chimpancés. Revista estadounidense de genética humana 68, 444-56 (2001). http://www.sciencedirect.com/sci…
[2] Khaitovich, P. y col. Patrones paralelos de evolución en los genomas y transcriptomas de humanos y chimpancés. Science (Nueva York, NY) 309, 1850-4 (2005). http://www.sciencemag.org/conten…
[3] Polavarapu, N., Arora, G., Mittal, VK y McDonald, JF. Caracterización y potencial significación funcional de la gran variación de INDEL en chimpancés humanos. Mobile DNA 2, 13 (2011). http://www.mobilednajournal.com/…

Bueno, esos artículos no parecen estar discutiendo el número del 97-98%, por lo que la pregunta parece un tanto discutible.

El porcentaje de superposición es en realidad un poco complicado, ya que depende de cómo se define una “superposición”. Hay polimorfismos de un solo nucleótido, transposiciones, inserciones, eliminaciones, etc., por lo que la comparación depende del algoritmo que se utiliza para alinear las cosas. Los algoritmos más sofisticados para alinear las comparaciones no funcionan bien durante largos períodos de tiempo, por ejemplo, el genoma completo.

El algoritmo más común, BLAST, produce una comparación del 98,5% entre el ADN humano y el chimpancé. Eso es realmente una comparación gen por gen. Calculado utilizando REPEATMASKER, obtienes el 95%. Un buen material de fuente:

http://www.ncbi.nlm.nih.gov/pmc/

Antes de las bases de datos de ADN, la superposición se calculaba poniendo la mitad izquierda de un genoma en un vaso de precipitados con la mitad derecha de otro. Cuanto más similares sean, más formarán los dos una molécula de ADN completa. Elevarían la temperatura, y cuanto más similares fueran, mayor sería la temperatura que tendría que hacer para separarla. Esa es una medida aproximada, y arrojó números que se estimaron en un intervalo de superposición del 95-98%.

El artículo no está realmente disputando ese número. Está señalando que gran parte de la diferencia está en el ADN “basura”. Si no fueran idiotas creacionistas, se darían cuenta de que esto significa que esto significa que las partes de codificación reales del ADN son incluso más similares de lo que se pensaban, no menos. De hecho, son prácticamente idénticos.

La pregunta es, ¿cómo las diferencias no codificantes en el ADN hacen una diferencia tan significativa entre los humanos y los chimpancés? La respuesta es que los imbéciles creacionistas no se dan cuenta de que el ADN no codificante todavía tiene un efecto significativo en la forma en que se expresan los genomas. Este artículo descubre una parte de cómo sucede eso: las piezas de ADN que se mueven fácilmente dentro del genoma a menudo se ubican cerca del ADN codificador. Agregar más o menos repeticiones de estas piezas de ADN hace posible activar o desactivar partes del ADN, cambiando considerablemente qué partes del ADN se generan y cuándo.

Nota sobre la política de Be Nice: No puedo ser amable con los creacionistas que deliberadamente malinterpretan la ciencia, y espero que al citar a los científicos puedan tener algún tipo de credibilidad a pesar del hecho de que no entienden las palabras que están copiando y pegando. Me repugnan No puedo ser amable con ellos ni pretender tratarlos con respeto. Son inmunes al pensamiento racional y ni siquiera voy a tratar de abordarlos como si fueran capaces de hacerlo. Si eso significa que me “colapsó”, que así sea. Tengo un gran respeto por las personas religiosas, como lo he demostrado en muchas respuestas, pero las personas que tienen la intención de hacer del mundo un lugar más estúpido no recibirán nada de mi parte, sin importar si están utilizando la religión o alguna otra cosa como fuente. de su idiotez.