Читать книгу Los números de la vida - Kit Yates - Страница 23

¿Cuáles son las probabilidades?

Оглавление

En 2007, 23andMe, cuyo nombre hace referencia a los 23 pares de cromosomas que integran el ADN humano normal, se convirtió en la primera empresa que ofrecía pruebas de ADN personalizadas con el fin de determinar la ascendencia de una persona. Al año siguiente, gracias a una inversión de 4 millones de dólares procedente de Google, 23andMe empezó a comercializar una prueba de saliva que podía estimar la probabilidad de sufrir casi 100 afecciones distintas, desde la intolerancia al alcohol hasta la fibrilación auricular. La lista de rasgos era tan completa, y los resultados tenían tal potencial transformador, que la revista Time declaró la prueba «Invento del Año».

Pero los buenos tiempos no duraron mucho para 23andMe. En 2010 la Administración de Alimentos y Fármacos de Estados Unidos (FDA) notificó a la empresa de genómica personal que sus pruebas se consideraban procedimientos médicos y, en consecuencia, requerían de su aprobación. En 2013, con 23andMe aún pendiente de dicha aprobación, la FDA le ordenó que dejara de proporcionar información sobre factores de riesgo de enfermedad hasta que se verificara la exactitud* de sus pruebas. Entonces los clientes de 23andMe presentaron una demanda colectiva, alegando que habían sido engañados con respecto a la información que podía facilitar la empresa en sus perfiles personales. En diciembre de 2014, en medio de todos estos problemas, 23andMe lanzó su servicio relacionado con la salud en el Reino Unido. Teniendo en cuenta toda esta controversia, yo no podía menos que preguntarme por la fiabilidad de las pruebas que podrían realizar con mi propio ADN si les enviaba una muestra.

Leer el artículo publicado en el New York Times sobre la experiencia de un desarrollador web de treinta y tres años de edad llamado Matt Fender no hizo nada para calmar mis inquietudes. Como obsesivo declarado y miembro de la creciente oleada de personas sanas que se preocupan excesivamente por su salud, Fender era el cliente ideal para 23andMe. Tras recibir los datos de su perfil y consultarlos con una fuente externa, descubrió que había dado positivo en la mutación PSEN1, un indicador de la enfermedad de Alzheimer de inicio temprano con «penetrancia completa», lo que significa que todos los que tienen la mutación contraen la enfermedad, sin condicionales ni excepciones. Como cabía esperar, Fender se alarmó ante la idea de perder su capacidad de pensar en términos abstractos, resolver problemas y rememorar recuerdos coherentes. El diagnóstico reducía sus expectativas de llevar una vida plena en al menos 30 años.

Incapaz de quitarse de la cabeza las implicaciones de la mutación, Fender quiso asegurarse. Dado que carecía de antecedentes familiares de Alzheimer, tenía difícil convencer a un genetista para que solicitara una prueba de seguimiento confirmatoria. En su lugar, optó por hacerse una segunda prueba genética por su cuenta. Envió un nuevo kit de saliva, esta vez a otra empresa llamada Ancestry.com, y esperó los resultados. Llegaron cinco semanas después: negativo para PSEN1. Ligeramente aliviado, pero aún más desconcertado que antes, finalmente Fender logró convencer a un médico para que le hiciera una evaluación clínica, que acabó confirmando el resultado negativo de Ancestry.com.

La tecnología de secuenciación empleada por 23andMe y Ancestry.com, con una tasa de error de solo un 0,1 %, parece increíblemente fiable. Sin embargo, vale la pena recordar que, cuando se verifican casi un millón de variantes genéticas, incluso ese reducido porcentaje implica que cabría esperar unos 1000 errores. Resulta preocupante, aunque quizá no sorprendente, que pueda haber discrepancia en los resultados de dos empresas independientes; pero probablemente aún lo sea más la evidente falta de apoyo tras haberlos recibido: los pacientes que solicitan perfiles genéticos a domicilio tienen que lidiar con sus resultados en un aislamiento casi completo desde un punto de vista médico.

Después de que 23andMe obtuviera gradualmente la aprobación de la FDA para una gama significativamente reducida de pruebas genéticas, en 2017 se relanzó la empresa en Estados Unidos, y su kit de prueba de ADN a domicilio se convirtió en uno de los artículos más vendidos en Amazon el Black Friday de ese año. A pesar de tener mis propias dudas al respecto —o tal vez precisamente por ello—, pedí un kit y envié mi muestra de saliva para que la analizaran.

En casi todas las células del cuerpo humano hay un núcleo que contiene una copia de nuestro ADN, el denominado «Libro de la vida». Heredamos esas largas y retorcidas escaleras de nucleótidos en 23 pares de cromosomas, donde uno de cada par proviene de cada uno de nuestros padres. Cada cromosoma de los dos que forman un par contiene una copia de los mismos genes que su pareja, cuyas secuencias son similares, pero no necesariamente iguales. Así, por ejemplo, hay dos variantes principales del gen ApoE asociado a la enfermedad de Alzheimer que evalúa 23andMe, denominadas ε3 y ε4. La variante ε4 está asociada a un mayor riesgo de contraer Alzheimer de inicio tardío. Dado que hay dos cromosomas, una persona puede tener una copia de ε4 (y una de ε3); dos de ε4 (y ninguna de ε3), o ninguna de ε4 (y dos de ε3): la cantidad de copias es lo que se conoce como genotipo. El genotipo más común son dos copias de ε3, que constituye la base de referencia con respecto a la que se evalúa la probabilidad de contraer Alzheimer. Cuantas más copias tenga una persona de la variante ε4, mayor será el riesgo asociado de desarrollar la enfermedad.

Pero ¿de qué hablamos exactamente cuando hablamos de un riesgo elevado? Dado que 23andMe había descubierto que yo tenía un determinado genotipo, ¿cuál era mi «riesgo previsto», esto es, la probabilidad de desarrollar la enfermedad? Si quería estar seguro de los riesgos que habían predicho para mí, necesitaba asegurarme de que su análisis matemático tenía una base sólida antes de llegar a ninguna conclusión.

La mejor forma de comprobar el riesgo previsto de contraer Alzheimer sería seleccionar a una gran cantidad de individuos representativos del conjunto de la población, determinar su genotipo y luego hacer un seguimiento regular para comprobar quién desarrolla Alzheimer. Con esos datos representativos sería fácil establecer una comparación entre el riesgo de contraer Alzheimer cuando se tiene un determinado genotipo y el riesgo de la población en general, lo que se denomina «riesgo relativo». No obstante, generalmente este tipo de estudios longitudinales tienen un coste prohibitivo debido a la gran cantidad de individuos que se requiere (especialmente en el caso de las enfermedades raras) y el prolongado período de tiempo durante el que se les debe observar.

Una opción más habitual —aunque con resultados menos potentes— es realizar lo que se conoce como un estudio de casos y controles (o estudio caso-control), que en el ejemplo que nos ocupa consistiría en seleccionar a varias personas que ya padecen Alzheimer junto con una serie de individuos «de control», es decir, personas con antecedentes similares, pero sin la enfermedad (en el capítulo 3 veremos por qué es tan importante realizar un minucioso control del historial de la gente). A diferencia del estudio longitudinal, en el que los participantes se seleccionan independientemente de su estado de salud en lo relativo a esa enfermedad concreta, en un estudio de casos y controles la selección está sesgada en favor de los portadores de la enfermedad, por lo que no es posible extrapolar una estimación de la incidencia de esta en el conjunto de la población; dicho de otro modo: lo que obtenemos es una predicción sesgada del riesgo relativo de contraer la enfermedad. No obstante, estos estudios nos permiten calcular con precisión las denominadas «razones de probabilidades», un parámetro que no requiere conocer la incidencia total de la enfermedad en la población.

Si alguna vez has estado en un canódromo o has apostado en una carrera de caballos, puede que recuerdes que la posibilidad de que un determinado animal gane una carrera suele expresarse en términos de probabilidades (habitualmente se habla de «apuestas»). Por ejemplo, en una carrera se podría decir que un caballo que no figura entre los favoritos tiene unas probabilidades de 5 a 1 en contra (o que las apuestas para ese caballo están en, o son de, 5 a 1 en contra). Eso significa que, si se corriera la misma carrera un total de seis veces, cabría esperar que ese caballo perdiera en cinco ocasiones y ganara solo en una, de modo que sus posibilidades de ganar son de 1 entre 6, o 1/6. La forma habitual de expresar las «probabilidades en contra» es hacerlo como la razón entre la posibilidad de que un evento no suceda y la posibilidad de que suceda (en este caso, 5/6 a 1/6, o, de forma simplificada, 5 a 1). En cambio, para el favorito de la carrera, las probabilidades podrían ser de 2 a 1 a favor. En el ámbito de las apuestas deportivas lo tradicional es poner siempre delante la cifra mayor, lo que nos obliga a distinguir entre probabilidades a favor o en contra. El concepto de «probabilidades a favor» (el inverso de las probabilidades en contra) expresa la razón entre la posibilidad de que un evento suceda y la posibilidad de que no suceda. Con unas probabilidades de 2 a 1 a favor, si la misma carrera se corriera un total de tres veces, cabría esperar que el favorito ganara dos de ellas y perdiera una. Las posibilidades de que el favorito gane son, pues, de 2 entre 3, o 2/3, mientras que las de que pierda son de 1/3, lo cual se expresa diciendo que las probabilidades son de 2/3 a 1/3 o, de forma simplificada, de 2 a 1.

En las competiciones en las que participa un reducido número de caballos, cualquiera que tenga las probabilidades a favor es también el favorito, puesto que en cualquier carrera dada solo puede haber un caballo que tenga más posibilidades de ganar que de perder. Sin embargo, en una competición con un mayor número de caballos es inusual que un solo caballo gane más carreras de las que pierde. Por ejemplo, en la competición ecuestre más famosa del Reino Unido, el Grand National, participan un total de 40 caballos; en la edición de 2019, incluso el ganador del año anterior, Tiger Roll, que partía como favorito (y que finalmente acabó ganando), tenía unas probabilidades de 4 a 1 en contra. Así pues, dado que no es probable que la mayoría de los caballos ganen la mayoría de sus carreras, a menos que se señale explícitamente lo contrario, cuando en el hipódromo se habla de probabilidades y se indica la cifra mayor delante, generalmente se hace referencia a las probabilidades en contra.

En el ámbito médico ocurre justamente lo contrario. Las probabilidades generalmente se expresan como probabilidades a favor: la posibilidad de que suceda un evento frente a la posibilidad de que no suceda; y dado que habitualmente hablamos de enfermedades raras (con una prevalencia de menos del 50 % en una determinada población), es la cifra menor la que suele ir delante.

Para ver la forma de calcular las probabilidades médicas y la razón de probabilidades deseada, imaginemos un estudio hipotético de casos y controles sobre los efectos de tener una sola variante ε4 (como aparecía en mi perfil de ADN) en la incidencia de la enfermedad de Alzheimer a los 85 años, tal como se presenta en la Tabla 1. Las probabilidades de desarrollar Alzheimer a la edad de 85 años si tienes una copia de la variante ε4 (como en mi caso) se calculan dividiendo el número de personas que padecen la enfermedad (100) entre el número de las que no la padecen (335): las probabilidades son, pues, de 100 a 335, o, expresadas como fracción, 100/335. Siguiendo la misma lógica, y según indican las cifras de la segunda fila de la tabla, las probabilidades de desarrollar la enfermedad a los 85 años si tienes dos copias de la variante común ε3 son de 79 a 956, o 79/956. La razón de probabilidades es, entonces, la comparación entre las probabilidades de contraer la enfermedad dado un determinado genotipo (una copia de la variante ε4 y una copia de la variante ε3, pongamos por caso) y las probabilidades de contraerla dado el genotipo más común (dos copias de la variante ε3). Para las cifras hipotéticas que figuran en la Tabla 1, la razón de probabilidades será, pues, 100/335 dividido entre 79/956, lo que da como resultado 3,61. De manera crucial, las razones de probabilidades no requieren que conozcamos la incidencia en el conjunto de la población, y, por lo tanto, se pueden calcular fácilmente a partir de estudios de casos y controles.


Tabla 1. Resultados de un estudio hipotético de casos y controles sobre los efectos de tener una sola variante ε4 en la incidencia de la enfermedad de Alzheimer a los 85 años.

Aunque las razones de probabilidades por sí solas no nos dan el riesgo relativo (la razón entre el riesgo de contraer la enfermedad con el genotipo ε3/ε4 y el riesgo de contraerla con el genotipo ε3/ε3), se pueden combinar con el riesgo de contraer la enfermedad del conjunto de la población y las frecuencias genotípicas conocidas para determinar la probabilidad de contraer la enfermedad para un genotipo dado. Este no es un cálculo nada trivial; de hecho, ni siquiera existe una forma única de hacerlo. Yo mismo intenté reproducir el riesgo de contraer Alzheimer de aparición tardía que figuraba en mi informe genético utilizando el mismo método que 23andMe y los datos extraídos directamente de dicho informe o bien de los artículos que en él se mencionaban1 (en caso de que estés interesado, el cálculo que realicé para determinar las probabilidades de contraer la enfermedad involucraba el uso de un programa de resolución no lineal para resolver un sistema de tres ecuaciones algebraicas para tres probabilidades condicionales desconocidas, el tipo de cosas con las que disfruto ensuciándome las manos en mi trabajo diario). Y el hecho es que encontré ciertas discrepancias, pequeñas pero potencialmente significativas, entre mis cifras y las suyas. Mis cálculos parecían sugerir que debía mostrar un cierto escepticismo con respecto a la precisión de las cifras de 23andMe.

Mi conclusión se vio reforzada cuando me tropecé con los resultados de un estudio realizado en 2014 que investigaba los métodos de cálculo de riesgos de tres de las principales empresas de genómica personal, incluida 23andMe.2 Los autores habían descubierto que las diferencias existentes en el cálculo de riesgos de la población en su conjunto, las frecuencias genotípicas y las fórmulas matemáticas utilizadas contribuían todas ellas a que hubiera una variación significativa entre las predicciones de riesgos de las diferentes empresas. Al utilizar la previsión de riesgos para clasificar a las personas en categorías de riesgo «aumentado», «reducido» o «invariable», las discrepancias resultaban aún más marcadas. El estudio revelaba que el 65 % de todas las personas en las que se evaluó el riesgo de contraer cáncer de próstata fueron clasificadas en categorías de riesgo opuestas (aumentado o reducido) por parte de al menos dos de las tres empresas. Así, en casi las dos terceras partes de los casos era posible que una empresa le hubiera dicho a una persona que estaba sana mientras otra le decía que tenía un riesgo significativamente aumentado de contraer la enfermedad.

Dejando al margen el potencial de error de las pruebas genéticas en sí, había obtenido una respuesta a mi tercera pregunta: las incoherencias en el enfoque matemático adoptado significaban que había que contemplar con cierto escepticismo los cálculos de riesgo numéricos presentados en los informes de salud de las empresas de genómica personal.

Los números de la vida

Подняться наверх