Causalidad, casualidad y estadísticas


“Existen tres tipos de mentiras: las mentiras, las malditas mentiras y la estadística”

Consideren la siguiente información: un estudio de la incidencia de cáncer de riñón en los 3.141 condados de Estados Unidos reveló un patrón notable: los condados en los que la incidencia de cáncer de riñón es más baja son en su mayoría rurales, poco habitados y situados en estados tradicionalmente republicanos en el medio oeste, sur y oeste. Ahora, ¿qué conclusión pueden sacar a partir de esta información?

Su mente ha estado muy activa en los últimos segundos, ya que está trabajando lo que el sicólogo y Premio Nobel de Economía Daniel Kahneman ha llamado Sistema 2: el modo de pensar lento que usamos en actividades complejas, como llenar nuestra declaración de impuestos, comparar dos productos para decidir cual comprar o manejar con tráfico en un día de lluvia. Deliberadamente han buscado datos en su memoria y han formulado ciertas hipótesis. Ciertamente han hecho algo de esfuerzo: sus pupilas se dilataron y su ritmo cardíaco aumentó de manera medible. Sin embargo también han usado el Sistema 1: el modo rápido que usamos cuando reaccionamos a los sonidos fuertes, para comprender oraciones simples o para manejar en una carretera vacía. Este sistema no estaba durmiendo y probablemente ha rechazado la idea de que ser republicano proporciona protección contra el cáncer de riñón. Es muy probable que hayan terminado centrándose en el hecho de que los condados con baja incidencia de cáncer son en su mayoría rurales. Es a la vez fácil y tentador inferir que la baja tasa de cáncer se debe directamente a la vida sana asociada a la vida rural: escasa contaminación del aire, agua pura, acceso a alimentos frescos y sin aditivos. Esto tiene mucho sentido.

Consideremos ahora los condados en los que la incidencia de cáncer de riñón es la más elevada. Estos condados tienden a ser en su mayoría rurales, poco habitados y situados en estados tradicionalmente republicanos en el medio oeste, sur y oeste. Es fácil inferir que sus altos índices de cáncer podrían estar directamente relacionados con la pobreza de la vida rural: no tienen acceso a una buena atención médica, tienen una dieta rica en grasas y tal vez consumen alcohol y/o tabaco en exceso… pero, ¿notan algo raro? Por supuesto que hay algo terriblemente mal aquí: el estilo de vida rural no puede explicar un nivel muy alto y al mismo tiempo muy bajo de incidencia de cáncer de riñón. ¿Qué está pasando?

El factor clave no es que los condados fueran rurales o predominantemente republicanos. El factor clave en esta historia es que los condados rurales tienen poblaciones pequeñas. Y la principal lección que hay que aprender no es sobre epidemiología, sino que se trata de la difícil relación entre nuestra mente y las estadísticas. El Sistema 1 es muy apto para la forma de pensar que automática y fácilmente identifica las conexiones causales entre los acontecimientos, a veces incluso cuando la conexión no existe. Cuando leyeron sobre los condados de alta incidencia de cáncer, ustedes asumieron inmediatamente que estos condados son “especiales” y de alguna forma diferentes de otros condados, que debe haber una causa que explica esta diferencia. Como veremos, sin embargo, el Sistema 1 es muy inapropiado cuando se enfrentan con hechos meramente estadísticos, que cambian la probabilidad de los resultados, pero no causan el resultado.

La previsibilidad de la aleatoriedad

Un evento al azar, por definición, es aleatorio (¡dah!), pero las colecciones de eventos aleatorios se comportan de forma muy regular. Imaginen una gran urna llena de bolitas. La mitad de las bolitas son de color rojo, la otra mitad son de color blanco. Ahora, imaginen a una persona muy paciente (o un robot) que toma sin mirar cuatro bolitas de la urna y anota el número de bolitas rojas en la muestra y luego las devuelve otra vez a la urna. Luego repite el proceso, muchas veces. Si resumimos los resultados, encontraremos que el resultado «dos rojas, dos blancas» se produce (casi exactamente) seis veces más que el resultado «cuatro rojas» o «cuatro blancas.» Esta relación es un hecho matemático.

roll-the-dice

Un hecho estadístico relacionado es relevante para entender lo que pasa con el ejemplo del cáncer. De la misma urna, dos personas se turnarán para extraer las bolitas. Juan saca cuatro bolitas cada vez y Pedro saca siete. Ambos anotan cada vez que observan una muestra homogénea; es decir, todas las bolitas rojas o blancas. Si lo hacen durante un tiempo suficiente, Juan observará estos resultados extremos con más frecuencia que Pedro. De hecho, por un factor de ocho (los porcentajes previstos son el 12,5 % y 1,56 %). No es causalidad, sino un hecho matemático: Las muestras de cuatro bolitas producen resultados extremos con más frecuencia que las muestras de siete bolitas. Es la regularidad subyacente a un evento aleatorio que se repite muchas veces.

Ahora, imaginen a la población de los Estados Unidos como bolitas en una urna gigante. Algunas bolitas están marcadas con las letras CR, por cáncer de riñón.  De esta forma, las muestras rurales son más pequeñas que otras muestras, como la de Nueva York, por ejemplo. Al igual que en el ejemplo de Juan y Pedro, los resultados extremos (muy altas y/o bajas tasas de cáncer) son más probables de encontrar en los condados con bajo número de habitantes. Esa es la explicación para la incidencia de cáncer del ejemplo.

No hay nada especial en esos condados, es pura y sencilla estadística.

Nuestra predilección por el pensamiento causal nos expone a graves errores en la evaluación de la aleatoriedad de los acontecimientos verdaderamente aleatorios. Por ejemplo, tomemos el sexo de seis guaguas nacidas en secuencia en un hospital. La secuencia de los niños y las niñas es, obviamente, al azar; los eventos son independientes entre sí y el número de niños y niñas que nacieron en el hospital en las últimas horas no tiene efecto alguno sobre el sexo del bebé que viene. Consideremos ahora tres posibles secuencias:

 1) Niño – Niño – Niño – Niña – Niña – Niña

 2) Niña – Niña – Niña – Niña – Niña – Niña

 3) Niño – Niña – Niño – Niño – Niña – Niño

¿Son igualmente probables estas secuencias? La respuesta intuitiva “¡por supuesto que no!” es incorrecta. Debido a que los eventos son independientes y porque los resultados Niño y Niña tienen (aproximadamente) la misma probabilidad, entonces una secuencia de seis nacimientos consecutivos es tan probable como cualquiera otra. Incluso ahora que saben esto, sigue pareciendo raro y contrario a su intuición, porque solo la tercera secuencia parece ser al azar. Como era de esperar, la secuencia Niño – Niña – Niño – Niño – Niña – Niño se juzga mucho más probable que las otras dos secuencias. Somos buscadores de patrones, creemos en un mundo coherente, en el que las regularidades (como una secuencia de seis niñas) no aparecen por casualidad, sino como resultado de la causalidad mecánica o de la intención de alguien. No esperamos ver regularidad producida por un proceso aleatorio y, cuando detectamos lo que parece ser un patrón, rechazamos rápidamente la idea de que el proceso es verdaderamente aleatorio.

El secreto del éxito de las escuelas

La Fundación Gates invirtió US $1.700 millones para intentar descubrir qué característica diferencia a las escuelas más exitosas. Muchos investigadores han buscado el secreto del éxito de la educación mediante la identificación de las escuelas más exitosas con la esperanza de descubrir su receta mágica. Una de las conclusiones de esta investigación fue que las escuelas más exitosas, en promedio, son pequeñas. En una encuesta de 1.662 escuelas en Pennsylvania, por ejemplo, seis de los 50 primeros puestos fueron para escuelas pequeñas, lo que que sobrepasaba lo esperado por un factor de cuatro. Estos datos alentaron a la Fundación Gates para hacer una fuerte inversión en la creación de escuelas pequeñas, a veces separando escuelas grandes en unidades más pequeñas.

c
Ok, escuelas no *tan* pequeñas…

Esto probablemente tiene un sentido intuitivo. Es fácil construir una historia causal que explica cómo las escuelas pequeñas son capaces de proporcionar la educación de mejor calidad y por tanto producen estudiantes de alto rendimiento, dándoles una atención más personalizada y mejores estímulos, lo que podría explicar que tengan mejores resultados que las escuelas más grandes… Por desgracia, este análisis causal no sirve de nada, ya que los hechos están equivocados.Si los estadísticos que hicieron el informe para la Fundación Gates se hubieran preguntado por las características de las peores escuelas habrían encontrado que las malas escuelas tienden a ser más pequeñas que el promedio. La verdad es que las escuelas pequeñas no son mejores en promedio; simplemente son más variables. Más aún, las escuelas grandes tienden a producir mejores resultados, sobre todo en los cursos mayores, donde existe más variedad de opciones curriculares (al menos en EEUU).

Esta ley de los números pequeños es parte de una historia más amplia sobre el funcionamiento de la mente: las estadísticas producen muchas observaciones que parecen calzar con explicaciones causales erroneas. Muchos hechos del mundo se deben al azar, incluidos los accidentes de muestreo: las explicaciones causales de eventos fortuitos están inevitablemente equivocadas.

Esta columna es un resumen traducido al castellano de un capítulo del libro «Thinking fast and slow» de Daniel Kahneman. Si pueden leerlo, se los recomiendo con sello de garantía y satisfacción.

Sexo, drogas y rock & roll: dopamina y la búsqueda del placer

La bolita blanca da algunos saltos sobre la ruleta que gira cada vez más lento. De pronto, la bolita deja de salta y queda inmóvil en uno de los casilleros. “Veintinueve negro”– anuncia la voz del croupier. He perdido nuevamente. Con las fichas que me quedan decido hacer un último intento. Las pongo todas en el ocho rojo y se va la bolita. Nerviosamente esta salta de un casillero a otro bajo mi atenta mirada. Cuando finalmente se detiene está ahí, felizmente estacionada en el ocho rojo. Gritos, saltos, puños al aire. He recuperado todas las pérdidas de la noche y he obtenido además una generosa ganancia. Es el momento de irse a casa… pero. Decido hacer una última apuesta y pongo todas mis fichas en el catorce rojo.  Se va la bolita y esta vez se demora más de la cuenta en quedarse en un casillero. Es el seis negro. He perdido todo… si tan solo me hubiera retirado cuando iba ganando.

La dopamina es una molécula de la familia de las catecolaminas que actúa como neurotransmisor en el cerebro, aunque posee funciones del tipo hormonal fuera de este. Los sistemas neuronales que liberan dopamina han sido foco de gran atención, particularmente por su vinculación en patologías como el Síndrome de Parkinson o la esquizofrenia. Sin embargo, uno de los papeles más interesantes de la dopamina es el rol que juega en el circuito de búsqueda del placer, clave en diferentes aspectos de la evolución humana. Y también podría explicar por qué acabo de perder todo en el casino…

Dame más dopamina

En 1959 el científico Suizo Arvid Carlsson descubrió que la dopamina actuaba como neurotransmisor en el sistema nervioso central. Particularmente Carlsson describió la relevancia de la dopamina en el control del movimiento y su implicancia en la enfermedad de Parkinson. En efecto, uno de los rasgos característicos de la enfermedad de Parkinson es la notoria baja de la dopamina en ciertas regiones del cerebro. De hecho, una de las terapias utilizadas para aliviar los síntomas del Parkinson consiste en la administración de L-DOPA, molécula precursora de la dopamina y que, a diferencia de esta, sí puede atravesar la barrera hemato-encefálica, alcanzando el cerebro donde es metabolizada a dopamina.  Actualmente se sabe que la dopamina está involucrada en varias funciones del cerebro, además de estar implicada en enfermedades siquiátricas y neurológicas, como la esquizofrenia. De hecho, la dopamina regula la vía tuberoinfundibular del cerebro, que participa en la liberación de hormonas relacionadas con la producción de leche. Es por esto que uno de los efectos secundarios que puede aparecer con la terapia antisicótica usada en la esquizofrenia es la producción de leche. Incluso en hombres.

Si bien las neuronas que producen dopamina dan cuenta de aproximadamente un 1% del total de neuronas en el cerebro, tienen un efecto muy profundo sobre su funcionamiento. Por ejemplo, se sabe que la dopamina tiene un importante papel en la memoria y aprendizaje, particularmente cuando existe una recompensa de por medio.

Buscando la felicidad

El placer –ese estado mental asociado a la felicidad, excitación, euforia y  gozo– genera un fuerte impulso para repetir aquellas experiencias que han gatillado esa sensación tan agradable (de la misma forma que el dolor nos impulsa a evitar las situaciones asociadas a esa sensación). De esta forma, las experiencias placenteras –una comida calórica o sexo (ambas juntas también funciona)– producen consecuencias de tipo hedónicas, las que inician un proceso de aprendizaje basado en la recompensa obtenida. De esta forma, existe un circuito motivacional que induce a repetir aquellas conductas que han producido placer (lo que entre otras cosas ayuda a explicar los mecanismo asociados a la adicción). Los estados motivacionales –hambre o deseo sexual– se relacionan directamente con el comportamiento. Entre más hambre se tenga, por ejemplo, se emprenderán más acciones tendientes a encontrar comida. Históricamente se ha asociado a la dopamina directamente con el placer. Algo así como la personificación molecular de las sensaciones placenteras. Sin embargo, en los últimos años ha cambiado la visión del papel que tiene la dopamina en el circuito del placer. Este nuevo punto de vista de la acción de la dopamina se han desarrollado a partir de modelos de refuerzo del aprendizaje, los que parten de la suposición de que un animal actuará para maximizar las recompensas futuras.

Querer versus Gustar

De acuerdo con la teoría de refuerzo del aprendizaje, el cerebro puede estimar y mantener en la memoria una valoración de los comportamientos o acciones posibles en base a la cantidad de recompensa que cada comportamiento ha tenido en el pasado. De esta forma, los animales utilizan esta información para predecir la recompensa que recibirán por una acción determinada. Sin embargo, es posible que exista una diferencia entre la recompensa estimada y la recompensa recibida. Esto recibe el nombre de error en la predicción de la recompensa.

En un experimento ya clásico, investigadores midieron la actividad de las neuronas dopaminérgicas en el cerebro de monos cuando se les daba una recompensa (jugo de frutas). Cuando el mono recibía el jugo de frutas, la actividad de estas neuronas se disparaba. Esto puede ser interpretado como que la dopamina está asociada directamente a la recompensa. Sin embargo, luego entrenaron a los monos durante varios días: les enseñaron que recibirían jugo solo cuando presionaran una palanca, pero debían hacerlo después de una señal luminosa. De esta forma, se prendía la luz, los monos activaban la palanca y recibían su recompensa en forma de jugo de frutas (¡yay!).

Captura de pantalla 2015-04-01 a las 10.29.11
Los puntos corresponden a la actividad de las neuronas dopaminérgicas (que se muestran sumados en la parte superior de cada panel). En el panel superior se puede ver que la actividad de las neuronas tiene un máximo justo después que el mono recibe su recompensa (R). En el panel del medio se puede ver que cuando el mono es entrenado, el máximo de actividad ocurre luego del estímulo visual (CS) y no después de la recompensa (R). Cuando se agrega un error en la predicción, igualmente se produce el máximo de dopamina después del estímulo pero. Sin embargo, cuando no llega la recompensa en el momento anticipado se produce un «silencio» en las neuronas dopaminérgicas. Modificado de Schultz et al (Science 275 no. 5306 pp. 1593-1599, 1997)

Sin embargo, los investigadores notaron algo raro: la descarga de dopamina ya no ocurría cuando el mono recibía el jugo, sino que ¡cuando se prendía la luz! El mono sabía que la luz anticipaba una recompensa y en ese momento las neuronas dopaminérgicas saltaban.

“Oh, ya sé de que se trata esto: se prende la luz y me van a dar juguito. ¡Ahí está la luz! Genial, ahora me darán juguito de frutas, que me encanta!”. 

En este mismo estudio luego a los monos se les daba la señal luminosa pero no iba seguida de recompensa (un error en la predicción). En ese caso se producía un «silencio» en las neuronas dopaminérgicas en el mismo momento en el que la recompensa debía llegar. Estos resultados sugieren que la dopamina no está asociada al placer mismo, sino que a la búsqueda del placer. Es la fuerza que nos impulsa a emprender acciones que terminan por darnos placer. 

El bichito del juego

Captura de pantalla 2015-04-01 a las 12.49.25
«¡Nooooo, lo del estornudo noooooo!»

En un estudio realizado en humanos, se analizó el potencial de la dopamina para reforzar el aprendizaje cuando había una recompensa en dinero de por medio. Para esto, los investigadores idearon un sencillo juego visual en el que había que escoger una de dos opciones que aparecían brevemente en una pantalla. Una de las figuras estaba asociada a una alta probabilidad de premio en dinero (80%) y la otra a una alta probabilidad de perder dinero. Cuando se les administraba L-DOPA los participantes ganaban dinero más rápidamente que cuando se les administraba un placebo. De manera similar, si les daban un inhibidor de la acción de la dopamina (haloperidol) ganaban más lentamente. De esta forma, la dopamina parece incrementar el aprendizaje cuando hay una recompensa de por medio, en este caso en dinero. De manera muy interesante, se ha descrito que personas que tienen Parkinson y están siendo tratadas con L-DOPA muestran un comportamiento impulsivo y pueden desarrollar una adicción a las apuestas. De hecho, un estudio reciente midió la actividad de las regiones del cerebro relacionadas con la dopamina en jugadores de casino y se descubrió que la actividad de esta región era tan alta cuando se ganaba como cuando se perdía. De esta forma, la dopamina no parece estar relacionada directamente con la recompensa sino que con el impulso para repetir una acción que podría terminar en una recompensa. Algo muy útil para aprender actividades que dependen de nuestra habilidad y perseverancia (como tocar guitarra eléctrica o jugar tenis) pero absolutamente inútil en juegos de azar. Algo que los casinos saben y que finalmente explica porque perdí todo en la ruleta.

Dos derivadas que parecen muy interesantes de esto tienen que ver con la relevancia de la dopamina en el afán por conquistar y descubrir nuevas tierras en la antigüedad. Es probable que la dopamina haya jugado algún rol en el afán aventurero de los que se atrevían a explorar más allá de lo conocido. Dejar el lugar donde vivían para encontrar uno mejor, con más comida y agua.

También es probable que la dopamina –y particularmente el error en la predicción de la recompensa– puedan explicar por qué algunas y algunos quedan enganchados emocionalmente de alguien que a veces los toma en cuenta y otras veces los ignora. Es posible que la dopamina esté jugando un papel clave en ese tipo de comportamientos: en el caso de los monos y el jugo de frutas, cuando el error en la predicción es de un 50% (es decir, la mitad del tiempo no reciben nada) los niveles de dopamina se disparan. Como dice el investigador Robert Sapolsky, no hay nada más adictivo que un tal vez.

PS. Para los nostálgicos, aquí pueden ver el capítulo «Early to bet», donde aparece el bichito del juego y la infame Ruleta de los Castigos.