El lado oscuro de las estadísticas

0
117

Las estadísticas muchas veces son consideradas como hechos expresados en forma de números. Confiamos en ellas y las usamos para tareas importantes como tomar decisiones en época de incertidumbre o realizar predicciones, debido a que estas nos proporcionan evidencia empírica. Las encontramos en todos lados desde reportes del clima, estudios científicos, noticias, publicidad o hasta en empaques de medicamentos. Tienen cierto encanto y el poder de ser extremadamente persuasivas.

“Hay tres tipos de mentiras– las mentiras, las malditas mentiras, y las estadísticas”- Benjamin Disraeli.

El peligro de las estadísticas esta en que son muy manipulables y convincentes al mismo tiempo. Su poder intrínseco de persuasión las lleva a ser usadas de maneras engañosas sin la necesidad de recurrir a data falsa. Los datos pueden ser seleccionados u organizados de manera especifica para mostrar resultados convenientes. También se puede usar la estadística de manera erronea para sacar relaciones que no necesariamente son correctas y que se presten a malas interpretaciones. O puede haber una confusión en el análisis de los datos que lleve a conclusiones incorrectas.

Un ejemplo del uso engañoso de la estadística es el caso de una publicidad de Colgate del 2007, que la Asociación de Normas Publicitarias (ASA) de Reino Unido pidió que retirara por usar la frase “Más del 80% de dentistas recomienda Colgate.” La aclamación no es falsa; sin embargo, sí se presta a una interpretación errónea. Pues, se da a entender que el 80% de dentistas recomiendan y prefieren la marca Colgate sobre cualquier otra marca.  En realidad, al hacer las encuestas se les permitió a los participantes escoger más de una marca de dentífricos. Por lo tanto, los resultados muestran que el 80% de los encuestados recomiendan Colgate al igual que otras marcas y no es que se tenga una preferencia por esta.

Otro error que se puede cometer con la estadística es pensar que la correlación implica causalidad. La correlación indica la relación entre dos variables, pero no significa que una sea causante de la otra. Por ejemplo, la tasa de divorcios de Maine, EE. UU. tiene una correlación con el consumo per cápita de margarina, sin embargo, no existe una relación de causalidad entre ambos. En otros casos, esto no es tan obvio. Por ejemplo, en el caso hipotético que el consumo de chocolate tenga correlación con la tasa de obesidad, se puede pensar que el alto consumo de chocolate lleva a mayor obesidad. Pero, también es lógico que las personas obesas consuman más chocolate. Sin embargo, puede que no haya causalidad entre ambas variables y que, más bien, una tercera variable sea causante de ambas. Por ejemplo, se podría decir que personas con una mala alimentación consumen más chocolate y son más propensas de sufrir de sobrepeso. Muchas veces las personas sacan conclusiones muy rápido y piensan que una correlación significa causalidad, lo que podría ser perjudicial en toma de decisiones o al informar a un público.

Respecto a las probabilidades, es una falacia el pensar que la probabilidad de A dado que B es igual a la probabilidad de B dado que A, cuando en realidad la probabilidad de A dado que B es es la division entre la probabilidad de la intersección de ambos eventos y la probabilidad de B. Por ejemplo, si tratas de adivinar una carta de en una baraja la probabilidad de que la carta sea un 4 de corazones, sabiendo que es roja es de 0.0385 aproximadamente. Pero la probabilidad de que la carta sea roja, sabiendo que es un cuatro de corazones es de 1. Este parece un error muy sencillo y fácil de evitar; sin embargo, ha llevado a culpar a personas inocentes de crímenes. Por ejemplo, el caso de la enfermera Lucia de Berk en el 2003. Durante sus turnos como enfermera ella presencio las muertes de muchos pacientes. La probabilidad de que una enfermera inocente estuviera presente durante tantas muertes era muy baja y por eso ella fue culpada de estas muertes. Años después fue declarada inocente. Porque se probó que la probabilidad que una enfermera, que haya presenciado tantas muertes, sea inocente de haberlas cometido es bastante alta.

Hay una paradoja que puede causar interpretaciones engañosas de la estadística y esta es la paradoja de Simpson, que consiste en que se pueden obtener conclusiones opuestas de la misma data dependiendo de como esta se divida. Por ejemplo, en este caso hipotético una persona quiere ir a una academia para prepararse para su examen y hay dos academias a las que puede ir: la academia Rigel y la academia Betelgeuse. En el folleto de Rigel indica que el 88% de sus estudiantes aprueban y en el de Betelgeuse se indica que el 87.5% de sus estudiantes aprueban. Con estos datos, la academia Rigel parece tener un mejor desempeño. Sin embargo, separando a los alumnos entre los que necesitan más de 10 y menos de 10 en el final se observan resultados distintos. En ambas categorías la academia Betelgeuse tiene mayores tasas de aprobados que Rigel, pero con los resultados totales Rigel tenía una mayor tasa de aprobados.

Aparte de estas confusiones y falacias que pueden suceder en la estadística, hay formas más sencillas de manipular como se presenta la información para obtener cierto efecto. Por ejemplo, no usar en los graficos el cero como la base, de esta forma las diferencias entre variables podrían verse más grandes de lo que realmente son. Otro ejemplo es descartar como si fueran datos anómalos los resultados que no son los que se quieren presentar. Muchas veces las estadísticas tomadas fuera de contexto pueden mostrar resultados engañosos al no verse los resultados completos.

En conclusión, las estadisticas son un recurso muy útil, pero no son perfectas. Son muy fáciles de manipular y de ser usadas inadecuadamente sin nesecidad de usar datos falsos, esto es peligroso debido a su naturaleza persuasiva. Además, pueden ocurrir errores en su interpretación, que lleven a las personas a asumir relaciones que no son correctas. Y si no se lleva a cabo un analisis estadístico adecuado se pueden presentar datos engañosos y confusos.

Bibliografía:

Abs.gov.au. 2020. Statistical Language – Correlation And Causation. Recuperado de: <https://www.abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+correlation+and+causation> (07/07/20)

BI Blog | Data Visualization & Analytics Blog | datapine. 2020. Misleading Statistics & Data – News Examples For Misuse Of Statistics. Recuperado de: <https://www.datapine.com/blog/misleading-statistics-and-data/> (07/07/20)

Campbell, S., 2012. Flaws And Fallacies In Statistical Thinking. Dover Publications, pp.2-10.

 CEBM. 2020. The Prosecutor’S Fallacy – CEBM. Recuperado de: <https://www.cebm.net/2018/07/the-prosecutors-fallacy/> (07/07/20)

Comparative Education, 2004. Editorial: ‘Lies, Damned lies and statistics!’ : three fallacies of comparative methodology.   pp.3-6.

Goodreads.com. 2020. Benjamin Disraeli. [online] Recuperado de: <https://www.goodreads.com/author/show/47030.Benjamin_Disraeli> (07/07/20.

Groeneboom, P., 2007. Lucia De Berk And The Amateur Statisticians. [online] Piet Groeneboom’s blog. Recuperado de: <https://pietg.blog/2007/05/28/lucia-de-berk-and-the-amateur-statisticians/> (07/07/20)

Hernán, M., Clayton, D. and Keiding, N., 2011. The Simpson’s paradox unraveled. International Journal of Epidemiology. pp.780-785.

How statistics can be misleading. 2020. M. Liddell. Recuperado de: <https://www.youtube.com/watch?v=sxYrzzy3cq8> (07/07/20)

LEAVE A REPLY

Please enter your comment!
Please enter your name here