Wheelan se abre Naked Statistics admitiendo que a veces le costaba ver la relevancia de lo que aprendía cuando era estudiante de matemáticas. Por lo tanto, pone la relevancia de la estadística en primer plano en el libro, construyendo su discusión de cada concepto estadístico en torno a por qué debemos conocerlo. Y lo que es mejor, Wheelan demuestra que la estadística no tiene por qué intimidar, poniendo las matemáticas detrás de la estadística en términos digeribles y explicando los conceptos con ejemplos relacionables, relevantes e incluso humorísticos.
Esta guía se centra en gran medida en dos temas principales de Naked Statistics. En primer lugar, explicamos el significado de muchas estadísticas comunes, cómo interpretarlas y por qué son importantes. Al igual que Wheelan, utilizamos ejemplos reales y ficticios para contextualizar cada estadística tratada. En segundo lugar, examinamos el debate de Wheelan sobre las consecuencias de los prejuicios y la mala aplicación e interpretación de las estadísticas para defender que todo el mundo debería adquirir conocimientos básicos de estadística.
Dependemos de los datos para entender el mundo, pero sin estadísticas, los conjuntos de datos serían en gran medida inútiles. Imagínate que le preguntas a un vendedor de coches qué kilometraje recorre un coche y te da una hoja de cálculo de 100 páginas con los kilómetros que ha recorrido y cuánta gasolina ha gastado en cada uno. Aunque la hoja de cálculo puede ser exhaustiva, también es bastante inútil si esperabas una respuesta rápida. Con la estadística, podemos tomar conjuntos de datos difíciles de manejar y transformarlos en valores significativos y procesables, como el promedio de millas por galón.
Las estadísticas que resumen conjuntos de datos se denominan estadísticas descriptivas. Dos de los estadísticos descriptivos más conocidos y utilizados son la media (el promedio) y la mediana (el número medio cuando se ordenan numéricamente todos los datos). La media y la mediana se denominan medidas de tendencia central y, aunque ambas nos informan sobre el "centro" de un conjunto de datos, Wheelan explica que pueden transmitir mensajes muy diferentes. Con unos conocimientos básicos de estadística, podemos saber cuándo utilizar una en lugar de la otra y detectar cuándo alguien puede estar informando sobre la media en lugar de la mediana (o viceversa) para promover una agenda.
Supongamos que las autoridades de una playa ficticia recogen datos sobre el número de picaduras de medusa que sufren los bañistas cada semana a lo largo del verano. Los datos podrían tener este aspecto:
| Picaduras de medusa/semana/500 nadadores | |||||||||||
| Junio | Julio | Agosto | Septiembre | ||||||||
| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 3 | 50 | 150 | 300 |
Shortform Nota breve: en este ejemplo, el conjunto de datos está ordenado de forma natural, por lo que no necesitamos ordenarlo para determinar la mediana).
El número medio de picaduras de medusa es 42. La mediana de picaduras es cero. Las autoridades de la playa podrían decir:
A) "¡Visite nuestra playa! El número medio de picaduras semanales/500 bañistas a lo largo del verano es de sólo 42!".
o
B) "¡Visite nuestra playa! El número medio de picaduras semanales a lo largo del verano es cero".
Ninguna de estas afirmaciones es incorrecta, pero transmiten un mensaje diferente a los posibles bañistas. Las autoridades de la playa seguramente anunciarán la opción B en lugar de la opción A porque la opción B hace que la playa parezca más atractiva. Como astutos estudiantes de estadística, deberíamos preguntarnos qué medida de tendencia central capta mejor la "historia" del conjunto de datos y ser conscientes de que ninguna estadística por sí sola puede transmitir plenamente la complejidad del mundo real.
La utilidad de la tendencia central
Las medidas de tendencia central son fundamentales para entender y comunicar los datos. Pero, como advierte Wheelan y pone de relieve nuestro ejemplo de la medusa, si no se utilizan con cuidado, pueden ser poco útiles o incluso peligrosas.
Una charla TED titulada "El mito de la media" destaca cómo la mala aplicación de la tendencia central afectó a las Fuerzas Aéreas de Estados Unidos en la década de 1950. A pesar de contar con pilotos bien formados y los aviones más avanzados hasta la fecha, las Fuerzas Aéreas estaban insatisfechas con el rendimiento de los pilotos. La investigación sobre las dimensiones de miles de pilotos reveló que las cabinas diseñadas para el piloto de "tamaño medio" no se ajustaban bien a ningún piloto, y las cabinas mal ajustadas impedían a los pilotos volar lo mejor posible. En respuesta, las Fuerzas Aéreas cambiaron su enfoque de diseño, pasando de fabricar cabinas que se ajustaran a la persona media a fabricar cabinas que pudieran acomodarse a las dimensiones humanas extremas. Este cambio mejoró el rendimiento de los pilotos existentes y permitió a las Fuerzas Aéreas reclutar el grupo de pilotos de caza más diverso del mundo.
La lección de este ejemplo es que una herramienta diseñada para el usuario medio no suele ser ideal para cualquiera. En muchos casos, como unas tijeras, podemos aceptar fácilmente este compromiso. Sin embargo, cuando se trata de situaciones que alteran la vida, como pilotar un avión, quizá debamos replantearnos los diseños basados en una media.
Las estadísticas descriptivas también pueden iluminar y describir las relaciones entre las variables de un conjunto de datos. Como explica Wheelan, **analizar la correlación entre dos variables puede indicarnos si un cambio en...
Desbloquee el resumen completo del libro Naked Statistics suscribiéndose a Shortform.
Los resúmenes Shortform ayudan a aprender 10 veces mejor:
He aquí un avance del resto del resumen de Naked Statistics de Shortform :
Wheelan explica que aprender estadística puede hacernos consumidores más críticos de la información y ayudarnos a tomar decisiones con conocimiento de causa. Como estudiantes de estadística, podemos aprender a evaluar la información que se nos presenta en campañas políticas y de marketing, en las noticias, en publicaciones científicas, etc., y situarla en un contexto útil. Aprender estadística también nos ayudará a detectar usos engañosos o erróneos de los datos y las estadísticas, en lugar de dejarnos engañar por ellos.
Gracias a Charles Wheelan, las estadísticas no tienen por qué intimidar. Naked Statistics pone las matemáticas que hay detrás de la estadística en términos digeribles y explica los conceptos estadísticos con ejemplos cercanos, relevantes e incluso humorísticos. Los lectores también se benefician de la visión sociopolítica adicional del libro, ya que Wheelan utiliza anécdotas del mundo real para explorar cómo las estadísticas pueden informar la toma de decisiones colectivas.
Charles J. Wheelan es profesor del Dartmouth College y antiguo profesor de la Universidad de Chicago, especializado en política pública. Es licenciado por el Dartmouth College, máster en Asuntos Públicos por la Universidad de Princeton y doctor en Políticas Públicas por la...
La segunda parte del título deNaked Statistics , Stripping the Dread From the Data, explica a los lectores por qué el libro de Wheelan es una buena elección si sienten curiosidad por la estadística pero no se atreven con las matemáticas. Wheelan, autor de superventas en el New York Times, profesor titular en el Dartmouth College y ex profesor titular en la Universidad de Chicago, utiliza sus dotes como profesor y narrador para hacer que el análisis de datos resulte cercano, digerible y entretenido.
Como explica Wheelan, las estadísticas son poderosas herramientas para resumir la información y hacer inferencias a partir de los datos. Señala que las personas tendrían dificultades para extraer significado de las montañas de datos que nuestra sociedad genera a diario sin ellas. Por lo tanto, las estadísticas hacen que los datos tengan sentido y sean procesables.
Los conocimientos que generamos con las estadísticas ayudan a dirigir la sociedad tal y como la conocemos. Por ejemplo, las mejores prácticas en medicina y educación se establecen mediante análisis estadísticos de datos. Los legisladores utilizan los datos para elaborar sus políticas. Los aficionados al deporte utilizan los datos para analizar las habilidades y el potencial de sus jugadores y equipos favoritos, y la lista continúa. Utilizamos las estadísticas de tantas maneras que Wheelan nos recuerda que informan nuestra vida cotidiana...
Este es el mejor resumen de Cómo ganar amigos e Influencia las personas que he leído nunca. La forma en que explicaste las ideas y las conectaste con otros libros fue increíble.
Ahora que ya sabemos por qué es importante aprender estadística, veremos algunos términos y conceptos estadísticos básicos, empezando por la estadística descriptiva. Como su nombre indica, las estadísticas descriptivas toman la información de un conjunto de datos y la condensan en una cifra significativa , como una media o un percentil.
Al utilizar estadísticas descriptivas para resumir datos, Wheelan explica que siempre hay que elegir entre complejidad y utilidad. Cada vez que tomamos datos del mundo real y los condensamos en un único valor, nos hacemos una idea de los datos en su conjunto, pero perdemos parte del matiz y la "historia" que hay detrás de esos datos.
Por ejemplo, digamos que su escuela primaria local ha puesto en marcha un nuevo programa de lectura que ha mejorado la capacidad lectora general de los alumnos en un 15%. ¡Qué bien! Sin embargo, un análisis más detallado podría mostrar que esas mejoras se concentraron en los estudiantes de familias con ingresos altos, y que las habilidades lectoras de los estudiantes con ingresos bajos se mantuvieron más o menos igual. A la luz de este panorama más completo, parece claro que el programa debe modificarse.
Como muestra el ejemplo de nuestro programa de lectura, los estadísticos descriptivos que elegimos al resumir los datos tienen un impacto determinante en la historia que...
Como hemos visto, las medidas de tendencia central no nos ofrecen la "historia completa" de un conjunto de datos. Podemos hacernos una idea más clara combinando la tendencia central con una descripción de la distribución de los datos.
La distribución normal es un concepto fundamental de la estadística. Una distribución normal se refiere a un conjunto de datos que forma una curva de campana perfectamente simétrica en torno a la media cuando se representa gráficamente como una distribución de frecuencias (una representación visual de los datos en la que la altura de las barras representa el número de veces que se produce un resultado específico).

(Tenga en cuenta que la media y la mediana serán iguales en una distribución perfectamente simétrica).
Cuando un conjunto de datos tiene el mismo aspecto a ambos lados de la media, decimos que es simétrico. Las distribuciones simétricas resultan intuitivamente familiares porque, como explica Wheelan, ocurren en la vida real todo el tiempo. Por ejemplo, la mayoría de los bebés empiezan a gatear entre los seis y los doce meses, con una media de unos nueve meses. Algunos gatean antes de los seis meses y otros después de los doce, pero el pico de frecuencia...
"Me ENCANTA Shortform porque son los MEJORES resúmenes que he visto nunca... y he mirado en muchos sitios similares. El resumen de 1 página y luego la versión más larga y completa son muy útiles. Leo Shortform casi todos los días".
Jerry McPheeWheelan explica que cualquiera con voluntad y un programa informático capaz puede realizar análisis estadísticos. Esta accesibilidad, combinada con la facilidad y rapidez con que se comparte la información en nuestra cultura orientada a la tecnología, facilita que las estadísticas engañosas se abran paso en nuestras vidas e informen nuestras opiniones o decisiones.
Piense en la última vez que leyó o le contaron una estadística que le llamó la atención. ¿Cuál fue su impresión inicial sobre la validez de la estadística?
La probabilidad es otra forma de utilizar las estadísticas descriptivas para tomar decisiones con conocimiento de causa.
La probabilidad es una relación matemática que indica la probabilidad de que se produzca un acontecimiento concreto en relación con todos los demás resultados posibles. La probabilidad nos permite gestionar la incertidumbre midiendo los riesgos y poniendo en perspectiva los posibles resultados. Wheelan explica que la comprensión de la probabilidad puede ser especialmente relevante en nuestra vida cotidiana porque tomamos decisiones basadas en nuestra percepción de la probabilidad todo el tiempo.
Sin embargo, nuestra percepción de los resultados probables suele ser matemáticamente irracional. Por ejemplo, la probabilidad de sufrir un accidente de coche mientras se conduce hacia una playa es mucho mayor que la probabilidad de ser atacado por un tiburón, pero a menudo tememos más -irracionalmente- el riesgo del tiburón.
A continuación trataremos algunos conceptos básicos y aplicaciones de la probabilidad.
La probabilidad no es intuitiva
Hay varias razones que explican nuestra percepción matemáticamente irracional de la probabilidad:
- Sesgo de confirmación: es cuando nos centramos en lo que esperamos e ignoramos...
Este es el mejor resumen de Cómo ganar amigos e Influencia las personas que he leído nunca. La forma en que explicaste las ideas y las conectaste con otros libros fue increíble.
Hemos examinado cómo la estadística descriptiva nos ayuda a resumir y describir datos, caracterizar relaciones y hacer predicciones. A continuación, pasaremos a la estadística inferencial, que nos permite extrapolar más allá de los datos que recogemos y hacer inferencias sobre cómo funciona el mundo.
Wheelan describe la estadística inferencial como la combinación de datos y probabilidad. Al igual que la probabilidad nunca garantiza un resultado, en la estadística inferencial no hay respuestas definitivas. Más bien, la estadística inferencial nos ayuda a utilizar lo que sabemos para hacer conjeturas matemáticas sobre lo que queremos saber.
Las estadísticas inferenciales no proporcionan un mecanismo
Como explica Wheelan, la estadística inferencial es muy eficaz para iluminar y describir relaciones, pero en realidad no puede demostrar nada por sí misma porque se basa exclusivamente en datos numéricos que no pueden captar la complejidad del mundo real. En otras palabras, la estadística inferencial nos da una razón de peso para creer que dos variables están relacionadas, pero no nos proporciona un [mecanismo para ello...
Todos los escenarios de recopilación de datos y estadísticas que hemos analizado hasta ahora han sido relativamente sencillos porque se refieren principalmente a una sola variable. Sin embargo, Wheelan argumenta que muchas cuestiones de investigación de importancia social son "desordenadas", con variables entrelazadas que abarcan periodos prohibitivamente largos.
Por ejemplo, supongamos que quiere saber si la exposición a una sustancia química concreta (la llamaremos sustancia química X) está asociada a un mayor riesgo de desarrollar cáncer. No puede esperar diseñar un estudio de investigación para comprobar esta cuestión porque exponer a un grupo de personas a una sustancia química de la que sospecha que causa cáncer sería éticamente problemático. Además de la exposición a sustancias químicas, existen innumerables variables que influyen en el riesgo de padecer cáncer: el tabaquismo, la genética, la dieta, el ejercicio, etcétera. Por último, el riesgo de desarrollar cáncer suele medirse a lo largo de toda la vida. Es comprensible que los investigadores quieran respuestas a lo largo de su vida.
En escenarios de investigación "desordenados", una herramienta estadística inferencial llamada análisis de regres ión puede ayudarnos a inferir relaciones entre variables que de otro modo no podríamos estudiar. **El análisis de regresión cuantifica...
Con Shortform, puedes:
Accede a más de 10 000 resúmenes de libros de no ficción.
Resaltar lo que quieras recordar.
Accede a más de 1000 resúmenes de artículos premium.
Tomar nota de tus ideas favoritas.
Leer sobre la marcha con nuestra aplicación para iOS y Android.
Descargar resúmenes en PDF.
Ahora que ya hemos cubierto el potencial y los escollos de la estadística inferencial, piense en una pregunta que le interese y en cómo podría utilizar la estadística para ayudar a responderla.
¿Cuáles son las variables independientes y dependientes de este estudio? ¿Cuáles son las hipótesis nula y alternativa?
Hemos examinado algunas de las estadísticas más utilizadas que probablemente nos encontremos en nuestra vida cotidiana. Sin embargo, comprender cómo realizar análisis estadísticos es sólo una pequeña parte del proceso estadístico global. Wheelan explica que, en cierto sentido, la "parte matemática" de la estadística es la parte fácil, ya que la mayoría de los análisis estadísticos se realizan en un ordenador y las fórmulas estadísticas son inmutables y fáciles de consultar. Por lo tanto, una vez que sabemos lo suficiente sobre estadística como para entender qué fórmulas utilizar y qué significan las estadísticas resultantes, el componente de cálculo es simplemente una cuestión de introducir los datos en las ecuaciones elegidas.
Dado que las estadísticas en sí son relativamente "fáciles" de calcular, Wheelan explica que la gente bienintencionada produce estadísticas engañosas todo el tiempo. Señala que muchas de las estadísticas que encontramos son precisas desde el punto de vista matemático (si se repitieran los cálculos se obtendría el mismo resultado), pero inexactas desde el punto de vista fáctico (aunque los números sean "ajustados", son erróneos). En otras palabras, los números se sostienen ante el escrutinio, pero no explican con exactitud una situación.
Por ejemplo, podría utilizar las estadísticas para presentar un convincente [vínculo entre...
Este es el mejor resumen de Cómo ganar amigos e Influencia las personas que he leído nunca. La forma en que explicaste las ideas y las conectaste con otros libros fue increíble.
Ahora que ya hemos hablado de algunos de los retos y estrategias de la recogida de datos, repasaremos el análisis de Wheelan sobre la fiabilidad de los propios datos.
Una de las características más importantes de los datos fiables es que proporcionan una representación real de la población que estamos estudiando. Como hemos visto en la sección sobre estadística inferencial, muchos proyectos de investigación y análisis estadísticos se basan en el muestreo como forma de conocer una población mayor. Si los datos recogidos en nuestra muestra no representan con exactitud a nuestra población, las estadísticas resultantes no serán fiables. Wheelan destaca dos formas principales de garantizar una muestra representativa:
Muestreo aleatorio: Una muestra verdaderamente aleatoria es ideal para la recogida de datos. El muestreo aleatorio nos permite estar razonablemente seguros de que estamos captando la diversidad de la población subyacente porque cualquier individuo tiene tantas posibilidades como cualquier otro de ser seleccionado. Por lo tanto, la diversidad de la muestra debe aproximarse a la diversidad de la población. Cuando una muestra refleja con exactitud la composición de su población, se denomina "muestra representativa".
Grandes tamaños de muestra: Cuanto mayor sea el tamaño de nuestra muestra,...
Considere el siguiente escenario hipotético de investigación:
Investigadores interesados en el efecto del yoga y la meditación sobre el bienestar emocional instalaron un stand en un gran ashram el último día de un retiro de yoga de una semana de duración. (Su hipótesis nula es que participar en yoga y meditación todos los días no influye en el bienestar emocional). Cuando los participantes abandonan el retiro, muchos se detienen en el stand para rellenar el cuestionario de los investigadores, en el que se les pregunta si creen que el yoga y la meditación tienen un impacto positivo en su bienestar emocional y que valoren su sensación de bienestar emocional actual en comparación con el primer día del retiro. Con estos datos, los investigadores rechazan su hipótesis nula y publican un artículo titulado: "La práctica diaria de yoga mejora universalmente el bienestar emocional".
¿Qué fuentes de sesgo de selección puedes identificar en este estudio? (Recuerde que el sesgo de selección se produce cuando nuestra muestra no es aleatoria y determinados subconjuntos de la población están sobrerrepresentados o infrarrepresentados).
Este es el mejor resumen de Cómo ganar amigos e Influencia las personas que he leído nunca. La forma en que explicaste las ideas y las conectaste con otros libros fue increíble.