La estadística descriptiva es una de las ramas principales de la estadística, y uno de los enfoques más importantes para su aplicación.
Este enfoque es elemental a la hora de representar datos de manera gráfica a través de tablas y figuras. Y esta técnica es imprescindible cuando se trata de cuantificar datos y hacerlos hacerlos comprensibles.
Y si buscas mejorar tus habilidades en programación y análisis de datos o convertirte en un especialista en ciencia de datos, este artículo es para ti. Aquí te contaremos de qué se trata esta disciplina y cómo ponerla en práctica.
¿Qué es la estadística descriptiva?
La estadística descriptiva es un enfoque analítico vital en las matemáticas y la investigación. Se basa en analizar los datos recolectados para después describir, resumir y presentar su comportamiento. O en otras palabras, traducir los datos y hacerlos comprensibles.
Además de describir los datos, también busca identificar patrones y tendencias dentro de dichos datos para detectar anomalías o datos inusuales.
Este enfoque solo estudia los datos recopilados en la investigación, sin realizar inferencias ni hipótesis.
¿Y dónde se usa la estadística descriptiva?
La gran ventaja de las estadísticas, incluyendo las estadísticas descriptivas, es que pueden usarse para toda clase de:
Estudios.
Investigaciones.
Programas de desarrollo.
Reportes.
Proyectos empresariales.
Lanzamientos de productos.
Estudios de mercado.
Análisis de rendimiento.
Entre muchas otras aplicaciones.
En otras palabras, sirven para todas las áreas, industrias y disciplinas que utilicen datos cuantificables, ya sea la educación, la política, la investigación, el marketing y la gestión empresarial, entre otras.
Tipos de variables
La estadística descriptiva trabaja en base a las dos dos siguientes tipos de variables:
Variable cuantitativa
Esta corresponde a todos los valores numéricos exactos. Valores con los que puedes realizar operaciones y cálculos. Pero veámoslo con ejemplos reales:
Edad: por ejemplo, 25 años, 40 años, 65 años.
Peso: 60 kg, 75.5 kg, 90.2 kg.
Ingresos: $2.000, $5.000, $10.000.
Tiempo de respuesta: representa el tiempo transcurrido entre una acción y su consecuencia. Por ejemplo, 2 segundos, 5.5 segundos, 8.3 segundos.
Número de hijos: 0 hijos, 2 hijos, 4 hijos.
Como verás, todos y cada uno de estos casos pueden representarse sin problemas en términos numéricos.
Variable cualitativa
Esta se refiere a valores no definidos, valores que no pueden plasmarse en número. O sea, los valores que la estadística descriptiva busca definir.
Por ejemplo:
Género.
Estado civil.
Color de ojos.
Ocupación.
En otras palabras, clasificaciones que pueden englobar variables cuantitativas.
Las variables son las que van a definir el modelo estadístico, así como su representación gráfica.
Ahora bien, la estadística descriptiva no solo depende de las variables, sino de los parámetros estadísticos a continuación:
Parámetros estadísticos
Cuando hablamos de la estadística descriptiva, estos son los tres parámetros más comunes:
1. Distribución de frecuencias
La distribución de frecuencias es una forma de organizar y resumir datos cuantitativos en una tabla, mostrando la frecuencia con la que ocurren los diferentes valores en un conjunto de datos.
Este parámetro ofrece una visión general de la distribución de los datos y permite identificar los valores más comunes, los valores atípicos y otros patrones importantes.
La distribución de frecuencias es bastante práctica para grandes conjuntos de datos. Además, puede ayudarte a identificar valores dominantes, valores atípicos o concentraciones específicas de datos en ciertos intervalos.
También puede ser utilizado como base para otros análisis estadísticos posteriores.
2. Medidas de tendencia central
Este es un conjunto de estadísticas que se utilizan para describir el punto central o típico de un conjunto de datos.
Estas medidas proporcionan un resumen numérico de los datos y ayudan a comprender dónde se concentran los valores en relación con el centro de la distribución.
O sea: el promedio.
Y en este caso, las tres medidas más recurrentes son:
Media aritmética: la suma de todos los valores dividida por la cantidad total de valores.
Mediana: o sea, el valor medio de los datos. Se encuentra en el medio de un conjunto de datos ordenados de manera ascendente o descendente.
Moda: o sea, el valor o el conjunto de valores más recurrentes en la estadística.
3. Medidas de variabilidad
Estas medidas describen la dispersión, amplitud o variabilidad de un conjunto de datos.
Estas medidas te dicen qué tan alejados están los valores individuales de la media o de otros valores centrales, y ayudan a comprender la distribución de los datos. Veámos a continuación:
Rango: o sea, la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos. Esta es la medida más básica de variabilidad y proporciona una idea general de cuánto se extienden los datos en toda la escala.
Varianza: mide la variabilidad de los datos respecto a la media aritmética y puede servirte para comparar diferentes grupos de datos.
Desviación estándar: indica cuánto se desvían los valores individuales de la media aritmética.
Coeficiente de variación: una medida relativa de variabilidad para comparar la dispersión entre diferentes conjuntos de datos, e incluso conjuntos con diferentes unidades y escalas.
Nota: ten en cuenta que estos son los parámetros más aceptados y aplicados, pero no son los únicos métodos para poner en práctica la estadística descriptiva.
Las 4 etapas de la estadística descriptiva
Para asegurar que tu modelo estadístico sea exitoso y te brinde resultados impecables, puedes seguir el siguiente paso a paso:
1. Recopilación de datos
Como en la mayoría de las ciencias cuantificables, el primer paso –y el más importante– es la recopilación de datos.
Puedes obtener los datos para tus investigaciones a través de encuestas, experimentos, observaciones, cuestionarios, herramientas analíticas, toolkits, un sinnúmero de fuentes de información.
Sin embargo, a la hora de obtener información, es primordial contar con un modelo de recolección de datos sólido y bien definido. Para ello, dedica todo el tiempo que necesites para definir tu proceso de recopilación y asegúrate de validarlo antes de ponerte manos a la obra.
2. Organización de la información
Una vez obtenidos los datos, es momento de organizarlos y clasificarlos según la información que estos puedan ofrecer.
Puedes empezar por ordenar tus datos en forma ascendente o descendente, dependiendo de las variables de tu interés.
Puedes agrupar tus datos en una o en varias tablas para luego etiquetarlos y clasificarlos según sus variables y tus objetivos. Así, puedes segmentar tus datos correctamente y evitar confusiones y sesgos estadísticos a la hora de analizar.
3. Presentación y tabulación
Y aquí es donde la estadística descriptiva es más que primordial.
Lo primero es realizar la descripción de los datos. Y para ello, puedes usar tanto las medidas de tendencia central como las medidas de dispersión.
Recuerda, las medias de dispersión te ayudarán a analizar y describir mejor los datos que hayas obtenido con las medidas centrales. Y a partir de aquí, viene la visualización.
En este punto es donde pasas a representar los datos en gráficas o tablas. Para hacerlo, puedes valerte de gráficos de barras, diagramas de dispersión o histogramas, entre otros recursos.
Estas herramientas no solo te ayudarán a crear análisis más acertados, sino a comunicar todos los datos de tus investigaciones de forma comprensible, tanto para tu equipo y tu empresa como para clientes y stakeholders.
4. Análisis de resultados
Lo primero es interpretar las estadísticas descriptivas. ya sean medidas de tendencia central o medidas de variabilidad.
Una vez que hayas analizado los resultados, es hora de buscar patrones y tendencias estadísticas dentro de tus datos. Esta parte requiere de análisis más exhaustivos, pero te permitirá encontrar correlaciones y patrones entre variables mucho más profundas y valiosas.
Desde luego, los datos tienen que servir a un propósito. En este caso, tus metas de investigación.
Luego de analizar las tendencias y patrones, es momento de contrastarlos con los objetivos iniciales de la investigación, así como otras investigaciones y estándares. Así, te será fácil verificar si tus datos y análisis son correctos.
Y una vez hayas terminado, solo tienes que representar los datos, ya sea en reportes, informes, gráficos o tablas.
Revisa que los datos de tus presentaciones correspondan a los resultados finales. También asegúrate de que sean comprensibles y fáciles de entender. Y que estén bien respaldados con tus datos de investigación y modelos estadísticos.
Diferencia entre la estadística descriptiva y la diferencial
Estos son los dos pilares fundamentales de la estadística. Ambas disciplinas pueden usarse a la vez para técnicas y modelos más precisos, eficientes y confiables. Sin embargo, primero hay que entender cómo se diferencian.
La estadística descriptiva:
Se centra en la descripción, resumen y visualización de los datos disponibles. También en identificar patrones para comprender mejor los datos recopilados.
Su objetivo principal es proporcionar una descripción clara, concisa y objetiva de un conjunto de datos.
Utiliza medidas de tendencia central (como la media, mediana y moda) y medidas de dispersión (como la varianza y desviación estándar).
Por ejemplo:
Supongamos que eres dueño de una empresa y quieres conocer las preferencias de tus clientes antes de lanzar un nuevo producto.
Con la recopilación de datos sobre las compras de los clientes, puedes:
Usar la estadística descriptiva para calcular la frecuencia de compra de diferentes productos.
Identificar los productos más vendidos.
Calcular la media de gasto por cliente.
Entre otros factores.
La estadística inferencial:
Como su nombre lo indica, busca hacer inferencias o generalizaciones sobre una población más amplia en base a una muestra de datos.
La estadística inferencial se basa en la teoría de la probabilidad.
Se utiliza para hacer afirmaciones o sacar conclusiones sobre una población en base a la información limitada de una muestra.
Utiliza pruebas de hipótesis, intervalos de confianza y análisis de regresión.
Por ejemplo:
Supongamos que lanzaste una campaña de marketing digital y quieres determinar si genera suficientes conversiones. O sea, si se vende bien. En este caso:
En lugar de analizar todos los datos de clics y conversiones de todos los usuarios, puedes usar la estadística inferencial.
Tomando una muestra aleatoria de los datos recopilados durante la campaña, se puede realizar una inferencia sobre la tasa de conversión en toda la población.
Incluso puedes calcular intervalos de confianza para estimar la tasa de conversión promedio y realizar pruebas de hipótesis para contrastar la validez de tus datos.
Las estadísticas descriptivas son vitales para toda clase de estudios estadísticos, sin importar la industria ni el sector en donde se apliquen.
Estas, complementadas con las estadísticas inferenciales, te servirán para obtener resultados precisos en toda clase de investigaciones. Eso sí, siempre y cuando te bases en los modelos estadísticos correctos y seas tan meticuloso como sea posible con tus análisis.
Y ahora, ¿cómo crees que podrías aplicar las estadísticas descriptivas? ¿Cómo te gustaría hacerlo? Déjanos tu comentario y cuéntanos cómo aplicarías estas estadísticas en tus proyectos.
¿Bucas algo en concreto?
TAMBIÉN PUEDES BUSCAR EN NUESTRAS CATEGORÍAS