Hogar Blog What Is Standard Deviation

¿Qué es la desviación estándar? (Conceptos esenciales, Cálculo, Aplicaciones)

La desviación estándar (σ/s) mide la dispersión de los datos, desde gastos en café hasta calificaciones de exámenes. Aprende métodos de cálculo, aplicaciones en finanzas/psicología y su relación con la varianza.

¿Qué es la Desviación Estándar?

Imagina que rastreas tus gastos mensuales en café: Algunas semanas te das el lujo de comprar lattes artesanales (25), otras te limitas a preparar café económico en casa (10). La fluctuación en tus gastos de café—qué tan "disperso" está tu gasto—es exactamente lo que mide la desviación estándar. Para los estudiantes, este concepto puede ser más relevante al analizar las calificaciones de los exámenes: Si dos clases tienen un promedio del 75% en una prueba, pero una tiene calificaciones consistentes (todas entre 70-80%) y otra varía enormemente (50-100%), la desviación estándar revela qué grupo tiene más variabilidad (¡y estrés!). Desde las finanzas personales hasta el rendimiento académico, la desviación estándar ayuda a cuantificar la predictibilidad—o el caos—en la vida cotidiana.

Gráfico de barras de datos de ventas con barras de error que muestran la desviación estándar en los ingresos mensuales

Definición Básica de Desviación Estándar

Conceptos Básicos de Álgebra

Definición

La desviación estándar (SD) es la raíz cuadrada de la varianza. Representa la distancia promedio de los puntos de datos desde la media.

Símbolo

Desviación estándar de la población: σ (sigma)

Desviación estándar de la muestra: s

Tipos

Desviación estándar de la población (σ): Se utiliza al analizar un conjunto de datos completo. 

Fórmula: \(\sigma = \sqrt{\frac{\sum (x_i - \mu)^2}{N}}\)

Aquí, \(\mu\) es la media de la población, y \(N\) es el número total de puntos de datos.

Desviación estándar de la muestra (s): Ajusta el sesgo en conjuntos de datos más pequeños. 

Fórmula: \(s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}}\)

Aquí, \(\bar{x}\) es la media de la muestra, y \(n\) es el tamaño de la muestra.

Expresiones

La varianza (\(\sigma^2\) o \(s^2\)) precede a la SD en los cálculos:

\(\sigma = \sqrt{\text{Varianza}}, \quad s = \sqrt{\text{Varianza}}\)

Esta relación simplifica pasos computacionales mientras conserva la interpretabilidad.

Ejemplos

1: Desviación Estándar de la Población

Conjunto de datos: Gastos diarios de café durante una semana: [10, 12, 15, 8, 20].

Paso 1: Calcular la Media (μ)

\(\mu = \frac{\sum x_i}{N} = \frac{10 + 12 + 15 + 8 + 20}{5} = \frac{65}{5} = 13\)

Paso 2: Encontrar las Desviaciones de la Media

Resta la media de cada valor:

\(10 - 13 = -3 \\ 12 - 13 = -1 \\ 15 - 13 = +2 \\ 8 - 13 = -5 \\ 20 - 13 = +7\)

Paso 3: Cuadrar Cada Desviación

\((-3)^2 = 9 \\ (-1)^2 = 1 \\ (+2)^2 = 4 \\ (-5)^2 = 25 \\ (+7)^2 = 49\)

Paso 4: Calcular la Varianza (σ²)

Suma las desviaciones al cuadrado y divide por \(N\):

\(\sigma^2 = \frac{9 + 1 + 4 + 25 + 49}{5} = \frac{88}{5} = 17.6\)

Paso 5: Tomar la Raíz Cuadrada

\(\sigma = \sqrt{17.6} \approx 4.20\)

Interpretación:

La desviación estándar de la población es \(\$4.20\), lo que significa que los gastos diarios de café normalmente se desvían de la media \((\$13)\) aproximadamente \(\$4.20\).

2: Desviación Estándar de la Muestra

Conjunto de datos: Puntuaciones de exámenes de un estudiante (sobre 100): [75, 80, 90, 65, 85].

Paso 1: Calcular la Media de la Muestra (\(\bar{x}\))

\(\bar{x} = \frac{\sum x_i}{n} = \frac{75 + 80 + 90 + 65 + 85}{5} = \frac{395}{5} = 79\)

Paso 2: Encontrar las Desviaciones de la Media

\(75 - 79 = -4 \\ 80 - 79 = +1 \\ 90 - 79 = +11 \\ 65 - 79 = -14 \\ 85 - 79 = +6\)

Paso 3: Cuadrar Cada Desviación

\((-4)^2 = 16 \\ (+1)^2 = 1 \\ (+11)^2 = 121 \\ (-14)^2 = 196 \\ (+6)^2 = 36\)

Paso 4: Calcular la Varianza (\(s²\))

Suma las desviaciones al cuadrado y divide por \(n - 1\):

\(s^2 = \frac{16 + 1 + 121 + 196 + 36}{5 - 1} = \frac{370}{4} = 92.5\)

Paso 5: Tomar la Raíz Cuadrada

\(s = \sqrt{92.5} \approx 9.62\)

Interpretación:

La desviación estándar de la muestra es aproximadamente 9.62, lo que indica que las puntuaciones de los exámenes varían de la media (79) en aproximadamente 9.62 puntos.

¿Por qué \(n - 1\)?

La corrección de Bessel (utilizar \(n - 1\) en lugar de \(n\) para muestras) ajusta el sesgo porque las muestras a menudo subestiman la varianza de la población. Este ajuste garantiza que la varianza de la muestra se aproxime mejor a la verdadera varianza de la población.

Ilustraciones

Visualizando la regla 68-95-99.7 con zonas de desviación estándar sombreadas

Gráficamente, la SD determina el "ancho" de una curva de campana en distribuciones normales:

  • 68% de los datos se encuentra dentro de \(\pm1\sigma\).
  • 95% dentro de \(\pm2\sigma\).
  • 99.7% dentro de \(\pm3\sigma\).

Un grupo estrecho (baja \(SD\)) implica previsibilidad, mientras que una dispersión amplia (alta \(SD\)) indica volatilidad.

Métodos para Calcular la Desviación Estándar

Desviación Estándar Poblacional

La desviación estándar poblacional (σ) cuantifica la dispersión de los datos a lo largo de un grupo o conjunto de datos completo. Se calcula utilizando todos los puntos de datos y refleja la verdadera variabilidad dentro de la población.

Fórmula:

\(\sigma = \sqrt{\frac{\sum (x_i - \mu)^2}{N}}\)

Pasos:

1. Calcular la media poblacional (\(μ\)):

\(\mu = \frac{\sum x_i}{N}\)

Ejemplo: Para las alturas (en cm) de los 5 estudiantes en una clase: 

\(160, 165, 170, 155, 175\)

\(\mu = \frac{\sum x_i}{N}\)

2. Calcular las desviaciones: Restar μ de cada valor:

\(160-165 = -5, \ 165-165=0, \ 170-165=+5, \ 155-165=-10, \ 175-165=+10\)

3. Cuadrar las desviaciones:

\((-5)^2=25, \ (0)^2=0, \ (+5)^2=25, \ (-10)^2=100, \ (+10)^2=100\)

4. Sumar las desviaciones al cuadrado:

\(25 + 0 + 25 + 100 + 100 = 250\)

5. Dividir por el tamaño de la población (\(N\)):

\(\text{Varianza } (\sigma^2) = \frac{250}{5} = 50\)

6. Tomar la raíz cuadrada:

\(\sigma = \sqrt{50} \approx 7.07 \ \text{cm}\)

Interpretación: Las alturas varían del promedio por ~7.07 cm.

Supuesto Clave: Utilice este método solo cuando trabaje con datos completos.

Distribución normal con el eje horizontal etiquetado por desviaciones estándar (σ)

Desviación Estándar de Muestra

La desviación estándar de muestra (\(s\)) estima la variabilidad en un subconjunto de datos. Ajusta el sesgo al usar \(n - 1\) (corrección de Bessel) en lugar de \(n\).

Fórmula:

\(s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n - 1}}\)

Pasos:

1. Calcular la media de la muestra (\(\bar{x}\)):

Ejemplo: Una muestra de 4 de 100 pesos de productos (en gramos): 

[\(75, 80, 90, 65, 85\)].

\(50-51.25=-1.25, \ 52-51.25=+0.75, \ 48-51.25=-3.25, \ 55-51.25=+3.75\)

2. Calcular las desviaciones:

\(50-51.25=-1.25, \ 52-51.25=+0.75, \ 48-51.25=-3.25, \ 55-51.25=+3.75\)

3. Cuadrar las desviaciones:

\((-1.25)^2=1.56, \ (+0.75)^2=0.56, \ (-3.25)^2=10.56, \ (+3.75)^2=14.06\)

4. Sumar las desviaciones al cuadrado:

\(1.56 + 0.56 + 10.56 + 14.06 = 26.74\)

5. Dividir por \(n - 1\):

\(\text{Varianza de la muestra } (s^2) = \frac{26.74}{3} \approx 8.91\)

6. Tomar la raíz cuadrada:

\(\sigma = \sqrt{50} \approx 7.07 \ \text{cm}\)

Interpretación: Los pesos en la muestra se desvían en ~2.99 gramos de la media.

¿Por qué \(n - 1\)?

Las muestras pequeñas a menudo subestiman la verdadera varianza de la población. Reducir el denominador a \(n - 1\) aumenta el valor de la varianza, proporcionando una estimación más precisa.

Cuándo Usar: Priorice este método para *conjuntos de datos parciales* o al generalizar a una población más amplia.

Para solidificar su comprensión de estos conceptos, considere practicar problemas de estadística que involucren el cálculo de desviaciones estándar en diferentes contextos, ya que los ejercicios prácticos mejorarán su comprensión del análisis estadístico.

Rol y Aplicaciones de la Desviación Estándar

Rol de la Desviación Estándar

Análisis de Datos

La desviación estándar es un pilar del análisis de datos, proporcionando un lente matemático para evaluar la variabilidad. Al cuantificar qué tan estrechamente o distanciados se agrupan los datos alrededor de la media, ayuda a los analistas a distinguir entre patrones consistentes y fluctuaciones aleatorias. Por ejemplo, en el control de calidad, un fabricante que mide el diámetro de tornillos podría encontrar una media de 10 mm con una desviación estándar de 0.2 mm. Una pequeña desviación implica alta precisión, mientras que desviaciones mayores podrían indicar fallos en el equipo o defectos en los materiales. Esto hace que la desviación estándar sea crítica para la optimización de procesos—las fábricas a menudo establecen “niveles sigma” (por ejemplo, Seis Sigma) para minimizar los defectos mediante la reducción de la variabilidad.

Más allá de las aplicaciones industriales, la desviación estándar simplifica la interpretación de los resultados de encuestas. Si dos encuestas políticas reportan idénticos promedios de satisfacción de los votantes (por ejemplo, 6/10), la encuesta con una desviación estándar más baja indica fuerte consenso entre los encuestados, mientras que una alta desviación refleja opiniones polarizadas. Los científicos sociales también la utilizan para filtrar valores atípicos—puntos de datos que se alejan mucho de la norma. Por ejemplo, en ensayos clínicos, un participante que muestra efectos secundarios extremos (por ejemplo, desviaciones de la presión arterial que exceden ±3σ) podría ser señalado para una investigación más detallada.

Esta métrica transforma números en bruto en información útil, permitiendo a los profesionales tomar decisiones basadas en evidencia. Ya sea optimizando cadenas de suministro o validando hipótesis, la desviación estándar actúa como una medida universal de la incertidumbre.

Aplicaciones de la Desviación Estándar

Finanzas

La desviación estándar es la base de la evaluación del riesgo financiero, sirviendo como una métrica universal para la volatilidad. En los mercados de valores, cuantifica las fluctuaciones de precios históricas de un activo, ayudando a los inversores a evaluar posibles riesgos futuros. Por ejemplo, una acción con una desviación estándar de retorno diario del 3% se considera más riesgosa que una con un 1%, ya que sus cambios de precio son más impredecibles.

Optimización de Portafolios: La Teoría Moderna de Portafolios (MPT) utiliza la desviación estándar para equilibrar activos de alto y bajo riesgo. Por ejemplo, combinar acciones tecnológicas volátiles (σ = 15%) con bonos gubernamentales estables (σ = 2%) puede reducir la volatilidad general de un portafolio. La Razón de Sharpe cuantifica además este equilibrio dividiendo los retornos excesivos por la desviación estándar, un cociente más alto señala un mejor desempeño ajustado al riesgo.

Gráfico de precios de acciones que demuestra alta desviación estándar (volatilidad)

Valoración de Derivados: El modelo de Black-Scholes integra la volatilidad histórica (derivada de la desviación estándar) para valorar opciones. Una acción con una volatilidad anualizada del 20% tendrá opciones más costosas que una con un 10%, ya que los compradores pagan más por el potencial de alta ganancia.

Mercados de Criptomonedas: La notoria volatilidad de Bitcoin (σ anualizada ≈ 80%) ilustra su naturaleza especulativa. Los comerciantes usan la desviación estándar para establecer órdenes de stop-loss; si el precio de Bitcoin fluctúa ±5% diariamente, una desviación del 10% podría desencadenar ventas automáticas para limitar pérdidas.

Caso de la Vida Real: Durante la crisis financiera de 2008, los valores respaldados por hipotecas mostraron una explosión en las desviaciones estándar, exponiendo riesgos ocultos. Las instituciones que ignoraron estas señales enfrentaron pérdidas catastróficas, subrayando el poder predictivo de la métrica.

Psicología

En psicología, la desviación estándar conecta el comportamiento individual con las normas poblacionales.

Pruebas Psicométricas: Las puntuaciones de CI siguen una media de 100 y una desviación estándar de 15. Una puntuación de 130 (>2σ por encima de la media) coloca a alguien en el 2.5% superior—un umbral para la clasificación de “superdotado”. Por el contrario, una puntuación de 70 (<2σ por debajo) puede indicar discapacidad intelectual.

Diagnósticos Clínicos: Los terapeutas rastrean la estabilidad emocional en pacientes bipolares usando diarios de ánimo. Un paciente con puntuaciones de ánimo diarias que oscilan ampliamente (σ = 4 en una escala de 10 puntos) podría requerir intervención urgente, mientras que un paciente estable (σ = 1.5) muestra mejor control de los síntomas.

Investigación Experimental: Los psicólogos cognitivos que estudian los tiempos de reacción usan desviaciones estándar bajas para validar condiciones controladas. Por ejemplo, si los tiempos de respuesta de los participantes en una prueba de memoria se agrupan estrechamente alrededor de 500ms (σ = 50ms), sugiere procesamiento cognitivo consistente. Altas desviaciones (σ = 200ms), sin embargo, podrían revelar lapsos de atención, impulsando a los investigadores a ajustar los protocolos experimentales.

Psicología Educativa: Las escuelas analizan distribuciones de calificaciones. Una clase de matemáticas con un promedio del 75% y σ = 5% indica efectividad docente uniforme, mientras que σ = 15% sugiere compresión desigual, guiando programas de tutoría dirigidos.

Big Data

En los ecosistemas de big data, la desviación estándar impulsa la detección de anomalías, la ingeniería de características y la analítica predictiva.

Redes de Sensores IoT: Las plantas de manufactura monitorean el equipo a través de sensores de temperatura. Una máquina operando a 30°C con σ = 1°C es estable, pero un aumento repentino a 40°C (σ > 3°C) podría señalar un fallo inminente, activando alertas de mantenimiento.

Aprendizaje Automático:

  • Escalado de Características: Los modelos estandarizan variables de entrada usando Z-scores \(\frac{x - \mu}{\sigma}\). Los datos de ingresos (rango: 0-200k) y edad (0–100 años) se vuelven comparables después de la normalización.
  • Detección de Anomalías: Los sistemas de detección de fraudes marcan transacciones con tarjetas de crédito que se desvían >3σ de los patrones de gasto de un usuario (por ejemplo, una compra de 5,000 después de un historial de promedios de 50).

Analítica de Retail:

  • Pronóstico de Demanda: Un producto con ventas σ = 10 unidades requiere un inventario de seguridad mínimo, mientras que uno con σ = 50 unidades necesita inventario de reserva.
  • Segmentación de Clientes: Los minoristas agrupan a los compradores por la variabilidad de sus compras. Los clientes con alta desviación (σ = 200/mes) podrían ser objeto de precios dinámicos, mientras que los consumidores estables (σ = 20) reciben recompensas de lealtad.

Industria del Entretenimiento: Netflix analiza las desviaciones en el tiempo de visualización para medir el atractivo de contenido. Una serie vista en maratón (σ = 10 minutos por sesión) se prioriza en recomendaciones, mientras que un documental con σ = 45 minutos (visualización esporádica) se relega a categorías de nicho.

Ciencia Climática: Los meteorólogos utilizan tendencias de desviación de temperatura (por ejemplo, aumento de σ en promedios estacionales) para modelar los impactos del cambio climático, como la mayor frecuencia de eventos climáticos extremos.

Ventajas y Desventajas de la Desviación Estándar

Ventajas

La desviación estándar es apreciada por su interpretabilidad. Como medida de dispersión expresada en las mismas unidades que los datos originales (por ejemplo, dólares, puntajes de exámenes), proporciona percepciones intuitivas. Por ejemplo, una panadería que informa el peso de las galletas con una media de 50g y σ = 2g indica inmediatamente que la mayoría de los productos están dentro de 46–54g.

También integra todos los puntos de datos, a diferencia del rango, que se enfoca solo en los extremos. Esto la hace sensible a pequeñas fluctuaciones, útil para detectar tendencias sutiles en el control de calidad o en los mercados financieros.

Intervalos de confianza superpuestos (90% vs 95% vs 99%) sombreados para la comparación de la dispersión de datos en un gráfico de distribución

Las propiedades matemáticas mejoran aún más su utilidad. La desviación estándar sostiene herramientas estadísticas como intervalos de confianza y pruebas de hipótesis. En inversiones, los portafolios se optimizan utilizando el Ratio de Sharpe, que divide los retornos por su desviación estándar para evaluar la eficiencia del riesgo.

Desventajas

La sensibilidad de la desviación estándar a los valores atípicos puede distorsionar los resultados. Por ejemplo, si un conjunto de datos de salarios de empleados promedia 60,000 pero incluye un CEO que gana 5 millones, σ se ve artificialmente inflada, lo que representa incorrectamente la distribución típica de los ingresos.

También supone simetría, lo cual es problemático con distribuciones sesgadas. Considere los precios de las casas en una ciudad: la mayoría están entre 200k–400k, pero algunas casas de lujo cuestan 2M. A pesar de los datos sesgados a la derecha, la desviación estándar trata las desviaciones por igual, pasando por alto la asimetría.

Además, carece de significado contextual para distribuciones no normales. En tales casos, métricas como el rango intercuartílico (IQR) capturan mejor la variabilidad.

Finalmente, la dependencia de las desviaciones cuadráticas enfatiza diferencias mayores, que pueden no alinearse con prioridades del mundo real. En encuestas de satisfacción del cliente (escalas de 1–5), incluso pequeñas desviaciones (por ejemplo, σ = 0.8) podrían ocultar cambios significativos en el sentimiento.

Relación Entre la Desviación Estándar y Otras Medidas Estadísticas

Desviación Estándar y Cuantiles

La desviación estándar (σ) y los cuantiles son herramientas complementarias para entender la distribución de datos, cada una ofreciendo perspectivas únicas. Los cuantiles, como los cuartiles o percentiles, dividen los datos en segmentos basados en su clasificación. Por ejemplo, la mediana (percentil 50) divide los datos en dos mitades, mientras que el rango intercuartílico (IQR = Q3 - Q1) captura el 50% medio de los valores. A diferencia de la desviación estándar, los cuantiles se centran en la *posición de los datos* en lugar de la dispersión desde la media, lo que los hace robustos ante valores atípicos y distribuciones sesgadas.

La desviación estándar, sin embargo, cuantifica directamente la dispersión promediando las desviaciones de la media. Su contraparte cuadrada, varianza (σ²), enfatiza aún más estas desviaciones, pero es menos intuitiva debido a las unidades al cuadrado. Para retornos financieros, la varianza suma las fluctuaciones diarias al cuadrado, pero los inversores prefieren σ (por ejemplo, la volatilidad anualizada) por su alineación directa con las escalas de retorno. Juntas, σ y los cuantiles proporcionan una visión holística: σ revela la variabilidad general, mientras que los cuantiles destacan la forma de la distribución y el impacto de los valores atípicos.

En distribuciones simétricas en forma de campana (por ejemplo, alturas), σ y el IQR se correlacionan estrechamente. Para una distribución normal, aproximadamente el 50% de los datos se encuentra dentro de ±0.67σ, alineándose con el IQR. Sin embargo, en datos sesgados (por ejemplo, ingresos), σ puede sobrestimar la variabilidad debido a valores atípicos, mientras que los cuantiles permanecen estables.

Para ilustrar, considere los ingresos familiares en una ciudad:

Histograma de precios de vivienda sesgados a la derecha: sensibilidad de la desviación estándar a valores atípicos

  • Sesgo a la derecha: La mayoría gana 40k–80k (IQR = 40k), pero algunos CEOs ganan más de 5M, inflando σ a 250k.
  • Estrategia normalizada: Los analistas informan ambas métricas: IQR para reflejar las ganancias típicas y σ para considerar la disparidad extrema de riqueza.

La varianza, si bien es fundamental en fórmulas (por ejemplo, ANOVA), a menudo es eclipsada por σ en la interpretación práctica. Sin embargo, comprender su relación puentea las estadísticas teóricas y la toma de decisiones en el mundo real.

Bienvenido a ¡Estudia ahora!
Inicie sesión para continuar con el recorrido de Thoth AI Chat
Continuar con correo electrónico
O continuar con
Al hacer clic en "Iniciar sesión", acepta nuestros términos y condiciones. Términos de Uso & Política de privacidad