Saltar la navegación

Medidas de forma

Para caracterizar aún con más detalle un conjunto de datos se pueden calcular otras medidas relacionadas con su distribución, o medidas de forma. La curtosis expresa cuántos datos se sitúan muy lejos de la media (los denominados valores atípicos, outliers en inglés) y cómo de alejados están, en comparación con los datos que se encuentran muy próximos a ella. El nombre proviene del griego kurtos, que significa curvado o arqueado, y a veces se relaciona esta medida con la manera en que los datos se concentran en torno a la media (es decir, con la forma del pico de datos a su alrededor en una representación gráfica), pero en realidad, como se ha descrito, depende principalmente de los datos muy alejados.

Otra medida de forma es la asimetría, que expresa la diferencia en la cantidad de datos que se sitúan a un lado de la media con respecto al otro, es decir, refleja si existe un exceso de datos por encima o por debajo de la media. Puede ocurrir que haya algunos pocos datos mucho mayores que la media y muchos datos poco menores que ella, situaciones que se compensan entre sí y pueden dar una medida de asimetría pequeña, a pesar de que los datos se distribuyen de forma claramente asimétrica. La curtosis puede reflejar este hecho, aportando así una información complementaria.

 

EJEMPLO

El conjunto 2 3 4 7 10 1000 es claramente asimétrico: su media es 171, pero la mayoría de los datos (todos menos uno) se sitúan por debajo de ella; de hecho, la media es mucho mayor que la mayoría de los datos porque unos de ellos, 1000, está muy alejado de los demás: se trata de uno de los valores atípicos, que influye en la curtosis del conjunto.