Todo lo que siempre quisiste saber de la curtosis pero nunca te atreviste a preguntar.

Y es que este año se cumplen nada menos que 110 años de la invención de la curtosis.

Un porcentaje altísimo de libros de estadística hablan de la curtosis en el primer capítulo: el de estadística descriptiva. Dicen que es una medida estadística que se utiliza para comparar la forma de una distribución con la campana de Gauss, o distribución normal. Así, si una distribución es más apuntada que la normal, es leptocúrtica, si es menos, platicúrtica, y si es igual mesocúrtica. Se introduce el llamado segundo coeficiente de Fisher, que mide la curtosis, y hala. En todo el libro no se vuelve a hablar de la curtosis. Como mucho, en el apartado de variables aleatorias, que puede volver a definirse, pero en vez de para una variable estadística, para una variable aleatoria.
Y hala, ya está. Cuántos miles de estudiantes y profesores de estadística circulan por ahí sin realmente tener más idea de que esta medida podía servir para algo más. De hecho, para bastantes cosas más.

Comenzad a aprender cosas sobre la curtosis que jamás llegásteis ni a imaginar:

– En la wikipedia (en english, claro) podemos leer

KURTOSIS fue utilizada por Karl Pearson en 1905 in “Das Fehlergesetz und seine Verallgemeinerungen durch Fechner und Pearson. A Rejoinder,” Biometrika, 4, 169-212, en la frase “el grado de curtosis.”Allí, establecía que había utilizado el término previamente. Este término está basado en el griego υρτός, kyrtos o kurtos (curvado o arqueado).

Pearson introdujo los términos leptocúrtico, platicúrtico y mesocúrtico, escribiendo en  Biometrika (1905), 5. 173: “Given two frequency distributions which have the same variability as measured by the standard deviation, they may be relatively more or less flat-topped than the normal curve. If more flat-topped I term them platykurtic, if less flat-topped leptokurtic, and if equally flat-topped mesokurtic”
Otros autores sugirieron:
Balanda and MacGillivray
dijeron que la definición estándar de la curtosis es “una pobre medida de la curtosis, apuntamiento o peso en las colas”, así que propusieron “definir curtosis de alguna forma como como el movimiento de la masa de probabilidad desde los hombros de la distribución hasta su centro y sus colas”

(de esta forma, la curtosis tiene un significado físico, al igual que lo tienen la media aritmética y la varianza)

Moors: dio una interpretación intuitiva de la curtosis. Sea
\(  Z=\frac{X-\mu}{\sigma} \)
donde X es una variable aleatoria, μ la media y σ  la desviación típica. Entonces
\( \kappa = E(Z^4)=Var(Z^2) + [E(Z^2)]^2 = Var(Z^2) +1 \)
donde κ es la kurtosis. De esta forma, la curtosis puede entenderse como una medida de la dispersión de  Z2 alrededor de su esperanza. Alternativamente, puede verse como la dispersión de Z alrededor de -1 y -1. κ alcanza su mínimo valor en una distribución simétrica de sólo 2 puntos. En términos de la variable original X, la curtosis es la medida de la dispersión de X alrededor de los valores  μ ± σ.

Valores altos para κ se dan en 2 circunstancias.

  • cuando la masa de probabilidad se concentra alrededor de la media.
  • cuando la masa de probabilidad se concentra en las colas.

La definición de Pearson se utiliza en física, como un indicador de intermitencias en turbulencias.

(esta es otra interpretación física de la curtosis)

En su trabajo “Errors of Routine Analysis” Biometrika, 19, (1927), p. 160 Student hizo un dibujo como regla nemotécnica para acordarse de los valores de la curtosis:

student-curtosis

 

Yo os dejo un par de ellos más

curtosis1 curtosis2

Cebrando los 100 años de la curtosis (fijémonos que muchos ni nos enteramos… ) Edith Seier, de la East Tennessee State University
escribió un artículo sobre la curtosis, del que voy a recoger lo que menos conozcamos:

Ethimology: The word kurtosis comes from the Greek ‘‘kurtos’ (curvature) and had been previously used to indicate curvature in Medicine and Mathematics.

Timeline of Kurtosis

1905  Pearson define la Kurtosis, β2\(   \beta_2 = \frac{E(X-\mu)^4}{Var(X)^2} \) as a measure of departure from normality in a paper published in Biometrika. β2=3 for the normal distribution and the terms ‘leptokurtic’ (β2>3), mesokurtic (β2=3), platikurtic (β2<3) are introduced.  Nota: ¿por que se llama coeficiente de Fisher si lo inventó Pearson?
1906-1910  Articles appear in Biometrika comparing frequency distributions of generally very large data sets (anthropometric measurements, indicators of severity of smallpox, size of paramecium Chilomona, pig fertility) to the normal distribution using and symmetry
1920’s..  the kurtosis statistic is mentioned in all statistics textbooks, even introductory ones, together with location, spread and symmetry 
1943a Articles start to appear pointing to some misconceptions about kurtosis in introductory textbooks. Some times people tended to think that if f(0) was higher for one density function than for another, necessarily that distribution had higher kurtosis. 
1943 b The ‘density crossing’ sufficient condition for one distribution to have a higher value of than another one appears (Dyson, 1943, Finucan 1963)). If two density functions(with common variance) cross twice at each side of 0, one has higher than the other.The graph at the right shows that the

Laplace and Normal distributions with equal variances cross twice,.the Laplace distribution has higher kurtosis than the Normal.

On the other hand, from the comparison of the density functions we could not assure that the Triangular has higher than the Normal because they cross 3 times

curtosis3
1970 The discussion if kurtosis measures should detect bimodality opens (currently the general understanding is that they do not have to). Here the graph shows the classic example of the double gamma and the normal distribution (Hildebrandt). We have added the plot of that shows that from the point of view of Van Zwet’s criteria, the two distributions are not comparable in terms of Kurtosis (the line is part convex part concave)  curtosis4
1982 Stavig define un estadístico robusto de la curtosis
1987 Using the influence function Ruppert addresses the on going discussion if kurtosis is related to peak or to tails (it is related to both)
1988 Moors defines a measure of kurtosis based on the ‘octiles’ (octiles, lo que nos faltaba!)
1988 Balanda y MacGillivray give a more flexible definition of kurtosis as the movement of mass, adjusted for mean and dispersion, from the shoulders of the distribution to th center and the tail, being possible of quantify it of many different ways.
1990 L-kurtosis is defined (Hosking) Mejor no buscar la fórmula, que da mucho miedo
1998  Groeneveld defines quantile kurtosis for symmetric distributions with mean 0

Quien quiera saber más, que busque el artículo original de Edith Seier en google, que es lo que he hecho yo.

Finalmente, recomiendo (para estudiantes y profesores de Economía, y además a los que quieren invertir en Bolsa, el siguiente artículo:

El malo, el bueno y la curtosis

 

Leave a Reply

Centro de preferencias de privacidad

Necessary

Advertising

Analytics

Other