Minimizando la dispersión
Ultimamente he estado más cercano a la estadística que a la Geometría, lo que me ha permitido reconstruir aprendizajes además de hacer algunas relaciones que nunca me fueron tan evidentes.
Particularmente de lo que voy a hablar hoy, es sobre la Media y la Varianza, pero aprovechando la geometría, y Geogebra particularmente, para ilustrar la interpretación geométrica de ambas, buscando entender mejor qué son y para qué sirven.
La idea central de este post proviene de un artículo del profesor Carlos Araújo de la Universidad Católica, relativo a la definición de la Media, de lo cual se desprenden algunas ideas geométricas que muestro más adelante.

Indicadores descriptivos:
¿Qué es la media?
Prof. Carlos Araújo
Docencia en estadística
Un primer aspecto que se discute en este artículo, es la idea de que la media corresponde a la suma de los individuos de una población, dividido por el número de individuos. Si bien en muchos textos se define de tal manera, esto en realidad corresponde a cómo se calcula, y no a qué es, representa o significa. Luego, es una mala definición.
Es razonable preguntarse, ¿qué es la media? independientemente de su cálculo, y luego surge la siguiente pregunta ¿cómo se calcula y por qué?
Es evidente que en la enseñanza de la matemática tenemos una enorme tendencia hacia lo procedimental, dejando muchas veces de lado lo conceptual. Y así es como uno puede haber calculado muchas veces la media, sin entender muy bien qué se está calculando o por qué se calcula así.
Definición de la media
Según plantea el profesor Araújo, la media se define de la siguiente forma:
¿Qué significa esta definición? Principalmente, responde a la necesidad de minimizar una determinada suma.
Veamos:
Esto parte de la idea de dispersión. El determinar qué tan dispersa es una población, supone determinar cuánto se alejan los individuos de un valor determinado. Luego la expresión (xi – k), representa cuánto se aleja el valor xi de una constante k.
Entonces, la suma de las desviaciones de los individuos de la población, respecto a un a valor arbitrario, es una forma de describir su dispersión; pero como no nos importa su signo (si están a la izquierda o derecha de k), se suele considerar la suma al cuadrado.
En consecuencia, la suma anterior, representa la dispersión de los individuos de la población, respecto a un valor arbitrario k.
Pero ¿cuál valor debe ser k? ¿respecto a qué valor se deben calcular las desviaciones de los individuos de una población? ¿cuál es el mejor valor respecto al cual calcular la dispersión?
Aquí entra en juego la geometría:
En este applet se han graficado 20 elementos y su media (μ), respecto
a la constante k, se ha calculado la dispersión de la población, es decir, la suma de los cuadrados de las desviaciones respecto a k.
Luego, volviendo a la pregunta anterior, ¿respecto a qué valor se deben calcular las desviaciones de los individuos de una población?
Para responder esto, es necesario mover K y observar qué valores se obtienen para la suma. ¿Existe un mínimo o un máximo y cómo se obtienen?
Otra aproximación al problema de la dispersión, es funcional. Si pensamos en esta sumatoria, como una función respecto de “k”, ¿qué tipo de función es?
Como es una suma de binomios al cuadrado, se trata de una parábola con el coeficiente de x2 positivo; luego podemos observar que esta función está acotada inferiormente.
Si se busca ubicar el punto K en el vértice de la parábola (mínimo), su abscisa tiende a la media, mientras que su ordenada tiende a la varianza.
Interpretación de la definición
Miremos entonces nuevamente la definición de la media:

La parte de la izquierda es la que usualmente se entrega como definición, y nos provee de la forma de cálculo, sin embargo esta es sólo una parte de la definición.
La segunda parte de la definición, es la que intento ilustrar con las construcciones anteriores. Ésta establece, que si se calcula la dispersión (suma de desviaciones al cuadrado) respecto a un valor “k”, esta es mínima cuando “k” corresponde a la media.
En resumen podemos afirmar que, la suma de las variaciones de los individuos de una población respecto a un valor arbitrario, es mínima cuando se calcula respecto a la media.
Como consecuencia de esta propiedad, podemos decir que la media es valor respecto al cual la dispersión de una población es mínima; y la varianza corresponde a tal dispersión mínima.
En la geometría clásica hay una definición que sigue exactamente esta estructura. Cuando calculamos la distancia de un punto a una recta, se define trazando una perpendicular, pero ¿por qué? Esto ocurre porque para las distancias de un punto exterior a un punto de la recta, existe una distancia mínima pero no una máxima, y esta distancia mínima la obtenemos trazando la perpendicular. Luego, podríamos definir la distancia del punto a la recta como la mínima distancia entre el punto exterior y un punto de la recta.
Asimismo, al calcular las desviaciones al cuadrado de los individuos de una población, existe un mínimo, y como consecuencia de tal propiedad surge la verdadera definición de la media y por añadidura de la varianza.
Nota (14/11/2011): Hoy tuve la oportunidad de presentarle estas ideas a los profesores del Colegio Alemán de Santiago, y surgió una demostración de que el mínimo valor de la función dispersión, se obtiene con la media. En el siguiente enlace dejo la transcripción de este desarrollo y agradezco la colaboración del profesor Cesar Fernández: minimizando_la_dispersion.doc




Estimado Rafael:
Felicitaciones por tu artículo. Quisiera tu permiso para citar y utilizar tu applet en cursos introductorios (sin cálculo) de Estadística.
Cordiales saludos
Muchas gracias por sus comentarios, estimado. Por supuesto que puede utilizar este material, de hecho todo el sitio está publicado bajo una licencia de creative commons (ver al final de la página) y está pensado para ser de libre disposición.
Saludos cordiales
Rafael