Varianza estadística
La varianza estadística es el resultado obtenido de la dispersión de valores aunados a la media de distribución o el promedio de la misma, lo que también se conoce como media aritmética.
Definiciones de la varianza estadística
La varianza estadística no es más que la medida de la desviación de una variable que es al azar o de un conjunto de valores que se obtienen de forma aleatoria. La unidad de medida de la variable estadística representa el valor de la unidad de medida de la variable pero elevada al cuadrado.
Otra definición de la varianza estadística viene dada por la probabilidad de que el resultado obtenido a través de un procedimiento sea distinto al resultado esperado. Casi siempre cuando se espera un resultado alto, el riesgo de obtenerlo es más elevado. Asimismo, se debe tener en cuenta que en la varianza estadística el valor mínimo es 0 y los números negativos no existen para este caso.
La desviación estándar también atribuye su nombre a la varianza estadística, ya que ambas son medidas de las observaciones realizadas o de la dispersión de los datos tomados. Por lo general la dispersión se utiliza para saber si todos los valores obtenidos en la toma de los datos varían.
Sí los datos tomados son iguales se dice que no hay dispersión. En cambio, cuando estos datos varían y son diferentes, hay presencia de dispersión estándar. Cabe destacar que la dispersión puede ser grande o pequeña, según la cercanía de los datos con la media.
Asimismo, existen dos tipos de varianza:
- La covarianza: estudia la dispersión o desviación de una o más variables.
- La varianza muestral: estudia los valores de una población mediante una muestra.
Para conocer la varianza estadística, podemos obtenerla con el conjunto de valores producto de la sumatoria de la dispersión o desviación elevadas al cuadrado, relacionadas con la media, dividido con el número de observaciones, conocido como n.
La varianza estadística se identifica con la expresión “S2” y la forma de calcularla sería igual a:
Donde:
- N: sumatoria de los valores observados.
Finalmente es importante mencionar que la varianza estadística y la variación estándar, son valores susceptibles a aquellos valores que estén muy alejados del promedio o la media. Estos valores se conocen, como valores atípicos.
Sin embargo, cuando hay presencia de estos valores, se pueden utilizar otras técnicas de dispersión o ignorar dichos valores, con la finalidad de que las mediciones no se vean tan afectadas y el porcentaje de error sea menor.
Usos y aplicaciones de la varianza estadística
La varianza estadística tiene muchos campos de aplicación, algunos de ellos son:
- Se aplica en las tomas de decisiones, específicamente utilizando un análisis de varianza. Esto es muy común a la hora de presentar varias opciones y tener dudas al escoger la mejor.
- Usualmente se utiliza para determinar la varianza de una población, ya que generalmente es desconocida y está dada por la expresión “2”.
- Gracias a la varianza estadística, se pueden realizar comparaciones a los grupos de datos observados u obtenidos.
- Se utiliza también para determinar qué probabilidad existe entre el éxito o fracaso de una inversión. Si en el resultado, la varianza del rendimiento es alta, la inversión no tendrá éxito.
- En las ciencias complejas como matemáticas, físicas y químicas, se utilizan para estudiar las variables en función al tiempo.
- Otra aplicación sería en los laboratorios, para estudiar los resultados obtenidos con los estimados.
Características de la varianza estadística
La varianza estadística presenta algunas características o propiedades, que permiten identificarla, las más comunes vienen dada por lo siguiente:
- Su valor nunca es negativo. Siempre es un número positivo o cero.
- La varianza no varía, cuando a cada uno de sus valores se les suma un número.
- Cuando los valores de las varianza se multiplican por otro valor, la varianza sería la multiplicación de su valor original por el cuadrado de dicho valor.
- Se puede calcular la varianza total, cuando se tienen presentes los valores de diferentes distribuciones que tengan la misma media.
- No permite calcular distribuciones en un límite abierto de clase.
- Generalmente cuenta con dos valores en su cálculo.
- Puede ser complicada al comienzo, ya que sus unidades están elevadas al cuadrado.
- La varianza no se puede hallar, cuando no hay valor de la media.
- El valor de la varianza es sensible a puntuaciones externas, alejadas de la media.
- Las medidas de dispersión pueden ser absolutas o relativas.
Ejemplos de la varianza estadística
Antes de calcular la varianza, es importante calcular un promedio de los datos a estudiar o la media.
También se puede calcular la varianza si se cuenta con la desviación estándar, para ello se elevaría el resultado de la misma al cuadrado y de esta forma se obtendría la varianza estadística.
Sin más preámbulos, explicaremos un ejemplo sencillo el cual nos permitirá familiarizarnos con la varianza y poder resolver problemas donde esté implícita:
Vamos a suponer que tenemos la cantidad anual de los pacientes que visitan diferentes clínicas, pero cada clínica es de un mismo dueño, entonces:
- Clínica 1: 25000 pacientes.
- Clínica 2: 30000 pacientes.
- Clínica 3: 12000 pacientes.
- Clínica 4: 8000 pacientes.
Ahora, calculamos la media de los pacientes anuales, para ello sumaremos la cantidad de pacientes de cada una de las clínicas y la dividiremos entre el número de clínicas, esto da como resultado un valor de 18750 pacientes.
Luego, vamos a calcular la varianza con la siguiente ecuación:
Finalmente si sacamos la raíz cuadrada de este número obtenemos la desviación estándar, cuya fórmula es:
Y el resultado de la desviación estándar sería: 21977.26098.
Errores comunes al utilizar la varianza estadística
Existen ciertos errores cuando se mide la varianza estadísticas, algunos de ellos se atribuyen a:
- Tomar y no ignorar los valores atípicos, ya que esto arroja un porcentaje de error alto.
- No contar con la media estadística.
- Tomar muestras erróneas de la varianza, esto pasa generalmente cuando no se aplican las técnicas adecuadas para la recolección de datos.
- No diferenciar la tipología de las variables a medir.
- No interpretar correctamente los valores de la varianza.