La media Winsorizada es un método de promediar que inicialmente reemplaza los valores más pequeños y más grandes con las observaciones más cercanas a ellos. Esto se hace para limitar el efecto de valores extremos anormales, o valores atípicos, en el cálculo. Después de reemplazar los valores, la fórmula de la media aritmética se utiliza para calcular la media ganada.
La fórmula para la media Winsorizada es
dónde:
n =El número de datos más grandes y más pequeños
puntos a ser reemplazados por la observación
más cercano a ellos
N = Número total de puntos de datos’
Las medias Winsorizadas se expresan de dos formas. Una media de “kn” se refiere a la sustitución de las observaciones más pequeñas y más grandes ‘k’, donde ‘k’ es un número entero. Una media de “X%” ganada implica reemplazar un porcentaje dado de valores de ambos extremos de los datos.
Cómo calcular la media Winsorizada
La media ganadera se calcula reemplazando los puntos de datos más pequeños y más grandes, luego sumando todos los puntos de datos y dividiendo la suma por el número total de puntos de datos.
¿Qué te dice el significado de Winsorized?
La media winsorizada es menos sensible a los valores atípicos porque puede reemplazarlos con valores menos extremos. Es decir, es menos susceptible a los contornos que a la media. Sin embargo, si una distribución tiene colas gruesas, el efecto de eliminar los valores más alto y más bajo de la distribución tendrá poca influencia debido al alto número de variabilidad en las cifras de distribución.
CONSEJOS CLAVE
- Un método de promediado que incluye reemplazar los valores más pequeños y más grandes con las observaciones más cercanas a ellos.
- Menos sensible a los valores atípicos porque puede reemplazarlos con valores menos extremos.
- Es diferente a la media recortada, que implica eliminar puntos de datos, aunque el resultado de los dos tiende a ser cercano.
Ejemplo de cómo utilizar la media Winsorizada
Se puede calcular la media winorizada para el siguiente conjunto de datos: 1, 5, 7, 8, 9, 10, 14. En este ejemplo, asumimos que la media winorizada está en el primer orden, reemplazamos los valores más pequeños y más grandes con sus observaciones más cercanas.
El conjunto de datos ahora aparece de la siguiente manera: 5, 5, 7, 8, 9, 10, 10. Tomar un promedio aritmético del nuevo conjunto produce una media ganada de 7.7, o (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7.
O considere una media ganadera del 20% que toma el 10% superior y el 10% inferior y los reemplaza con su siguiente valor más cercano. Ordenaremos el siguiente conjunto de datos: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Los dos los puntos de datos más pequeños y más grandes, o el 10%, se reemplazarán con su siguiente valor más cercano. Por lo tanto, el nuevo conjunto de datos es: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. El winsorized la media es 33,9, o el total de datos (678) dividido por el número total de puntos de datos (20).
La diferencia entre la media Winsorizada y la media recortada
La media ganada incluye la modificación de puntos de datos, mientras que la media recortada implica la eliminación de puntos de datos. Es común que la media ganadera y la media recortada estén cerca.
Limitaciones del uso de Winsorized Mean
Una desventaja importante de los medios ganadores es que introducen sesgos en el conjunto de datos. Por supuesto, el conjunto de datos está idealmente menos sesgado después de la modificación que si se dejaran valores atípicos.
Más información sobre Winsorized Mean
Para obtener información relacionada, lea más sobre las diferencias entre los cálculos de medias clave.