lunes, 24 de abril de 2017

Tema 8 "Medidas de tendencia central, posición y dispersión"

¡Buenas noches a todos! Os traigo un nuevo tema, uno de los últimos ya de la asignatura. 

Existen dos grandes tipos de medidas estadísticas:

  • Medidas de posición o tendencia central (dan idea de la magnitud o tamaño de los datos)
  • Medidas de dispersión o variabilidad (dan información acerca de la heterogeneidad de nuestras observaciones)
Medidas de tendencia central
  1. Media: se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos los valores de la variable observada entre el total de observaciones, se calcula para variables cuantitativas (si los datos son agrupados, se usa como valor de referencia de cada intervalo su marca de clase)
  2. Mediana: es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor, si el número de observaciones es impar el valor de la observación será justamente la observación que ocupa la posición (n/2)+1, y si el número es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1 
  3. Moda: es el valor con mayor frecuencia, es decir el que más veces ve repite. La muestra puede ser bimodal (dos modas) o multimodal (más de dos), si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor. Puede calcularse para cualquier tipo de variable
Medidas de posición
  1. Cuantiles: se calculan para variables cuantitativas, y sólo tienen en cuenta la posición de los valores en la muestra. Los cuantiles más usuales son los percentiles, los deciles y los cuartiles
  2. Percentiles: dividen la muestra ordenada en 100 partes, para buscar la posición de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi) vea superior al valor del percentil. El valor del P50 corresponde al valor de la mediana
  3. Deciles: dividen la muestra ordenada en 0 parte. El valor del D5 corresponde al valor de la mediana y por tanto, al del P50
  4. Cuartiles: dividen la muestra ordenada en 4 partes. Tenemos cuatro cuartiles (Q1: primer cuartil, Q2: segundo cuartil, Q3: tercer cuartil y Q4: cuarto cuartil)
Medidas de dispersión

La información aportada por las medidas de tendencia central es limitada. Ejemplo:
  • serie 1: 18,19,20,21,22
  • mediana serie 1= 20 media serie 1=20
  • serie 2: 9,14,20,27,30
  • mediana serie 2=20 media serie 2=20
¿Qué es lo que diferencia a una serie de otra? La dispersión
  1. Rango o recorrido: diferencia entre el mayor y el menor valor de la muestra
  2. Desviación media: media aritmética de las distancias de las distancias de cada observación con respecto a la media de la muestra
  3. Desviación típica: cuantifica el error que cometemos si representamos una muestra únicamente por su media
  4. Varianza: expresa la misma información en valores cuadráticos
  5. Recorrido intercuartílico: diferencia entre el tercer y el primer cuartil [Q3-Q1]
  6. Coeficiente de variación: medida de dispersión relativa (adimensional), nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medida (c.v=s/x)
Distribuciones normales: también llamada distribución de Gauss o distribución gaussiana. Es una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. La gráfica de su función de densidad tiene forma acampanada. 



Asimetrías y curtosis

Coeficiente de asimetría de una variable: grado de asimetría de la distribución de sus datos en torno a su media. Es adimensional y los resultados pueden ver los siguientes:
  • g1=0 (distribución simétrica)
  • g2>0 (distribución asimétrica positiva)
  • g1<0 (distribución asimétrica negativa)


Coeficiente de apuntamiento o curtosis de una variable: sirve para medir el grado de concentración de los valores que toma en torno a su media. Los resultados pueden ser los siguientes:
  • g2=0 (distribución mesocúrtica o normal)
  • g2>0 (distribución leptocúrtica)
  • g2<0 (distribución platicúrtica)

Tipificación de los valores y su relación con la campana de Gauss

Trabajamos con una variable continua que sigue una distribución normal y que tiene más de 100 unidades. La tipificación nos permite conocer si otro valor corresponde o no a esa distribución de frecuencia. La media coincide con lo más alto de la campana:8 y la desviación típica es de 2 puntos (50% puntuaciones>8 y 50% puntuaciones<8), y aproximadamente el 68% puntúa entre 6 y 10.





Durante este tema hemos realizado problemas en clase para ir afianzando la teoría. Hasta la próxima.

"Lo único imposible es aquello que no intentas" 

No hay comentarios:

Publicar un comentario