Medidas de detención central
Son medidas estadísticas que pretenden resumir en un valor, un conjunto de valores. Las mas utilizadas son:
- Media aritmética o media (X): es la suma de todo los valores de la variable entre el total del número de variables. Es mas común en la estadística descriptiva. Su formula es:
- Mediana: ocupa la posición central de la distribución.
- Nuestros datos tienen que estar ordenados de mayor a menor o de menor a mayor.
- Si la media y la mediana son iguales, la distribución de la variable es simétrica.
- Es un concepto al que se le da menos uno
La mediana se calcula según si el numero de valores es par o impar.
Si es impar la fórmula sera (n+1)/2, siendo n el numero de valores
Ejemplo:
10, 4, 5, 7, 22, 77, 14 → 4, 5, 7, 10, 14, 22, 77
Aplicamos la formula → (7+1)/2= 4
4, 5, 7, 10, 14, 22, 77
La mediana seria 10
Si es par su calculo se realizara haciendo la media de los dos valores centrales. Primero ablicamos la fórmula (n+1)/2, y cuando encontremos los valores centrales haremos su media
Ejemplo:
15, 24, 33, 11, 17, 40, 32, 25 → 11, 15, 17, 24, 25, 32, 33, 40
Aplicamos la fórmula → (8+1)/2= 4,5
11, 15, 17, 24, 25, 32, 33, 40
Los dos valores centrales son 24 y 25.
Hacemos su media → 24+25/2= 24, 5
La mediana es 24,5
- Moda: es el menos usado. Valor que con mayor frecuencia se repite.
- Unimodales: distribución con una sola moda
- Bimodales: dos modas en una distribución.
- Multimodales: mas de dos modas en una distribución
Medidas de posición:
Divide un conjunto ordenado de datos en grupos de la misma cantidad.
- Cuantiles: es para variables cuantitativas. Es un valor de la variable, que por debajo de el se encuentra una frecuencia acumulada. Los cuantiles mas usados son los percentiles, los deciles y los cuartiles (según la muestra se divida en 110, 10 o 4).
- Percentiles: la muestra se divide en 100 partes. Son 99 valores que dividen la serie de datos en 100 partes iguales. Se representan por P(n)
- El percentil 'i': cuando las observaciones están ordenadas de forma crecienten el 1% es menor que el y el (100-1%) restante es mayor
- El P50 es la mediana.
- Deciles: la muestra se divide en 10 partes. Son 9 valores que dividen la serie de datos en 10 partes iguales. Se presenta con la letra D
- Cada parte representa el 10% de los valores de la distribución.
- El decil 'i': cuando las observaciones están ordenadas de forma creciente, el i/10% es menor que el y el (100-i)/10% restante son mayores.
- D5 corresponde a la mediana y a P50
- Cuartiles: la muestra se divide en 4 partes. Son 3 valores que dividen la serie de datos en 4 partes iguales. Se representa por Q1, Q2, Q3.
- Cada parte corresponde al 25% de los valores de la distribución.
- El Q1 indica una posición que forma el 25% de las observaciones es menor y que el 75% restante es mayor
- El Q2 indica una posición que forma el 50% de las observaciones es menor y que el 50% restante mayor.
- El Q3 indica una posición que forma el 75%de las observaciones es menor y que el 25% restante es mayor.
- El Q4 indica el valor mayor de a serie numérica
- El Q2 corresponde con D5, P50 y la mediana.
Medidas de dispersión
Dan información de la heterogeneidad de nuestras observaciones.
- Rango (R): la medida mas simple. Consiste en tomar el valor mas alto y el mas bajo que se haya recogido, y restarlos. Es una medida muy sensible, al igual que la media.
- Desviación media (DM): media aritmética de las distancias de cada observación con respecto a la media de la muestra.
- Varianza (S2): es una medida de dispersión. Se calcula haciendo la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.
- Desviación típica o estandar: se define como la raíz cuadrada de la varianza de la variable. Sirve para conocer la desviación que presentan los datos en su distribución respecto a la media.
- Siempre va a ser un valor positivo o cero.
- Si todas las variables se multiplican por un número, la desviación típica queda multiplicada por el mismo número.
- Coeficiente de variación (CV): Se calcula dividendo la desviación típica entre la media de la variable. Se expresa en porcentajes. Nos permite comparar la dispersión o variabilidad de dos o mas grupos.
Y este es el resumen del tema 5. Gracias por leerme!!!!
Mi película recomendada es:
Película: Memorias de una Geisha
BSO


No hay comentarios:
Publicar un comentario