domingo, 17 de mayo de 2020

Tema 5: Estadísticos univariables: medidas resumen para variables cuantitativas



Medidas de detención central
Son medidas estadísticas que pretenden  resumir en un valor, un conjunto de valores. Las mas utilizadas son:

  • Media aritmética o media (X): es la suma de todo los valores de la variable entre el total del número de variables. Es mas común en la estadística descriptiva. Su formula es: 
  • Mediana: ocupa la posición central de la distribución. 
    • Nuestros datos tienen que estar ordenados de mayor a menor o de menor a mayor.
    • Si la media y la mediana son iguales, la distribución de la variable es simétrica.
    • Es un concepto al que se le da menos uno
La mediana se calcula según si el numero de valores es par o impar.
Si es impar la fórmula sera (n+1)/2, siendo n el numero de valores

Ejemplo:
10, 4, 5, 7, 22, 77, 14  →  4, 5, 7, 10, 14, 22, 77

Aplicamos la formula → (7+1)/2= 4

4, 5, 7, 10, 14, 22, 77
La mediana seria 10 

Si es par su calculo se realizara haciendo la media de los dos valores centrales. Primero ablicamos la fórmula (n+1)/2, y cuando encontremos los valores centrales haremos su media

Ejemplo:
15, 24, 33, 11, 17, 40, 32, 25  →  11, 15, 17, 24, 25, 32, 33, 40
Aplicamos la fórmula → (8+1)/2= 4,5
 11, 15, 17, 24, 25, 32, 33, 40
Los dos valores centrales son 24 y 25.
Hacemos su media → 24+25/2= 24, 5 
La mediana es 24,5

  • Moda: es el menos usado. Valor que con mayor frecuencia se repite. 
    • Unimodales: distribución con una sola moda
    • Bimodales: dos modas en una distribución.
    • Multimodales: mas de dos modas en una distribución

Medidas de posición:
Divide un conjunto ordenado de datos en grupos de la misma cantidad.
  • Cuantiles: es para variables cuantitativas. Es un valor de la variable, que por debajo de el se encuentra una frecuencia acumulada. Los cuantiles mas usados son los percentiles, los deciles y los cuartiles (según la muestra se divida en 110, 10 o 4).
    • Percentiles: la muestra se divide en 100 partes. Son 99 valores que dividen la serie de datos en 100 partes iguales. Se representan por P(n)
      • El percentil 'i': cuando las observaciones están ordenadas de forma crecienten el 1% es menor que el y el (100-1%) restante es mayor
      • El P50 es la mediana.
    • Deciles: la muestra se divide en 10 partes. Son 9 valores que dividen la serie de datos en 10 partes iguales. Se presenta con la letra D 
      • Cada parte representa el 10% de los valores de la distribución.
      • El decil 'i': cuando las observaciones están ordenadas  de forma creciente, el i/10% es menor que el y el (100-i)/10% restante son mayores.
      • D5 corresponde a la mediana y a P50
    • Cuartiles: la muestra se divide en 4 partes. Son 3 valores que dividen la serie de datos en 4 partes iguales. Se representa por Q1, Q2, Q3.
      • Cada parte corresponde al 25% de los valores de la distribución.
      • El Q1 indica una posición que forma el 25% de las observaciones es menor y que el 75% restante es mayor
      • El Q2 indica una posición que forma el 50% de las observaciones es menor y que el 50% restante mayor.
      • El Q3 indica una posición que forma el 75%de las observaciones es menor y que el 25% restante es mayor.
      • El Q4 indica el valor mayor de a serie numérica
      • El Q2 corresponde con D5, P50 y la mediana.
Medidas de dispersión
Dan información de la heterogeneidad de nuestras observaciones.


  • Rango (R): la medida mas simple. Consiste en tomar el valor mas alto y el mas bajo que se haya recogido, y restarlos. Es una medida muy sensible, al igual que la media.
  • Desviación media (DM): media aritmética de las distancias de cada observación con respecto a la media de la muestra.
  • Varianza (S2): es una medida de dispersión. Se calcula haciendo la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.
  • Desviación típica o estandar: se define como la raíz cuadrada de la varianza de la variable. Sirve para conocer la desviación que presentan los datos en su distribución respecto a la media.
    • Siempre va a ser un valor positivo o cero.
    • Si todas las variables se multiplican por un número, la desviación típica queda multiplicada por el mismo número. 
  • Coeficiente de variación (CV): Se calcula dividendo la desviación típica entre la media de la variable. Se expresa en porcentajes. Nos permite comparar la dispersión o variabilidad de dos o mas grupos.

Y este es el resumen del tema 5. Gracias por leerme!!!!
 Mi película recomendada es:

Película: Memorias de una Geisha
BSO



No hay comentarios:

Publicar un comentario

Tema 15, 16 y 17: Visión general ETIC

Tema 15: concepto de la red de información sanitaria Cada vez hay más información sobre salud, pero con ella también se multiplican  l...