jueves, 4 de junio de 2020

Tema 9: Introducción a la inferencia estadística

Inferencia estadística
Es el conjunto de procedimiento estadísticos por el cual permite pasa de lo particular  (la muestra), a lo general (la población) .

  • La población: puede ser finita o infinita.
  • La muestra puede ser:
    • Muestra independiente: datos dependientes de una única observación
    • Muestra dependiente o apareada: compara el mismo grupo de personas en dos tiempos distintos.
Hay dos formas de inferencia estadística:
  • Estimación del valor de la población (parámetro) a partir del valor de la muestra (Estimador)
    • Estadístico-estimador: indice que representa una información de la muestra estudiada.
Propiedades de los estimadores:
Insesgadez: cuando la esperanza matemática es igual que el parámetro que se desea estimar.
Eficiente: cuando tiene la capacidad de estimar de forma precisa cuando su varianza es reducida.
Consistencia: cuando la medida de la muestra crece, se aproxima al valor real del parámetro.
    • Parámetro: cada uno de los estadísticos tras la inferencia.
  • Contraste de hipótesis: a partir de los valores de la muestra, se concluye si hay diferencia entre ellos en la población.
Dos formas de estadística inferencial.
  • Pruebas paramétricas: solo aplicables a variables numéricas y de gran población, para que el calculo se mas exacto. Se basa en las leyes de distribución normal.
    • T-STUDENT: es una prueba estadística en la que su valor es t. Se usa para ver si hay una diferencia significativa entre las medias de dos grupos, es decir, para comparar dos medias de poblaciones independientes y normales.
    • ANOVA o análisis de varianza: es un método que se usa para  comparar dos o mas medias.
    • FISHER: es un test que se usa para ver si existe asociación entre dos variables cualitativas, es decir, si las proporciones de una variable son diferentes dependiendo del valor que tome la otra variable
    • PERSON: el coeficiente de variación de PERSON se usa para estudiar la relación entre dos variables aleatorias cuantitativas.
  • Pruebas no paramétricas: se encargan de organizar datos que no tienen una distribución particular y se basan en una hipótesis.
    • U-MAN WHITNEY: es una prueba que se aplica a dos muestras independiente. Es la prueba T-STUDENT pero versión no paramétrica.
    • K-W: la prueba de Kruskal-Wallis sirve para probar si un grupo de datos provienen de la misma población. Es idéntico a el ANOVA.
    • Tablas de contingencia: sirven para registrar y analizar la relaciona entre dos variables.
Estimaciones
Proceso que utiliza la información de una muestra para extraer conclusiones acerca de toda la población. La información se utiliza para estimular un valor. Se puede realizar por:
  • Estimación puntual: utiliza el valor del estadístico calculado en la muestra como valor del parámetro que se desea estimar.
  • Estimación por intervalos: consiste en calcular dos valores entre los cuales se encuentra el parámetro poblacional que queremos estimar con una probabilidad determinada.
Error estándar (EEM)

Mide la dispersión hipotética que tendría la media de infinitas muestras de una población determinada. Es un error de muestreo.
Cuanto mas pequeño es el error, mas nos podemos fiar del valor de una muestra concreta.

¿como se calcula?
Depende de el estimador y depende de si estamos hablando de medias o de proporciones.
Error estándar de la media: depende la desviación típica de la población y del tamaño muestral.
Siendo S la desviacion tipica y n el tamaño muestral
Error estándar para una proporción:  se aplica cuando las variables son cualitativas o atributos
siendo P es el porcentaje a estimar y n es el tamaño muestral.

Teorema central de un límite (TCL)
Es una teoría que establece que dada la muestra suficientemente grande, la distribución de las medias muestrales seguirá una distribución normal. 
Sus propiedade son:
  • El TCL encuentra una muestra grande cuando es mayor de 30. Es decir, que si la muestra es superiora 30, la distribución de las medias sera normal.
  • La media poblacional y la media muestral serán iguales.
  • la varianza de la distribución de las medias muestrales  sera  ẟ2/n. Que es la varianza de la población entre el tamaño de la muestra


Y hasta aquí el resumen del tema 9. Gracias por leerme!!!!!
Película recomendada↡↡↡


Película: tomates verdes fritos
BSO



No hay comentarios:

Publicar un comentario

Tema 15, 16 y 17: Visión general ETIC

Tema 15: concepto de la red de información sanitaria Cada vez hay más información sobre salud, pero con ella también se multiplican  l...