martes, 12 de mayo de 2020

Tema 4: Introducción a la estadística descriptiva


La estadística descriptiva sirve para explicar y resumir datos, es el tipo de estadística que vemos en los medios de comunicación.
Este tipo de estadística describe analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que presentan la información

  • Organiza de manera clara
  • Resume de datos 
  • Explora las relaciones entre variable

La estadística inferencial utiliza muestras de datos para sacar conclusiones de poblaciones más grandes, este método se encuentra en publicaciones de estudios científicos.
Induce leyes de comportamiento en una población.
Efectua:

  • Estimaciones
  • Decisiones
  • Predicciones 
  • Generalizaciones sobre un conjunto mayor de datos

Variables (presentación de datos):
Los datos se muestran en filas (las categorías) y en columnas (frecuencia). Presentan la información de manera visible y comprensible.
Sus requisitos son:
→ Son autoexplicativas
→ Son sencillas y de fácil comprensión
→ Indican frecuencias absolutas y relativas.

Representación de la tabla según el tipo de variable:

Variable cualitativa dicotómica: Solo se puede elegir entre dos variables

Sexo
Frecuencia absoluta (fi)
Frecuencia relativa (fh)
A.       Masculino
110
18,24%
B.       Femenino
493
81,76%
Total
603
100,00%

Variable cualitativa policotómica: se puede elegir entre varia variables

Profesión
Frecuencia absoluta (fi)
Frecuencia relativa (hi)
Médicos
658
0.28
Enfermeros
932
039
Técnicos
123
0.052
Auxiliares
598
0.25
Otras
32
0.013
Total
2343
1

Variable cualitativa ordinal: se escoge entre una jerarquía de categorías


ULT. 30 DÍAS,
CUANDO COMES
VERDURAS
Frecuencia absoluta (fi)
Frecuencia relativa (hi)
Frecuencia relativa
acumulada (Sigma)
No comí verduras
9
1,48%
1,48%
Menos de una vez al día
97
15,98%
17,46%
1 vez al día
215
35,42%
52,88%
2 veces al día
196
8,40%
85,17%
3 veces al día
51
2,97%
93,57%
4 o más veces al día
39
3,46%
96,54%
Total
607
100%
100%













Variable cuantitativa discreta: se escoge entre números enteros.


CUANTOS DÍAS
COMISTE EN UN
RESTAURANTE DE
COMIDA RÁPIDA
Frecuencia absoluta (fi)
Frecuencia relativa (hi)
Frecuencia relativa
acumulada (Sigma)
0 DÍAS
310
51,07%
51,07%
1 DÍA
203
33,44%
84,51%
2 DÍAS
58
9,56%
94,07%
3 DÍAS
25
4,12%
98,19%
4 DÍAS
5
0,82%
99,51%
5 DÍAS
3
0,49%
100%
Total
607
100%
100%












Variables cuantitativas continuas: se incluyen valores decimales

Datos desagrupados:
3,9
4,7
3,7
5,6
4,3
5,3
3,9
4,3
5,0
6,0
3,3
4,3
4,1
5,8
4,4
4,0
5,4
3,9
4,5
3,3
n=20
Estos datos están recogidos por orden de llegada, lo primero que debemos hacer para construir la tabla de frecuencia es ordenarlos de mayor a menor peso. Una vez ordenados se crean los intervalos:
  • Primero defino los intervalos.
  • Defino de extremos de los intervalos.
  • Definición de amplitud o distancia entre los extremos.
  • Cálculo de la marca de clase (dato de cada uno de los intervalos) de cada intervalo.
La manera de hacerlo sería la siguiente: 
Primero, calculamos el recorrido o rango Re= xn-x1 =6- 3,3= 2,7
(esto quiere decir que hay una diferencia de 2,7 kg entre el niño que pesa más y el que pesa menos).
El número de intervalos se obtiene calculando la raíz cuadrada del número de datos observado (n=20). Veremos que la raíz cuadrada de 20 es igual a 4,4 por lo tanto tomaremos 4
intervalos.
Como el recorrido es 2,7 si lo dividimos por el número de intervalos tendremos la amplitud de cada uno de ellos y así: 2,7/4= 0,675. Así calculamos la amplitud de cada intervalo.

Tipos de frecuencia:

  • Frecuencia absoluta (fi): número de individuos que presentan una característica.
  • Frecuencia relativa (hi):  porcentaje de individuos que presentan una característica referidos al total.
  • Frecuencia acumulada ( Σfi ó Σhi): número de individuos menores o iguales de una característica. 


Indicadores:
Se define indicador como la medida de la frecuencia de un determinado suceso en una población.
Es la señal que permite que permite identificar las características de las variables
El indicador siempre esta formado por el resultado del cociente de dos magnitudes.
Existen muchos indicadores elaborados en:

  • Instituto Nacional de Estadística (INE)
  • Instituto de Estadística de Andalucía (IEA)
  • Centro de Investigaciones Sociológicas (CIS)

Proporciones:
Es una medida resumen de variables cualitativas, y se calcula dividiendo el subconjunto entre el conjunto al que pertenece.
Ejemplo:
                             nº de mujeres
Proporción de =-------------------------
mujeres.              nº de individuos

Sus características son:
  • El numerador siempre esta incluido en el denominador.
  • Su valor esta entre 0 y 1 
  • Se suele multiplicar por 100 para expresarlo en porcentajes
Tasas:
Medida que expresa el riesgo de ocurrencia del evento estudiado. Consiste en una comparación (división) entre el número de acontecimientos sucedidos en un periodo de tiempo y la población en la que pueda ocurrir dicho acontecimiento.
Normalmente el resultado de esta división es menor que 1, por lo que se suele multiplicar por múltiplos de 10 (100, 1000, 10000)

MEDIDAS MAS EMPLEADAS EN LA ESTADÍSTICA SANITARIA

Concepto de prevalencia:
Es el proporción de la población que tiene una enfermedad concreta. Se calcula dividiendo en nº de individuos con una enfermedad concreta entre el total de la población en un periodo de tiempo.
Este concepto es adimensional y su valor es entre 0 y 1 (es una proporción)

Ejemplo de como se calcula la prevalencia:

Consumo de tabaco en hombres y mujeres (>16 años), según sexo y edad. España.
Encuesta Nacional de Salud, 2016.

Mujeres fumadoras (45-64 años): 507/2860=0,17727 *100= 17,7%
Hombres fumadores (45-64 años): 1166/2714=0,42962*100=42,9%

Concepto de incidencia:
Número de nuevos casos de la enfermedad que ocurren en un periodo especifico de tiempo. Es una medida de riesgo.

Incidencia acumulada (proporción de incidencia) 
Es una estimación de la probabilidad de que un individuo libre de una enfermedad la desarrolle en un periodo de tiempo especifico.
Mide el riesgo promedio de padecer una enfermedad.
Se calcula dividiendo los nuevos casos en un periodo de tiempo determinado entre una población a riesgo.
  • No tiene unidades, es una proporción.
  • Su valor esta entre 0 y 1
  • No lleva implicito el periodo de tiempo 
Su formula es:

        Nuevos casos en un tiempo determinado
IA=--------------------------------------------------
                  Población a riesgo de T0

Tasa de incidencia(densidad de incidencia) 
Velocidad de aparición de nuevos casos con respecto al tamaño de la población.

  • Se necesita especificar el tiempo al que se refiere la tasa (personas-año, personas-semana)
  • Se puede hacer un seguimiento de una misma cantidad de personas-tiempo.
  • Se mide en unidad de tiempo.
La formula de la tasa de incidencia basada en datos individuales es :


                                                  Casos nuevos (t0,t)
Densidad de incidencia=------------------------------------------------
                                           Personas tiempo a riesgo (t0,t)

Personas- tiempo:

  • Es la suma de los tiempos que los individuos están a riesgo de desarrollar una enfermedad. 
  • Las unidades dependen del investigador. Los eventos poco frecuentes suelen describirse en personas-año o un múltiplo del mismo (100 o 1000 personas-año). En cambio en los eventos más frecuentes (ej: la gripe) se pueden utilizar personas-semana o personas-día


Y aquí esta el resumen del tema 4. Gracias por leerme!!!!!!




Película: The Greatest Showman 
Canción: Rewrite the stars


No hay comentarios:

Publicar un comentario

Tema 15, 16 y 17: Visión general ETIC

Tema 15: concepto de la red de información sanitaria Cada vez hay más información sobre salud, pero con ella también se multiplican  l...