Post on 07-Dec-2015
description
UNIVERSIDAD NACIONAL DE HUANCAVELICA
FACULTAD DE ENFERMERIA
ESTADISTICA INFERENCIAL
• PRESENTADO POR: ARAUJO MONTES; LAURA LORENA.
ESTADISTICA
VARIABLES Y SU CLASIFICACION
POBLACION, MUESTRA Y MUESTREO
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSION
CLASIFICACION DE LOS DATOS, TABULACION Y REPRESENTACION
GRAFICA
GENERALIDADES
INTRODUCCION
ESTADISTICAS PARAMETRICAS
ESTADISTICAS NO PARAMETRICAS
ESTIMACION DE PARAMETROS
INTERVALO DE CONFIANZA
PRUEBAS DE HIPOTESIS ALTERNATIVA
DESCRIPTIVA
INFERENCIAL
ANALISIS DE REGRESION MULTIPLE
ANALISIS DE DATOS CATEGORICOS
ESTADISTICA
INFERENCIALLa inferencia estadística es una
técnica mediante la cual se obtienen
generalizaciones o se toman decisiones en
base a una información parcial o completa obtenida mediante
técnicas descriptivas. (1)
Permite responder interrogantes que pueden
surgir cuando no se dispone de la información sobre todo los individuos
de la población de interés, sino solo de una parte de ella, decir que los datos
provienen de una muestra de individuos de la
población bajo estudio. (2)
Las poblaciones pueden ser: VentasPersonal de una empresaConsumidores de un producto etc..
Rama de la estadística que estudia el
comportamiento y propiedades de las
muestras, y la posibilidad y limites de la
generalización de los resultados obtenidos a partir de aquellas a las
poblaciones que representan.(3)
Se usa esencialmente para determinar la probabilidad de que una conclusión sacada a partir de los datos de una muestra sea cierta en la población muestreada
ESTADISTICA
INFERENCIAL
CONCEPTOS BASICOS
POBLACION: La totalidad de elementos sobre los
cuales recae la investigación. A cada elemento se le llama unidad
estadística. Si representamos con “x” una
variable aleatoria, al estudiar a esta variable, en la población como resultado tendremos los valores:
MUESTRA:SIERRA BRAVO(1991):Es toda parte representativa DE LA POBLACION, cuyas características debe reproducir en pequeño lo mas exactamente posible.
MUESTRA ALEATOREA:Considere la población dada por la variable aleatoria X con función de distribución Una muestra aleatoria de tamaño esta formada por de estas variables ( ,…….,)
PARAMETRO:Característica que describe a una población.
ESTADISTICO:Característica que describe a una muestra.
VARIABLE ALEATORIA:
No se conoce su valor hasta que se realiza el experimento
Antes de realizar el experimento se conocen sus valores y la probabilidad de que los tome = función de probabilidad
POBLACION MUESTRA
Definición Totalidad de elementos sobre los cuales recae la investigación.
Parte o porción de la población seleccionada para su estudio.
Características “Parámetros” “Estadísticos”
Símbolos =Tamaño de la población. = Tamaño de la muestra.
µ = Media de la población. = Media de la muestra
σ = Desviación estándar de la población.
= Desviación estándar de la muestra
ESTIMACION DE PARAMETROS
TIPOS DE ESTIMACION:
1. ESTIMACION PUNTUAL:
Estadistico calculado a partir de la informacion obtenida de la muestra y que se usa para estimar el parametro poblacional. = Para un parametro cualquiera.
2. ESTIMACION POR INTERVALO:INTERVALO
DE CONFIANZA (IC):
Conjunto de valores obtenidos a partir de los datos muestrales en el que hay una determinada probabilidad que se encuentre el parámetro a esta probabilidad se le conoce con el nivel de significancia
ESTIMACION DE LOS PRINCIPALES
PARAMETROS
ESTIMACION DE MAXIMA
VEROSIMITUD
A) ESTIMACION CON UNA
POBLACION
IC Para un promedio
IC Para una proporción
B) ESTIMACION CON DOS
POBLACIONES
IC Para una diferencia entre dos promedios
IC Para una varianza
IC Para una diferencia entre dos proporciones
IC Para la razon entre dos varianzas
1. ESTIMACION DE LOS PRINCIPALES PARAMETROS
En este tipo de estimaciones no se puede medir el error de estimación sin embargo entre mayor sea el tamaño de la muestra se espera que mejor sea la estimación.
EJEMPLO:Las duraciones de 8 baterías cargadas de computadora de marca Dutec son 151,153,175,134,170,172,156 y 114 minutos. Entonces una estimación puntual de la duración promedio de una batería dutec es:
= 153,125 Supongamos que la empresa Dutec asegura que la duración
promedio de sus baterías es de 200.De acuerdo ala estimación obtenida se puede sospechar que la afirmación de Dutec es poco probable.
Tamaño de muestra: = 8Estimacion: = 153,125
2. ESTIMACION DE MAXIMA VEROSIMITUD
Tiene como requisito que se conosca la distribucion de la pobacion en terminos del parametro desconocido. (4).
= (ϴ)
INTERVALO DE CONFIANZA
Son intervalos aleatorios obtenidos a partir de los datos y en los cuales hay un grado de confianza prefijado ( medido en % ) de que dicho intervalo contenga al verdadero valor del parámetro que se quiere estimar. Al nivel de confianza se le denota como:
100 (1-) % DONDE: = Probabilidad de cometer un error1- = la proporcion de veces que los distintos intervalos de confianza contienen al parametro.Usualmente el valor 100 (1-) % se lo fija en el 95% loq ue llevaria a establecer que en promedio solo en el 5% de los casos se cometeria error al suponer que el intervalo contiene al verdarero valos del parametro
ESTIMACION CON UNA POBLACION
INTERVALO DE CONFIANZA PARA UN PROMEDIO
IC Para un promedio si el promedio muestral es normal y se conoce la varianza poblacional.Se considera la poblacion dada por la variable que con media poblacional y varianza poblacional . si sigue una distribucion normal para muestras de tamaño .
INTERVALO DE CONFIANZA PARA UNA PROPORCION:
Sea la proporcion de determinados exitos de
una poblacion. =
DONDE: B es la variable que indica el numero de
exitos en la muestra.
INTERVALO DE CONFIANZA PARA UNA VARIANZA:
Se considera la poblacion dada por una variable
aleatoria que sigue una distribucion normal con varianza poblacional .
=
INTERVALO DE CONFIANZA PARA MUESTRAS MAYORES A 30 ELEMENTOS
n
szX
INTERVALO DE CONFIANZA PARA MUESTRAS MENORES A 30 ELEMENTOS
n
stX
DESVIACIÓN ESTÁNDAR
N
X
2)(
1
)( 22
nn
XX
s
PRUEBAS DE HIPOTESIS
HIPOTESIS:Es una afirmación sobre
una población que puede someterse a pruebas al
extraer una muestra aleatoria.
PASOS PARA PROBAR UNA HIPOTESIS:1. Prueba de hipótesis2. Seleccionar el nivel de
significancia.3. Calcular el valor
estadístico de prueba.4. Formular la regla de
decisión.5. Decidir.
PRUEBA DE HIPOTESIS:Formular una teoría y
luego contrastarla
TIPOS DE HIPOTESIS
HIPOTESIS NULA:(“ACUSADO ES
INOCENTE”)
Es una aseveracion en el sentido de que un
parametro tenga un valor especifico y se
denota
: =
HIPOTESIS ALTERNATIVA:(“ACUSADO ES CULPABLE”)
Es una aseveracion que se acepta si se rechaza se denota por y tiene la
forma:
: , O :
:0:0
00 :
H
HPASO 1 :PLANTEAR H0 Y H1 Hipótesis nula:
Afirmación acerca del valor de un parámetro poblacional.
Hipótesis Alternativa: Afirmación que se aceptará si los datos muéstrales aseguran que es falsa H 0
Paso 2:SELECCIONAR EL NIVEL DE SIGNIFICANCIA Generalmente son
del 5% o 1% (error de tipo I y error de tipo II)
Error de tipo I. Rechazar la hipótesis nula, H0 cuando es verdadera
Error de tipo II aceptar la hipótesis nula, H0 cuando es Falsa
01
01
:
:
H
H
PASOS PARA PROBAR UNA
HIPOTESIS
Paso 3: CALCULAR EL VALOR ESTADÍSTICO DE PRUEBA.Estadísticos de pruebas como: Z, t de Student , F y Chi cuadrado
PASO 4:FORMULAR LA REGLA DE DECISION:Son las condiciones según las que se acepta o rechaza la hipótesis nula.
n
Xz
n
PZ
)1(
n
Xt
PARA MUESTRAS GRANDES
PARA MUESTRAS PEQUEÑAS
PARA PROPORCIONES
PASO 5:TOMAR UNA DECISIÓN:El valor observado de la estadística muestral se compara con el valor de estadística de prueba.
REGIONES DE ACEPTACION Y RECHAZO:
La aceptacion de se da si al tomar una muestra no se encuentra evidencia significativa en su conra.Es de cir la acpetacion de no esta directamente ligada a la posibilidad de que se cumpla , mas bein su aceptacion se da cuando no existan datos en su contra.Por lo tanto el concepto de aceptacion en prueba de hipotesis es distinto al de la vida cotidiana.
EJEMPLO:Juan afirma que kati tiene puesta una camisa de color rosada. Se tiene que:
la camisa que tiene puesta kati es rosada: la camisa que tiene puesta kati no es rosadaSe entrevistan a 4 personas que vieron a kati. Carlos indica que la camisa no es de color
verde. Rebeca dice que no es roja. Alberto que no recuerda el color Sara indica que no es amarilla.Por lo tanto, dado que la informacion obtenida no brinda evidencia en contra de , se acepta que la camisa es rosada, esto pese a que directamente no se obtuvo informacion de que fuera de dicho color.Asi,
Se acepta Y lo correcto es concluir que no de hallan evidencias en contra de que sea rosada
REGION DE ACEPTACION:Valores de , estimaciones de
que aceptan
VALOR CRITICO:Separa una region de
rechazo y una de aceptacion se denota
REGION DE RECHAZO:Valores de ,
estimaciones de , que rechazan
ERRORES EN UNA PRUEBA DE HIPOTESIS
ERROR TIPO I: “CONDERNAR A UN INOCENTE”
La hipotesis nula se rechaza siendo nula.
La probabilidad del error tipo i se denota por y es la probabilidad de rechazar (“se decalara culpable al acusado”) sabiendo que es verdadera
= P ()
ERRORES TIPO II: “DEJAR LIBRE AL CULPABLE”
La hipotesis nula se acepta (“acusado es inocente”) siendo falsa.
La probabilidad del error tipo ii se denota por y es la probabilidad de aceptar (se declara inocente al acusado) ,sabiendo que es verdadera.
= P ()
CONTRASTE DE HIPOTESIS
A. ENFOQUE CLASICO O DETERMINACION DE REGIONES:
Este enfoque consiste en habllar el o los valorescriticos a partir del nivel de significacion dado.El enfoque sigue los siguientes pasos1. Redactar y 2. Especificar el crierio de prueba o
contraste3. Determinar el o los valores criticos, de
cuerdo al criterio de contraste (paso 2) para ello se redacta la probabilidad del error tipo i
4. Datos muestrales: un valor 5. Decisión: sea r la region de rechazo :
Si entonces se rechaza Si entonces se acepta
6. Conclusion Si se rechaza , se dice que si hay
evidencia para rechazarla. Si se acepta ,se dice que no hay
evidencia significativa en contra de
B) VALOR P DE LA PRUEBA:El valor p de una prueba de hipotesis es la probabilidad de que el estadistico tenga el valor observado en la muestra o un valor extremo (en direccion de ) cuando es verdadera.Es decir es el nivel de significancia mas bajo en el que el valor observado es significativo para rechazar En otras palabras el valor p , indica el valor minimo de que ocurra el error tipo icuando el valor observado se considera parte de la region de rechazo
ANALISIS PARAMETRICOS
COEFICIENTE DE CORRELACIÓN DE PEARSON:
Analiza la relación entre dos variables medidas en un nivel por intervalos o de razón.
Se simboliza con: r Ejemplos: A mayor X, mayor Y.
A mayor X, menor Y. La hipótesis de investigación señala que la correlación es
significativa . (No identifica causalidad) Puede variar de -1.00 a +1.00
REGRESIÓN LINEAL:Es un modelo estadístico para estimar el efecto de una variable sobre otra.Está asociado con el coeficiente de correlación de pearson.Brinda la oportunidad de predecir las puntuaciones de una variable tomando las puntuaciones de la otra variable.
PRUEBA DE DIFERENCIA DE PROPORCIONES
• Es una prueba estadística para analizar si dos proporciones o porcentajes difieren significativamente entre sí, en dos grupos.
• La comparación se realiza con una variable.
• Si hay varias variables hay que realizar una prueba por cada variable.
PRUEBA T:Es una prueba estadística para evaluar si dos grupos difieren entre si de manera significativa respecto a sus medias en una variable.Se simboliza con :T.La hipótesis de inv.propone que los dos grupos difieren de manera significativa,y la hipótesis nula que los dos grupos no difieren.
PRUEBA DE DIFERENCIA DE PROPORCIONES:Es una prueba estadística para analizar si dos proporciones o porcentajes difieren significativamente entre sí, en dos grupos.La comparación se realiza con una variable.Si hay varias variables hay que realizar una prueba por cada variable.
ANÁLISIS DE VARIANZA (ANOVA- ONE-WAY)• Es una prueba estadística
para analizar si más de dos grupos difieren significativamente (son diferentes)entre sí en cuanto a sus medias y varianzas.
• Hay otras a estadísticas relacionadas con anova.
SUPUESTOS:1. Aceptan distribuciones no
normales.2. Pueden analizar datos
medidos con escalas de intervalos,razón,nominales u ordinales.
ANALISIS NO PARAMETRICOS
Las pruebas no paramétricas más comunes son:Chi cuadrada Coeficientes de correlación e
independencia para tabulaciones cruzadas
Coeficientes de correlación por rangos ordenados de Spearman y Kendall.
CHI CUADRADAEs una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas.Se simboliza :X2No considera relaciones causales.
COEFICIENTES RHO DE SPEARMAN(RS) Y TAU SIMBOLIZADO POR T DE KENDALL:Los individuos u objetos de la muestra pueden ser ordenados por rangos.
RECUERDE
Ningún método estadístico puede corregir los defectos por una inadecuada selección del problema que se investiga, o por una mala recolección de datos. Una investigación que empieza mal con seguridad termina mal.CON DATOS DE MALA CALIDAD NO SERA POSIBLE DAR RESPUESTA ADECUADA A UN PROBLEMA CIENTIFICO.
BIBLIOGRAFIA:1. ESTADISTICA DESCRIPTIVA E INFERENCIAL I-. Autor: GARCIA MANCILLA Hugo Y MATUS
PARRA Juan., PRIMERA EDICION
2. GUIA PARA EL CURSO DE INFERENCIA ESTADISTICA :INSTITUTO NACIONAL DE ESTADISTICA GEOGRAFIA E INFORMATICA-Autor: CERVANTES LOPEZ Ernesto.
3. GUIA DE ESTADISTICA INFERENCIAL APLICADA.DEPARTAMENTO ACADEMICO DE ESTADISTICA DE LA UNMSM –Autor: VIOLETA ALICIA NOLBERTO SIFUENTES Y MARIA ESTELA PONCE ARUNERI.PRIMERA EDICION .LIMA,2008
4. COMPRENDIENDO LA ESTADISTICA INFERENCIAL: Autor: GIOVANNI SANABRIA BRENES.