Download - Chulde john portafolio estadistica inferencial.

MÉTODOS

ESTADÍSTICOS Y

PRINCIPIOS DE

DISEÑO

EXPERIMENTAL

i

UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI

FACULTAD DE INDUSTRIAS AGROPECUARIAS Y CIENCIAS

AMBIENTALES

Escuela de Desarrollo Integral Agropecuario

Modalidad PRESENCIAL

Módulo

“ESTADÍSTICA INFERENCIAL”

CUARTO NIVEL

DOCENTE(S) / INVESTIGADOR(ES):

ING. FAUSTO MONTENEGRO ARELLANO.

ING. RAMIRO MORA QUILISMAL

PERÍODO ACADÉMICO Sep. 2012 – Feb 2013

Tulcán, marzo 2015

ii

CONTENIDO

Introducción ....................................................................................................................................................... 17

1.1 Función de la estadística y del diseño experimental ................................................................................ 17

1.2 Definición. ............................................................................................................................................... 17

1.3 Campos en los que se aplica la Estadística .............................................................................................. 18

1.4 Algunos datos históricos. ......................................................................................................................... 20

1.5 La Estadística y el Método Científico ..................................................................................................... 21

Capítulo 2 .............................................................................................................................................................. 23

Variación – Variables ........................................................................................................................................ 23

2.1 Variación ambiental y variación hereditaria. ........................................................................................... 23

2.2 Variables. ................................................................................................................................................. 24

2.3 Observaciones, hechos. ............................................................................................................................ 25

2.4 Población y muestra................................................................................................................................. 25

2.5 Distribuciones. ......................................................................................................................................... 26

2.6 Presentación de datos............................................................................................................................... 28

Capítulo 3 .............................................................................................................................................................. 32

Muestreo ............................................................................................................................................................ 32

3.1 Poblaciones. ............................................................................................................................................. 32

3.2 Muestras: ................................................................................................................................................. 33

3.3 Estimación. .............................................................................................................................................. 33

3.4 Teorema del límite central. ...................................................................................................................... 33

3.5 Tipos de muestreo. ................................................................................................................................... 34

Capítulo 4 .............................................................................................................................................................. 38

Medidas de tendencia central y de dispersión ................................................................................................... 38

4.1 Simbología matemática. .......................................................................................................................... 38

4.2 Funciones. ................................................................................................................................................ 41

4.3 Redondeo de cifras. ................................................................................................................................. 41

4.4 Parámetros y estadísticas. ........................................................................................................................ 41

iii

4.5. La media y otras medidas de tendencia central. ..................................................................................... 42

4.6 La desviación típica y otras medidas de dispersión ................................................................................. 45

4.7. Cambios en las observaciones y su influencia en 𝝁 y 𝝈𝟐 . ..................................................................... 49

4.8. Desviación típica de las medias. ............................................................................................................. 50

4.9. Coeficiente de variación, (C.V.). ............................................................................................................ 51

4.10. Modelo lineal aditivo. ........................................................................................................................... 52

4.11. Intervalos de confianza. ........................................................................................................................ 52

Capítulo 5 .............................................................................................................................................................. 56

Cuadros de Curvas de Frecuencia –Histogramas .............................................................................................. 56

5.1 Cuadros de frecuencia ............................................................................................................................. 56

5.2 Histogramas y polígonos de frecuencia ................................................................................................... 58

Capítulo 6 .............................................................................................................................................................. 62

Probabilidad ....................................................................................................................................................... 62

6.1. Sucesos independientes. ......................................................................................................................... 63

6.2. Sucesos dependientes ............................................................................................................................. 65

6.3. Sucesos mutuamente excluyentes ........................................................................................................... 66

6.4. Análisis combinatorio ............................................................................................................................. 68

6.5. Factorial N. ............................................................................................................................................. 68

6.6. Permutaciones. ........................................................................................................................................ 69

6.7 Combinaciones. ...................................................................................................................................... 70

Capítulo 7 ............................................................................................................................................................. 72

Distribuciones Teóricas de Frecuencias ........................................................................................................... 72

7.1 La distribución binomial. ......................................................................................................................... 72

7.2 La distribución normal............................................................................................................................. 78

Capítulo 8 .............................................................................................................................................................. 87

Pruebas de Hipótesis .......................................................................................................................................... 87

8.1 La hipótesis nula, HO. .............................................................................................................................. 87

8.2 Prueba de hipótesis y nivel de significación ............................................................................................ 88

iv

8.3 Errores tipo I y tipo II. ............................................................................................................................. 89

8.4 Potencia de la prueba. .............................................................................................................................. 90

8.5 Pruebas de una y de dos colas. ................................................................................................................ 90

Capítulo 9 .............................................................................................................................................................. 94

La Distribución de X2 ........................................................................................................................................ 94

9.1 Cálculo de X2. .......................................................................................................................................... 94

9.2 Cuadros con dos criterios de clasificación. .............................................................................................. 98

9.3 Corrección de Yates............................................................................................................................... 102

La Distribución de t. ........................................................................................................................................ 103

10.1 Prueba t para observaciones no pareadas............................................................................................. 104

10.2 Prueba de t para observaciones pareadas. ............................................................................................ 105

Capítulo 11 .......................................................................................................................................................... 110

Correlación ...................................................................................................................................................... 110

11.1 Coeficiente de Correlación .................................................................................................................. 111

11.2 Propiedades del Coeficiente De Correlación ....................................................................................... 113

Capítulo 12 .......................................................................................................................................................... 115

Regresión ......................................................................................................................................................... 115

12.1 Ecuación de la línea recta .................................................................................................................... 117

12.2 El método de los cuadrados mínimos. ................................................................................................. 118

12.3 Cálculo del coeficiente de regresión y de la ecuación de regresión. ................................................... 119

12.4 Valores ajustados. ................................................................................................................................ 121

12.5 Fuentes de variación en regresión ....................................................................................................... 122

12.6 Desviación y límites de confianza ....................................................................................................... 123

12.7 Propiedades y suposiciones en regresión lineal. ................................................................................ 124

Capítulo 13 .......................................................................................................................................................... 125

Covariancia ...................................................................................................................................................... 125

13.1 Usos del ANACOVA .......................................................................................................................... 126

13.2 Suposiciones en el ANACOVA y el modelo lineal aditivo. ................................................................ 127

v

13.3 Modelo matemático ............................................................................................................................. 127

Generalidades .................................................................................................................................................. 130

1.1 INTRODUCCIÓN ................................................................................................................................ 130

1.2 ESTADÍSTICA Y MÉTODO CIENTÍFICO ........................................................................................ 133

1.3 DEFINICIONES Y CONCEPTOS ....................................................................................................... 135

CAPÍTULO 2 ...................................................................................................................................................... 141

Presentación, resumen y caracterización de la información ............................................................................ 141

2.1 TABLAS DE DISTRIBUCIÓN DE FRECUENCIA ............................................................................ 141

2.2 GRÁFICOS ESTADÍSTICOS .............................................................................................................. 147

2.2.1 Histograma ......................................................................................................................................... 148

2.3 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN ......................................................... 152

2.3.1 Medidas de tendencia central. ............................................................................................................ 152

CAPÍTULO 3 ...................................................................................................................................................... 182

Conceptos básicos de Probabilidad ................................................................................................................. 182

3.1. INTRODUCCIÓN ................................................................................................................................ 182

3.2 CONCEPTOS BÁSICOS PARA EL ESTUDIO DE LAS PROBABILIDADES ................................ 183

1

I. DIRECCIONAMIENTO ESTRATÉGICO

UPEC - MISIÓN MISIÓN – ESCUELA

Formar profesionales humanistas, emprendedores y competentes,

poseedores de conocimientos científicos y tecnológicos; comprometida

con la investigación y la solución de problemas del entorno para contribuir con el desarrollo y la integración fronteriza”.

La Escuela de Desarrollo Integral Agropecuario contribuye al desarrollo

Provincial, Regional y Nacional, entregando profesionales que participan

en la producción, transformación, investigación y dinamización del sector agropecuario y agroindustrial, vinculados con la comunidad, todo esto con

criterios de eficiencia y calidad

UPEC - VISIÓN

VISIÓN - ESCUELA

“Ser una Universidad Politécnica acreditada por su calidad y

posicionamiento regional”.

Liderar a nivel regional el proceso de formación y lograr la excelencia

académica generando profesionales competentes en Desarrollo Integral Agropecuario, con un sólido apoyo basado en el profesionalismo y

actualización de los docentes, en la investigación, criticidad y creatividad

de los estudiantes, con una moderna infraestructura que incorpore los últimos adelantos tecnológicos, pedagógicos y que implique un ejercicio

profesional caracterizado por la explotación racional de los recursos

naturales, producción limpia, principios de equidad, participación,

ancestralidad, que den seguridad y consigan la soberanía alimentaria

ÁREA CONOCIMIENTO ESCUELA CINE-UNESCO

SUB-ÁREA CONOCIMIENTO CINE-UNESCO

CIENCIAS

Matemática y Estadística (46)

II. DATOS BÁSICOS DEL MÓDULO “Biología Molecular y Celular”:

CÓDIGO NIVEL CUARTO

DOCENTE: Ing. Fausto Montenegro A

TELÉFONO: 0993331913 e-mail: [email protected]

CRÉDITOS T 1,5 CRÉDITOS P 1,5 TOTAL CRÉDITOS 3

HORAS T 48 HORAS P 48 TOTAL HORAS 96

PRE-REQUISITOS: (Módulos obligatorios que DEBEN estar aprobados antes de éste módulo) CÓDIGOS

1. Estadística Descriptiva.

CO-REQUISITOS: (Módulos obligatorios que TIENEN que aprobar en paralelo a éste módulo) CÓDIGOS

1.

EJE DE FORMACIÓN: (En la malla ubicado en un eje con un nombre) Básica

2

ÁREA DE FORMACIÓN: (En la malla agrupado con un color y un nombre) Exactas.

LIBRO(S) BASE DEL MÓDULO: (Referencie con norma APA el libro, físico o digital, disponible en la UPEC para estudio )

MARTINEZ BECARDINO, C. (2012). Estadística y Muestreo. Bogotá.: ECOE Ediciones.

LIBRO(S) REFERENCIAL/COMPLEMENTARIO DEL MÓDULO: (Referencie con norma APA el libro, físico o digital, disponible en la UPEC para

estudio)

LIND, D. M. (2012). Estadística aplicada a los negocios y la Economía. México: Mc Graw Hill. GONZÁLEZ BAHAMONDE, G. Métodos Estadísticos y Principios de Diseño Experimental. Universidad Central del Ecuador. Quito. 1989.

MONTGOMERY, D., RUNGER, G. (2002) “Probabilidad y Estadística aplicada a la Ingeniería”, Limusa Wiley, Segunda Edición,

México – México.

MENDENHALL, W., WACKERLY, D., SHEAFFER, R. (1990)”Estadística Matemática con Aplicaciones”, Grupo Editorial

Iberoamérica, Segunda Edición, México – México.

El curso de Estadística Inferencial comprende el estudio de modelos de variables aleatorias continuas utilizadas frecuentemente en ingeniería estudiadas

de formas univariada y bivariada, también se presentan las propiedades de los estimadores y métodos de estimación así como las distribuciones

muestrales a partir de las cuales se realiza la Estadística Inferencial a través de estimadores puntuales, intervalos de confianza y Pruebas de Hipótesis para medias, varianzas, proporciones para una o dos muestras independientes, así como independencia estocástica y bondad de ajuste. Finalizando el

curso se presentan modelos lineales y la estimación a través de mínimos cuadrados.

III. RUTA FORMATIVA DEL PERFIL

Nodo Problematizado: (Elija uno de la propuesta GENÉRICA de la UPEC o GLOBAL de la ESCUELA). Formulación de problemas

Restringido conocimiento sobre el área de estudio y la profesión.(4)

Competencia GENÉRICA - UPEC: (Elija una que guarde coherencia con el NODO PROBLEMATIZADO)

Capacidad de aplicar los conocimientos en la práctica (2).

Competencia GLOBAL - ESCUELA: (Elija una que guarde coherencia con el NODO PROBLEMATIZADO y las COMPETENCIAS GENÉRICA)

Interpretar, difundir y transferir conocimientos científicos y tecnológicos de la producción agrícola (2)

Competencia ESPECÍFICA - MÓDULO: (Escriba una que guarde coherencia con el NODO PROBLÉMICO y las COMPETENCIAS GENÉRICA y

GLOBAL)

Lograr interiorizar en los estudiantes los conocimientos teóricos y aplicaciones de los mètodos estadìsticos y aplicaciones de los mètodos estadìsticos en el

estudio y soluciòn de problemas diversos en el campo de la Ingeniería.

3

NIVELES DE

LOGRO

PROCESO

COGNITIVO

| |1

1. TEÓRICO

BÁSICO

RECORDAR

MLP

El estudiante logra recordar: La Inferencia estadística para

variables cualitativas:

Tablas de contingencia y medidas de asociación: prueba chi cuadrado, de Pearson, razón de verosimilitud, coeficiente de

linealidad.

Corrección de Yates, coeficiente phi, riesgo relativo

Medidas de asociación para variables de escala nominal:

coeficiente de contingencia y otros. (2)

Factual.- listar definiciones de vocabulario y conocimiento

referente a la Estadística inferencial.

2. TEÓRICO

AVANZADO

ENTENDER

El estudiante logra explicar: Inferencia estadística para variables

cuantitativas: Prueba t de Student: elementos fundamentales,

prueba para una muestra, prueba para dos muestras relacionadas, prueba para dos muestras independientes, prueba para varias

muestras, con prueba de Levene. Prueba Z o normal: elementos

fundamentales, aplicaciones Prueba F de Fisher: elementos fundamentales, prueba de Levene, aplicaciones

Pruebas de bondad de ajuste para una muestra: prueba de la binomial, prueba ji cuadrado, pruebas de Kolmogorov,

Kolmogorov-Smirnov-Liliefors y gráficas de probabilidad

normal PP-QQ. (35)

Conceptual.- Explica las diferentes operaciones estadísticas y su proceso.

3. RÁCTICO

BÁSICO

APLICAR Regresión lineal simple

Formulación del problema, análisis de correlación entre pares de

variables, estimación de parámetros, análisis de los residuos,

prueba de Levene y transformaciones para estabilizar la varianza, análisis de varianza y coeficiente de determinación,

pruebas de hipótesis. (41)

Procesal.- resolución de ejercicios prácticos reales con la ayuda del ordenador, lecturas, trabajos y evaluación.

4. PRÁCTICO

AVANZADO

ANALIZAR

El estudiante logra: Regresión lineal múltiple

El coeficiente de correlación múltiple, coeficiente de

determinación, análisis de varianza, coeficiente de correlación parcial, estimación de parámetros, violación de los supuestos del

modelo clásico: multicolinealidad, heterocedasticidad,

autocorrelación

(14)

Procesal

Resolución de ejercicios y elaboración de ensayos o informes

que impliquen el intercambio y la discusión de ideas, mostrando gran respeto por la opinión de los demás.

5. TEÓRICO

PRÁCTICO

BÁSICO

EVALUAR

El estudiante logra: Modelos probabilísticos de regresión

(5)

Conceptual.-

Explica modelos probabilísticos de regresión

6. TEÓRICO

PRÁCTICO

AVANZADO

El estudiante logra: Análisis de componentes principales ACP y

cluster análisis (53)

Conceptual.- Explica Análisis bivariante de variables

cuantitativas: distribución de frecuencias e histogramas, estadísticos descriptivos

4

CREAR

Trabajo interdisciplinar: (Saberes integrados de los módulos recibidos y recibiendo que tributan directamente a la formación de la COMPETENCIA

ESPECÍFICA).

El curso de Estadística Inferencial para la formación de un ingeniero contribuye con:

Los conocimientos que le permiten realizar inferencias estadísticas y proyecciones a partir de muestras.

Tomar decisiones de manera óptima y basada fundamentalmente en evidencia estadística.

Bases teóricas necesarias para el curso de muestreo y análisis multivariado de datos.

5

IV. METODOLOGÍA DE FORMACIÓN DEL PERFIL:

LOGROS DE APRENDIZAJE

(Acciones sistémicas, ELEMENTOS DE

COMPETENCIA, SUB -

COMPETENCIAS)

CONTENIDOS DE APRENDIZAJE PARA QUE EL ESTUDIANTE ALCANCE LOS LOGROS ESPERADOS

ESTRATEGIAS

DIDÁCTICAS

Estrategias, métodos y

técnicas

HORAS

CLASE

COGNITIVOS

¿Qué TIENE que saber?

PROCEDIMENTALES

¿Saber cómo TIENE que aplicar el

conocimiento?

AFECTIVO MOTIVACIONALES

¿Saber qué y cómo TIENE actuar

axiológicamente?

T

P

El estudiante logra recordar: La Inferencia

estadística para variables cualitativas:

Tablas de contingencia y medidas de asociación: prueba ji cuadrado de

Pearson, razón de verosimilitud,

coeficiente de linealidad.

Corrección de Yates, coeficiente phi,

riesgo relativo

Medidas de asociación para variables de escala nominal: coeficiente de

contingencia y otros. (2)

Factual.- listar definiciones de vocabulario y

conocimiento referente a la Estadística

inferencial.

Explicación teórica con la ayuda de

diapositivas, preguntas y respuestas,

resolución de ejercicios prácticos reales con la ayuda del ordenador, lecturas,

trabajos y evaluación.

•Exposiciones

Audiovisuales

•Pizarra • Internet.

8

8

El estudiante logra explicar: Inferencia

estadística para variables cuantitativas:

Prueba t de Student: elementos fundamentales, prueba para una muestra,

prueba para dos muestras relacionadas,

prueba para dos muestras independientes, prueba para varias muestras, con prueba

de Levene. Prueba Z o normal: elementos

fundamentales, aplicaciones Prueba F de Fisher: elementos fundamentales, prueba

de Levene, aplicaciones

Conceptual.- Explica las diferentes operaciones

estadísticas y su proceso.

Explicación teórica con la ayuda de diapositivas, preguntas y respuestas,

resolución de ejercicios prácticos reales

con la ayuda del ordenador, lecturas,


•Exposiciones Audiovisuales

•Pizarra

• Internet.

8

8

6



COMPETENCIA, SUB -

COMPETENCIAS)


ESTRATEGIAS

DIDÁCTICAS


técnicas

HORAS

CLASE

COGNITIVOS


PROCEDIMENTALES


conocimiento?



axiológicamente?

T

P

Pruebas de bondad de ajuste para una

muestra: prueba de la binomial, prueba ji

cuadrado, pruebas de Kolmogorov, Kolmogorov-Smirnov-Liliefors y gráficas

de probabilidad normal PP-QQ. (35)

Regresión lineal simple

Formulación del problema, análisis de correlación entre pares de variables,

estimación de parámetros, análisis de los

residuos, prueba de Levene y transformaciones para estabilizar la

varianza, análisis de varianza y

coeficiente de determinación, pruebas de hipótesis. (41)

Procesal.- resolución de ejercicios prácticos

reales con la ayuda del ordenador, lecturas, trabajos y evaluación.


diapositivas, preguntas y respuestas, resolución de ejercicios prácticos reales



•Exposiciones Audiovisuales

•Pizarra

• Internet.

8

8


El coeficiente de correlación múltiple,

coeficiente de determinación, análisis de varianza, coeficiente de correlación

parcial, estimación de parámetros,

violación de los supuestos del modelo clásico: multicolinealidad,

heterocedasticidad, autocorrelación

(14)

Procesal

Resolución de ejercicios y elaboración de

ensayos o informes que impliquen el

intercambio y la discusión de ideas, mostrando gran respeto por la opinión de los

demás.

Explicación teórica con la ayuda de diapositivas, preguntas y respuestas,

resolución de ejercicios prácticos reales

con la ayuda del ordenador, lecturas, trabajos y evaluación.

•Exposiciones

Audiovisuales

•Pizarra

• Internet.

.

8

8

7



COMPETENCIA, SUB -

COMPETENCIAS)


ESTRATEGIAS

DIDÁCTICAS


técnicas

HORAS

CLASE

COGNITIVOS


PROCEDIMENTALES


conocimiento?



axiológicamente?

T

P

El estudiante logra: Modelos

probabilísticos de regresión

Modelo logit

Modelo probit (5)

Conceptual.-

Explica modelos probabilísticos de

regresión


diapositivas, preguntas y respuestas,

resolución de ejercicios prácticos reales con la ayuda del ordenador, lecturas,


•Exposiciones

Audiovisuales •Pizarra

• Internet.

8

8

El estudiante logra: Análisis de

componentes principales ACP y cluster análisis (53)

Conceptual.- Explica Análisis bivariante

de variables cuantitativas: distribución de frecuencias e histogramas, estadísticos

descriptivos


diapositivas, preguntas y respuestas, resolución de ejercicios prácticos reales



•Exposiciones

Audiovisuales •Pizarra

• Internet.

8

8

8

V. PLANEACIÓN DE LA EVALUACIÓN DEL MÓDULO



COMPETENCIA, SUB - COMPETENCIAS)

FORMAS DE EVALUACIÓN DE LOGROS DE APRENDIZAJE

indicar las políticas de evaluación para éste módulo según los resultados esperados

DIMENSIÓN

(Elija el grado de

complejidad que

UD. EXIGIRÁ

para alcanzar el

logro)

INDICADORES DE

LOGRO DE INGENIERÍA

Descripción

TÉCNICAS e INSTRUMENTOS

de EVALUACIÓN 1° PARCIAL 2° PARCIAL 3° PARCIAL SUPLETORIO

El estudiante logra recordar: La Inferencia estadística

para variables cualitativas:

Tablas de contingencia y medidas de asociación: prueba ji cuadrado de Pearson, razón de

verosimilitud, coeficiente de linealidad.


Medidas de asociación para variables de escala

nominal: coeficiente de contingencia y otros. (2)

Factual.- listar definiciones

de vocabulario y

conocimiento referente a la Estadística inferencial.

• Pruebas

individuales

• Trabajos grupales e

individuales de

consulta • Exposiciones

individualess

• Trabajos de

clase grupales e

individuales

• Talleres

Poligrafiado

básico del

docente.

Internet.

Debate dirigido

Organizadores del

conocimiento

Lluvia de Ideas.

Exposición

Individual y grupal.

Aulas virtuales.

Pruebas

individuales

60%.

Trabajos

grupales e

individuales de

consulta 20%.

Aulas virtuales

20 %.

Pruebas

individuales

60%.

Trabajos

grupales e

individuales de

consulta 20%.

Aulas virtuales

20 %.

Pruebas

individuales

60%.

Trabajos

grupales e

individuales de

consulta 20%.

Aulas virtuales

20 %.

Pruebas

individuales

90%.

Portafolio 10%.

El estudiante logra explicar: Inferencia estadística

para variables cuantitativas: Prueba t de Student: elementos fundamentales, prueba para una muestra,

prueba para dos muestras relacionadas, prueba para

dos muestras independientes, prueba para varias

Conceptual.- Explica las diferentes operaciones estadísticas y su

proceso.

• Pruebas

individuales • Trabajos

grupales e

individuales de

Poligrafiado

básico del docente.

Internet.

Pruebas

individuales 60%.

Pruebas

individuales 60%.

Pruebas

individuales 60%.

Pruebas

individuales 90%.

9






DIMENSIÓN

(Elija el grado de

complejidad que

UD. EXIGIRÁ

para alcanzar el

logro)

INDICADORES DE


Descripción



muestras, con prueba de Levene. Prueba Z o normal:

elementos fundamentales, aplicaciones Prueba F de Fisher: elementos fundamentales, prueba de Levene,

aplicaciones

Pruebas de bondad de ajuste para una muestra: prueba de la binomial, prueba ji cuadrado, pruebas de

Kolmogorov, Kolmogorov-Smirnov-Liliefors y

gráficas de probabilidad normal PP-QQ. (35)

consulta

• Exposiciones individualess

• Trabajos de

clase grupales e individuales

• Talleres

Debate dirigido

Organizadores del

conocimiento

Lluvia de Ideas.

Exposición


Aulas virtuales.

Trabajos

grupales e individuales de

consulta 20%.

Aulas virtuales

20 %.

Trabajos


consulta 20%.

Aulas virtuales

20 %.

Trabajos


consulta 20%.

Aulas virtuales

20 %.

Portafolio 10%.


Formulación del problema, análisis de correlación

entre pares de variables, estimación de parámetros,

análisis de los residuos, prueba de Levene y transformaciones para estabilizar la varianza, análisis

de varianza y coeficiente de determinación, pruebas de hipótesis. (41)

Procesal.- resolución de ejercicios prácticos reales

con la ayuda del ordenador,

lecturas, trabajos y evaluación.

• Pruebas individuales

• Trabajos



individualess

• Trabajos de clase grupales e

individuales

• Informes de investigaciones

realizadas

• Talleres

Poligrafiado básico del

docente.

Internet.

Debate dirigido

Organizadores del

conocimiento

Lluvia de Ideas.

Exposición

Individual y

Pruebas individuales

60%.

Trabajos grupales e

individuales de consulta 20%.

Aulas virtuales 20 %.


60%.

Trabajos grupales e




60%.

Trabajos grupales e




90%.

Portafolio 10%.

10






DIMENSIÓN

(Elija el grado de

complejidad que

UD. EXIGIRÁ

para alcanzar el

logro)

INDICADORES DE


Descripción



grupal.

Aulas virtuales.


El coeficiente de correlación múltiple, coeficiente de

determinación, análisis de varianza, coeficiente de correlación parcial, estimación de parámetros,

violación de los supuestos del modelo clásico:

multicolinealidad, heterocedasticidad, autocorrelación

(14)

Procesal

Resolución de ejercicios y

elaboración de ensayos o informes que impliquen el

intercambio y la discusión de

ideas, mostrando gran respeto por la opinión de los demás.

• Pruebas

individuales


individuales de


individualess


individuales

• Talleres

Poligrafiado

básico del

docente.

Internet.

Debate dirigido

Organizadores del

conocimiento

Lluvia de Ideas.

Exposición


Aulas virtuales.

Pruebas

individuales

60%.

Trabajos


consulta 20%.

Aulas virtuales

20 %.

Pruebas

individuales

60%.

Trabajos


consulta 20%.

Aulas virtuales

20 %.

Pruebas

individuales

60%.

Trabajos


consulta 20%.

Aulas virtuales

20 %.

Pruebas

individuales

90%.

Portafolio 10%.

El estudiante logra: Modelos probabilísticos de

regresión

Modelo logit

Modelo probit (5)

Conceptual.-

Explica modelos

probabilísticos de regresión

• Pruebas

individuales


individuales de


individualess

Poligrafiado

básico del

docente.

Internet.

Pruebas

individuales

60%.

Pruebas

individuales

60%.

Pruebas

individuales

60%.

Pruebas

individuales

90%.

Portafolio 10%.

11






DIMENSIÓN

(Elija el grado de

complejidad que

UD. EXIGIRÁ

para alcanzar el

logro)

INDICADORES DE


Descripción



• Trabajos de

clase grupales e individuales

• Talleres

Debate dirigido

Organizadores del

conocimiento

Lluvia de Ideas.

Exposición


Aulas virtuales.

Trabajos


consulta 20%.

Aulas virtuales

20 %.

Trabajos


consulta 20%.

Aulas virtuales

20 %.

Trabajos


consulta 20%.

Aulas virtuales

20 %.

El estudiante logra: Análisis de componentes principales ACP y cluster análisis (53)

Conceptual.- Explica Análisis bivariante de

variables cuantitativas:

distribución de frecuencias e histogramas, estadísticos

descriptivos

• Pruebas individuales

• Trabajos



individualess


individuales

• Talleres

Poligrafiado básico del

docente.

Internet.

Debate dirigido

Organizadores

del

conocimiento

Lluvia de Ideas.

Exposición



60%.

Trabajos


consulta 20%.

Aulas virtuales

20 %.


60%.

Trabajos


consulta 20%.

Aulas virtuales

20 %.


60%.

Trabajos


consulta 20%.

Aulas virtuales

20 %.


90%.

Portafolio 10%.

12






DIMENSIÓN

(Elija el grado de

complejidad que

UD. EXIGIRÁ

para alcanzar el

logro)

INDICADORES DE


Descripción



Aulas virtuales.

ESCALA DE VALORACIÓN

Nivel ponderado de aspiración y alcance

9.0 a 10.0 Acreditable - Muy Satisfactorio 7.0 a 7.9 Acreditable – Aceptable

8.0 a 8.9 Acreditable – Satisfactorio 4.0 a 6.9 No Acreditable – Inaceptable

13

VI. GUÍA DE TRABAJO AUTÓNOMO / PRODUCTOS / TIEMPOS


(Acciones sistémicas, ELEMENTOS DE COMPETENCIA, SUB - COMPETENCIAS)

APRENDIZAJE CENTRADO EN EL ESTUDIANTE

HORAS

AUTÓNOMAS

INSTRUCCIONES RECURSOS

PRODUCTO

T P

El estudiante logra recordar: La Inferencia estadística para variables cualitativas:

Tablas de contingencia y medidas de asociación: prueba ji cuadrado de Pearson, razón de

verosimilitud, coeficiente de linealidad.


Medidas de asociación para variables de escala nominal: coeficiente de contingencia y

otros. (2)

Impóngase un horario para su trabajo autónomo, consulte en libros e internet,

construya cuadros sinópticos. Respete

posiciones de sus compañeros si el trabajo lo hace en equipo.

Internet

Textos

Entrevistas a técnicos

Presentación en medio

magnético para socializar la

consulta utilizando organizadores gráficos.

Presentación de resultados

Fundamentación de la

revisión bibliográfica.

8

8

El estudiante logra explicar: Inferencia estadística para variables cuantitativas: Prueba t de Student: elementos fundamentales, prueba para una muestra, prueba para dos muestras

relacionadas, prueba para dos muestras independientes, prueba para varias muestras, con

prueba de Levene. Prueba Z o normal: elementos fundamentales, aplicaciones Prueba F de Fisher: elementos fundamentales, prueba de Levene, aplicaciones

Pruebas de bondad de ajuste para una muestra: prueba de la binomial, prueba ji cuadrado,

pruebas de Kolmogorov, Kolmogorov-Smirnov-Liliefors y gráficas de probabilidad normal PP-QQ. (35)

Impóngase un horario para su trabajo

autónomo, consulte en libros e internet,

construya cuadros sinópticos. Respete posiciones de sus compañeros si el trabajo lo

hace en equipo.

Internet

Textos

Entrevistas a

técnicos

Cuadro comparativo

8

8


Formulación del problema, análisis de correlación entre pares de variables, estimación de parámetros, análisis de los residuos, prueba de Levene y transformaciones para estabilizar

la varianza, análisis de varianza y coeficiente de determinación, pruebas de hipótesis. (41)




hace en equipo.

Revistas Científicas

Textos

Internet

Presentación de Informe sobre las prácticas realizadas

Socialización en grupos

sobre el tema estudiado

8

8

14




HORAS

AUTÓNOMAS


PRODUCTO

T P


El coeficiente de correlación múltiple, coeficiente de determinación, análisis de varianza,

coeficiente de correlación parcial, estimación de parámetros, violación de los supuestos del modelo clásico: multicolinealidad, heterocedasticidad, autocorrelación

(14)

Impóngase un horario para su trabajo autónomo, consulte en libros e internet,

construya cuadros sinópticos. Respete

posiciones de sus compañeros si el trabajo lo hace en equipo.

Revistas

Científicas

Textos

Internet

Informe de prácticas

realizadas

Presentación en forma

magnética sobre las trabajos técnicos

8

8

El estudiante logra: Modelos probabilísticos de regresión

Modelo logit

Modelo probit (5)




hace en equipo.

Internet

Textos

Fichas técnicas

Resultados de Investigaciones

Consulta a expertos

Recursos

económicos

para la

investigación

Presentación y exposición.

8

8

El estudiante logra: Análisis de componentes principales ACP y cluster análisis (53)

Impóngase un horario para su trabajo autónomo

Consulte en libros e internet

Construya cuadros sinópticos Valore la creatividad de cada presentación.

Respete posiciones de sus compañeros si el

Revistas Científicas

Textos

Internet

Guías de

Presentación en forma

magnética sobre las trabajos técnicos

8

8

15




HORAS

AUTÓNOMAS


PRODUCTO

T P

trabajo lo hace en equipo. laboratorio.

Fichas técnicas

PROYECTO INTEGRADOR DE SABERES: (Proyecto Integrador de conocimientos con los módulos del Nivel )

TOTAL

48 48

CRÉDITOS

1.5 1.5

3

16

VII. BIBLIOGRAFíA

BÁSICA: (Disponible en la UPEC en físico y digital – REFERENCIAR con normas APA)

MONTGOMERY, D., RUNGER, G. (2002) “Probabilidad y Estadística aplicada a la Ingeniería”, Limusa Wiley, Segunda Edición, México – México.

MENDENHALL, W., WACKERLY, D., SHEAFFER, R. (1990)”Estadística Matemática con Aplicaciones”, Grupo Editorial Iberoamérica, Segunda Edición, México – México. GONZÁLEZ BAHAMONDE, G. Métodos Estadísticos y Principios de Diseño Experimental. Universidad Central del Ecuador. Quito. 1989.

LIBRO(S) REFERENCIAL/COMPLEMENTARIO DEL MÓDULO: (Referencie con norma APA el libro, físico o digital, disponible en la UPEC para estudio)

1. ANDER-EGG, E. (1995). Técnicas de Investigación Social. Buenos Aires: Lumen.

2. MARTINEZ BECADRDINO, C. (2012). Estadìstica y Muestreo. Bogota.: ECOE Ediciones. 3. LIND, D. M. (2012). Estadística aplicada a los negocios y la Economía. México: Mc Graw Hill.

DOCENTES:

Guillermo Fausto Montenegro Arellano.

DOCENTE EDIA-UPEC

ENTREGADO: 2012-09-03

17

Capítulo 1

Introducción

1.1 Función de la estadística y del diseño experimental

El progreso en el campo agropecuario así como en otros a los que el hombre dedica su atención

tiene que basarse en la investigación o experimentación.

Esta verdad, que ha sido reconocida en los últimos años, han permitido el incremento del trabajo

experimental en muchos países y ha estimulado a grupos cada vez más numerosos de

profesionales jóvenes, para que se adiestren y dediquen su tiempo y esfuerzo a la investigación,

en los diferentes campos.

La experimentación, en su forma moderna, tiene que planearse y ejecutarse sobre bases

científicas para, de esta manera, poder llegar a conclusiones válidas y confiables, que más tarde

se traducirán en recomendaciones de tipo práctico para el público y que significan incremento

de rendimientos, calidad, eficacia, etc.

El conocimiento de los Métodos Estadísticos permite una clara compresión del Diseño

Experimental, a base del que es posible identificar el problema, plantear una hipótesis de

trabajo, conducir el ensayo e interpretar sus resultados en forma correcta.

1.2 Definición.

La palabra Estadística es de uso generalizado. Desafortunadamente aún para muchos hombres

cultos es una simple recolección de datos.

Así se oye hablar, por ejemplo, de estadísticas de consumo, de accidentes, censos de población,

etc., que si bien son colecciones importantes de datos, a base de las que se puede hacer un

verdadero trabajo estadístico posterior no representan sino una pequeña porción del alcance de

la Estadística.

La simple colección y ordenación de datos, se llama Estadística Descriptiva, mientras que la

obtención sistemática de una o más conclusiones a partir de los datos, se llama Inferencia

Estadística. Así vemos que los datos obtenidos por la Estadística Descriptiva, constituyen un fin

para ésta, pero tan solo un medio para llegar a la Inferencia Estadística.

18

Steel y Torrie (1960), definen a la Estadística como "la ciencia pura y aplicada que crea,

desarrolla y aplica procedimientos, en tal forma, que se pueda evaluar la certeza de la inferencia

– inductiva”.

De acuerdo con Spiegel (1961),”La Estadística es la ciencia que usa métodos para reunir,

organizar, resumir y analizar datos, así como para obtener conclusiones válidas y tomar

decisiones razonables, a base de tales análisis”.

Para la mayoría de científicos, la Estadística es Lógica o sentido común, en combinación con

procedimientos aritméticos. La lógica daría el método para la toma de datos y la aritmética

proporciona el material sobre el que ha de basarse la inferencia. La aritmética constituye

generalmente la parte rutinaria del Procedimiento.

Finalmente se dice que la Estadística es el estudio científico del análisis de datos numéricos.

De acuerdo con lo expuesto, se usa en forma común la palabra Estadística, por lo que, en

realidad, corresponde Métodos Estadísticos.

1.3 Campos en los que se aplica la Estadística

En los últimos años se ha podido apreciar cambios notables en la Estadística. Nuevas teorías

han estado surgiendo continuamente. Seguidamente, se describen algunas aplicaciones de la

Estadística.

1.3.1 Genética. Ciencia de comunicación biológica entre generaciones. Lo que se transmite de

padre a hijo (tercer principio dilucidado por Johan Gregor Mendel, en 1865).

Mendel tenía una .mente brillante - física, matemática, estadística -. Su capacidad como

experimentador para seleccionar individuos que diferían en ciertas características cualitativas y

su meticulosidad para realizar, tabular y analizar contajes de las progenies resultantes de sus

cruzamientos, permitió llegar, más tarde, a una clara comprensión de la genética de poblaciones

(Srb y colaboradores, 1965).

Algunos atributos importantes de plantas, animales y del hombre, se ubican en escalas continuas

de medida y se expresan mejor como kilogramos, centímetros, cocientes de inteligencia, etc.

Estas variaciones son de naturaleza cuantitativa y se llaman caracteres cuantitativos. La

descripción y análisis de éstos, requiere de métodos especiales, dados por !a rama de las

matemáticas, llamada Estadística.

El conocimiento de las leyes de azar (probabilidad), es básico para comprender la transmisión

de, factores heredables. Así podemos preguntar, “en familias que tienen dos hijos, ¿qué

19

proporción de ellas tendrán dos varones?; ¿varón y mujer?; ¿dos mujeres?; ¿ojos claros y cafés?

La expansión binomial daría respuesta a estas preguntas.

La prueba de x2 indicaría si el número y clase de progenie obtenida en cruzamientos de alfalfa

está de acuerdo a la hipótesis mendeliana. Tal sería el caso del cálculo de recombinaciones de

genes, por sobre cruzamiento, cuando los genes se hallan ligados en cromosomas homólogos.

Dentro del trabajo de creación de nuevas variedades, la determinación de la aptitud

combinatoria general y específica, utiliza modelos estadísticos como los presentados de Sprague

y Tatum (1942), Griffing (1956), Gates y Wilcox (1964), entre otros, que son considerados

clásicos en el campo de fitomejoramiento.

Por considerar de interés para los fito-mejoradores, hemos añadido el Capítulo 19, en el que se

demuestra el uso de uno de los métodos de Griffing (1956), para el cálculo de aptitud

combinatoria general y específica.

Para el efecto, se utilizaron datos provenientes de cruzamientos di alélicos en alfalfa analizados

por el que escribe.

1.3.2 Nutrición. Tanto en nutrición humana como animal el control de calidad de alimentos es

utilizado extensamente para mantener la uniformidad de productos elaborados. Continuamente

se está probando la bondad de nuevas dietas, que se traduzcan en mayores ganancias de peso en

aves, porcinos, etc. Un diseño experimental que permita evaluar a nuevos balanceados

producidos por casas comerciales frente a un testigo deja la oportunidad l investigador para

seleccionar el .mejor y recomendarlo al público.

1.3.3 Comercialización. A las entidades encargadas de controlar la distribución de productos

agrícolas interesa conocer zonas de cultivo, época de siembra y cosecha, costos de producción,

canales por los que se distribuye el producto. Una encuesta bien diseñada y un muestreo

adecuado, pueden dar resultados económicos satisfactorios tanto para el agricultor corno para el

consumidor.

1.3.4 Industria. Los fabricantes de piezas de repuesto, necesitan conocer el porcentaje de

unidades defectuosas qué produce una máquina.

En esta forma será posible determinar si la máquina se halla funcionando en forma eficiente y

económica, o si debe hacerse algún cambio para conseguir tal propósito. Por ejemplo

suponiendo que los diámetros de arandelas de presión, permiten una tolerancia establecida,

usando una prueba de x es posible determinar el porcentaje de arandelas defectuosas.

20

Así mismo, usando la distribución normal, se puede determinar la probabilidad de que, en una

muestra de 10 tuercas sacadas al azar, dos de ellas sean defectuosas.

1.3.5 Medicina. La prensa informa diariamente sobre nuevos productos para controlar o

prevenir tal enfermedad; o sobre el resultado de varios métodos para curar el cáncer. Para

conseguir esos nuevos productos o métodos, el investigador médico puede usar conejos o ratas,

a los que se inocula el organismo causante de la enfermedad, quizás en varias dosis, frente a un

testigo. Después de tomar cuidadosamente los datos y del análisis estadístico respectivo, es

posible multiplicar nuevas vacunas, sueros, etc.

En el mismo campo médico, por medio de un simple muestreo, et profesional obtiene

inferencias sobre la sangre de sus pacientes, a través del examen de una sola gota.

Así mismo, se puede calcular la probabilidad de que el tercer de una familia que padece de

hemofilia, herede este carácter. O se puede establecer quién es el padre de un niño, cuya madre

tiene grupo sanguíneo O.

1.3.6 Agronomía. El ensayo más sencillo sería la prueba de adaptación de algunas variedades de

trigo, en cierta localidad. Si las condiciones de fertilidad, riego, cuidados culturales, etc., se las

mantiene constantes, el único factor en estudio estará formado por las variedades y así se podrá

establecer cuál es la de mayor rendimiento. Si se quiere obtener mayor información, es posible

usar dosis de fertilizante y/o sembrar las variedades en varias localidades, con lo que se amplía

el alcance de las inferencias.

1.3.7 Información general. Un muestreo bien diseñado puede predecir el resultado de las

próximas elecciones, o informar sobre las preferencias del consumidor.

1.4 Algunos datos históricos.

La Estadística moderna es considerada como una herramienta de trabajo para el investigador.

Producto del siglo 20, para el biólogo cobró especial auge en 1925, cuando Sir Ronald Fisher

publicó sus Métodos Estadísticos para Investigadores.

El término Estadística es muy antiguo y quiere decir aritmética del Estado. Con el objeto de

conseguir para librar guerras, el gobernante antiguo pedía que aquellos se acerquen al

“estadístico" más cercano a cumplir con sus obligaciones.

Posteriormente encontramos una aplicación empírica del cálculo de probabilidades en el seguro

de barcos de que disponían, los flamencos en el siglo XIV. El sistema pudo haber sido

21

especulación o juego de azar, pero ha devenido modernamente en el lucrativo negocio de

seguros.

Los juegos de azar condujeron a la teoría de probabilidades, originada por Pascal y Fermat, a

mediados del siglo XVII.

Charles Darwin, en el siglo IX, basó su trabajo biológico en métodos estadísticos sin embargo,

los problemas planteados por su Teoría de la Evolución, hicieron evidente la necesidad de usar

métodos más refinados y fue Karl Pearson (1936), inicialmente un físico-matemático, quien

aplicó sus conocimientos para mejorar la toma de datos y las evaluaciones respectivas.

Un alumno de Pearson, William S. Gosset -científico y cervecero, desarrolló en forma empírica

lo que hoy se conoce como la distribución de "t de Student", que fue el seudónimo que

empleaba Gosset en sus publicaciones en Biométrica.

Sir Ronald Fisher ha hecho numerosas y valiosas contribuciones en el campo de la Estadística,

particularmente con el análisis de variancia, que es el procedimiento más usado por

investigadores, prácticamente en todo tipo de experimento. Igual es el caso de los análisis de

covarianza y regresión.

1.5 La Estadística y el Método Científico

Es conocido que los investigadores usan métodos científicos dentro de su trabajo diario. Resulta

difícil definir lo que es el método científico, puesto que, en investigación, puede usarse

cualquier sistema ideado por una persona, para llegar a obtener un resultado. Sin embargo, la

mayoría de los procedimientos tienen algunas características en común:

a) Una revisión de hechos, teorías, con miras a

b) Formular una hipótesis lógica, sujeta a ser probada por métodos experimentales.

c) Diseño y conducción del experimento.

d) Evaluación objetiva de la hipótesis, en base a los resultados experimentales.

e) Publicación o divulgación de los resultados.

La ciencia es una rama de estudio que tiene que ver con la observación y clasificación de

hechos. El investigador debe estar en capacidad de observar un evento, como resultado de un

plan o diseño. Este es el experimento, la sustancia del método científico.

La evaluación objetiva de una hipótesis, presenta un problema: no es posible observar todos los

eventos posibles en la naturaleza y, por cuanto las leyes exactas de causa y efecto, son

generalmente desconocidas, va a haber variación entre las observaciones. El científico debe

22

siempre partir de casos particulares, para llegar a generalizaciones (proceso inductivo). Por

cuanto es imposible, o poco práctico, estudiar todo el universo (población), por razones de

costo, tiempo y esfuerzo el investigador debe contentarse con estudiar la muestra y, a partir de

ella, obtener conclusiones sobre la población (inferencia estadística). El proceso inverso, como

nos enseña la lógica, es la deducción, por la que, de una norma o ley generales, se llega a casos

particulares.

23

Capítulo 2

Variación – Variables

Los seres vivos plantas, animales y el hombre difieren, aún dentro de la misma especie, en

muchos caracteres. Puede generalizarse que, inclusive en el caso de gemelos homocigóticos, no

existen dos seres vivos idénticos. Trabajos experimentales realizados en Australia, demostraron

que dos terneras gemelas homocigóticas, llevadas la una a un hato en el que el manejo y

alimentación fueron adecuados; y la otra a un hato en el cual estos aspectos fueron deficientes,

se comportaron de acuerdo con el ambiente en que crecieron, siendo este el último factor,

responsable en 85% de la precocidad y ganancia de peso obtenidos.

Si observamos un potrero de raigrás cultivo de fecundación cruzada a primera vista puede

impresionarnos la uniformidad de las plantas: altura y desarrollo de los tallos; forma, tamaño y

disposición de las hojas; forma y tamaño de la espiga, etc. Pero, si comparamos dos plantas de

raigrás, arrancadas al azar, en detalle y se mide cuidadosamente caracteres cuantitativos de

diferentes partes de la planta, encontraremos que los individuos difieren en varios aspectos.

Habrá notables diferencias en vigor de plántulas, días a floración, producción de forraje,

producción de semilla, etc. De este tipo de variación es justamente de lo que se sirve el fito-

mejorador para la selección y creación de nuevas variedades.

2.1 Variación ambiental y variación hereditaria.

La variación dentro de una especie se deben a:

1) Variaciones debidas al ambiente en que desarrolla una especie y

2) Variaciones debidas a la herencia.

2.1.1 La variación provocada por causas ambientales, puede probarse sembrando plantas de

igual genotipo en diferentes localidades. Esta situación da lugar a la formación de agro tipos y

eco tipos como en el caso de la alfalfa “Nacional”. La semilla de alfalfa, introducida

originalmente del Perú y sembrada en diferentes regiones de la Sierra ecuatoriana, ha dado

origen a eco tipos cuyos individuos varían en caracteres morfológicos y constitución fisiológica

que resultan en mayor o menor altura de planta, resistencia al frío, a la altura, a las

enfermedades, etc.

Dos plantas de trigo de la misma variedad, tendrán desarrollo y rendimiento diferentes, si la una

es atacada por el “polvillo”, mientras a la otra se protege de la infección.

24

Estas variaciones provienen del ambiente en el que desarrollaron las plantas y pueden o no

pueden presentarse en las respectivas progenies.

2.1.2 Las variaciones hereditarias son resultado de la diferente constitución genética

(genotipo), de las plantas o animales. Generalmente, estas variaciones pueden probarse

sembrando diferentes especies o variedades, en condiciones ambientales similares.

Las variaciones hereditarias pueden ser fácilmente observadas: plantas de trigo enanas o altas;

diferencia en el color de la planta, flor o semilla; cantidad de pubescencia en tallos y hojas;

presencia o ausencia de aristas, etc. Existen, desde luego, caracteres más difíciles de identificar

como vigor de plántula, capacidad de macollamiento, resistencia a enfermedades, etc.

Por cuanto estas variaciones son heredables, ellas se manifiestan en la progenie, aun cuando la

intensidad con que se expresen, varíe con el ambiente.

Todo lo expuesto sugiere que genotipo y ambiente no son dos identidades independientes. Más

bien, se sabe que el individuo es el resultado de los dos factores, más la interacción

correspondiente.

2.2 Variables.

Asertos como “Juan es moreno” o “él pasa sobre las 150 libras”, son comunes e informativos.

Se refieren a características que no son constantes y que varían de un individuo a otro.

Variable es, entonces, la cantidad o carácter que pueden ser medidos y se hallan, en

consecuencia, sujetos a variación: edad, peso, altura, temperatura, etc. Las variables pueden ser

cualitativas o cuantitativas.

2.2.1 Variable cualitativa. Es aquella en que cada individuo pertenece a una de varias

categorías mutuamente excluyentes, generalmente no numéricas: color, sabor, nacionalidad. Así

podríamos decir que el color blanco, excluye automáticamente al negro; el sabor agrio, excluye

al dulce. Es claro que el color puede calificarse de acuerdo a una escala relativa numérica, en

cuyo caso podrían analizarse los datos como si fueran cuantitativos.

2.2.2 Variable cuantitativa. Se refiere a datos numéricos: contajes, medidas, pesos, etc.

Variable cuantitativa discreta. Es aquella en que los valores son clasificados en categorías

específicas: número de plantas por surco, número de sépalos en una flor.

Variable cuantitativa continua. Es aquella en que es posible tener todos los valores dentro de

una escala o rango, en forma continua: altura, peso, temperatura.

25

2.3 Observaciones, hechos.

Son elementos o atributos de información: altura de una planta o persona; peso de novillos.

Las observaciones son la materia prima con que trabaja el investigador. Para poder analizarlas,

esas observaciones tienen que estar en forma de números. En agronomía, las cifras pueden ser

rendimientos por parcela o por hectárea; en investigación médica o veterinaria, tiempo de

duración de una vacuna, número de pústulas de acuerdo a varias dosis de un producto dado; en

industria, número de piezas defectuosas en lotes producidos en serie; etc.

Los números constituyen los “datos” y su característica común es la variación o variabilidad.

2.4 Población y muestra.

La primera preocupación del investigador frente a un grupo de datos, es saber si ellos

constituyen la totalidad de individuos u observaciones, o si forman parte de un grupo mayor.

Aun cuando la diferencia entre los dos casos, parezca trivial, es en realidad de gran importancia.

Población. La población o universo consiste de todos los valores posibles dentro de una

variable: todos los estudiantes de un curso, el número de caras en 100 lanzamientos de una

moneda.

Muestra. Es una parte de la población; es una selección de individuos tomados del universo o

población.

La muestra debe ser representativa si vamos a llegar a una inferencia valida sobre la población.

Tal sería el caso de la toma muestras de suelos, encuestas políticas, encuestas sobre preferencias

del público, etc.

Muestra al azar. Es una porción del todo, en la que cada individuo tiene igual oportunidad de

ser incluido (verdadera muestra al azar). No es posible tomar una muestra al azar, si no es por

métodos mecánicos. La influencia subjetiva de una persona, impediría que esa muestra sea al

azar.

Los mecanismos para extraer una muestra al azar se refiere al uso de papeles numerados (caso

de la lotería) o de tablas de números al azar. Si se va a nombrar un jurado parcial, dentro de una

clase, se podría seleccionar a los alumnos de acuerdo con los números impares de la lista. El

caso típico está dado por “las experiencias de papas”: ni al agricultor ni al comprador les

interesa efectuar la compra-venta “al ojo”. Si el primero estima el rendimiento de una hectárea

en 400 quintales, por ejemplo, y el comprador obtiene 500, aquel se abría perjudicado; en caso

contrario, si el cálculo es de 400 quintales y el comprador cosecha 300, éste habría perdido.

26

Con el objeto de que la compra-venta sea equitativa para las dos partes, se procede a realizar las

“experiencias”, que no son sino un muestreo al azar, que consiste en lo siguiente: se cosecha de

tres a cinco surcos separadamente, dentro de una “tabla”. Se multiplica luego el peso promedio

por surco por el número de surcos y así se puede estimar el rendimiento por hectárea.

Otro sistema más preciso, aun cuando requiere de más tiempo, se refiere a “cavar” de tres a

cinco matas por surco, de un total de tres a cinco surcos de la “tabla”. Una vez obtenido el

promedio por mata, se cuenta el número de matas por surco y el número de surcos, con lo que se

puede llegar a estimar el rendimiento por hectárea. De acuerdo con la superficie ocupada por la

cementera, se optara por uno u otro sistema de muestreo.

La tabla N° 1 del Apéndice presenta un grupo de números al azar.

Estadística. Escrita con minúscula, es una cantidad que se refiere o describe a la muestra.

Parámetro. Es una cantidad que se refiere a la población.

2.5 Distribuciones.

Los valores de una variable sirven para describir o clasificar individuos o para distinguirlos

unos de otros. Muchos de nosotros hacemos algo más que describir o clasificar datos, porque

tenemos cierta idea sobre la frecuencia relativa de los valores de una variable. No daríamos

crédito si nos hablan de personas de tres metros de estatura; un niño de ocho libras de peso al

nacimiento, sería algo común, excepto para sus padres. Generalmente asociamos una medida

cualquiera con el valor de una variable, una medida de que tan común o raro es ese valor. En

Estadística se dice que la variable tiene una distribución, una distribución de frecuencias o de

probabilidades. Para una moneda, por ejemplo, la probabilidad de obtener sello o cara es de 0.5.

En la distribución binomial, por ejemplo, los elementos pueden ser clasificados en una de dos

clases o categorías: cara o sello; macho o hembra; defectuoso o no defectuoso; inoculado o no

inoculado, etc. Generalmente se considera a las dos clases como éxito y fracaso, tal como se

verá en la Sec. 7.1.

Otra distribución a la que se adaptan datos correspondientes a variables cuantitativas discretas,

es la distribución de Poisson. Este resulta un modelo apropiado para la distribución de un

número de elementos por unidad de tiempo o espacio, cuando el número promedio de elementos

por unidad es relativamente pequeño. Tal sería el caso que resulta del contaje de huevos de

insectos o larvas por determinada área foliar en papa, por ejemplo; el número de focos que

deben ser remplazados en los semáforos de la ciudad, cada mes; el número de radios

defectuosos producidos en una semana, etc., etc. Como se verá más adelante, este tipo de datos

27

0

10

20

30

40

50

60

0 10 20 30 40 50 60 70 80 90 100

Distribución de frecuencias del coeficiente intelectual

no se distribuyen en forma “normal”, es decir, no se agrupan bajo la campana simétrica que

caracteriza a la distribución normal, la misma que se describe ligeramente a continuación y en

forma amplia en la Sec. 7.2.

Si registramos y tabulamos datos como el cociente intelectual o pesos de un numero d

individuos, vamos a conformar cuadros de frecuencia tal como se verá en la Sec. 5.1. Es decir,

se determina las clases o categorías (el cociente intelectual o el peso en libras) y seguidamente

de frecuencia o número de personas dentro de cada clase. A partir del cuadro de frecuencias, es

posible ubicar los datos dentro de un sistema de coordenadas, en el que las clases se localizan en

el eje de las abscisas(x) y la frecuencia en el de las ordenadas (y). Para la Fig. 2.1, podemos

apreciar que la media o promedio del cociente intelectual de un número dado de personas, es

100, registrándose el mayor número de ellas alrededor de este valor; a los extremos de la curva

(los cocientes más altos y más bajos) y en menor número, se encuentran los individuos de

mayor y menor cociente intelectual. En igual forma, en la Fig. 2.2 se ve que el peso promedio de

30 personas es de 150 libras; aquellas de peso más alto y más bajo se ubican, en menor número

en las colas derecha e izquierda, respectivamente, de la distribución, encontrándose el mayor

número alrededor del valor promedio.

Cuando se grafican datos como altura, edad, peso de personas, temperatura y muchas otras

variables de naturaleza continua, vemos que los datos dan una curva parecida a las Figs. 2.1 y

2.2.

Obreros calificados

Normal 50% Comerciantes

Alumnos escuelas especiales Dirigentes

estudiantiles y profesionales

23%

23%

28

0

10

20

30

40

50

60

0 10 20 30 40 50 60 70 80 90 100

Peso en libras de un grupo de personas

Diferencia mental Atrasados

Superdotados Inteligencia superior

2%

2%

Fig. 2.1 Distribución de frecuencias del coeficiente intelectual

Fig. 2.2 Peso en libras de un grupo de personas

2.6 Presentación de datos.

De acuerdo con el grupo de personas para quien se escribe y presenta datos, puede usarse varios

tipos de Cuadros, figuras y Tablas. Los títulos de Tablas y cuadros se escriben sobre ellos y los

de Figuras en la parte inferior de las mismas. Se numera como Figuras, dibujos a mano, ejes de

coordenadas, fotografías, etc.; se llama Cuadros a los grupos de datos obtenidos de un ensayo

experimental, en tesis de grado, etc.

En caso de que las escalas usadas en ejes de coordenadas no aumentan en forma continua a

partir de cero, se rompe la línea del eje respectivo, como se indica en la Fig. 2.6.

Seguidamente, se presenta algunos tipos de Figuras, las que van de lo más simple a lo más

complicado, debiendo usarse cualquiera de ellas, de acuerdo al grupo de lectores para quienes

va dirigida la publicación.

29

Fig. 2.3 Distribución de estudiantes por Facultades

Fig. 2.4 Numero de insectos atrapados.

Estudiantes por facultades

Filosofía Medicina Ingenieía Arquitectura Leyes

Veterinaria Agropecuaria Oddontología Administración

0

1

2

3

4

5

6

7

8

9

10

Lepidóp. Ortóp. Otros

Numero de Insectos atrapados

Insectos

30

Fuente: Intern. Agric. Develop. Vol. I (9), Octubre, 1981

0

1

2

3

4

5

69 70 71 72

Ton

. mét

r. (

mile

s)

Fig. 2.5 Sistema de "barras" con dos variables

trigo maiz

0

0,5

1

1,5

2

2,5

3

3,5

4

4,5

5

0 50 100 150 200 250 300

Ton

/ h

a

Urea (Kg / ha)

Fig. 2.6 Sistema de línea continua

0

100

200

300

400

500

600

700

7 3 7 4 7 5 7 6 7 7 7 8 7 9 8 0 8 1

Fig. 2.7 Precio mundial del azucar en libras esterlinas por toneladas

31

La forma de presentar cifras en cuadros (bloques compactos de números), podrá ser como sigue:

CUADRO Nº 2.1 Población de ganado Holstein en tres provincias del ecuador, en 1977 y 1978,

por sexo.

1977 1978

Sexo Pichincha Cotopaxi Tungurahua Pichincha Cotopaxi Tungurahua

Machos ------ ------ ------ ------ ------ ------

Hembras ------ ------ ------ ------ ------ ------

CUADRO Nº 2.2 Importación de fertilizantes de Holanda y Alemania de 1976 a 1978, por

Ecuador, Colombia y Chile, en toneladas métricas.

Países Holanda Alemania

Ecuador 1976 1977 1978 1976 1977 1978

Colombia ------ ------ ------ ------ ------ ------

Chile ------ ------ ------ ------ ------ ------

CUADRO Nº 2.3 Matrícula estudiantil en la Universidad Central, por sexo, de 1978 a 1981

Agronomía Medicina Ingeniería Odontología Economía

Año M. F. M. F. M. F. M. F. M. F.

1978 ---------------- ---------------- ---------------- ---------------- ----------------

1979 ---------------- ---------------- ---------------- ---------------- ----------------

1980 ---------------- ---------------- ---------------- ---------------- ----------------

1981 ---------------- ---------------- ---------------- ---------------- ----------------

32

Capítulo 3

Muestreo

3.1 Poblaciones. De acuerdo con la definición común, la población está formada por la

totalidad de habitantes dentro de un área geográfica determinada. Desde el punto de vista

estadístico, una población o universo, está constituida por la totalidad de elementos que poseen

una o más características en común. Así hablamos de la población de radios marca “X”,

producida por una fábrica durante un año; de la población de animales vacunos que posee una

hacienda; de la población de plantas de abacá dentro de un lote; del número de estudiantes del

curso, etc., etc.

La definición estadística de población, no incluye solamente a poblaciones de individuos u

objetos, sino que considera poblaciones de valores numéricos obtenidos al medir una o más

características de personas u objetos como la altura o peso de individuos, el diámetro de tuercas

producidas por una fábrica; o pueden consistir de todos los valores posibles que se puede

conseguir cuando se hace observaciones repetidas, como sería el caso de registrar al número de

caras o sellos al lanzar una moneda mil veces.

El principal objetivo de la inferencia estadística es sacar conclusiones a partir de la muestra,

sobre poblaciones. En consecuencia, es de fundamental importancia específica o definir la

población con la que estamos trabajando. Muchas veces, la población para la que se han

obtenido ciertas inferencias, difiere en algún aspecto importante de la población que produjo los

datos en los que se basó la inferencia.

Siempre existe riesgo cuando se generalizan conclusiones para una población amplia, partiendo

de una población limitada o que no es representativa de aquella. Cuando se realizan pruebas de

adaptación de una nueva variedad en varias localidades o haciendas, dentro de un cantón o

provincia, tendremos seguridad de recomendarla si los resultados fueron satisfactorios para las

localidades o haciendas en las que se hizo el ensayo. Sería peligroso generalizar las

conclusiones y afirmar que la nueva variedad puede sembrase indistintamente en todo el cantón

o provincia.

Esto es así por cuanto conocemos la variabilidad de suelos, clima, prácticas culturales que

existen dentro de un mismo cantón o provincia.

33

Para estudios de tipo sociológico, industrial, económico, etc., nos interesa obtener una muestra

representativa y suficiente que refleje lo más exactamente que sea posible las características de

la población para la que se sacara conclusiones si vamos a tener confianza en las poblaciones.

Cuando se trata de establecer, por ejemplo, la edad promedio de los estudiantes de la

Universidad, o los ingresos de sus padres para adoptar una decisión de carácter económico

debemos realizar un muestreo estratificado formando clases o grupos con características

similares dentro de cada uno.

3.2 Muestras: Cuando queremos obtener datos sobre una población cualquiera, sería ideal si

pudiéramos analizar cada elemento de la población. En la mayoría de los casos, tal

procedimiento seria descartado por razones de tiempo y costo principalmente. Por ejemplo lado,

no se justificaría debido a que, en la práctica, pueden obtenerse resultados precisos, en forma

rápida y con menor costo, estudiando solo una parte de la población. Esta parte de la población

constituye la muestra. En la Sec. 3,5 veremos los diferentes tipos de muestreos que pueden

utilizarse con diversas poblaciones.

3.3 Estimación. En general, debido a que difícilmente se pueden estudiar y analizar una

población íntegra, desconocemos el valor real de los parámetros de la distribución teórica de la

que suponemos que los datos tomados por nosotros constituyen una muestra. Aspiramos

entonces, a que la muestra tomada sea un estimado insesgado (no viciado, confiable) de los

valores poblacionales o paramétricos. Por ejemplo, cuando se cumple con lo que dice el

teorema del límite central (Sec. 2.4), la media de la muestra �� es un estimador de la media

poblacional µ; la desviación típica de la muestra s, es un estimador de la desviación típica de la

población ơ.

3.4 Teorema del límite central. Uno de los teoremas más importantes en lo que se refiere a

distribuciones de muestreo, para series de variables tomadas al azar, independientes,

idénticamente distribuidas, es el teorema del límite central. Se dice que un juego de

observaciones al azar es idénticamente distribuida cuando todos los miembros o elementos del

juego de observaciones han sido seleccionadas de la misma distribución (población).

El teorema en su forma más simple, dice: si se seleccionan muestras al azar de una población

determinada, conforme aumenta el tamaño de la muestra, la distribución se aproxima a la

distribución normal. (Ver Secs. 2.5 y 7.2). Es decir que podemos hacer uso de la teoría sobre

distribuciones normales y de distribuciones de muestreo derivadas de poblaciones normales, con

el objeto de obtener inferencias acerca de la población involucrada, sin tomar en cuenta la forma

o tipo de esta, con tal de que el tamaño de la muestra sea suficientemente grande. El tamaño de

34

la muestra que puede considerarse suficiente en una situación dada, depende del grado en que la

población involucrada se desvía de la normalidad.

3.5 Tipos de muestreo. Sabemos que, a partir de la muestra, se obtienen generalizaciones sobre

la población. La exactitud de aquellas depende del cuidado con que se diseña y ejecuta el

análisis muestral.

Trabajar con la muestra no solo reduce el tiempo sino el costo de obtener la información. Por ser

imposible o impráctico trabajar con la población total, se han creado diseños muestrales,

algunos de los que se trata seguidamente.

El procedimiento o diseño de muestreo que ha de utilizarse depende:

1) El tipo de población de que se trata;

2) De la información deseada; y,

3) De los fondos y tiempo disponibles.

El diseño de muestreo es un plan que especifica cómo se seleccionara la muestra que se ha de

extraer de una población dada.

En general, las poblaciones pueden ser finitas o infinitas. Las casas de un barrio, los agricultores

de una parroquia, el número de cabezas de ganado de una hacienda, son ejemplos de

poblaciones finitas.

Poblaciones infinitas se asocian con algún proceso repetitivo como el de lanzar una moneda,

que puede dar caras o sellos, en forma indefinida; también constituyen poblaciones infinitas, los

individuos u observaciones cuyo contaje o mensuración sería difícil o imposible de establecer:

las bacterias Azotobacter del suelo.

3.5.1 Muestreo aleatorio simple. Si bien el término aleatorio (al azar) puede implicar que las

observaciones son seleccionadas de manera fortuita o casual, las verdaderas muestras aleatorias

requieren de un cuidadoso diseño y ejecución a fin de asegurar la independencia de dichas

observaciones. Si la muestra no es aleatoria, no se puede tener confianza sobre las conclusiones

derivadas de ella.

La selección de muestras aleatorias de una población finita puede ser una tarea larga y tediosa.

Supongamos que se desea estimar la edad promedio de los estudiantes de la Universidad

Central; una persona podría instalarse en la puerta principal y preguntar la edad de cada 100

estudiantes que entren. Esta no sería una muestra aleatoria porque la probabilidad de usar esa

puerta es mayor para cierto grupo de estudiantes que para otros.

35

También se podría telefonear, una determinada noche, al 10% de alumnos que habitan en

Residencia Universitaria; esta tampoco sería una muestra aleatoria, porque es posible que

estudiantes de ciertos cursos tengan mayor acceso a la Residencia o porque determinados

grupos de estudiantes no permanezcan en ella las noches.

Una manera de lograr una muestra aleatoria, sería conseguir una lista completa de todos los

estudiantes matriculados, asignar un número a cada uno, anotarlos en pedazos de papel y, luego

de colocarlos en una caja, seleccionar los números, reponiéndolos cada vez y mezclando los

papeles antes de cada extracción. Esta sería una verdadera muestra al azar, para la que

estaríamos trabajando con todo el universo o población. El proceso, claro está, duraría varios

días y sería impráctico y tedioso dado el alto número de estudiantes que conforman la población

universitaria. Este tipo de muestreo seria utilizable cuando se trata de poblaciones pequeñas,

bien definidas; las rifas o sorteos, como el juego de lotería de Guayaquil emplean muestreos

aleatorios simples, en los que la población está constituida por los números cero a nueve, para

cada una de las cinco fichas que dan los diferentes premios.

3.5.2 Muestreo probabilístico. En este caso, lo primero es fijar el tamaño de la muestra, a fin de

obtener un determinado grado de precisión a la estimación de un parámetro.

Supongamos que el rector de la escuela quiere determinar el coeficiente intelectual de los

estudiantes, a partir de una muestra aleatoria. Al efecto, decide usar la media aritmética y una

muestra al azar formada por los datos contenidos en 50 tarjetas de archivo, el total de alumnos

es de 1000. En este caso el rector estaría trabajando con 5% del estudiantado. Por cuanto sería

impráctico emplear pedazos de papel en los que se halle el número de cada uno de los alumnos,

de acuerdo con el listado de archivo, resulta más fácil recurrir a una tabla de números

randomizados, como la Tabla Nº1 del Apéndice. Dicha Tabla está formada por dígitos

obtenidos……

Estratos Clasificación Número Proporción por

estrato

1 Obreros 800 0,80

2 Administrativo 150 0,15

3 Ejecutivos 50 0,05

Total 1000 1,00

Si seleccionamos una muestra de 80 empleados (8%), por muestreo proporcional, obtendríamos:

36

80 x 0,8 = 64 Obreros

80 x 0,15 = 12 Administrativos

80 x 0,05 = 4 Ejecutivos

Dando un total de 84 empleados, los que serán seleccionados al azar, dentro de cada estrato o

categoría.

En esta forma daríamos cumplimiento a lo establecido por este tipo de muestreo, puesto que a la

población total, se habría dividido en tres subpoblaciones cuyos promedios de ingresos son

diferentes unos de otros, existiendo homogeneidad dentro de cada estrato o subpoblación.

3.5.4 Muestreo sistemático. Para este tipo de muestreo, se incluye cada k-esimo elemento de

una población ordenada, por ejemplo, en forma alfabética. El punto de partida se elige al azar

entre los primeros k elementos y el muestreo se continua, de acuerdo con el intervalo decidido,

hasta completar los n objetos u observaciones. Se podría, por ejemplo, hacer una encuesta

telefónica, llamando a cada quincuagésimo nombre.

El principal inconveniente radica en que las muestras sistemáticas no siempre. Son aleatorias. Si

la población esta ordenada en forma sistemática con respecto a la característica de interés, es

posible que se incluyan más elementos de una clase que de otra. Por ejemplo, si se trata de

averiguar el ingreso de empleados administrativos y obreros de una fábrica.

De gran tamaño, posiblemente van a parecer en la lista de pagos, más obreros que empleados

administrativos, sesgando el ingreso medio general.

En algunos casos, pueden modificarse el sistema cambiando ocasionalmente el punto de partida

y el intervalo entre muestra y muestra.

3.5.5. Muestreo por áreas. O por conglomerados, en que las subdivisiones pueden ser barrios,

distritos, parroquias, cantones, etc.

Se usa este tipo de muestreo, especialmente en encuestas sociológicas, en las que se asignan al

encuestador una porción (conglomerado), de los distintos tipos de personas que han de ser

entrevistadas (grupos sociales, religiosos, profesionales, económicos, etc.). El encuestador hace

la selección aleatoria dentro de conglomerado.

El muestreo por áreas elimina al tener que hacer un listado completo de los elementos de una

población finita. Es adecuado para encuestas a nivel nacional y se puede aumentar el tamaño de

la muestra sin mayor problema.

37

3.5.6 Muestreo dirigido. En este tipo de muestreo, el criterio desempeña un papel importante en

la selección. Puede ser de utilidad si el investigador está bien familiarizado con la población y

puede elegir elementos representativos para la integración de la muestra. El analista debe aplicar

su propio criterio para decidir si una muestra es “buena” o “mala”. La muestra debe ser

representativa si vamos a llegar a obtener una inferencia valida sobre la población. Tal sería el

caso de la toma de muestras de suelo, encuestas políticas, encuesta sobre preferencias del

público, etc. Para la primera situación, el profesional divide el campo de acuerdo con la

homogeneidad aparte de la vegetación y la topografía para, dentro de cada sector o lote

relativamente uniforme, tomar al lazar las muestras que serán analizadas en el laboratorio. Las

recomendaciones sobre el uso de fertilizantes, por ejemplo, se harán en forma separada para los

lotes de los que se extrajo las muestras. Si este trabajo hubiera sido hecho de forma

indiscriminada, para lotes obviamente diferentes, no tendría valor recomendación del

laboratorio.

En el caso de encuestas de tipo político sobre preferencias del público, debe procederse de

manera similar. Diferentes grupos de personas (aspectos raciales, religiosos, económicos,

educativos, etc.), van a tener diversas preferencias y, en consecuencia, conviene separarlas en

grupos a fin de obtener inferencias más precisas sobre las poblaciones involucradas. Como

vemos, este tipo de muestreos son partes dirigidos y parte aleatorios.

3.5.7 Muestreo por cuotas. Es un tipo de muestreo dirigido en el que se fijan cuotas de acuerdo

con ciertos, para, dentro de ellas realizar la selección en base al criterio personal del

entrevistador. Supongamos que se va a investigar sobre el uso de un nuevo detergente y se

decide entrevistar a 500 personas en esta forma: 50% amas de casa; 20% ganaderos y 30%

lavanderías comerciales. Ajustándose a las cuotas señaladas, el entrevistador puede tener cierta

preferencia por ciertos sectores de la ciudad o del campo; o de trabajar ciertas horas del día o

ciertos días de la semana, en las que puede o no puede encontrar a la persona indicada. Para

resolver este problema, la persona podría hacer en la encuesta a la mitad de las amas de casa,

ganaderos y lavanderías pasadas las seis de la tarde o durante los fines de semana.

38

Capítulo 4

Medidas de tendencia central y de dispersión

4.1 Simbología matemática. En estadística se usan algunos símbolos para representar

observaciones. La utilización de dichos símbolos, es lo que constituye la notación de una

expresión matemática.

Como se indica en la Sec. 2.2, la base del trabajo en estadística está formada por variables, las

que se designan generalmente con las letras mayúsculas X, Y, Z. Las primeras letras del

alfabeto, en minúsculas, sirven para designar constantes.

Uno de los signos de mayor uso en Estadística, es la letra griega mayúscula ∑ (sigma), que

significa “la suma de” o “sumatoria de”.

Una observación cualquiera se representa por X1 y, si existen varias observaciones, ellas serán

x1, x2, x3,…….,xn. Es decir que la letra i en X1, llamada subscrito o índice, representa cualquiera

de los valores 1, 2, 3,………,..n. Si tenemos los números 6, 8, 4, 12, la suma de ellos está dada

por

∑4i=1 Xi = X1 + X2 + X3 + X4

= 6 + 8 + 4 + 12 = 30

En general ∑4 i=1 Xi = X1 + X2 + X3 +……..+Xn, que dice la suma de las X1, desde i = 1 hasta n

(la enésima o última observación), es igual a la suma total de las observaciones. Algunos

autores representan ∑ Xi como ∑X.

∑ni=2 Xi = X2 + X3 +…. + Xn

En las que no se toman en cuenta x1 y se suma desde x2 hasta xn.

Otras dos expresiones de uso común son ∑Xi2 y (∑xi)2. La primera representa “la suma de los

cuadros de las X”, es decir

∑4i=1 Xi

2 = X12+ X2

2+ X32+……+ Xn

2

En el ejemplo anterior,

∑4i=1 Xi

2 = X12+ X2

2+ X32 +……+ Xn

2

39

La segunda expresión (∑ Xi)2 representa “el cuadrado de la suma de X”, es decir

(∑n Xi)2 i=1 = (x1 + X2 + X3 + Xn)2

En el ejemplo,

(∑4 Xi)2 i=1 = (6 + 8+ 4 + 12)2 = 302 = 900

Seguidamente, se da algunas notaciones y su desarrollo:

a) ∑nj=1 XjYj= X1 Y1 + X2 Y2 +X3 Y3 +…….+ XnYn

b) ∑5i=1 (xi+2) = (x1 + 2) + (x2 + 2) + (x3 + 2) + (x4 + 2) + (x5 + 2)

= x1+ x2 + x3 +x4+ x5+ 10

c) ∑5i=2(4 Xi Yi) = 4 X2Y2+ 4 X3Y3+ 4 X4Y4+ 4 X5Y5

d) ∑4j=2(FjXj

3)= F1X13+ F2X2

3+ F3X33+ F4X4

3

e) Si x1 = 2, x2 = -5, x3 = 4, x4 = -8

Y1 = -3, y2 = -8, y3 = 10, y4 = 6, calcular:

∑Xi, ∑Yi, ∑XiYi, ∑Xi2, ∑Yi

2, (∑Xi) (∑Yi), ∑XiYi2

∑Xi= (2) + (-5) + (4) + (-8) = -7

∑Yi = (-3) + (-8) + (10) + (6) = +5

∑Xi Yi= [(2) (-3) + (-5) (-8) + (4) (10) + (-8) (6)] = +26

∑Xi2= (2)2 + (-5)2+ (4)2 + (-8)2= 109

∑Yi2= (-3)2 + (-8)2 + (10)2 + (6)2 = 209

(∑Xi) (∑Yi) = (-7) (5) = -35

∑Xi Yi2 = [(2) (-3)2 + (-5) (-8)2 + (4) (10)2 + (-8) (6)2] = -190

40

Cuando se trata de una observación formada por dos o tres componentes, se usa el símbolo Xjj y

Xijk, respectivamente, en cuyo caso la suma total de las X se representa así:

∑ni=1 ∑n

j=1 Xij y ∑ni=1 ∑n

j=1 ∑nk=1 Xijk

O simplemente, ∑i ∑jXij y ∑i ∑j∑k Xijk

Si, para un cálculo dado, los componentes j son mayores que los i, se escribe,

∑i<∑jo ∑i ≠ ∑jXij

Como puede apreciarse en el cap. IX, existen combinaciones más complejas que las expuestas al

comienzo del presente Capitulo. En esos casos es necesario comprender claramente las

notaciones, a fin de evitar errores. Si, para cruzamientos di alélicos, por ejemplo, el número de

progenitores p= 3, tendríamos el siguiente cuadro de 3 x 3:

(Progenitor i)

(Progenitor i)

X11 X12 X13 X 1.

X21 X22 X23 X 2.

X31 X32 X33 X 3.

∑ X.1 X.2 X.3 X. .

El cruzamiento, u observación x23, corresponde a xij. El cuadro presentado correspondería

también a cualquiera combinación de dos factores, cada uno de los cuales tiene tres niveles.

Haciendo nuevamente referencia el cap. 19, las notaciones para los diferentes cruzamientos,

serian:

Xi. = ∑j Xij= Xi1Xi2 + Xi3

X.j = ∑iXij= X1jX2j + X3j

X... = ∑j ∑i Xij= X11 X12+…..+ X33 (todas las nueve observaciones)

X... = ∑i ≤∑jXij= X11 + X12+ X13+ X22+ X23+ X33

41

Xi. = ∑j≠iXij = p. ej: X2.= X21+ X23

X.j = ∑i ≠j Xij = p. ej: X.2= X12+ X32

X... = ∑∑i ≠ j Xij= X12+ X13+ X21+ X23+ X31 + X32

4.2 Funciones.

Decimos que Y es función de X, corresponde un valor de Y; es decir, existe dependencia

funcional de Y en X, la que se representa como Y =f (X).

Si suponemos que el rendimiento R, es función de fertilizante Escribimos: R = f (F).

Si Y = f (X), se acostumbra a indicar “Y” es función de X, cuando X vale tanto”. Por ejemplo,

si X =5, Y =3, sería igual a

Y = 3 (5) – 3 = 12

4.3 Redondeo de cifras.

Cuando se trabaja con decimales, y se necesita cierto grado de precisión, el investigador debe

ser consistente en el redondeo de números. Así de evita acumular errores por redondeo, cuando

se trabaja con un número crecido de cifras.

En general, la idea es aproximar el número a la cifra que se encuentra más cerca, superior o

inferior. En el caso de 103.7 el redondeo es hacia 104. 0, puesto que 103.7 está más cerca a

104.0 1que a 103.0. Así mismo, 34.2246, se redondearía, si se quiere dos decimales, a 34.22 y

no a 34.23. En el caso de 34.465, la cifra quedaría como 34.46 y no 34.47, de acuerdo al criterio

generalizado de redondear al centésimo más bajo, cuando este es un número par y el milésimo

es 5 o mayor, si el centésimo fuera un número impar, el redondeo seria el centésimo más alto:

34.475 quedaría como 34.48.

4.4 Parámetros y estadísticas.

Como se ha indicado en la Sec. 2.4, los parámetros son cantidades fijas, que describen o definen

la población, en tanto que las estadísticas son cantidades variables que definen la muestra. En el

último caso, la estadística es una cifra y no una ciencia que nos ocupa. Son de uso común en

Estadística, los símbolos que se indican seguidamente, para representar parámetro y estadísticas.

42

Parámetros (Población) Estadística

(Muestra)

Media µ (miu) X

Varianza 𝜎2 𝑆2

Desviación típica 𝜎 s

Desviación típica de las medias Sx

Desviación típica de la diferencia Sd

z

t

𝑋2

Por cuanto el investigador trabaja generalmente con muestras, para a base de ellas, sacar

conclusiones sobre la población, se hace constar solo como estadísticas las cantidades dadas por

z, t, y X2, así como Sx y Sd.

4.5. La media y otras medidas de tendencia central.

Cuando se presenta datos, generalmente se hace referencia a un valor central (𝑥−), y a otro que

denote el grao de dispersión o variación en un juego de datos. Esta última cifra nos indicaría que

valores se hallan alrededor de la media (del centro) y cuales se alejan hacia los extremos.

Expresiones como “Juan es de altura mediana”, son vagas, aun cuando dan alguna información

general. Se refieren a que, si la altura promedio de la población ecuatoriana, por ejemplo, es de

1.65, la estatura de Juan se halla alrededor de esa cifra.

Sin embargo, cuando el investigador colecta datos que implican gasto de tiempo, dinero y

esfuerzo, él no puede darse el lujo de tener informaciones vagas. En investigación de cualquier

tipo, es necesario una medida precisa de tendencia central, la que nos da un resumen parcial de

los datos.

43

A pesar de que estas medidas de tendencia central son útiles, nos dan información alguna sobre

la variación de los datos, es decir, qué valores se hallan al centro y cuáles se ubican hacia los

extremos. Tal sería el caso al determinar el sueldo promedio mensual de una institución: si el

jefe gana $15.000,00; ocho funcionaros intermedios ganan $ 8.000,00 y 10 empleados inferiores

ganan $ 2.500,00, el sueldo promedio mensual para la institución, sería de $ 5.473,00 valor que

no refleja la remuneración del jefe, ni la de los empleados inferiores.

Seguidamente, vamos a tratar sobre las medidas más comunes de tendencia central, que son la

media aritmética o promedio, la mediana y el modo.

4.5.1. La media aritmética

La media de un grupo formado por n números, x1, x2, x3……..xn, se denota por x- (equis barra) y

se define como,

�� = 𝑥1 + 𝑥2 + 𝑥3 + ⋯ … … … … … . + 𝑥𝑛

𝑛= ∑ 𝑥1

𝑛

𝑖=1

/𝑛 = ∑𝑥

𝑛

Por ejemplo la media de los números 6, 8, 10, 12 y 14 es

�� = 6 + 8 + 10 + 12 + 14

5=

50

5= 10

Si los números x1, x2, x3……..xn, aparecen con frecuencia f1, f2, f3……….fn, la media será,

�� = 𝑓1𝑥1 + 𝑓2𝑥2 + 𝑓3𝑥3 + ⋯ + 𝑓𝑘𝑥𝑛

𝑓1 + 𝑓2 + 𝑓3 … … … . + 𝑓𝑘=

∑ 𝑓1𝑥1𝑛𝑖=1

∑ 𝑓1𝑛𝑖=1

= ∑ 𝑓𝑥

𝑛

𝐷𝑜𝑛𝑑𝑒 𝑛 = ∑ 𝑓 , 𝑙𝑙𝑎𝑚𝑎𝑑𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑡𝑜𝑡𝑎𝑙

Por ejemplo si tenemos los números 4, 8, 12 y 14, que aparecen con frecuencia 2, 4, 3 y 1,

respectivamente, la media será,

�� = (2)(4) + (4)(8) + (3)(12) + (1)(14)

2 + 4 + 3 + 1=

8 + 32 + 36 + 14

10=

90

10= 9

Media ponderada. A veces se asocia a los números x1, x2, x3……..xn con ciertos factores

llamados de ponderación w1, w2, w3……..wk; cuyo caso

�� = 𝑤1𝑥1 + 𝑤2𝑥2 + 𝑤3𝑥3 + ⋯ + 𝑤𝑘𝑥𝑛

𝑤1 + 𝑤2 + 𝑤3 … … … . + 𝑤𝑘=

∑ 𝑤1𝑥1𝑛𝑖=1

∑ 𝑤1𝑛𝑖=1

44

Propiedades de la media aritmética

a) La suma algébrica de las desviaciones de un grupo de números, desde su media, es igual

a cero. Por ejemplo, la media de los números 4, 8, 12, 14 y 16, es �� = 54

5= 10.8.

𝐿𝑎𝑠 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑛ú𝑚𝑒𝑟𝑜, 𝑐𝑜𝑛 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑠𝑜𝑛:

𝑥1 �� 𝑥1 − ��

4 10.8 -6.8

8 - 2.8

12 +1.2 = 0; ∑ (𝑥1 − ��𝑛𝑖=1 ) = 0

14 + 3.2

16 + 5.2

b) La suma de los cuadrados de las desviaciones de un grupo de números 𝑥1, desde un

número cualquiera a es un mínimo, si y solo si 𝑎 = ��.

c) Si 𝑓1 números tiene media 𝑚1, 𝐹2números tienen media 𝑚2 ………. 𝐹𝑘 números tienen

media 𝑚𝑘, la media de todos los números es,

�� = 𝐹1𝑚1 + 𝐹2𝑚2 + 𝐹3𝑚3 + ⋯ + 𝐹𝑘𝑚𝑛

𝐹1 + 𝐹2 + 𝐹3 … … … . + 𝐹𝑘

Es decir que �� es una media ponderada de todas las medias.

4.5.2. La mediana

La mediana de un grupo de números arreglados en orden de magnitud, es el valor medio (en

posición), o la aritmética de los valores centrales. Por ejemplo en las series,

4, 8, 8, 10, 12, 14, 18, 18 20, la mediana es 12

4, 6, 8, 8, 12, 13, 13, 16, la mediana es 8 +12/2 = 10

4.5.3 El modo

El modo de un grupo de números, es el valor que aparece con mayor frecuencia. Es decir que no

puede existir modo, o ‘este puede no ser único.

= -9.6

= +9.6

45

4.6 La desviación típica y otras medidas de dispersión

Como se indicó en la Sección precedente, se llama variación o dispersión de los datos, al grado

en que éstos se ubican hacia los extremos de un valor promedio. Las dos medidas más comunes

de dispersión son el rango y la variancia.

4.6.1 El rango

Es una medida muy fácil de establecer y se refiere a la diferencia entre el valor más alto y el

más bajo, dentro de un grupo de datos. Por ejemplo, en los números,

4, 6, 7, 8, 12 y 23, el rango es 23 – 4 =19

Como puede verse, el rango nos da una idea sobre el grado de variación de los datos.

4.6.2 La variancia

Llamada también varianza o cuadrado medio, es el cuadrado de la desviación típica (Sec.

4.6.3) y todas las propiedades de ésta, se aplican a aquélla. Se representa a la variancia de la

población por 𝜎2 y a la de la muestra por 𝑠2.

Estadísticamente, se define a la variancia como la suma de cuadrados de las desviaciones de un

grupo de números con respecto a su media, dividida por el número de desviaciones menos uno

(para el caso de la muestra. Para poblaciones finitas, se divide la suma de cuadrados de las

desviaciones para N (el total de observaciones). Este concepto tiene que ver con el de grados de

libertad, el cual se discute ampliamente en la Sec. 15.2.

El concepto de varianza puede ser algo difuso para el estudiante. Para aclararlo, vamos a

servirnos de un ejemplo que es familiar para todos.

En caso de la clasificación de huevos para la venta al público, encontramos que al momento de

recoger los huevos, en el criadero avícola, van a ver huevos muy grandes y otros muy pequeños,

en cuyo caso su varianza va a ser grande, Después de clasificarlos por tamaño, para ponerlos en

los cartones conocidos, los huevos serán más o menos uniformes, en cuyo caso la varianza será

pequeña. Si todos los huevos fueran idénticos, su varianza sería cero.

La fórmula de definición de la varianza está dada por,

𝜎2 = ∑ (𝑥1 − 𝜇)2𝑛

𝑖=1

𝑁=

∑ 𝑥2

𝑁, 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

𝑠2 = ∑ (𝑥1 − ��)2𝑛

𝑖=1

𝑛 − 1=

∑ 𝑥2

𝑛 − 1, 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

46

Si x1, x2, x3……..xn observaciones ocurren con frecuencia f1, f2, f3……….fk, la fórmula sería,

𝜎2 = ∑ 𝑓1(𝑥1 − 𝜇)2𝑛

𝑖=1

𝑁=

∑ 𝑓𝑥2

𝑁, 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑦

𝑠2 = ∑ 𝑓1(𝑥1 − ��)2𝑛

𝑖=1

𝑛 − 1=

∑ 𝑓𝑥2


Las fórmulas de definición pueden usarse cuando el número de observaciones es pequeño. Para

el caso de análisis de datos provenientes de ensayos experimentales, en los que el número de

datos es crecido, se usa la fórmula de trabajo, que da idénticos resultados:

𝜎2 = ∑ 𝑥1

2 −(∑ 𝑥1)

2

𝑁𝑛𝑖=1

𝑁, 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑦

𝜎2 = ∑ 𝑥1

2 −(∑ 𝑥1)2

𝑛𝑛𝑖=1


Como se verá en el Cap. 15, ∑ 𝑥12𝑛

𝑖=1 en lo que se llama la suma de cuadrados no corregidos, y

(∑ 𝑥1𝑛𝑖=1 )2/𝑛, el factor de corrección y n – 1, los grados de libertad. Los dos términos del

numerador constituyen la suma de cuadrados y el cociente que resulta de dividir la suma de

cuadrados por los grados de libertad, se denomina la variancia o cuadrado medio.

Para demostrar el uso de las dos fórmulas para el cálculo de la variancia –la fórmula de

definición así como la de trabajo –vamos a utilizar la muestra constituida por los siguientes

datos. Por definición, el resultado debe ser idéntico.

3, 5, 6, 2, 4, 6, 2,

La fórmula de definición para la muestra está dada por:

𝑠2 = ∑ (𝑥1 − ��)2𝑛

𝑖=1

𝑛 − 1

Peso 1: encontrar la suma de cuadrados (el numerador):

∑ 𝑋1 = 3 + 5 + 2 + 6 + 4 + 6 + 2 = 28

�� = ∑𝑥1

𝑛

𝑛

𝑖=1

= 28

7= 4

47

𝑥1 − �� -1 1 +2 -2 0 +2 -2

(𝑥1 − ��)2 1 1 4 4 0 4 4 = 18

∑(𝑥1 − ��)2 = 18

7

𝑖=1

Paso 2: para obtener la variancia, dividir la suma de cuadrados (el numerador), para los grados

de libertad (n – 1).

𝑠2 = ∑ (𝑥1 − ��)2𝑛

𝑖=1

𝑛 − 1=

18

6= 3.00

Paso 3: para calcular la desviación típica, extraemos la raíz cuadrada de la variancia:

𝑆 = √𝑆2 = √3.00 = 1.73

Si queremos usar la fórmula de trabajo, para el mismo juego de datos, procederíamos así:

Paso 1: calcular la suma de cuadrados no corregidos (el primer término del numerador):

𝑆2 = ∑ 𝑥1

2 −(∑ 𝑥1)2

𝑛𝑛 − 1

∑ 𝑥12 = 32 + 52 + 62 + 22 + 42 + 62 + 22 = 9 + 25 + 36 + 4 + 16 + 36 + 4 = 130

Paso 2: calcular el factor, de corrección (segundo término del numerador):

(∑ 𝑥1)2

𝑛=

282

7= 112

Paso 3: calcular la suma de cuadrados, corregidos:

∑ 𝑥12 −

(∑ 𝑥1)2

𝑛= 130 − 112 = 18

Paso 4: dividir la suma de cuadrados corregidos para los grados de libertad:

𝑆2 = 18

6= 3.00

48

Y la desviación típica: 𝑆 = √3.00 = 1.73

A pesar de que las dos fórmulas dan igual resultado, es preferible usar la fórmula de trabajo, la

que elimina o reduce errores por redondeo, los que se producen al usar la fórmula de definición.

4.6.3 La desviación típica.

Como se anotó en la Sección precedente, la desviación típica no es sino la raíz cuadrada de la

variancia,

𝜎 = √∑ (𝑥1 − 𝜇)2𝑛

𝑖=1

𝑁=

√∑ 𝑥12 −

(∑ 𝑥1)2

𝑁𝑁

, 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑦

𝑆 = √∑ (𝑥1 − ��)2𝑛

𝑖=1

𝑛 − 1=

√∑ 𝑥12 −

(∑ 𝑥1)2

𝑛𝑛 − 1

, 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Para demostrar la relación entre el rango y la variancia, vamos a comprar cinco grupos de datos

(poblaciones):

Grupo ∈ 𝝁 rango 𝝈𝟐 𝝈

a) 6, 6, 6 18 6 0 0 0

b) 4, 6, 8 18 6 4 2.66 1.63

c) 3, 7, 8 18 6 5 4.66 2.15

d) 2, 6, 10 18 6 8 10.66 3.26

e) 0, 1, 17 18 6 17 60.66 7.78

𝑎) 𝜎2 = (6 − 6)2 + (6 − 6)2 + (6 − 6)2

3= 0

a) 𝜎2 = (4−6)2+(6−6)2+(8−6)2

3=

8

3= 𝟐, 𝟔𝟔

b) 𝜎2 = (3−6)2+(7−6)2+(8−6)2

3=

14

3= 𝟒, 𝟔𝟔

c) 𝜎2 = (2−6)2+(6−6)2+(10−6)2

3=

32

3= 𝟏𝟎, 𝟔𝟔

49

d) 𝜎2 = (0−6)2+(1−6)2+(17−6)2

3=

182

3= 𝟔𝟎, 𝟔𝟔

Como vemos, la media de los cinco grupos es la misma, pero el rango, 𝜎2 y 𝜎 van creciendo,

conforme aumenta el grado de dispersión de los datos, alrededor de 𝜇 = 6; esta es la variación

que se pretendió ilustrar con el ejemplo de los huevos.

4.7. Cambios en las observaciones y su influencia en 𝝁 y 𝝈𝟐 .

Es de esperar que, al cambiar las observaciones, la media y la varianza cambiarán. Al respecto,

se puede establecer dos teoremas.

4.7.1. Si se suma o resta.- Un valor fijo a cada una de las observaciones, la media aumentará o

disminuirá en tal valor, pero la varianza y la desviación típica no se alteran.

En el juego de datos, 12, 13 y 14, su media es𝝁 = 𝟑𝟗

𝟑= 𝟏𝟑.

Si sumamos 10 a cada observación, los nuevos valores son 22, 23 y 24, y su media 𝝁 = 𝟑𝟗

𝟑=

𝟏𝟑, que es justamente 10 más que la media original.

Si restamos 10 de cada observación, los nuevos valores son 2, 3 y 4 y su media 𝝁 = 𝟗

𝟑= 𝟑, que

es 10 menos que la media original. La varianza, en cambio, no se altera.

𝜎2 = (12 − 13)2 + (13 − 13)2 + ( 14 − 13)2

3=

1 + 0 + 1

3=

2

3= 𝟎, 𝟔𝟔

Si añadimos 10 a cada observación,

𝜎2 = (22 − 23)2 + (23 − 23)2 + (24 − 23)2

3=

1 + 0 + 1

3=

2

3= 𝟎, 𝟔𝟔

4.7.2. Si se multiplica.- Cada observación por un valor fijo m, la nueva media es m veces la

original; la nueva varianza es 𝑚2 veces la varianza original y la nueva desviación típica es m

veces la desviación típica original.

En el ejemplo anterior, 12, 13 y 14, sabemos que 𝜇 = 13.

La varianza original es 0,66. La nueva varianza será:

𝜎2 =2

3 ; 𝜎 = √

2

3=√0,66 = 𝟎, 𝟖𝟏

50

Si multiplicamos las observaciones por m=10, los nuevos valores serán 120, 130 y 140, su

media 𝜇 = 30, que es justamente m veces, o sea 10 veces mayor que la media original 13.

𝜎2 = (120 − 130)2 + (130 − 130)2 + (140 − 130)2

3=

100 + 0 + 100

3=

200

3= 𝟔𝟔, 𝟔𝟔

Que es justamente 𝑚2 veces la varianza original.

La nueva desviación típica será:

𝜎 = √200

3=√66,66 = 𝟖, 𝟏, que es m veces la 𝜎 original.

Estos mismos principios se aplican a la división, puesto que no es sino una multiplicación

fraccionaria.

4.8. Desviación típica de las medias.

De una población de observaciones, es posible sacar sub-muestras, las que tendrán su propia

�� 𝑦 𝑠. Dichas estadísticas constituyen una población de �� 𝑦 𝑠 y, naturalmente, se hallan sujetas a

variación. Se esta que esta variación va a ser menor que la existente entre las observaciones

individuales, a las cuales representan.

Para la población,

𝝈𝝁𝟐 =

𝝈

𝑵; 𝝈𝝁 = √

𝝈𝟐

𝑵=

𝝈

√𝑵

Para la muestra,

𝑺𝒙𝟐 =

𝑺𝟐

𝒏 ; 𝑺𝒙

− = √𝑺𝟐

𝒏=

𝑺

√𝒏

Supongamos que tenemos la muestra formada por los números 4, 6, 8 y 10; para los que

𝑆2=6,66 y S= 2,58.

𝑆𝑥− =

𝑆

√𝑛=

2,58

√4=

2,58

2= 𝟏, 𝟐𝟗

O también, 𝑆𝑥− = √

𝑆2

𝑛= √

6,66

4= √1,64 = 𝟏, 𝟐𝟗

51

4.9. Coeficiente de variación, (C.V.).

Es una medida relativa de variabilidad, independiente de las unidades de medida, en contraste

con la desviación típica, la que se expresa en las mismas unidades de medida que las

observaciones cuyo grado de homogeneidad establece.

El coeficiente de variación para peso de estudiantes será el mismo si los datos se registran en

libras, kilogramos, toneladas, etc. Se puede comparar el coeficiente de variación para pesos de

caballos con el de pollos. De hecho, si queremos comparar el grado de dispersión de dos juegos

de datos que tienen diferentes medias, es más interesante comparar los coeficientes de variación

que las desviaciones típicas correspondientes. Si un tipo de vacuna da una protección de 12

meses con S= 30 días, y otro tipo de vacuna con una duración de 24 meses con S=60 días, y otro

tipo de vacuna con una duración de 24 meses con S=60 días, parecía que el segundo tipo es el

más variable. Sin embargo, si observamos que los coeficientes de variación son de 25 y 14%,

respectivamente, concluiremos que, con relación a su duración promedio, la primera vacuna es

más variable.

El coeficiente de variación es generalmente mayor en ensayos con animales que con plantas y

en el campo que en ensayos de invernadero, donde las condiciones ambientales son controladas.

El investigador usa el C.V. para evaluar resultados de diferentes experimentos que tratan sobre

el mismo factor y que han sido llevados a cabo por diferentes personas. El C.V. mide también el

grado de precisión del diseño y de la conducción del experimento. Por ejemplo, si en la siembra

de las parcelas experimentales, o en la fertilización, se emplea jornaleros, podemos estar seguros

de que el C.V. puede acercarse al doble de lo que sería, en caso de usar maquinaria o equipos

calibrados. Esto es especialmente cierto en situaciones en las que se utiliza varios jornaleros

indistintamente para efectuar cierta labor, la misma que debiera realizarse uniformemente para

todas las parcelas dentro del bloque o repetición.

Para decidir si un C.V. es grande o pequeño, es necesario tener experiencia sobre datos

similares.

Se define al C.V. como la desviación típica de la muestra, expresada como porcentaje de la

muestra.

𝑪. 𝑽. =𝑺

𝒙(𝟏𝟎𝟎)

En la Sec. 4.11 se ilustra el uso del C.V.

52

4.10. Modelo lineal aditivo.

El desdoblamiento de los componentes que forman una observación cualquiera Xi da lugar a un

modelo que, en su forma más simple, consiste de la media más un error.

𝑿𝒊 = 𝝁 + 𝝐𝒊

Se supone que los 𝜖𝑖 son al azar y provienen de una población de ∈ con media cero, es decir que

la población de 𝑋𝑖 ha ido muestreada al azar.

El tamaño del error será menor conforme aumenta el tamaño de la muestra y, en ese caso,

podemos decir que �� es un buen estimador de 𝜇.

En el caso de un diseño de bloques completos al azar (ver Sec. 16.2), el modelo lineal aditivo

está dado por:

𝑿𝒊𝒋 = 𝝁 + 𝝉𝒊 + 𝜷𝒋 + 𝝐𝒊𝒋

En el que, a la medida de una observación 𝑋𝑖𝑗, se suman los efectos de tratamientos, bloques y

del error experimental.

4.11. Intervalos de confianza.

A partir de los datos de la muestra, es posible inferir sobre la ubicación de 𝜇. Este es un proceso

inductivo, en el que se razona de la parte al todo. Puesto que �� es una variable (población de ��),

dudaríamos de afirmar que 𝜇 está en ��. Sería preferible llegar a un intervalo, quizás con �� al

centro, y afirmar que confiamos en que 𝜇 se halla dentro de ese intervalo.

En la forma más simple, esta afirmación podría escribirse así,

𝑃(3 < 𝜇 < 6) = 𝟗𝟓

Es decir, que la probabilidad de que 𝜇 se encuentre comprendida entre tres, límite inferior, y

seis, límite superior, es de 95%. En otras palabras, hay cinco probabilidades entre 100 o una

entre 20, de que esta afirmación sea equivocada.

A fin de tener mayor grado de confianza en la predicción, se utiliza la estadística t. de Student,

la que se presenta con amplitud en el Cap. 10.

𝒕 =�� − 𝝁

𝑺��

53

Fórmula en que la única incógnita es 𝜇. Para el cálculo estadístico de los intervalos de

confianza, buscamos el valor tabular de t el que es parte de la fórmula.

𝑃 = [𝑥 − (𝑡.05)(𝑆��) < 𝜇 <��+ (𝑡.05)(𝑆��)] = 𝟎, 𝟗𝟓

Donde t es el valor tabular al 95% de probabilidades, de acuerdo con el número de grados de

libertad (n-1). En la tabla V del Apéndice encontramos, por ejemplo, que el valor de t al 95%

(0,05), para seis grados de libertad, es 2,447.

Como la ilustración, supongamos que se ha probado siete muestras de una nueva variedad de

maíz y queremos predecir el rendimiento de la variedad (población), en una localidad dada. Los

siguientes son los rendimientos obtenidos:

Localidad Rendimiento

1 80

2 62

3 75

4 48

5 76

6 82

7 60

483

�� =483

7= 𝟔𝟗

𝑺𝟐 =∑𝑿𝒊

𝟐 − (∑𝑿𝒊𝟐)/𝒏

𝒏 − 𝟏

=34,273 − 233,289/7

7 − 1=

34,273 − 33,327

6

=946

6= 158; 𝑠 = √158 = 𝟏𝟐, 𝟓𝟔 𝒒𝒒

54

𝑠𝑥 : √𝑠2

𝑛= √

158

7= √22,57 = 𝟒, 𝟕𝟓

𝑠𝑥 :12,56

√7= 𝟒, 𝟕𝟓

𝐶. 𝑉. = 𝑠

��(100) =

12,56

69(100)=18%

𝑡.05 = (6𝑔. 𝑑𝑒 𝑙. ) = 𝟐, 𝟒𝟒𝟕

Intervalo de confianza, al 95%,

𝑃[�� − (𝑡.05)(𝑠𝑥 ) < 𝜇 < �� + (𝑡.05)(𝑠𝑥 )] =, 𝟗𝟓

69 − (2,447)(4,75) < 𝜇 < 69 + (2,447)(4,75)

𝟓𝟕, 𝟑𝟖 < 𝜇 < 80,62

Fig. 3.1. Ubicación de 𝝁 e intervalos de confianza.

La media de la muestra ��=69 y la desviación típica s=12,56, nos dan los mejores estimados de

los parámetros correspondientes 𝜇 𝑦 𝜎, respectivamente. Puesto que nuestro interés está en el

rendimiento de la población (variedad de maíz), cuya muestra hemos probado, se ha calculado

un intervalo y afirmamos que 𝜇 se encuentre entre 57,40 y 80,60, con una probabilidad de 95%

de estar en lo cierto.

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

0,2

0 5 10 15 20

55

Para aclarar de otro modo el significado del intervalo de confianza, digamos que queremos

determinar si la utilización de un balanceado X es económica. El costo del producto es tal, que

su uso sería económico solo en el caso de que deje una ganancia de peso, en novillos de

engorde, de 1,5 libras diarias, en promedio. Si después de realizar el experimento respectivo,

encontramos que los límites de confianza al 95%, sor de 1,8 y 2,0 libras diarias, estaríamos

seguros de que conviene usar el balanceado. Pero si los límites de confianza son de 1,0 y 1,2

libras, se descartaría el empleo del producto. Habría duda, en caso de que los límites fueran 1,0

y 2,0 libras, porque puede haber una pequeña ganancia o una pequeña pérdida; en todo caso

habría riesgo al hacer la recomendación. Lo adecuado sería repetir el ensayo.

56

Capítulo 5

Cuadros de Curvas de Frecuencia –Histogramas

5.1 Cuadros de frecuencia

En el Sec. 2.6 se indicó la forma de presentar datos numéricos en formas gráficas. A veces

este sistema llama la atención del lector no especializa dado, más que si los datos tuvieran

instruidos en un cuadro numérico. De todos modos, cuando se dispones de una gran cantidad de

cifras, es útil para el investigador, tabularlas antes de confeccionar cuadros, figuras o proceder

a cualquier tipo de análisis. Por otro lado, para ciertos tipos de revistas científicas , es

importante presentar en un cuadro compacto, el resumen de los datos incluye la frecuencia de

las observaciones dentro de cada clase o categoría . A este resumen se llama justamente

cuadro de frecuencia .Los datos que se encuentran desordenados en el libro de campo

pueden, en esa forma ser manejado más fácilmente finalmente , de esos cuadros de frecuencia

se puede calcular x, s2 y s, en forma más fácil que a partir de los datos originales .

Supongamos que tenemos los pesos de los de 10 cerdos en libras.

80, 85, 80,70, 75, 80, 75, 80,70y75

Para determinar la frecuencia de clase, es útil confeccionar un cuadro de control, como el

cuadro N° 5.1

CUADRO Nº 5.1 Control de datos

Clase Control Recuento

70

75

80

85

//

///

////

/

TOTAL

2

3

4

1

10

57

Del cuadro puede apreciarse que existen dos cerdos de 70 libras, tres de 75, cuatro de 80 y6

uno de 85 libras .Es decir que del grupo desordenado de datos, se a formado un cuadro

subgrupos o clase

El número de observaciones o individuos dentro de cada clase, se llama frecuencia de clase.

El número total de observaciones de toda la clase, se llama frecuencia total. Una vez

establecidas la clase, se puede determinar la frecuencia relativa y acumulada de las

observaciones, como se indica en el cuadro Nº 5.2.

CUADRO Nº 5.2 Frecuencia relativas y acumuladas de clase:

Peso (x) Frecuencia (f) Frecuencia relativa

(f. r)

Frecuencia

acumulada

(f. a )

70

75

80

85

2

3

4

1

20%

30%

40%

10%

20%

50%

90%

100%

Total : 10 100%

La frecuencia relativa indica el porcentaje de individuos dentro de cada clase, con relación a

la frecuencia total; la frecuencia acumulada, indica el porcentaje de individuos que se

encuentran hasta un peso dado. Por ejemplo vemos que el 50% de los cerdos llegan hasta

las 75 libras el 90% hasta las 80 libras y, obviamente , el 100% de los cerdos alcanza las 85

libras

El cuadro Nº 5.3 demuestra la forma de cálculo x, s2 y s, a partir de un cuadro de frecuencia

CUADRO Nº 5.3 cálculo de x, s2 y s de un cuadro de frecuencia

X F fx (X-x) (X-x)2 f(X-x)2

70 2 140 7.0 49 98

75 3 225 2.0 4 12

58

80 4 320 3.0 9 36

85

∑

1

10

80

770

8.0

X=770/10=77,0

64

64

210

Puede llamar la atención del lector, el hecho de que ∑(X-x), no sea igual a cero como lo

establece una propiedad de la media aritmética

Esto se debe a que en el cuadro Nº 5.3, consta solamente los cuatro pesos (clase), y no los 10

pesos consideran dados. Si se resta la media de los 10 pesos, la suma de las desviaciones dará

cero.

×=770

10= 77

S2= ∑𝑓(𝑋−𝑥)

𝑛−1=210/9=23.33

S=√23.33 = 4.83

5.2 Histogramas y polígonos de frecuencia

Se llama histogramas al grafico construido a partir del cuadro de frecuencias. Consta de un

conjunto de rectángulos, cuya altura es proporcional a la frecuencia de clase

Para nuestro ejemplo la Fig. 5.1 representa el número de cerdos dentro de cada clase y el

porcentaje con respecto al total

0

20

40

60

80

100

1 2 3 4

peso

frecuencia

59

Por medio del histograma, se puede observar de un vistazo, la naturaleza de la distribución de

los datos. Si se desea compara una distribución teórica con la real, se puede graficar la una

sobre la otra, y n averiguar la razón de la diferencia.

El polígono de la frecuencia, se prepara uniendo los puntos medios de cada clase, por medio de

líneas rectas. El polígono de la frecuencia tiende a sugerir el tipo de curva de la población de la

que se extrajo la muestra.

El histograma y el polígono de la frecuencia son formas más objetivas que el cuadro de

frecuencias, para presentar datos

El siguiente ejemplo permitirá una clara compresión sobre la forma en que se construye un

histograma y el polígono de frecuencia respectivo.

Se ha registrado la altura de 100 plantas tomadas al azar, de una parcela de pasto azul.

Los datos constan el cuadro Nº 5.4

Límite de

verdaderos de la

clase

Intervalos de la

clase

(Altura en cm9

Frecuencia

(Nº plantas )

Marca de clase

59.5-62.5

>62.5-65.5

>65.5-68.5

>68.5-71.5

>71.5-74.5

60-62

63-65

66-68

69-71

72-74

5

18

42

27

8

∑=100

61

64

67

70

73

Como puede apreciarse, la menor altura encontrada fue de 60 cm.

Por redondeo aritmético, todas las plantas que midan entre 59.5 y 62.5 pertenecen al primer

intervalo. Una planta que mida 62.6 cm., entraría al segundo intervalo. En la práctica, se

obtiene los verdaderos límites de clase, sumando el límite superior de una clase, al límite

inferior de la siguiente y dividiendo para dos.

62+63/2= 62.5

60

Por conveniencia, se ha establecido que el tamaño de clase sea tres; al restar 62.5 – 3.0 = 59.5,

en cuyo caso tenemos el limite verdadero e inferior, que es el punto de partida. La marca de

clase se obtienes sumando los límites verdaderos inferior y 6 superior de una clase y dividiendo

para 2.

59.5+62.5/2=61

O sumando los límites inferior o superior del intervalo de clase y dividiendo para dos:

60+62/2=61

De todos los modos, la diferencia entre los límites verdaderos de clase así como entre las

marcas de clase deben ser tres.

Con los datos del cuadro Nº 5.4 estaríamos listos para construir el histograma y el polígono

de la frecuencia, que se vería como la Fig. 5.2

Como regla generales para la construcción de histogramas se puede mencionar:

a) Determinar el rango

b) Dividir el rango en un número conveniente de intervalo de clase del mismo tamaño.

Este número va generalmente de 5 a 20 desacuerdos a los datos.

c) Determinar el número de observaciones dentro de cada intervalo de clase.

d) A partir de estos datos, puede construirse histogramas y polígonos de frecuencia.

En el ejemplo propuesto

a) Rango:74-60=14

b) Para intervalos de clase tamaño 3.14/3=4.66≅ 5 clases.

Para terminar el número de clases, se puede también usar la relación empírica

K=1+3.3 log n

Donde k es el número de clases, n es el número de valores u observaciones y log n es el

logaritmo común (base 10), de n.

Para los 10 pesos de cerdo del cuadro Nº 5.1, tenemos

k=1+3.3 log (10)

=1+3.3 (1)=4.3≅4-5 clases

61

5456586062646668707274

(Nºplantas

)

5 18 42 27 8∑=100

(Alturaen cm9

60-62 63-65 66-68 69-7172-74

59.5-62.5

>62.5-65.5

>65.5-68.5

>68.5-71.5 >71.5-74.5

Marca de clase

Marca de clase

62

Capítulo 6

Probabilidad

Sucesos comunes o raros, son aquellos cuyas probabilidades de que ocurran son grandes o

pequeñas, respectivamente. En la vida diaria usamos todo el rango de probabilidades, de una u

otra manera. Así decimos “la muerte de X pudo deberse a que manejaba descuidadamente”,

cuando no estamos muy seguros de la causa del fallecimiento; o, “la muerte de X seguramente

se debió a que se le rompieron los frenos del automóvil”, cuando tenemos mayor seguridad

sobre la causa del accidente.

En estadística se remplazan las palabras “pudo” y “seguramente”, por números que varían de

cero a uno. Es decir, se indica con precisión qué tan probable o improbable puede ser un seceso

o evento.

El cálculo de probabilidades tiene que ver con variedades discretas, involucradas en problemas

de muestreo, como encuestas, estudio de caracteres genéricos, etc. Lógicamente cuando se habla

de muestreos, no es posible disponer de toda la población. Se ha anotado en el Cap. II que se

razona a partir de la muestra, para luego pasar inferencias sobre la población; en consecuencia,

no es posible obtener todas las predicciones correctas. En el proceso de predicción, el azar juega

un papel predominante.

Sin embargo, la Estadística dispone de métodos que permiten afirmar con qué frecuencia las

afirmaciones serán correctas, en promedio.

El uso de un número fraccionario o relación, es común en Estadística. Así, se dice que el equipo

“Nacional” tiene cinco chances contra tres (5:3), de ganar al Emelec. Esto se interpretaría como

que el equipo de casa puede ganar por un margen estrecho o que, se dos equipos jugaran varias

veces, el “Nacional” ganaría 5 / 8 o el 62% de los juegos.

5 / (5 + 3) = 5 / 8 = 0,62

Los chances de perder, o de que gane el Emelec, serian de 3 / 8 = 0,38 = 38%. Como se ve, las

probabilidades de ganar o perder, son valores que pueden estar entre 0 y 1, como se anotó al

comienzo del Capítulo.

Supongamos que un evento E, puede ocurrir en r formas de un total de N formas, igualmente

posibles. La probabilidad P de que el evento ocurra (probabilidad de éxito) está dada por:

63

𝑃 (𝐸𝑖) =𝑃

𝑁 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 𝑃(𝐸𝑖) =

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠

𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠

El número total de eventos está dado por el total de éxitos más fracasos, llamándose fracaso a la

probabilidad de que un evento no ocurra.

La probabilidad de fracaso (q) se calcula así,

𝑃 (𝑁𝑜 𝐸𝑖) = 𝑞 = 𝑁 − 𝑝

𝑁= 1 − 𝑃 = 1 − 𝑃 (𝐸𝑖)

De lo expuesto, vemos que p + q = 1. O P (Ei) + P (No Ei) = 1

Se ha anotado antes que el cálculo de probabilidades se aplica a muchos campos de orden

práctico. Experimentos simples de orden repetitivo, como el lanzamiento de una moneda,

pueden ilustrar cómo funciona el cálculo de probabilidades. Supongamos que tiramos una

moneda dos veces o lo que es lo mismo, Tiremos dos monedas una vez. En los dos casos existen

cuatro posibilidades: CC, CS, SC, SS; la combinación SC, en el tercer cao, significaría que se

ha obtenido sello en el primer lanzamiento y cara en el segundo. Si en lugar de dos, tiramos tres

monedas, pueden producirse cualquiera de ocho resultados.

CCC, CCS, CSC, SCC, CSS, SCS, SSC, o SSS

Para experimentos de este tipo, es necesario conocer la totalidad de los resultados posibles y

hacer una lista de aquellos que son de nuestro interés. Tal sería el caso al averiguar la

probabilidad de sacar siete al tirar dos dados. Como cada dado puede dar seis resultados, las

combinaciones posibles son 36, siendo de nuestro interés, las siguientes:

(3, 4) (2, 5) (1, 6) y las reciprocas

(4,3) (5, 2) (6, 1)

Es decir que la probabilidad de sacar siete, en este caso sería = 6

36=

1

6

6.1. Sucesos independientes.

Si E1, E2, E3,…, En, corresponden a n eventos independientes, los cuales tienen probabilidades

p1, p2, p3,…, pn, la probabilidad de que dichos eventos se cumplan, será p1p2p3. . . pn, es decir

que la ocurrencia E1 no afecta a que E2 o E3 se produzcan.

64

En este caso tenemos lo que se llama la regla de la multiplicación y que se expresa así,

𝑃 ( 𝐸1, 𝐸2, 𝐸3

) = P (𝐸1) P (𝐸2) P (𝐸3

)

Cuando se produce un evento 𝐸1y este no afecta la ocurrencia de 𝐸2, la expresión seria:

𝑃 ( 𝐸1, 𝐸2) = P (𝐸1) P (𝐸2 / 𝐸1, ),

O lo que es igual, para sucesos independientes.

𝑃 ( 𝐸1, 𝐸2) = P (𝐸1) P (𝐸2)

Ejemplos:

a) Calcular la probabilidad de que, al sacar dos cartas de una baraja ordinaria de 52 cartas,

con reemplazo, la primera sea el as de diamante y la segunda el as de trébol. Si

llamamos E1 al evento “as de diamante” y E2 al evento “as de trébol”; tenemos que,

(,-1.) = ,1-52.; (, 𝐸-2.) = ,1-52.

𝑃 ( 𝐸1) = 1

52; 𝑃 ( 𝐸2) =

1

52

𝑃 ( 𝐸1, 𝐸2) = 1

52×

1

52=

1

2704

a) Si se lanza un dado dos veces, encontrar la probabilidad de sacar 2, 3 0 5 en el primer

lanzamiento y 1, 4, 5 o 6 en el segundo.

Si llamamos E1 al evento “2, 3, 5” y E2 al evento “1, 4, 5 o 6”, vemos las seis formas en que

puede caer el segundo; es decir; existen 6×6=36 combinaciones. Las tres formas en que puede

caer el segundo, para dar 3×4=12 formas en que E1 y E2 pueden ocurrir entonces,

𝑃 ( 𝐸1, 𝐸2) = P (𝐸1) P (𝐸2 ) = 3

6 ×

4

6=

12

36=

1

3

a) Si lanzamos una moneda cuatro veces, la probabilidad de obtener cuatro caras en forma

sucesiva es:

P (4 caras)= 1 2⁄ × 1 2⁄ × 1 2⁄ × 1 2⁄ = (1/2)4 = 1 16⁄

65

a) Si una urna contiene cinco bolas blancas y tres negras y otra urna tiene tres bolas

blancas y dos negras y extraemos una de cada urna, la probabilidad de que dos sean

blancas es:

P (B, B) = P (B) P (B) = 5/8 × 3/5 = 3/8

6.2. Sucesos dependientes

La probabilidad de que un seceso dependiente de otro, se llama probabilidad condicional, en la

que la probabilidad de que ocurra E2, depende de la ocurrencia de E1, así,

𝑃 ( 𝐸1, 𝐸2) = P (𝐸1) P (𝐸2 / 𝐸1, )

Ejemplos:

a) ¿Cuál es la probabilidad de sacar un as de diamante, de una baraja ordinaria de 52

cartas, después de haber sacado sin reemplazo, el as de trébol?

Si designamos al evento as de diamante E2 y al evento as de trébol E1, tendremos

𝑃 ( 𝐸1) = 1

52; 𝑃 ( 𝐸2 𝐸1) =

1

51

𝑃 ( 𝐸1, 𝐸2) = 𝑃 (𝐸1) P (𝐸2 / 𝐸1)

= 1

52×

1

51=

1

2652

Por cuanto se ha extraído una carta, sin reemplazo, quedan 51 cartas en la baraja, para la

segunda extracción.

a) En un ánfora hay 25 papeletas, cinco de las cuales son premiadas.

¿Cuál es la probabilidad de sacar dos premios al extraer las dos primeras papeletas?

𝑃 ( 𝐸1, 𝐸2) = 5

25×

4

24=

1

30

a) Una urna contiene cuatro bolas blancas y cinco negras; sacamos dos en forma sucesiva

sin reemplazo. ¿Cuál es la probabilidad de que las dos bolas sean blancas? La

probabilidad de que la primera sea blanca es 4/9. Si la primera bola fue blanca, la

probabilidad de que la segunda también lo sea es 3/8, en cuyo caso:

𝑃 ( 𝐸1, 𝐸2) = P (𝐸1) P (𝐸2)

66

= 4/9 × 3/8 = 1/6

6.3. Sucesos mutuamente excluyentes

Son aquellos en los que la ocurrencia de uno de ellos excluye la ocurrencia de otros eventos. Es

decir, que si 𝐸2 y 𝐸3 son dos eventos mutuamente excluyentes, P (𝐸1 𝐸2 ) = 0; los dos eventos

no pueden ocurrir, como en el caso del nacimiento de un hijo en que 𝐸1 seria “varón” y 𝐸2 es

“mujer”.

En estos casos se aplica la regla de la adición,

𝑃 ( 𝐸1 + 𝐸2 ) = 𝑃 (𝐸1) + P (𝐸2)

Si dos presentan el caso de que 𝐸1 o 𝐸2o los dos ocurran,

𝑃 ( 𝐸1 + 𝐸2 ) = 𝑃 (𝐸1) + P (𝐸2) − 𝑃 ( 𝐸1 𝐸2 ) ,

Como en el siguiente ejemplo,

a) Calcular la probabilidad de que la primera carta sacada de una baraja, sea jota ( 𝐸1 ) o

corazones ( 𝐸2 ),

(𝐸1 + 𝐸2 ) = 𝑃 (𝐸1) + P (𝐸2) − 𝑃 ( 𝐸1 𝐸2 )

4

52 +

13

52 −

1

52 =

16

52

En este caso estamos restando la posibilidad de que la carta sacada sea “la jota de corazones”,

que tiene una probabilidad de 1/52.

a) Encontrar la probabilidad de que una k, en 8 de trébol o el 5 de picas, aparezca en una

extracción de una de 52 barajas.

El evento puede ocurrir en una de seis formas:

4

52 +

1

52+

1

52 =

6

52=

3

26

67

¿Cuál es la probabilidad de que, en el próximo lanzamiento de un dado salgan el tres o el

cuatro? Hay seis formas en que puede caer el dado: 1, 2, 3, 4, 5, o 6. Si E1 puede ocurrir en dos

de las seis formas:

P (E1) = 1/6 + 1/6 = 2/6 = 1/3

P (N0 E1) = 1 – 1/3 = 2 /3

d) Queremos comprar tres tomates de un camión que va a descargarlos en el mercado; elegimos

uno al azar y lo calificamos como bueno (B) y lo dejamos en su lugar. Repetimos la operación

con otros dos tomates. En esta muestra de tres hemos encontrado dos buenos y uno malo (M).

¿Cuál es la probabilidad de este resultado si sabemos que, por un muestreo previo, existe 10%

de tomates en mal estado en el camión?

X (variable aleatoria) = cantidad de tomates en mal estado. Por tanto, X puede valer 0, 1, 2 o 3,

El resultado fue X= 1

La probabilidad de elegir un tomate malo en una determinada extracción es p= 0,10; la

probabilidad de que sea bueno es (1 - p) = 0,90

Hay tres formas en las que un tomate malo pueda salir en la muestra de tres.

M, B, B

B, M, B

B, B, M

Formas que son mutuamente excluyentes, en cuyo caso sumamos la probabilidad total de cada

extracción. Dentro de cada extracción, se trata de eventos independientes, porque el resultado de

la primera extracción no afecta a la segunda ni a la tercera. Por tanto, tenemos:

P (M, B, B)= P (1 - p) (1 - p) = (0,1) (0,9) (0,9) = 0,081

P (B, M, B)=( 1 – p ) (p) ( 1 – p ) = (0,9)(0,1)(0,9) = 0,081

P (B, B, M)= )=( 1 – p ) ( 1 – p ) =(0,9)(0,9)(0,1) = 0,081

P(X = 1) = P (M, B, B) + P (B, M, B) + P (B, B, M) = = 0,243

P(X = 1) = 0,243= ¼, la probabilidad de sacar en una extracción cualquiera, dos tomates Buenos

y uno malo.

68

6.4. Análisis combinatorio

Para resolver probabilidades de eventos complejos, como algunos juegos de azar, es

conveniente disponer de fórmulas que ahorran tiempo y trabajo, el que, de otro modo, sería

difícil y tedioso.

El análisis combinatorio utiliza dichas formulas, como se indica en esta Sección. Supongamos

que deseamos aplicar tres niveles de nitrógeno, tres de fosforo y tres de potasio, todas las

combinaciones posibles serian:

Con un total de 27 tratamientos o niveles. Se identifica a la dosis cero como niveles; tal es el

caso de No. Po y K0.

6.5. Factorial N.

Se define a N! (N factorial), en la siguiente forma:

N! = N (N – 1) (N – 2) (N – 3)… 1

Por ejemplo, 4! = 4 × 3 × 2 × 1 = 24

7! 3! = (7 × 6 × 5 × 4 × 3 × 2 × 1) (3 × 2 × 1) = 30.240

7! 3! = (7 × 6 × 5 × 4 × 3 × 2 × 1) (3 × 2 × 1) = 1.200

4! 4 × 3 × 2 × 1

0! = 1

Se puede simplificar valores iguales del numerador y del denominador, para ahorrar trabajo.

K0 K0 K0

P0 K1 P0 K1 P0 K1

K2 K2 K2

K0 K0 K0

N0 P1 K1 N1 P1 K1 N2 P1 K1

K2 K2 K2

K0 K0 K0

P2 K1 P2 K1 P2 K1

K2 K2 K2

69

6.6. Permutaciones.

La permutación es una selección de N objetos, tomados r a la vez, respetando el orden de

arreglo,

N P r = (N – 1) (N – 2)… (N – r + 1) = 𝑁!

(𝑁−𝑟)!

Al símbolo N P r, se llama la permutación de N objetos tomados r a la vez. Así, hay N formas

de seleccionar el objeto para el primer lugar; luego, N – 1 formas para el segundo lugar, hasta

llegar a la r-ésima forma, para el último lugar, para el que quedan N – r + 1 formas posibles de

seleccionar el objeto dado.

Supongamos que se quiere formar todos los grupos posibles de dos letras cada uno, a partir de

las letras a, b, c y d, sin que ninguna de ellas se repite. Podemos imaginar que las letras se hallan

pegadas en dados y que se juntaran dos dados a la vez. Aplicando la formula respectiva

tenemos,

4 P 2 = 𝑁 ¡

( 𝑁−𝑟)! =

4 ¡

(4−2)!=

4!

2! =

4 ×3×2

2

= 12 grupos, que estarían formados así:

Ab, ba, ac, ca, ad, da, bc, cb, bd, db, dc, cd

Ejemplos:

𝑎) 𝐸𝑛 𝑐𝑢𝑎𝑛𝑡𝑎𝑠 𝑓𝑜𝑟𝑚𝑎𝑠 𝑝𝑢𝑒𝑑𝑒 𝑎𝑐𝑜𝑚𝑜𝑑𝑎𝑟𝑠𝑒 𝑎 8 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠, 𝑠𝑖 𝑒𝑥𝑖𝑠𝑡𝑒𝑛 3 𝑎𝑠𝑖𝑒𝑛𝑡𝑜𝑠 𝑑𝑖𝑠𝑝𝑜𝑛𝑖𝑏𝑙𝑒𝑠?

8P3=8!

(8−3)!=

8×7×6×5×4×3×2

5×4×3×2= 336 𝑓𝑜𝑟𝑚𝑎𝑠

b) Si en una carrera de caballos, participan siete, en cuantas formas pueden tres de ellos terminar

primero, segundo y tercero ?

7P3 = 7!

(7−3)!=

7!

4!= 7x 6 x 5 = 210

c) La facultad ha contratado a seis nuevos jornaleros para Rumi pamba. El administrador decide

ubicar a tres de ellos en tres lugares claves. ¿De cuántas formas puede conseguirse este objeto?

O sea, ¿cuántas permutaciones de seis hombres existen, tomados de tres en tres?

6P3= 6!

(6−3)!=

6!

3!= 6 x 5 x4 = 120

d) Evaluar: 1) 5p5, 2) 8P3, 3) 10P8

70

1) 5P5=5!

(5−5)!= 120

2) 8 P3=8!

(8−3)!= 336

3) 10 P 8=10!

(10−8)!= 181. 320

6.7 Combinaciones.

La combinación es una selección de r de los N objetos u observaciones, sin tomar en cuenta el

orden de arreglo.

N C r = 𝑁(𝑁−1)(𝑁−2)….(𝑁−𝑟+1)

𝑟(𝑟−1)….1=

𝑁!

𝑟!(𝑁−𝑟)!

En el caso de las letras a, b, c, d, todas las combinaciones posibles tomadas de dos en dos

estarían dadas por,

4 C 2=𝑁!

𝑟!(𝑁−𝑟)!=

4!

2!(4−2)!

=4!

2!2!=

4 𝑥 3 𝑥 2

2 𝑥 2=

24

4= 6

Y serían: ab, ac, ad, bc, bd, cd. Nótese que ab es la misma combinación que va, pero no la

misma permutación.

Ejemplos:

a) En cuantas formas puede formarse un jurado de doce hombres y mujeres, de un total de

18 personas?

18 C 12= 18!

12!(18−12)!=

18!

12!(6)!=

18 𝑥 17 𝑥 16 𝑥 15 𝑥 14 𝑥 13

6 𝑥 5 𝑥 4 𝑥 3 𝑥 2= 18.564 𝑓𝑜𝑟𝑚𝑎𝑠

Nótese que se ha simplificado 12! del denominador con la cifra equivalente del numerador.

b) Evaluar: 1) 8 C 8, 2) 4 C 2, 3) 7 C 3

1) 8 C 8= 8!

8!(8−8)!=

8!

8!0!= 1 , 𝑝𝑜𝑟 𝑐𝑢𝑎𝑛𝑡𝑜 0! = 1

2) 4 C 2=4!

2!(4−2)!=

4 𝑥 3 𝑥 2

2 𝑥 2=6

71

3) 7 C 3=7!

3!(7−3)!=

7!

3!4!=

7 𝑥 6 𝑥 5

3 𝑥 2= 35

72

Capítulo 7

Distribuciones Teóricas de Frecuencias

En el capítulo cinco se trató sobre cuadros y polígonos de frecuencia. En el presente capitulo se

presenta las distribuciones de frecuencia y sus propiedades.

La distribución de frecuencia de una muestra sugiere el tipo de distribución de la población a la

que aquella representa. Si el tamaño de la muestra es suficientemente grande, es de esperar que

la distribución de frecuencias de la muestra sea una buena aproximación de la distribución de

frecuencias de la población. Por ejemplo, si en una encuesta sobre preferencias de consumo de

una población de diez mil habitantes, se entrevista a 50 personas, no se puede esperar que las 2

distribuciones de frecuencias sean similares; si, en cambio, el tamaño de la muestra es de 3000

individuos las distribuciones de frecuencias, serán similares:

El cálculo de probabilidades en relación con los juegos de azar, ofrece ejemplos de

distribuciones de frecuencias teóricas, para ciertas variables discretas. Tal es el caso de las Figs.

7.1 y 7.2.

7.1 La distribución binomial.

En un evento binomial – lance de una moneda, posibilidad de que un hijo sea varón o mujer–

existen solo dos alternativas en cuyo caso solo una de ellas puede tener lugar: cara o sello; y

varón o mujer, en los dos ejemplos propuestos.

En estadística, estos eventos se conocen como ‘éxito’’ o ‘’fracaso’’, tal como vimos en el cap.

6. El procedimiento usual consiste en observar un número dado de eventos y registrar la

frecuencia de éxitos.

El muestreo de una distribución binomial es similar al sacar papeles numerados de un ánfora,

con remplazo. Es decir que la probabilidad asociada con un evento, como el de sacar un ficha

roja de una bolsa, es constante para cada extracción en cuyo caso se dice que los eventos sean

independientes.

Si p es la probabilidad de que un suceso tenga lugar en una sola prueba (probabilidad de éxito) y

q= 1- p, la probabilidad de que no suceda, (probabilidad de fracaso) la probabilidad de que el

evento tenga lugar exactamente X veces en N pruebas (O sea X éxitos y N- X fracasos) está

dada por,

73

P(X)=N C X 𝑝𝑥𝑞𝑁−𝑋=𝑁!

𝑋!(𝑁−𝑋)!𝑝𝑥𝑞𝑁−𝑋

Por ejemplo, preguntamos, ¿cuál es la probabilidad de que en una familia con seis hijos, habrá

seis mujeres? O, ¿lo que es igual, seis varones?

Se supone que la probabilidad de varón o mujer antes del nacimiento es ½ y que se trata de

eventos independientes, o sea que la probabilidad de varón o mujer permanece constante para

cada nacimiento la probabilidad es entonces,

6 C 6(1/2)6(1/2)0=6!

6!0!(1/2)0 (1/2)0 = 0.0156 = 1/64

Es decir que la probabilidad es de que una familia tenga 6 hijos del mismo sexo es muy baja; en

otras palabras, de una a dos familias de cada 100 que tienen 6 hijos podrán contar con 6 hijos

del mismo sexo.

Ejemplo: La probabilidad de que los padres con ojos azul-cafés tengan un hijo con ojos azules

es de ¼ (carácter recesivo). Si existen 6 hijos en la familia, ¿cuál es la probabilidad de que por

lo menos la mitad de ellos tenga ojos azules? Ya sabemos que se trata de eventos

independientes, para los que la probabilidad de éxito, en un solo intento es de ¼ y la

probabilidad de fracaso es de ¾; entonces N= 6 Y p = ¼.

Es necesario calcular P (3), P (4), P (5), y P (6), y sumar las probabilidades correspondientes,

debido a que ellas equivalen a las maneras mutuamente excluyentes en que pueden ocurrir el

evento.

P (3)=6!

3!3!= (

1

4)3(3/4)3=

540

4096

P (4)=6!

4!2!= (

1

4)4(3/4)2 =

135

4096

P (5)=6!

5! 1!= (

1

4)5(3/4)1=

18

4096

P (6)=6!

6!0!= (

1

4)6(3/4)0=

1

4096

La probabilidad de obtener los éxitos deseados, se consigue sumando las probabilidades

individuales, lo que se representaría por p (X)≥ 3.

p (X≥ 3)= 694

4096= 0.169

74

Lo cual demuestra, como en el caso anterior, la baja probabilidad de que este tipo de familia

tenga tantos hijos de ojos azules.

Ejemplo: La probabilidad de sacra exactamente dos caras en seis lanzamientos de una moneda:

6 C 2 (1

2)

2 (

1

2)

6−2=

6!

2!4!= (

1

2)

2 (

1

2)

4=

15

64

Ejemplo: La probabilidad de que al lanzar una moneda tres veces, aparezcan a) tres caras, b) dos

caras un sello, c) tres sellos.

a) P(tres caras)=3 C 3(1

2)3(

1

2)0=

3!

3! 0! (

1

2)3 (

1

2)0 = 1(

1

8) 1 =

1

8

b) P(2caras, 1 sello)= 3 C 2(1

2)

2(

1

2)

1=

3!

2! 1!(

1

2)

2(

1

2)

1= 3(

1

4) (

1

2) =

3

8

c) P (1 cara, 2 sellos) = por simetría con b)= 3/8

d) P ( 3 sellos) = 3 C 0(1

2)0(

1

2)3= por simetría con a)= 1/8

Ejemplo: Una agencia de publicidad sostiene que 25% de los estudiantes que fuman, fuman

Winston. Si obtenemos una muestra al azar de cuatro estudiantes que fuman y aquella

afirmación es cierta, cual es la probabilidad de que por lo menos uno de ellos fume tal marca?

Suponiendo que el aserto es verdadero, la distribución del número de estudiantes que fuman

Winston en una muestra de cuatro seria:

P(x)= 4!

𝑋!(4−𝑋)! (

1

4)𝑥(

3

4)4−𝑥

Donde X= 0, 1, 2, 3,4

La probabilidad de encontrar por lo menos uno está dada por:

P(X ≥ 1)= P (1) + P (2) + P (3) +P (4)

P (1)=4!

1!(4−1)! (

1

4) (

3

4)3 = 4 (

1

4) (

27

64) = 108/256

P (2) =4!

2! 2! (

1

4)2(

3

4)2 = 6 (

1

16) (

9

16) =

54

256

P (3) =4!

2! 2! (

1

4)3(

3

4)1 = 4 (

1

64) (

3

4) = 12/256

75

P (4) =4!

2! 2! (

1

4)4(

3

4)0 = 1 (

1

256) 1 = 1/256

Entonces, P(X ≥ 1)= P (1) + P (2) + P (3) +P (4)

=108/256+54/256+12/256+1/256= 175/256

O, lo que es igual,

P(X ≥ 1)= 1- p (0)=1- [(4!

0!4!(

1

4)0(

3

4)4]

= 1 - 81/256 = 175/ 256

Ejemplo: La probabilidad de que un estudiante nuevo apruebe el curso es de 0,4; determinar la

probabilidad de que, de 5 estudiantes nuevos, a) ninguno, b) uno y, c) por lo menos uno apruebe

el curso.

a) P ( Ninguno) = 5!

0!5!(0.4)0(0.6)5= 1 * 1( 0.07776) =0.08

b) P (uno) = 5!

1!4!(0.4)1(0.6)4= (5) (0,4) (0,1296)= 0.26

c) P (A! menos uno)= 1 – P ( Ninguno)

= 1 – 0.08 = 0.92

La distribución de frecuencias para un lanzamiento de dos datos, es como sigue:

76

Para esta distribución binomial, vemos que la probabilidad de que los eventos mutuamente

excluyentes 2, 3, 4, 5 ,6 y 7 tengan lugar, va aumentando de 1/36 a 2/36…………………….

6/36, respectivamente. En igual forma, disminuye para los eventos 8, 9, 10 y 12. Los

numeradores corresponden a los coeficientes de la expansión binomial, tal como nos indica en

la próxima sección. La distribución de probabilidades para 5 lanzamientos de una moneda, está

indicada en el cuadro 7.1.

CUADRO 7.1 Distribución de probabilidades para el binomial p= ½, N= 5.

Caras (X) 0 1 2 3 4 5

P (X) 1/32 5/32 10/32 10/32 5/32 1/32

Para esta distribución binomial vemos que la probabilidad de que tengan lugar los eventos

mutuamente excluyentes (cuya suma es igual a 32/32 =1), 0, 1 y 2 caras, va aumentando de 1/32

a 5/32 y 10/32; en igual forma, disminuye para los eventos 3, 4 y 5, de 10/ 32 a 5/32 y 1/32. Los

numeradores, como en el caso anterior, corresponden a los coeficientes de la expansión

binomial. La fig. 7.2 muestra los mismos resultados del Cuadro7.1

5

36

2 3 4 5 6 7 8 9 10 11 12

1

36

2

36

3

36

4

36

6

36

5

36

4

36

3

36

2

36

1

36

77

Fig. 7.2 Probabilidad de obtener caras para el binomial p= 1/2, N= 5

7.1.1 La expansión binomial.

La distribución de probabilidades se llama distribución binomial, puesto que para X= 0, 1, 2,

3,…, N, hay valores sucesivos correspondientes en la expansión binomial:

(𝑝 + 𝑞)𝑁 = 𝑝𝑁 + 𝑁𝐶 1 𝑝𝑁−1𝑞 + 𝑁𝐶 2𝑝𝑁−2𝑞2 + ⋯ + 𝑞𝑁

Donde 1, NC1, NC2, se llaman coeficientes binomiales. Por ejemplo,

(𝑝 + 𝑞)5 = 𝑝5 + 5 𝑝4𝑞 + 10 𝑝3𝑞2 + 10 𝑝2𝑞3 + 5 𝑝1𝑞4 + 𝑞5

Los coeficientes binomiales están dados por el Triángulo de Pascal:

También se puede obtener los coeficientes binomiales en forma directa: se multiplica el

coeficiente por el exponente de p del término involucrado y se divide para el número de orden

del mismo término. Se inicia en esta forma desde el primer término y se hace el mismo cálculo

para los términos siguientes:

(𝑝 + 𝑞)5 = 1𝑝5 + 5 𝑝4𝑞 + 10 𝑝3𝑞2 + 10 𝑝2𝑞3 + 5 𝑝1𝑞4 + 1 𝑞5

1𝑋 5

1= 5;

5 𝑋 4

2= 10;

10 𝑋 3

3= 10;

10 𝑋 2

4= 5;

5 𝑋 1

5= 1

78

7.1.2 Algunas propiedades de la distribución binomial.

Mediante el uso de algunos procedimientos algebraicos, es posible hacer cálculos para la

distribución binomial. Esos cálculos dan lugar a fórmulas para la media, la variancia y la

derivación típica, que pueden emplearse en todos los problemas de tipo binomial. Por salir del

alcance de este texto, no se describen los procedimientos algebraicos. Las tres propiedades más

importantes de la distribución binomial son:

μ = N p

σ2= N p q

σ= √𝑁 𝑝 𝑞

Donde N es el número de observaciones, p la probabilidad de éxito y q la probabilidad de

fracaso de un evento.

Ejemplo: Si la probabilidad de que las tuercas producidas por una máquina sean defectuosas es

0.1, encontrar a) la media, b) la desviación típica para la distribución de tuercas defectuosas, en

un total de 400.

a) ẋ= N p =400(0.1) =40, es decir que podemos esperar que existan 40 tuercas

defectuosas;

b) σ2 = 𝑁𝑝𝑞 = 400(0.1)(0.9) = 36; σ = √36 = 6

7.2 La distribución normal.

La distribución binomial de la Sec. 7.1 es la distribución teórica de frecuencias más usadas para

variables discretas.

En esta Sección se estudiará la distribución de frecuencias para casos de variables continuas,

como el caso de altura, peso o ingresos de individuos. La variable pasa sin interrupción de un

individuo al siguiente, una variable continua, sin límite con respecto al número de individuos

con diferentes medidas.

Muchos fenómenos biológicos proporcionan datos que se distribuyen en forma suficiente

“normal”, como para que esta distribución sea la base de la teoría estadística empleada por el

investigador. El gráfico de esta distribución, la curva normal, llamada también curva de Laplace

o de Gauss, tiene forma acampanada, siendo el tamaño de σ2, el que determina que tan aplanada

o alargada sea la curva. La curva de la Fig. 7.3 es la gráfica de una distribución normal. Igual es

el caso de la Fig.2.1, sobre cociente intelectual y de la Fig. 2.2 sobre peso corporal.

79

1 Fig. 7.3 Distribución normal típica

La localización y forma de la curva normal está dado por los valores de μ y σ. El valor de μ

establece el centro de la curva, en forma simétrica es decir que 50% de las observaciones se

hallan a la derecha de μ y 50% a su izquierda; en tanto que el valor de σ determina el grado de

dispersión de los datos. En la Fig. 7.4 podemos apreciar tres curvas normales, todas con igual

media, pero con diferente variancia (ver Sec. 4.6.3).

La curva A es la que menor grado de dispersión presenta; la curva B es intermedia y la curva C

tiene la mayor variancia. En todas las curvas, el área total, o sea el total de las observaciones o

individuos, es equivalente a 100% o uno.

2Fig. 7.4 Tres curvas normales con igual μ y diferente σ

Debido a la propiedad de simetría de la curva normal, como se ilustra en la Fig. 7.3, en el

intervalo de μ hasta μ + σ, se encuentran aproximadamente, 34% de las observaciones (valor

obtenido por cálculo superior). Mediante integración, se puede conocer la frecuencia relativa de

las observaciones, pero siendo este un trabajo largo y tedioso, es más conveniente usar tablas

que existen para el objeto, las que dan los valores de las ordenadas (altura de la curva) o las

áreas bajo la curva. En la tabla N°III del Apéndice, puede verse los valores desde cero hasta

Y

F

μ -

3σ

μ -

2σ

μ -

1σ

μ

μ+

1 σ

80

zeta, que estarían en el eje de las abscisas. En la columna de la izquierda se lee los valores de z,

desde 0.0 hasta 3.9, es decir para unidades y décimas; en la fila horizontal superior, se lee esos

valores para las centésimas, por ejemplo, para z= 2.5, leemos (un valor de área bajo la curva,

que significa porcentaje de individuos u observaciones del total que es 100%), en la siguiente

forma: columna izquierda, 2.5, seguimos en forma horizontal, hasta interceptar el valor

correspondiente a la columna 8= 0.4951. si el valor del área bajo toda la curva equivale a 100%

o uno, esto quiere decir que entre z=0 y z=2.58, se halla 49.51% del total de los individuos u

observaciones.

Puesto que en el eje de las X se tiene los valores de z, desde μ (z=0), hasta el extremo de la

curva μ+3σ (z=3.99), el valor derecho inferior de la Tabla N° III del Apéndice, muestra la cifra

0.5000, que corresponde justamente a la mitad del área total bajo la curva. Cuando existen

valores de z negativos, por la propiedad de simetría de la curva, los valores tabulares son los

mismos, pero sabemos que corresponden al lado izquierdo de la curva.

Las tablas de z están hechas para la llamada curva típica, con media cero y desviación típica y

variancia uno, pero pueden usarse con cualquier distribución normal si se aplica los teoremas

4.7.1 y 4.7.2, cuya generalización para la observación transformada, constituye la estadística z,

que expresa el valor de la variable X, en términos de unidades típicas; se dice entonces que z es

normalmente distribuida con media cero y variancia y desviación típica uno, y es independiente

de las unidades usadas (libras, centímetros, etc.).

z= 𝑋− μ

σ

Ejemplo: Si la distribución de las observaciones de una población es normal, con media= 50 y

desviación típica=10, al restar 50 de cada observación, la media de (X – 50) será igual a 10

(Teorema 4.7.1). Ahora, si cada valor (X-50) se divide por 10, la nueva media será 0/10 = 0 y la

nueva desviación típica será 10/10 = 1 (Teorema 4.7.2), de modo que la observación

transformada z= (X−50)

10, viene a ser la correspondiente a la fórmula de z, que, como sabemos es

igual a z= 𝑋− μ

σ , o sea que el valor de z de la observación 60 será: z=

60−50

10 = 1

El valor de z de la observación 45 será: z= 45−50

10 = -0.5, que es otra forma de decir que 60 es

una desviación típica sobre la media 50 y que 45 es media desviación típica bajo la media 50.

En la curva normal típica de la Fig. 7.4, se indica las áreas incluidas entre z= -1; y+1; z=-2; y

z=-3y + 3, que corresponden al 68,27%, 95,45% y 99,73%, respectivamente, del área total que

es igual a 100% o uno. De la Fig. 7.4 se desprende que el área bajo la curva termina

prácticamente en -3σ y +3σ. Sin embargo, la ecuación de la curva va de -∞ a + ∞.

81

3 Fig. 7.5 Áreas bajo la curva normal

68.27

95.45

99.73

Para encontrar el área o porcentaje bajo la curva normal (zona sombreada), debe usarse la Tabla

N° III del Apéndice, en la siguiente forma:

0 1.6

-3 -2 -1 0 1 2 3

82

a) Z= 1.6

Área entre 0 y 1.6= 0.4452

b) Z= -0.97

Área entre 0 y 0.97=0.3340

c) 𝑧1= -0.30 y 𝑧2= 1.88

Área entre 0 y -0.30= 0.1179 + área entre 0 y 1.88= 0.4699

0.5878

-.97 0

-.30 0 1.88

83

d) 𝑧1= 1.12 y 𝑧2=2,46

Área entre 0 y 2.46= 0.4931- área entre 0 y 1.12= 0.3686

0.1245

e) Z= < -2.08

1

2 de curva = 0.5000 -área entre 0 y -2.08=

0.4812

0.0188

f) z=>-2.35

½ curva= 0.5000

+ Área entre 0 y -2.35= 0.4906/0.9906

-2.08 0

0 1.12 2.46

84

g) z1 = < -0.77 y z2 => 0.23

1- (área entre 0 y -0.77 + área entre 0 y 0.23)

1- (0.2794 + 0.0910) = 1 - 0.3704 = 0.6296

O también:

0.5000 – área entre 0 y -0.77

+ 0.5000 – área entre 0 y 0.23

90 -

Ejemplo:

La media en un examen de Estadística fue 68/10; s = 12. Sólo el 10% de notas superiores

recibirán A. ¿Cuál es la nota mínima para obtener A?

Área de 0 a z = 0.3997 = 0.4000 = 1.28

En el cuerpo de la tabla de z podemos ver que la cifra más próxima a 0.4000, es 0.3997.

85

z = (x − xˉ)/s; 1.28 (x − 68)/12

(1.28)(12)=x-68

X= (1.28) (12)+68

X=83.36

La nota mínima para obtener A es 83.4

Ejemplo: La estatura promedio de 300 estudiantes es de 160 cm; la desviación típica, 18 cm.

Suponiendo que la estatura es normalmente distribuida, averiguar cuántos estudiantes miden, a)

entre 140 y 170 cm. Y b) más de 180 cm.

a) 140 en unidades típicas= (140 − 160)/18 = −1.11

170 en unidades típicas= (170 − 160)/18 = 0.55

-1.11=0.3665

0.55=0.2088/0.5753

Si 300 estudiantes constituyen 100% de la población, 57%, es decir 171 individuos,

miden entre 140 y 170 cm.

b) 180 en unidades típicas= (180 − 160)/18 = 1.11

1.11 = 0.3665

0.5000

-0.3665/0.1335

De 300 estudiantes, 13.35%, es decir 40, miden más de 180 cm.

Ejemplo: El diámetro promedio de una muestra de 100 pernos producidos por una máquina es

de 0.42 cm; la desviación típica es de 0.08 cm. La tolerancia máxima en diámetro es de 0.48 y

0.36 cm; fuera de estos límites, los pernos son considerados defectuosos. Determinar el

porcentaje de pernos defectuosos producidos por la máquina.

86

0.48 en unidades típicas= (0.48 − 0.42 = 0.75)/0.08

0.36 en unidades típicas=(0.36 − 0.42)/0.08 = −0.75

0.75=0.2734

0.2734x2=0.5468=55%

100-55=45%

Es decir que 55% de los pernos se ajustan a la tolerancia permitida; la diferencia a 100%, el

total de la muestra, se considera defectuosa.

87

Capítulo 8

Pruebas de Hipótesis

Se define a la hipótesis como una teoría tentativa o una suposición adoptada provisionalmente

para explicar ciertos hechos y guiar la investigación de otros.

Toda comprobación de hipótesis, incluye los siguientes aspectos:

a) Enunciación de hipótesis.

b) Deducción de alguna o algunas teorías.

c) La verificación de estas teorías.

d) Conclusiones en base a los resultados experimentales.

Cuando una persona se halla investigando sobre la naturaleza de un fenómeno cualquiera, le

obligan a proponer una teoría. Para que esa teoría tenga valor debe estar de acuerdo con lo que

en realidad sucede en la práctica, ella debe ser revisada o descartada.

Podemos suponer que la teoría puede ser expresada como una hipótesis estadística, es decir que

cuando se plantea una hipótesis existe más de una alternativa.

Supongamos que la vida promedio e cierta marca de baterías X, es de 30 meses, con una

desviación típica de cuatro meses. Si decidimos probar una nueva marca Y, cuyo precio es más

bajo, vamos a esperar que la duración promedio de la segunda marca sea, por lo menos, igual a

la que hemos venido usando; de otro modo no valdría la pena cambiar la marca conocida. Si se

encuentra que la vida útil de Y es 24 meses, con una desviación típica de cinco meses, podemos

plantear el problema de la siguiente forma:

HO: μ=30

H1: μ <30

Se plantea H1 en la manera indicada, puesto que si la calidad de Y no es igual a la de X,

entonces la marca Y sería inferior a X.

8.1 La hipótesis nula, HO.

Es preferible plantear la hipótesis en el sentido de que las marcas son iguales en calidad, en

lugar de la hipótesis de que son diferentes. Así se establece la hipótesis,

HO: μ1 – μ2 = 0, o lo que es igual, HO: μ1 – μ2

88

A este tipo de hipótesis se le conoce como hipótesis nula, debido a que supone que no existe

diferencia entre tratamientos.

8.2 Prueba de hipótesis y nivel de significación.

Al momento de plantear la hipótesis nula, se escoge el nivel de probabilidad o nivel de

significación, se concluye que la hipótesis nula es falsa y la hipótesis alternativa verdadera. Si se

escoge el nivel de significación de 0.05, se rechaza la hipótesis nula afirmando que existen

diferencias significativas al 5%. Los procedimientos que nos permiten aceptar o rechazar

hipótesis se llaman pruebas de hipótesis o pruebas de significación.

Por ejemplo, antes de lanzar una moneda, suponemos que la moneda no está “cargada” y

esperamos 50% de sellos y 50% de caras. Si al lanzar esa moneda 100 veces, registramos 75

caras y 25 sellos, rechazaríamos la hipótesis de que la moneda es correcta.

Fig. 8.1 Zonas de aceptación y rechazo de H0´ al 1% de significación.

Prueba de dos “colas”.

De z estará comprendido entre -2.58 y +2.58, fuera de las zonas críticas o de rechazo de H0.

El valor de 2.58 viene dado por la resta de 0.5 (mitad de la curva) de 0.005 (mitad de 0.01, que

es el nivel de probabilidad escogido):

0.5000

- 0.0050

9 9

ACEPTACIÓN

DE Ho.

005 005

Z = -2.58 Z = 0 Z = +2.58

Zona Crítica

89

0.4950 = 2.58

El valor de 0.4950 consta en el cuerpo de la Tabla de z; buscando hacia la columna de la

izquierda, entonces el valor 2.5 y hacia arriba, en la fila superior de la Tabla, vemos .08, con lo

que el valor correspondiente de z es 2.58.

Si el nivel escogido hubiera sido el 5%, se reemplaza 2.58 por 1.96:

0.5000

- 0.0250

0.4750 = 1.96

La significación al 5% se indica poniendo un asterisco junto al valor calculado y dos asteriscos

cuando la significación es al 1% en este último caso se habla de un valor altamente

significativo. La no significación se denota por NS.

8.3 Errores tipo I y tipo II.

Si rechazamos una hipótesis que debiera ser aceptada, hipótesis verdadera, cometemos un error

tipo I. Si aceptamos una hipótesis falsa (que debiera ser rechazada), se comete un error tipo II.

La única forma de reducir los dos tipos de error, es aumentando el tamaño de la muestra, es

decir, incrementando el número de observaciones.

El error tipo I se comete siempre que, siendo la hipótesis de trabajo verdadera, por error de

muestreo, el valor utilizado en la decisión queda comprendido en la zona de rechazo (Fig. 8.1).

Se designa con la letra griega ∞, la probabilidad de cometer este tipo de error.

Así mismo, se comete el error tipo II, siempre que, siendo falsa la hipótesis de trabajo, por error

de muestreo, el valor utilizado en la decisión queda comprendido en la zona de aceptación (Fig.

8.1). La probabilidad de cometer este tipo de error, se designa con la letra griega β.

Seguidamente, se presenta un resumen de las características de los dos tipos de error.

CUADRO N° 8.1 Tipos de error I y II

Decisión SITUACIÓN VERDADERA

La H0 es cierta La H0 es

falsa

Símbolo

90

8.4 Potencia de la prueba.

Está estrechamente relacionada con la probabilidad de cometer un error tipo II. Es decir se

refiere a la probabilidad de aceptar la hipótesis alternativa cuando la hipótesis nula es verdadera.

La potencia de la prueba se denota 1 – β.

8.5 Pruebas de una y de dos colas.

En la Sec. 8.2 se ha presentado valores de z a la derecha e izquierda de µ. Es decir que, los

valores pueden hallarse en los dos extremos o “colas” de la distribución y por esto a prueba se

llama de “dos colas”. A veces podemos tener interés únicamente en valores a la derecha de µ,

como sería el caso de probar que la aplicación de un fertilizante da mayor rendimiento que el

testigo. En este caso tenemos una prueba de “una cola”, que presentaría una zona de aceptación

y rechazo de H0, tal como se puede apreciar en la Fig. 8.2.

0.5000

- 0.0100

0.4900 = 2.33

Aceptación de

la H0

No hay error Error tipo II β

Rechazo de la

H0

Error tipo I No hay

error

∞

91

Fig. 8.2 Zonas de aceptación y rechazo de H0 al 1% de significación.

Prueba de una “cola”.

Al comparar la Fig. 8.1 con la 8.2, podemos concluir que las dos áreas sombreadas de la

primera, son equivalentes al área sombreada de la Fig. 8.2.

Ejemplo: El fabricante de una medicina sostiene que el producto tiene 80% de efectividad para

el control de una enfermedad. En una muestra de 300 individuos que tenían la enfermedad, la

medicina alivió a 220 personas. Determinar si la afirmación del fabricante es cierta al 5% de

probabilidades.

H0: p = 0.8 y la afirmación es verdadera

H1: p < 0.8 y la afirmación es falsa

Escogemos una prueba de una cola, puesto que nos interesa solo valores < 0.8, es decir,

inferiores a 80% de efectividad del producto.

0.5000

- 0.05

0.4500 = z = - 1.65

9 9

ACEPTACIÓN

DE Ho. .01

Z = 0 Z = 2.33

Zona Crítica

92

De acuerdo con la Sec. 7. 1. 2:

X = Np = 300 (0.8) = 240

𝑠 = √𝑁𝑝𝑞 = √300 (0.8)(0.2) = √48 = 6.92

𝑧 = 220 − 240

6.92= −2.89

El valor (absoluto) de z calculada es mayor que el tabular, es decir aquel cae en la zona de

rechazo de H0, por lo que aceptamos la hipótesis alternativa y concluirnos que la afirmación del

fabricante es falsa.

Ejemplo: En una muestra de 200 semillas, germinaron 172; al nivel de 1% podemos rechazar la

afirmación de que el poder germinativo de la semilla es, por lo menos, del 90%?

H0: p ≥0.9

H1: p < 0.9

En este caso, escogeremos una prueba de una cola – del lado izquierdo, negativo- puesto que

nos interesa solo valores <0.9

X = 200 (0.9) = 180

𝑠 = √𝑁𝑝𝑞 = √(200)(0.9)(0.1) = √18 = 4.24

𝑧 = 172 − 180

4.24= −1.88

0.5000

- 0.01

0.49 = z = - 2.33

El valor absoluto de z calculada es menor que el tabular, por lo que aceptamos H0: p ≥ 0.9 y

concluimos que el poder germinativo de la semilla llega, por lo menos al 90%.

En el caso de distribuciones binomiales, como hemos visto en los ejemplos anteriores, la

estadística

93

𝑧 = 𝑥 − µ

ợ=

𝑋 − 𝑝

√𝑝𝑞𝑁

Hay situaciones en las que podemos trabajar con X o con valores fraccionales X/N, como en el

siguiente ejemplo:

Nos dan un par de datos con el objeto de establecer si están o no cargados, al nivel del 5%. Si

decidimos probar la H0 de que la probabilidad de obtener 7 es igual 1/6, H0: p = 1/6; la H1 seria

p ≠ 1/6; en este caso usaríamos una prueba de dos colas por cuanto la probabilidad puede ser

mayor que 1/6. Si tiramos los dados 300 veces y encontramos que el 7 aparece 38 veces:

𝑧 = 𝑋 − 𝑝

√𝑝𝑞/𝑁=

𝑋𝑁

− 𝑝

√𝑝𝑞/𝑁=

38300

−16

√(16

) (56

) (1

300)

= 0.126 − 0.166

0.02= −2.0

Por tratarse de una prueba de dos colas restamos de 0.5 (la mitad de la curva), el valor de 0.025

(estamos trabajando al nivel del 0.05 de probabilidades); la diferencia es de 0.4750, que, en

valores de z= -1.96. El valor calculado cae fuera de la zona de aceptación de H0, en cuyo caso

rechazamos H0: p = 1/6, al nivel del 5%; sin embargo, no podríamos hacerlo al nivel del 1%.

Por esta razón y por cuanto sabemos que la probabilidad de sacar 7 es 1/6, pensaríamos que 300

lanzamientos fue un número insuficiente de pruebas y repetiríamos el ensayo.

94

Capítulo 9

La Distribución de X2

En el Cap. VII se trató de casos en los que la población consistía de dos clases de individuos y

en los que el muestreo se refería a una o dos poblaciones. En el presente Capítulo vamos a

considerar poblaciones clasificadas en más de dos categorías y a muestras extraídas de más de

dos poblaciones. Se define a X2 (letra griega que se lee Ji cuadrado), como la suma de

cuadrados de variables independientes, normalmente distribuidas, con media cero y varianza

uno.

La distribución de X2 depende del número de grados de libertad, existiendo una distribución

(curva dentro del eje de coordenadas), para cada grado de libertad. En la Tabla de X2 (Tabla N°

IV del Apéndice), se da el nivel de probabilidad a la cabeza de la tabla, los grados de libertad en

la columna izquierda equivale y los valores X2 en el cuerpo de la Tabla. El número de grados de

libertad equivale al número de clases que se comparan menos uno.

La mayoría de los problemas en que se usa X2, implican a la cola derecha de la distribución, al

contrario de la distribución de z, en la que podemos estar interesados tanto en una, cualquiera,

como en las dos colas de la distribución.

La distribución de X2 se usa generalmente para la enumeración de datos. Sin embargo, X2 es

una distribución continua que se basa en la distribución normal.

9.1 Cálculo de X2.

Como se ha visto en el Cap. VI, los resultados provenientes de muestreo no siempre coinciden

con resultados teóricos, de acuerdo a las reglas de probabilidad. Por ejemplo, aun cuando

teóricamente esperaríamos obtener 250 caras y 250 sellos, en 500 lanzamientos de una moneda,

llamaría la atención que obtengamos exactamente esa proporción en la práctica.

La prueba de X2, o prueba de bondad de ajuste, nos indica como los valores observados se

comparan con los valores esperados.

Supongamos que, en una muestra dada, esperamos, de acuerdo a la teoría de probabilidades, que

una serie de eventos E1, E2, E3,… En, se produzcan frecuencias e1, e2, e3,… en, llamadas

frecuencias esperadas; después de realizado el experimento, observamos que dichos eventos se

presentan con frecuencias o1, o2, o3,… on, llamadas frecuencias observadas. La primera

95

pregunta que se nos ocurre, en presencia de los resultados, es la siguiente: ¿se hallan éstos de

acuerdo con los que esperábamos?; ¿son los resultados confiables?

La medida en que los valores observados y esperados discrepan, está dada por la estadística X2,

la que, en su forma más simple, se expresa así,

𝑋2 = (𝑜1 + 𝑒1)2

𝑒1+

(𝑜2 − 𝑒2)2

𝑒2+ . . . +

(𝑜𝑛 − 𝑒𝑛 )2

𝑒𝑛

∑(𝑜1

𝑛

1=1

−𝑒1 )

2

𝑒1

Si el valor de X2 = 0, las frecuencias teóricas y las observadas, se hallarían totalmente de

acuerdo. Tal sería el caso a obtener exactamente 250 caras y 250 sellos, en 500 lanzamientos de

una moneda. Mientras mayor en el valor X2, mayor sería la diferencia entre las frecuencias.

Ejemplo: En 500 lanzamientos de una moneda, se observaron 275 caras y 225 sellos. Probar la

hipótesis de que la moneda no está “cargada”, al nivel de 5 y del 1% de probabilidades.

𝑋2 = (275 − 250)2

250+

(225 − 250)2

250= 5.0

Puesto que el número de categorías en n= 2 (caras y sellos), el número de grados de

libertad sería 2 – 1 = 1. Los valores de X205 y X2

01 para un grado de libertad son 3,84 y

6,63, respectivamente.

El valor calculado de X2 = 5,0 es mayor de 3,84 en consecuencia, podemos afirmar que las

frecuencias esperadas difieren significativamente de las frecuencias observadas, y rechazamos

la hipótesis de que la moneda no está cargada, al nivel de 5% de probabilidades. Sin embargo,

puesto que 5,0 es menos que 6,63, no podemos rechazar la hipótesis al 1% de probabilidades.

En este caso, lo correcto sería repetir la prueba.

Ejemplo: Alguien nos proporciona un par de dados, de los que sospechamos que están

“cargados”. Para probarlo, efectuamos 36 lanzamientos y obtenemos los resultados indicados

abajo. ¿Podemos concluir que los dados están “cargados”, al 1% de probabilidades?

_____________________________________________________________________

Resultado 2 3 4 5 6 7 8 9 10 11 12

Frecuencia 1 0 5 0 4 5 6 5 0 10 0

96

H0: los dados son correctos

H2: los dados están “cargados”

La distribución de frecuencias para el lanzamiento de dos dados está indicada abajo; los

numeradores de las frecuencias de las fracciones que corresponden a cada resultado, serían las

frecuencias esperadas, de un total de 36, como corresponde al total de las posibles

combinaciones al lanzar dos dados.

Resultado 2 3 4 5 6 7 8 9 10 11 12

Frec. Esperada 1

36

2

36

3

36

4

36

5

36

6

36

5

36

4

36

3

36

2

36

1

36

Frecuencia 1 0 5 0 4 5 6 5 0 10 0

𝑥2=(1−1)2

1+

(0−2)2

2+

(5−3)2

3+

(0−4)2

4+

(4−5)2

5+

(6−5)2

6+

(5−4)2

4+

(0−3)2

3+

(10−2)2

2+

(0−1)2

1=

44.14

X2.01 (10g.l.) = 23.21; por cuanto el valor calculado de x2 es mayor que el valor tabular,

rechazamos H0 y concluimos que los dados están “cargados”, lo cual salta a la vista, puesto que

sería raro que ,de 36 lanzamientos, no salgan una sola vez el 3, 5 , 10 o 12

Ejemplo: En cruzamiento de dos tipos de frejol, se encontraron, en la segunda generación,

cuatro tipos de plantas. En una muestra de hojas de 1.301 plantas se encontró:

773 verdes

231 doradas

238 verdes - rayadas

59 doradas- verdes- rayadas

1.301

97

De acuerdo a la teoría mendeliana sobre la herencia, la proporción de tipos de hojas debe ser, 9:

3: 3: 1. La Hipótesis nula sería que los resultados están de acuerdo con la teoría mendeliana. El

número de plantas dentro de cada clase, de acuerdo a las frecuencias esperadas, seria:

9

16(1.301) = 731.9

3

16(1.301) = 243.9

3

16(1.301) = 243.9

1

16(1.301) =

81.3

1.301,0

𝑥2 =(773.0 − 731.9)2

731.9+

(231.0 − 243.9)2

243.9+

(238.0 − 243.9)2

243.9+

(59.0 − 81.3)2

81.3= 9.25

= 9.25, con 4-1= 3 grados de libertad

El valor x2.05 para tres grados de libertad es 7.81. Por cuanto el valor calculado 9.25 es mayor

que tabular 7.81, estaríamos dispuestos a rechazar la hipótesis nula y aceptar la alternativa: los

resultados obtenidos no concuerdan con la teoría sobre la herencia propuesta. Como en el

ejemplo anterior, se justificaría el ensayo.

Ejemplo: la relación hombres – mujeres en un pequeño pueblo de Escocia fue 1940, de 7 a 1, en

favor de los hombres; es decir, había 7 mujeres por cada hombre. Supongamos que en una

encuesta reciente se encontró que, en una muestra tomada al azar, formada por 300 personas

había 72 hombres. Podríamos afirmar que la relación 7: 1 ha cambiado?

Si la relación es de 7 a 1, una de cada 8 personas es hombre; en consecuencia, si la relación no

ha cambiado, la proporción de hombre es P= 1/8

Vamos a probar, entonces:

H0: p = 1/8, contra la hipótesis alternativa de dos colas

H1: p ≠1/8, al 5% de probabilidades

Si X es el número de hombres:

X= 72, N – X = 300 – 72 = 228 mujeres

98

La frecuencia separada sería:

Hombres = 1/8 (300) = 37.5

Mujeres = 7/8 (300) = 262.5

𝑥2 =(72.0 − 37.5)2

37.5+

(228.0 − 262.5)2

262.5= 31.74 + 4.53 = 36.27

En la tabla Nº IV del apéndice, vemos que el valor de x2.05 (1 g. l.) = 3.84; por cuanto el valor

calculado es mayor que el tabular, rechazaríamos H0 y concluiríamos que, desafortunadamente,

la relación ha cambiado.

9.2 Cuadros con dos criterios de clasificación.

Llamados también cuadros de doble entrada, en los que las filas representan un criterio de

clasificación y las columnas el otro. Para ilustrar el procedimiento, vamos a usar los siguientes

ejemplos:

Para una prueba con pasta dentífrica, se dividió a cierto número de niños en tres grupos. Cada

uno de ellos usó una marca distinta durante un año. Los resultados fueron:

Marca de pasta Cantidad de caries nuevas Total

0 – 1 2 – 3 4+ filas

____________________________________________________________________________

A 40 10 10 60

B 50 20 20 90

C 60 10 20 90

Total columnas 150 40 50 240

99

Es cierta la afirmación que hacen los fabricantes de A, en el sentido de que hay “significativas

diferencias” entre su producto y los otros, en ¿cuánto a su capacidad para reducir el número de

caries?

La hipótesis planteada sería:

H0: las tres marcas de pasta son iguales

H1: la marca A disminuyó significativamente el número de caries, con relación a B y C.

El cuadro presenta los valores observados. Para calcular los valores esperados, teóricos,

procedemos de la siguiente forma, para llenar las celdas, dentro de cada columna

𝑒11 =(150)(60)

240= 37.5; 𝑒21 =

(150)(90)

240= 56.25; 𝑒31 =

(150)(60)

240= 56.25

𝑒12 =(40)(60)

240= 10.0; 𝑒22 =

(40)(90)

240= 15.0; 𝑒32 =

(40)(90)

240= 15.0

𝑒13 =(50)(60)

240= 12.5 ; 𝑒23 =

(50)(90)

240= 18.75; 𝑒33 =

(50)(90)

240= 18.75

El cuadro final de valores observados y esperados (entre paréntesis) sería como sigue:

Marca de pasta Cantidad de caries nuevas

0 – 1 2 – 3 4+

A 40 10 10

(37.5) (10.0) (12.5)

B 50 20 20

(56.26) (15.0) (18.75)

C 60 10 20

(56.25) (15.0) (18.75)

100

𝑥2 =(40.0 − 37.5)2

37.5+

(50.0 − 56.25)2

56.25+

(60.0 − 56.25)2

56.25+

(10.0 − 10.0)2

10.0

+(20.0 − 15.0)2

15.0+

(10.0 − 15.0)2

15.0+

(10.0 − 12.5)2

12.5+

(20.0 − 18.75)2

18.75

+(20.0 − 18.75)2

18.75= 8.76

Los grados de libertad se calculan así:

g. l. = (filas – 1) (columnas – 1)

= (3 – 1) (3 – 1) = 4

El valor tabular de x2.05 (4 g. l.) = 9.49

x2.05 (4 g. l.)=13.28

Por cuanto el valor calculado de x2 = 8.76 es menor que los valores tabulares al 5 al 1 % de

probabilidad, aceptamos la hipótesis nula y concluimos que las tres marcas de pasta dentífrica

son iguales y, en consecuencia, falsa la afirmación de los fabricantes de A, en el sentido de que

su producto es superior a los otros. Los fabricantes de A pudieron sostener que, en total, su

producto disminuyó 30 caries con relación a B y C o, en otras palabras, que fue 33% más

efectivo; pero, como hemos visto; la diferencia no fue estadísticamente significativa.

Ejemplo: Para probar la efectividad de una vacuna, se administró el producto a 170 conejos; un

grupo formado por 220, no recibió la vacuna, es decir, constituyó el lote testigo. Los 390

animales fueron infectados artificialmente con el agente causal de la enfermedad. Del grupo de

animales vacunados, murieron ocho, en tanto que del testigo, murieron 19. Podemos concluir

que la vacuna fue efectiva. La hipótesis nula sería:

H0: la tasa de mortalidad entre los dos grupos es igual; o, lo que es lo mismo, la vacuna no fue

efectiva

H1: la tasa de mortalidad para el grupo de animales vacunados es menor; es decir, la vacuna fue

efectiva

El cuadro de doble entrada para los valores observados sería:

101

Muertos Vivos Total

Vacunados 8 162 170

No vacunados 19 201 220

Total 27 363 390

Los valores esperados son:

𝑒11 =(27)(170)

390= 11.76; 𝑒21 =

(27)(220)

390= 15.23

𝑒12 =(363)(170)

390= 158.23; 𝑒22 =

(363)(220)

390= 204.76

El cuadro de valores observados y esperados (entre paréntesis) es:

Muertos Vivos

Vacunados 8 162

(11.76) (158.23)

No vacunados 19 201

………………………………………………………(15.23) (204.76)

𝑥2 =(8.0 − 11.76)2

11.76+

(19.0 − 15.23)2

15.23+

(162.0 − 158.23)2

158.23+

(201.0 − 204.76)2

204.76= 2.29

Los grados de libertad, como en el caso anterior:

g. l = (filas - 1) (columnas – 1)

= (2 – 1) (2 – 1) = 1

102

X2.05 (1 g. l.) = 3.84 Por cuanto el valor calculado es menor que el valor tabular, no podemos

rechazar H0 y concluimos que la vacuna no fue efectiva en cuanto a reducir la tasa de

mortalidad

Los ejemplos precedentes sirven para demostrar que, en estudios de este tipo, no se debe sacar

conclusiones rápidas, previas al análisis estadístico. Es común que la prensa o revistas no

científicas presenten resultados similares en forma de porcentajes y que podrían no estar

basados en un análisis matemático. Sería precipitado concluir de los valores observados del

ejemplo anterior, que el porcentaje de muertes dentro del lote de animales vacunados fue de

42%, con respecto al lote de animales no vacunados. No sólo es de interés conocer el número de

muertes en cada grupo, sino que se debe tomar en cuenta el tamaño de la muestra, puesto que

los números observados nos dicen algo cuando están relacionados con el número total de

individuos dentro del experimento. Supongamos que en un ensayo similar, el número de

muertes permanecía igual, pero que el total de animales dentro de cada grupo era de 30. En este

caso x2

Sería igual a 8, 14, mayor que el valor tabular de 3,84, en cuyo caso habríamos rechazado la

hipótesis nula y habríamos concluido que la vacuna resultó efectiva. No es lo mismo comparar

ocho muertes de entre 170 animales, que ocho muertes de entre 30

9.3 Corrección de Yates

Esta corrección se usa generalmente, cuando el número de grados de libertad es uno y está dada

por,

𝑥2𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑎 =[(01 − 𝑒1) − 0.5]

𝑒1+

[(02 − 𝑒2) − 0.5]

𝑒2+ ⋯ +

[(01 − 𝑒1) − 0.51]

𝑒1

De la comparación de los valores de x2, corregidos y no corregidos, pues de sacarse la

conclusión pertinente: en caso de que los dos valores sugieran conclusiones diferentes, la

solución estaría en aumentar el número de observaciones, es decir, incrementar el tamaño de la

muestra.

103

Capítulo 10

La Distribución de t.

Como en el caso de X2, t presenta una distribución diferente, de acuerdo al número de grados de

libertad. En la tabla N° V de Apéndice podemos ver que, para una muestra de 14 pares de

observaciones por ejemplo, (n=14-1=13), en la columna de grados de libertad 13 y al nivel de

probabilidades del 1%(0,01), en el cuerpo de la tabla encontramos el valor 3.012, el mismo que

debe ser sobrepasado por el valor de t calculado, en cuyo caso decimos que los resultados son

significativos al 1%. Si el valor calculado fuera menor que 3.012 aceptaríamos la hipótesis nula

de que los resultados no son significativos.

Conforme aumenta el número de grados de liberación, la distribución de t se aproxima a la

normal. Se ha visto en capítulos anteriores que, para muestras mayores que 30 (30

observaciones), llamadas muestras “grandes”, las distribuciones de muestreo a ola normal,

disminuye conforme se reduce el número de observaciones.

Así, William S. Gasset, industrial cervecero y estadístico, pudo apreciar que el uso de s para

predecir α, al calcular valores de z no era confiable para pequeños muestras. Este autor ideo la

estadística t, llamada “t de Student”, seudónimo usado por Gasset.

Por definición,𝑡 =��−𝜇

𝑠𝑥

𝑡 = 𝑥1 − 𝑥2 = ��

𝑠(𝑥1 − 𝑥2 ) = 𝑠𝑑

Por la que t está dada por la diferencia entre medias de tratamientos, dividida por el error típico

de la diferencia.

En definitiva, la prueba de t resulta un análisis de variancia para dos tratamientos.

En la práctica, para probar la hipótesis nula de que

no hay diferencia entre dos juegos de muestras, se

aplica.

104

10.1 Prueba t para observaciones no pareadas.

Tanto para observaciones pareadas como para las no pareadas, el valor d, reemplaza el de𝑥1 −

𝑥2 , proveniente de los dos juegos de muestras.

Para observaciones no pareadas.

𝑠𝑑 = √𝑠2 (1

𝑛1+

1

𝑛2) = √𝑠2 (

𝑛1 + 𝑛2

𝑛1𝑛2)

Ejemplo: El cuadro N° 10.1 presencia la ganancia de peso en novillos con y sin suministro

proteínico.

𝐻0: 𝜇𝐴 = 𝜇𝐵

𝐻1: 𝜇𝐴 ≠ 𝜇𝐵

A (sin suplemento) B(con suplemento)

25 48

30 42

28 50

26 38

32 46

35 40

34

Suma de cuadrados SC 𝑆𝐶(𝑥2) = ∑ 𝑥21 − (∑ 𝑥1)2/𝑛1

∑ 𝑥1 = 210 264

∑ 𝑥21 = 6.390 11.728

(∑ 𝑥1)2/𝑛 = 6.300 11.661

𝑥 = 30 44

105

= 6.390 −44.100

7= 6.390 − 6.300 = 90

𝑆𝐶(𝑥2) = ∑ 𝑥22 − (∑ 𝑥1)

2

/𝑛2

= 11.728 −69.696

6= 11.728 − 11.616 = 112

𝑠2 =𝑆𝐶(𝑥1) + 𝑆𝐶(𝑥2)

(𝑛1 − 1) + (𝑛2 − 1)=

90 + 112

6 + 5=

202

11= 18,36

18,36 es un estimado de la varianza común para los dos grupo; los grados de libertad =(𝑛1 −

1) + (𝑛2 − 1) = 6 + 5 = 11

𝑠𝑑 = √𝑠2 (𝑛1 + 𝑛2

𝑛1𝑛2) = √18.36 (

42

7 + 6) = √59.32 = 7.70 𝑙𝑖𝑏𝑟𝑎𝑠

El valor de 𝑡05(11𝑔. 𝑑 1) = 2.201

El valor de 𝑡01(11 𝑔. 𝑑 1. ) = 3.106

𝑡 =𝑑

𝑠𝑑=

30 − 44

7.70=

−14

7.70= −1.82(𝑁.𝑆)

Es decir, la diferencia no es significativa, puesto que el valor calculado no sobrepasa el valor

tabular. En consecuencia, aceptamos la H0, de que no hay diferencia entre los tratamientos.

10.2 Prueba de t para observaciones pareadas.

Frecuentemente, las observaciones dentro de un ensayo son pareadas: cuando se va a comparar

dos raciones usando dos animales de cada una de las 20 camadas de cerdos, asignando los

animales de cada camada al azar, uno a cada ración, o en el caso de comparar el contenido de

aceite de dos variedades de ajonjolí, sembradas en 14 localidades.

Ejemplo: los rendimientos de dos variedades de avena en 10 localidades fueron:

𝐻0: 𝜇𝐴 = 𝜇𝐵

55 46 9 81

89 81 8 64

53 60 -7 49

106

𝐻1: 𝜇𝐴 ≠ 𝜇𝐵

64 54 10 100

84 89 -5 25

86 74 12 144

52 59 -7 49

32 29 3 9

X1 625 582 43

729

X 62,5 58,2 d= 4,3

𝑆2�� =∑ 𝐷2 − (∑ 𝐷)2/𝑛

𝑛(𝑛 − 1)=

729 − 184.9

10(9)=

544.1

90= 6.04

𝑆2�� = 6.04; 𝑆�� = √6.04 = 2.45

𝑔. 𝑑𝑒 𝐼. = 10 − 1 = 9; 𝑡05(9𝑔. 𝑑𝑒 1. ) = 2.262

𝑡 =��

𝑆𝑑=

4,30

2,45= 1.76(𝑁𝑆)

Aceptamos 𝐻0: no hay diferencia en rendimientos entre las variedades.

De los ejemplos propuestos anteriormente, se desprende que cuando el valor de t calculado es

superior, en términos absolutos, al valor tabular, se rechaza la hipótesis nula de que la media del

tratamiento A es igual a la de B y optamos por la hipótesis alternativa. Normalmente, no existe

ninguna hipótesis alternativa; puede haber varios tipos de ellas, las que pueden ser designadas

como alternativas de una o dos colas o lados. El uso de la prueba de una o dos colas está

determinada por la forma de plantear el problema o la pregunta dentro del experimento. En los

dos ejemplos anteriores escogimos la prueba de dos colas por cuanto los tratamientos B con

(con suplemento proteínico y variedad B respectivamente), pueden ser mayores o menores que

los tratamientos A, en cuyo caso se justifica usar la hipótesis alternativa 𝜇𝐴 ≠ 𝜇𝐵.

Rechazaremos entonces, la hipótesis nula cuando los valores absolutos de t calculados, sean

mayores que los tabulares en los dos lados de la distribución es decir cuando aquellos se hallen

en la región crítica o zona de rechazo, fuera de la zona de aceptación de la hipótesis nula.

107

En el primer ejemplo el valor tabular de t01 para 11 grados de libertad, es de 3.106, el valor

calculado de t fue de -1.82, que cae en la zona de aceptación de la hipótesis nula. Por tanto,

declaramos los resultados no significativos.

En resumen para pruebas e dos colas o de dos alternativas, se lee el valor respectivo en la Tabla

N° V del Apéndice, de arriba hacia abajo, de acuerdo con los grados de libertad y el nivel de

probabilidad escogido. Para pruebas de una cola, o de una sola alternativa, es decir cuando

tenemos interés solamente en valores extremos a un solo lado de �� , se lee los valores de abajo

hacia arriba, así mismo de acuerdo con los grados de libertad y el nivel escogido. En este último

caso, si 𝐻0: 𝜇𝐴 ≡ 𝜇𝐵, las alternativas nativas pueden ser:

𝜇𝐴 < 𝜇𝐵 𝑜 𝜇𝐴 > 𝜇𝐵

Para ilustrar los casos en que se utilizan pruebas de una o de dos colas, presentamos

seguidamente los siguientes ejemplos:

Ejemplo: Un fabricante de motores o gasolina sostiene que, en promedio, ellos gastan no más de

0.6 galones de gasolina por ahora. Se probó una muestra de 24 motores y se encontró que el

consumo promedio fue de 0.84 galones con s=0.26. Con estos resultados, podemos decir que la

afirmación del fabricante es cierta

L H0 seria que la afirmación es correcta en cuyo caso 𝐻0: 𝜇 = 0.6. Puesto que nuestro interés

seria rechazarla solamente en caso de que el consumo sea mayor que 0.6 galones escogerías una

prueba de una cola,𝐻1: 𝜇 > 0.6 . Si el nivel de probabilidad es del 5% vamos a comparar el

valor calculado de t con el tabular para 23 grados de libertad.

𝑡 =�� − 𝜇

𝑠��=

�� − 𝜇

𝑠/√𝑁=

0.84 − 0.6

0.26/√24=

0.24

0.05= 4.8

108

En la tabla N° V vemos que t05 (23g. I)= 1.714; por consiguiente, rechazamos la hipótesis nula y

concluimos que el consumo promedio de los motores es mayor que 0.6 galones por hora del

fabricante es falsa.

Ejemplo: el pago promedio mensual por consumo de luz en la ciudad, el año pasado, fue de

s/320,00; quisiéramos saber si ha habido algún aumento esta año. Para probarlo tomamos una

muestra al azar de varias familias y estimados los pagos realizados por ellas. Vamos a utilizar la

hipótesis de que no habido cambio, es decir 𝐻0: 𝜇 = 320 , contra la alternativa de dos colas,

𝐻1: 𝜇 ≠ 320 , al nivel de probabilidad del 1%.

Optamos por una prueba de dos colas porque el valor de las planillas pue haber aumentado o

disminuido.

Tomamos una muestra de 50 familias y encontramos que el gasto promedio es de s/.280, con

S=s/.70

𝑡 =�� − 𝜇

𝑠��=

280 − 320

70/√50=

−40

9.9= −4.04

Valor que supera el de 𝑡.005(49 𝑔. 𝐼. ) = −2.684. En consecuencia, rechazamos Ho y

concluimos que ha habido un cambio significativo en el valor de las planillas de luz.

Ejemplo: la ganancia promedio de 30 conejos a los que se alimentó con una dieta experimental,

fue de 275 gramos. 𝑆�� = 15.6𝑔; Al nivel del 5%, podemos concluir que la ganancia promedio

con esa ración es no menor de 300g

𝐻0 ∶ 𝜇 ≥ 300

𝐻1 ∶ 𝜇 < 300

𝑡 =275 − 300

15.6=

−25

15.6= −1.602

El valor tabular de 𝑡05(29 𝑔. 𝐼. ) = −1.699, por cuanto el valor tabular es mayor que el

calculado, no podemos rechazar Ho y concluimos que la ganancia promedio que podemos

esperar con la dieta experimental es de, por lo menos, 30 g.

En los ejemplos propuestos podemos apreciar los siguientes aspectos:

1) La hipótesis nula se presenta siempre como una igualdad es decir 𝐻0 ∶ 𝜇𝐴 = 𝜇𝐵 la

forma como se presenta la hipótesis alternativa depende del tipo de pregunta que

plantea el problema.

109

𝐻1 ∶ 𝜇𝐴 ≠ 𝜇𝐵; 𝜇𝐴 > 𝜇𝐵; 𝜇𝐴 < 𝜇𝐵

2) Se usará una prueba de una o dos colas, dependiendo de nuestro interés y la forma como

se plantea la pregunta dentro el problema. Si existe la posibilidad de que el tratamiento

o factor B pude ser tanto mayor como menor (cualquiera de los dos casos) que el

tratamiento o factor A usaremos una prueba de dos colas, plateando 𝐻1 ∶ 𝜇𝐴 ≠ 𝜇𝐵en

caso de que tengamos interés en determinar si B tiene valores únicamente mayores o

únicamente menores que A es decir valores extremos solamente de la distribución,

usaremos una prueba de una cola, plantando 𝐻1 ∶ 𝜇𝐴 > 𝜇𝐵 o 𝜇𝐴 < 𝜇𝐵.

3) En el caso de pruebas de una cola, leemos el valor tabular de t, para el nivel de

probabilidad establecido, directamente en la tabla N° V, de abajo hacia arriba; para

pruebas de dos colas se lee el valor tabular, de acuerdo al nivel e probabilidad escogido,

de arriba hacia abajo.

4) Cuando la diferencia entre dos tratamiento A y B es de tal magnitud que el valor

calculado de t cae en una de las dos colas de la distribución (zonas críticas o de

rechazo), rechazamos Ho y optamos por la alternativa H1.

110

Capítulo 11

Correlación

En muchos problemas de investigación, tiene especial interés conocer el grado de relación que

existe entre dos o más variables. Por ejemplo, existe alguna relación entre dosis de fertilizantes

o fungicidas y el rendimiento de un cultivo; entre el grado de instrucción de una persona y su

inteligencia; entre la edad y la cantidad de cigarrillos que fuma un individuo.

La correlación mide la correlación, el grado de la intensidad de asociación entre dos variables o

el grado en que las variables cambian una con respecto a la otra.

Los valores de correlación (r) varían de -1 a +1, cuando existe una relación perfecta negativa y

positiva, respectivamente. Cuando no existe relación alguna entre las variables, r=0. En la

práctica, los valores se distribuyen entre los dos extremos y, más bien, debemos dudar de un

valor de r= 1.0.

El diagrama de dispersión de los datos, o dispersograma, dentro de los ejes X, Y, da una idea

del grado de asociación entre las variables. A cada valor de X, en el eje de las abscisas,

corresponde uno de Y, en el eje de las ordenadas, ubicándose en esta forma el punto, dentro de

los ejes de coordenadas.

En la Fig. 11.1 vemos que, en el primer caso, cuando la correlación es pequeña, r se aproxima a

cero, es decir no existe relación entre las variables.

Y

X

r=0

X

Y

r= +1

r=-1

111

Al centro se puede ver una relación positiva estrecha que, teóricamente, es igual a 1 y, en el

tercer caso, una relación negativa, en la que r = -1.

A pesar de lo expuesto, puede ser difícil y riesgoso tratar de interpretar visualmente un valor de

correlación, puesto que si no se escoge escalas adecuadas para los ejes de las X e Y, la simple

observación puede sugerir una correlación falsa o esconder una verdadera. El primer caso sería

el de un vendedor que, para impresionar al público, presenta una línea ascendente pronunciada,

que representa volumen de ventas la cual no guarda relación con la proporción real. Para evitar

conclusiones falsas, el investigador debe indicar, junto con el diagrama de dispersión de los

datos, el valor de la desviación típica y el valor r.

11.1 Coeficiente de Correlación

Cuando se trata de establecer el grado de relación entre dos variables, se calcula el coeficiente

de determinación (r² x 100), que determina el porcentaje de asociación entre las variables. Es

decir que este valor denota el porcentaje de la variación de Y atribuible a X; el resto de esa

variación no se puede explicar.

El coeficiente de indeterminación, está dado justamente por 1-r² = l², que constituye la

proporción no explicable de una suma de cuadrados total.

r= √𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑏𝑙𝑒

𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛𝑛 𝑡𝑜𝑡𝑎𝑙

La raíz cuadrada de coeficiente de determinación es lo que se llama coeficiente de correlación,

el cual está dado por

r=∑ 𝑋𝑌−(∑ 𝑋) (∑ 𝑌)/𝑛

√[∑ 𝑋²−(∑ 𝑋)²/𝑛] [∑ 𝑌²−(∑ 𝑌)²/𝑛]

o sea que r es el cociente de dividir la suma de productos XY[SP(XY)], por la raíz cuadrada de

la suma de cuadrados de X[SC(X)] por la suma de cuadrados de Y [(SC(Y)].

Supongamos que tenemos dos variables X, Y, con seis pares de observaciones correspondientes

a dosis de fungicidas (X) y rendimiento (Y)

X

Fig. 11.1 grado de relación entre dos variables

112

(X)

Fungicida

(Y)

Rendimiento

2 3

5 7

4 3

7 9

3 5

9 10

30 37

SC(x)= ∑ 𝑋1²6

𝑖=1 − (∑61=1 𝑥1) ²/n

= 2²+5²+……+9²-(30)²/6

184-150= 34

SC (Y) = 3²+…..+10²-(37)²/6

= 273 -228= 45

SP (XY) = ∑ 𝑋𝑌6𝑖=1 − (∑ 𝑋6

𝑖=1 (∑ 𝑌6 )/6

= (2x3) + (5x7) +….. (9x10) – (30)(37)/6

221-185=36

r= 36

√(34)(45)= +0.92 + +

La significación del coeficiente de correlación r depende del número de pares de observaciones.

Mientras mayor es un número, mayor es la probabilidad de obtener significación, pues que el

número de grados de la libertad se basa en (n-2), en lugar de (n-1), como en casos y

distribuciones anteriores.

113

El valor de r tabular debe ser sobre pasado por el valor calculado para obtener significación. En

nuestro ejemplo, los valores tabulares para 6-2=4 de grados de libertad, a los niveles del 5 y del

1% son, 0,811y 0,917, respectivamente; por cuanto el valor calculado en nuestro ejemplo es de

0,92, podemos rechazar la hipótesis nula de que no existe relación entre las variables y aceptar

la hipótesis alternativa: existe relación entre ellas, más de lo que pudiera atribuirse al azar…

El coeficiente de determinación viene dado por,

r² (100)= (0,92)² X 100 = 84,64 %

Es decir que 85% del aumento en rendimiento, se puede atribuir a la aplicación el fungicida. El

resto no se puede explicar

11.2 Propiedades del Coeficiente De Correlación

a) r es independiente del origen de las variables; indica, más bien, la consistencia del

cambio: no importa si comparamos lluvia con toneladas, libras con centímetros, etc.

b) Es independiente de la escala

c) Es independiente del número de medidas, aun cuando generalmente se considera que

son más necesarios por lo menos 20 pares para tener confianza en un valor de r

significativo.

d) Las variables deben ser pareadas por alguna razón lógica

e) Las muestras deben ser tomadas al azar

f) Correlación espuria es una condición en que las variables no están causalmente

relacionadas entre sí sino que más bien, lo están a una tercera.

g) Se debe tener mucho cuidado al inferir causa y efecto de un coeficiente de correlación

significativo.

Con relación al último literal, debe añadirse que, de todas las medidas estadísticas estudiadas, el

coeficiente de correlación es la que está más sujeta a ser mal interpretada. Esto se debe a la

suposición frecuentemente errónea de que por cuanto dos variables tienen relación, el cambio de

una de ellas ocasiona un cambio en la otra. Así, muchas veces podemos usar un coeficiente de

correlación significativo, para “probar” una relación de causa y efecto, que puede no existir.

Se ha demostrado que existe una correlación negativa entre el hábito de fumar y la obtención de

buenas calificaciones. Si uno fuma, podría usarse este hecho como evidencia de que fumar es

nocivo, de que fumar causa o se refleja en la obtención de notas bajas. Esto puede ser cierto,

114

pero los fumadores podrían argüir que el obtener bajas calificaciones causa tensión nerviosa lo

cual, a su vez, estimula al estudiante a fumar más.

Podría suceder que también fumar y obtener malas notas no estén directamente relacionados

entre sí, pero se hallan correlacionados porque los dos hechos tiene relación con un tercer factor,

tal vez el grado en que el individuo se dedica a actividades sociales o que no tengan que ver con

el estudio. Esto es justamente lo que se conoce como correlación espuria, tal como se anote en

el literal F.

Finalmente hay que notar que, debido a la variación a las muestras, podemos obtener una

correlación significativa aun cuando las variables no estén relacionadas; esto puede ser

controlado seleccionado el nivel de significación.

115

Capítulo 12

Regresión

Como se ha visto en el capítulo precedente, en el campo de la investigación frecuentemente se

encuentra dependencia entre dos variables. Así por ejemplo, decimos que existe relación entre la

cantidad de fertilizante aplicado y el rendimiento de cultivos; o entre la longitud y diámetro de

mazorca y el peso del grano; entre la altura de una persona y su peso, etc.

El coeficiente de correlación determina la intensidad de asociación entre dos variables, pero

nada nos dice sobre la gradiente de la línea de asociación, ni tiene capacidad de predicción.

Regresión tiene que ver con la dependencia de la variable Y, llamada variable dependiente, de

otra variable X, la variable independiente. En matemáticas, se conoce a Y como función de X.

es decir, en el caso de dosis de fertilizante X, y rendimiento de trigo, por ejemplo, a una serie de

valores 𝑥1,𝑥2,𝑥3 … .. corresponde otra de 𝑦1,𝑦2,𝑦3 … ..

Como en el caso del diagrama de dispersión o dispersograma, en correlación, estos valores se

disponen dentro de los dos ejes de coordenadas, y el dispersograma puede sugerir si existe una

relación lineal como en la

Fig. 12.1 a, o si ella es curvilineal (Fig. 12.1b).

116

Distancia entre surcos

Fig. 12.1 Respuesta lineal y curvilineal

En estadística, no nos contentamos con la apreciación visual del dispersograma, sino que

tratamos de encontrar ecuaciones que describan dichas curvas de respuesta, lo que se llama

ajuste de curvas de respuesta.

Pero, además de determinar la función matemática, que nos diga de qué manera están

relacionadas las variables, o sea que nos de la “mejor” relación funcional entre ellas, es de

interés saber con qué precisión se puede predecir el valor de una variable, si se conoce los

valores de la otra. Puede tener interés tratar de predecir valores futuros como la producción de

frutas, accidentes automovilísticos (Compañías de Seguro), posible ingreso de estudiantes a la

facultad, etc. O, puede ser posibles observar un valor de X e imposible o poco práctico, observar

el valor correspondiente de Y.

Sin embargo, es necesario advertir que, simplemente en base de nuestra suposición de que existe

dependencia de Y en X, y por haber seguido el procedimiento mecánico de cálculo, no se debe

concluir automáticamente que existe relación causal entre X e Y. solo el investigador, con

conocimiento cabal del material y la forma como se llevó a cabo el experimento, está en

capacidad de tomar esa decisión.

Sin bien el termino regresión no describe, dentro de la estadística, los usos que tiene, su empleo

es de origen histórico. Galton, en 1886. Postulo la teoría de que existe relación entre la estatura

de los padres y la de los hijos. Sin embargo, este autor encontró que la altura promedio de los

hijos de matrimonios altos, no era tan grande como la de estos, ni que los hijos de pareas de baja

estatura, eran tan pequeños como sus padres. Galton concluyo que parecía existir una tendencia

del carácter altura, a acercarse a los valores promedios de la población; es decir una regresión

hacia los valores promedios.

0

0,2

0,4

0,6

0,8

1

1,2

0 0,2 0,4 0,6 0,8 1 1,2

(b)

117

Resumiendo, podemos decir que los usos de la regresión en estadística pueden ser:

a) Determinar si la variable dependiente Y, depende de X; es decir, nos da la medida de la

proporción de cambio en Y, por una unidad de cambio en X.

b) Conocidos los valores de la variable independiente X, predecir valores de Y,

desconocidos en ese momento.

c) Algunos investigadores pueden estar interesados en determinar el error en Y, dentro de

un experimento, después de hacer los ajustes del efecto que puede tener X en Y.

d) Un investigador puede postular su teoría sobre causa y efecto: para probarla, puede

usar varios métodos de regresión.

12.1 Ecuación de la línea recta.

Si dentro del dispersograma, las observaciones se sitúan alrededor de la línea recta, (repuesta

lineal), podemos determinar, por geometría analítica, la ecuación de esa línea recta.

�� − �� = b (X- ��)

�� − �� = bX- b��

�� = �� - b�� + 𝑏𝑋; �� - b�� = a

��= a + bX (relación funcional)

Donde �� : valor de la ordenada (valor precedido)

X: valor de la abscisa (valor conocido)

��: media de x

��: media de y

B: coeficiente de regresión

118

La Fig. 12.2 ilustra la forma como se traza la línea recta, en base de su ecuación matemática.

Fig. 12.2 Ecuación y trazado de la línea recta.

De la fig. 12.2 se desprende que, cuando X = 0, Y = a, es decir que a es el punto donde la línea

recta corta al eje Y, o sea el intercepto en Y. cuando a = 0, la línea pasa por el punto de origen

(0,0).

El cambio de una unidad en el eje de las X, provoca un cambio b en el eje de las Y, de tal

manera que b mide la gradiente de la línea de regresión. Cuando b es positivo, las dos variables

aumentan o disminuyen juntas. Tal sería el caso cuando X es kg. De fertilizante por hectárea, e

Y, toneladas de grano por hectárea. Cuando b es negativo, mientras el valor de una variable

aumenta, el de la otra disminuye: si X es distancia entre surcos e Y rendimiento, a mayor

distancia el rendimiento tiende a disminuir.

12.2 El método de los cuadrados mínimos.

Se ha anotado antes, que la cualidad principal de establecer un valor de regresión, consiste en

poder predecir resultados de Y, cuando solo se conoce el de X. sin embargo, estos parámetros

no se pueden determinar sin error, debido a que los valores observados de la variable

dependiente, rara vez coinciden con los valores esperados. Esto se demostró claramente en el

Cap. 9, al tratar sobre 𝑥2.

Cuando se traza líneas de regresión, es necesario ser objetivo al tratar de ajustar una serie de

datos a esas líneas de regresión. Para ello, se debe escoger la línea de “mejor ajuste” de estos

datos.

Como se ilustra en la fig. 12.2, los datos observados se disponen alrededor del eje o línea de

regresión. Se dice que la línea de regresión trazada es la que “mejor se ajusta” a los datos. En

Y

X

1 Unid. X

b. Unid

(x.y)

119

otras palabras, si se trazara otra línea de regresión, la suma de cuadrados de las desviaciones de

los puntos observados, tendría un valor más grande.

12.3 Cálculo del coeficiente de regresión y de la ecuación de regresión.

El cuadro 12.1 presenta, a manera de ilustración, los pesos promedios de cinco camadas de

cerdos y el consumo correspondiente de balanceado.

CUADRO 12.1 pesos iniciales promedios de cinco camadas de cerdos y consumo de

balanceado.

Peso corporal

(X)

Consumo (Y) Desviaciones

X Y

Cuadrados

𝑥2𝑦2

Productos

XY

85

75

80

68

82

720

680

700

630

715

+7 +31

-3 -9

+2 +11

-10 -59

+4 +26

49 961

9 81

4 121

100 3481

16 676

217

27

22

590

104

390

�� 78

3445

689

0 0 178 5320 960

Coeficiente de regresión b= ∑𝑥𝑦

∑𝑥2 = 960

178 = 2,39 lbs. De balanceado por libra de peso corporal de

los cerdos.

A este valor de b, el coeficiente de regresión, se ha llegado aplicando la fórmula.

𝑏𝑦.𝑥 =∑(𝑋 − 𝑥)(𝑌 − 𝑦)

(𝑋 − ��)2

120

𝑏𝑦.𝑥 = 𝑆𝑃 (𝑋𝑌)

𝑆𝐶(𝑥)

La suma de productos cruzados XY, dividida por la suma de cuadrados de X. la fórmula de

trabajo usual es

𝑏𝑦.𝑥 = ∑𝑋𝑌 − (∑𝑋)(∑𝑦)/𝑛

∑𝑥2 − (∑𝑥)2 /𝑛

En el ejemplo propuesto,

SP(xy) = (85 x 720) + (75 x680) + …. + (82 x 715) – (390) (3445)/5

= 269.670- 268.710 = 960.

SC (X) = 852 + 752 +….+ 822 − (390)2/5

= 30.598 – 30. 420 = 178

𝑏𝑦.𝑥 =960

178= 5.39

Lo que se interpreta diciendo que, para conseguir el aumento de 1 lb. De peso de los cerdos, se

necesita 5.39 lbs. De balanceado.

La ecuación de regresión se escribiría

�� − �� = b (X- ��)

�� − 689 = 5.39 (X- 78)

�� = 689 + 5.39 (X – 78)

��= 268.58 + 5.39X = a + b X

El intercepto en Y, a =�� − 𝑏��

a = 689 – 5.39 (78)

= 689 – 420.42

= 268.58

121

La función de predicción puede apreciarse con el siguiente ejemplo: queremos determinar la

cantidad de balanceado que consumiría un grupo de cerdos, cuyo peso promedio es de 90 lbs.

Como puede verse en el cuadro 12.3, no existe el valor de X = 90. Sin embargo, podemos

estimar el valor correspondiente Y, aplicando la ecuación: �� = 𝑎 + 𝑏 𝑋

��(90) = 268.58 + 5.39 (90)

=268.58 + 485.10

= 753.68 lbs. De balanceado.

12.4 Valores ajustados.

Son aquellos que se esperarías si todo los valores de Y tuvieran un valor promedio de X, o algún

otro valor fijo. El cuadro 12.2 presenta los valores ajustados de consumo de balanceado, que

serían aquellos que esperaríamos si todos los cerdos tuvieran un peso promedio de 78 libras.

CUADRO Nº 12.2 valores de regresión y valores ajustados de consumo para los datos del

cuadro Nº 12.1

Peso

corporal (x)

Consumo

(y)

Consumo

estimado ��

Desviación

𝒃𝒚.𝒙 = 𝒚 − ��

𝒅𝟐𝒚.𝒙

Consumo

ajustado

85

75

80

68

82

720

680

700

630

715

726.73

672.83

699.78

635.10

710.56

-6.73

+7.17

+0.22

-5.10

+4.44

45.29

51.41

0.05

26.01

19.71

682.27

696.17

689.22

683.90

693.44

3.445 3.445,00 0 142.47 3.445,00

�� = 𝑎 + 𝑏𝑋

122

= 268.58 + 5.39 (85) =726.73

12.5 Fuentes de variación en regresión

Tal como se indica ampliamente en el capítulo 15, el análisis de variancia es un procedimiento

aritmético que consiste en desdoblar la variación total en un juego de datos, de acuerdo con las

diferentes fuentes de variación presentes. Para el caso de regresión lineal, la variación total

puede desdoblarse en las siguientes fuentes: debido a regresión (X) y desviación de regresión

(residual).

El análisis de variancia (ADEVA), para los datos del cuadro 12.1 sería como sigue.

X (debido a regres.) 1 (∑𝑥𝑦)2/∑𝑥2 1 5.177,53 5.177,53 109,02**

Residual (desv. Regr.) n-2 por diferencia 3 142,47 47,49

Total n-1 ∑𝑦245.320,00

SC (residual) = (∑𝑥𝑦)2/∑𝑥2

= 5.320,00 – (920)2 / 178

5.320,00 - 5.177,53 = 142.47

SC (X), debido

A regresión = (∑𝑥𝑦)2/∑𝑥2

= (920)2 / 178

= 5.177,53

La prueba de f del ADEVA es una prueba de la hipótesis nula de que el coeficiente de regresión

poblacional β = 0, o sea de que la variación en X no contribuye a la variación en Y.

El valor altamente significativo de F para X (debido a regresión), nos permite rechazar la 𝐻0 y

afirmar que el peso de los cerdos explica fácilmente la variabilidad en la cantidad de balanceado

consumida.

123

12.6 Desviación y límites de confianza.

Un estimado insesgado de la verdadera variancia en regresión, está dado por el cuadrado medio

de la desviación de regresión, con n-2 grados de libertad.

𝑆2y.x = ∑𝑦2 −/ (∑𝑥𝑦)2 / ∑𝑦2

n - 2

= 5.320,00 – (920)2 / 178 = 47,50

3

La raíz cuadrada de este valor S y.x = 6,89 se denomina la desviación típica de Y para X fija.

La variancia de un valor estimado 𝑌 = 𝑌 + 𝑏𝑥, de la media de una población, está dada por la

suma de las variancias de 𝑌 y bx, así.

𝑆2y.x [1

𝑛+

(𝑋− 𝑥) 2

∑𝑥2 ]

Esta variancia aumenta conforme X aumenta. Para establecer los límites de confianza para una

media estimada, al nivel del 95%, tendríamos.

LC (𝑌 )= 𝑌 + 𝑏𝑥 ± .05 𝑆𝑦. 𝑥 √1

𝑛+

(𝑋− 𝑥) 2

∑𝑥2

El valor de ţ.05, con n-2 g. de 1 en el ejemplo de los cerdos, los límites de confianza para X =

90, son.

LC = 689 + 5.39 (90-78) ± 3.182 (6,89) √1

5+

122

178

= 731.76 Y 775.60

A veces, e necesario determinar los límites de confianza para β, el parámetro estimado por b.

para ello usamos.

𝑆2b = 𝑆2y.x / ∑𝑥2, dentro de la ecuación b±ţ.05 𝑆2y.x

√∑𝑥2

En el ejemplo, 5,39 ± 3.182 (6,89)

178 = 3,75 y 7,03.

124

Concluimos que β se encuentre entre 3.75 y 7.03 lbs. De balanceado por libra de peso corporal

de los cerdos, con 95% de seguridad de estar en lo cierto.

12.7 Propiedades y suposiciones en regresión lineal.

El problema de regresión lineal tiene las siguientes propiedades:

a) El punto 𝑥, 𝑦 , está situado sobre la línea de regresión.

b) La suma de las desviaciones de y de la línea de regresión es igual a cero.

c) La suma de los cuadrados de las desviaciones es un mínimo. Es decir, si reemplazamos

la línea de regresión calculada con cualquiera otra línea, la suma de cuadrados del

nuevo grupo de desviaciones será un valor más grande.

En lo posible, las variables independientes (X), deben ser igual o convenientemente espaciadas,

a fin de tener mayor eficiencia en la conducción del experimento y en la interpretación de los

datos: temperatura, distancias de siembra, dosis de herbicidas etc.

Cuando se supone que existe una variancia común, se puede usar el cuadrado medio del error,

para obtener inferencias validas sobre la media de una población, sin tomar en cuenta el valor de

X. si las variancias no son homogéneas, es necesario transformar los datos, a fin de

homogeneizar las variancias. Tal sería el caso de contajes de insectos o daños causados por

ellos, en que las variancias se ajustan a la distribución de Poisson y no a la normal.

125

Capítulo 13

Covariancia

El análisis de covariancia (ANACOVA), es un procedimiento de gran importancia en

experimentación y que, desafortunadamente, no es usado con la frecuencia que se debiera.

El ANACOVA utiliza el análisis de variancia (sobre el que se trata ampliamente en el Cap. 15)

y regresión, para remover la variabilidad que generalmente existe en la variable independiente

X, ajustar media de tratamiento y, sobre esta base, estimar con mayor fidelidad el efecto de X

sobre la variable dependiente Y.

Para los datos del cuadro 12.1 en el que se presenta pesos corporales de cerdos (X) y el

consumo de alimento balanceado (Y), si se hubiera usado varias raciones o dietas, las

diferencias entre los efectos de raciones podían o no podían ser significativas; es decir puede o

no puede haber diferencias en cuanto a la calidad de las raciones. Sin embargo, antes de sacar

conclusiones al respecto, debemos preguntarnos: al existir variación en los pesos promedios

iniciales de las camadas (68 y 85 lbs.), podemos atribuir la diferencia en los pesos finales de los

cerdos (a la terminación del ensayo), a la bondad de algunas de las raciones ¿O, quizás, buena

parte de las diferencias en los pesos iniciales de las camadas? Con respecto a esta última

pregunta, es sabido que lechones grandes y de mayor peso al nacimiento son más agresivos y,

en consecuencia, consumen mayor cantidad de alimento y ganan peso más fácilmente que

lechones pequeños y livianos.

Al ajustar los valores de Y, de acuerdo con los valores correspondientes de X, es posibles

analizar e interpretar con precisión los resultados del ensayo. Por medio del ANACOVA, la

contribución al erro experimental para ganancia de peso- contribución que, como se ha notado,

puede deberse a diferencias de peo inicial- puede ser calculada y eliminada.

En general, e ensayos de alimentación de animales, las diferencias entre medias de tratamientos

no ajustadas, puede deberse al valor nutritivo de las raciones, a diferencias en la cantidad

consumida por los animales o a las dos causas. Tal sería el caso de una dieta de alto valor

nutritivo en la que, un exceso de harina de pescado, puede volver impalatable al alimento; o

cuando se adiciona niveles subidos de melaza o torta de algodón a la dieta: en el primer caso

pueden producirse diarreas y en el segundo intoxicaciones por el contenido de gosipol de la

torta.

126

13.1 Usos del ANACOVA

a) Aumentar la precisión de experimentos. En estos casos, el covariado X (ejemplo de las

raciones consumidas por cerdos), es la medida que se toma dentro de cada unidad

experimental (animales), antes de aplicar los tratamientos (dietas), medida que tiende a

predecir la respuesta de la unidad experimental (X), al tratamiento (Y).

b) Como se ha anotado antes, una fuente importante de error proviene del azar, del hecho de

que, por randomización, cerdos más grandes sean asignados a ciertas raciones. Al remover

las diferencias de peso inicial, se obtiene un error experimental. Por ejemplo, podemos

suponer que ciertos tratamientos influyen no solo en la variable dependiente (Y), sino

también en la variable independiente (X). la utilización del ANACOVA nos permitirá

confirmar o negar esta suposición.

c) Ajustar medias de tratamiento frente a posibles fuentes de error. Los ejemplos de consumo

de alimentos por animales y de parcelas de maíz afectadas por causas ambientales, tipifican

este uso del ANACOVA. Después de ajustar medias de tratamientos, es importante

determinar si los tratamientos están influyendo sobre la variable independiente (X), en cuyo

caso la interpretación de los datos variaría. Esto se debe a que las medias de tratamientos

ajustadas, estiman o predicen valores, suponiendo que las medias de tratamientos de la

variable independiente X son iguales.

El ajuste remueve parte de los efectos de tratamientos cuando las medias de la variable

independiente son afectadas por los tratamientos; en estos casos, se debe interpretar los

resultados del ensayo con cuidado.

d) Control de error. El objetivo del ANACOVA es incrementar la precisión al medir efectos de

tratamientos, cuando la variable independiente mide efectos ambientales y no está

influenciada por los tratamientos. En un ensayo de aplicación de úrea a parcelas de raigrás,

la cantidad de nitrógeno aplicada, puede determinar diferencias en la población, remueve

parte del efecto de la aplicación de nitrógeno y, en esta forma, es posible equivocarse en la

interpretación de los datos.

e) Estudiar el tipo de respuesta. Cuando se trata de relacionar aplicación de urea y rendimiento

de forraje, es interesante estudiar si el tipo de respuesta es lineal o curvilineal. Este sería un

caso típico de regresión, cuando se establece un ensayo de fertilización como el anotado, en

varias localidades y a lo largo de varios años.

f) Desdoblamiento de la covariancia en sus partes constitutivas; y,

127

g) Estimar datos perdidos.

13.2 Suposiciones en el ANACOVA y el modelo lineal aditivo.

Las suposiciones en covariancia deben ser una combinación de aquellas propuestas en el

ADEVA y en regresión.

1. Las medias deben medirse sin error y tener valores fijos.

2. Debe haber homogeneidad en la regresión, luego de haber removido los efectos de bloques

y tratamientos; además, se supone que la regresión de Y en X, es lineal e independiente de

bloques y tratamientos.

3. Los residuos, son normal e independientemente distribuidos, con media cero y variancia

común.

Para un diseño de bloques completos al azar, la descripción del modelo lineal aditivo, está dado

por,

𝑌𝑖𝑗 = µ + 𝑇𝑖 + 𝑃𝑖 + 𝛽 (𝑋𝑖𝑗 − ��. . ) + 𝜖𝑖𝑗

Dónde:

µ: media

𝑋𝑖𝑗: Variable independiente o concomitante

𝑌𝑖𝑗 : Variable dependiente

𝑇𝑖: Efecto de tratamientos

𝑃𝑖: Efecto de bloques

β: coeficiente de regresión

��. . : Media de la variable independiente

𝜖𝑖𝑗: Error

13.3 Modelo matemático

El cuadro Nº 13.1 presenta el modelo del NACOVA y el procedimiento para obtener los valores

de acuerdo a las diferentes fuentes de variación.

128

El análisis de los valores ajustados representa los puntos alrededor de la línea de regresión. La

suma de cuadrados debida a regresión, significa la dependencia de Y en X, si el valor de F

(cociente entre el cuadrado medio de tratamientos, sobre el cuadrado medio del error), resulta

significativo, existen diferencias entre tratamientos. La tabla Nº VI del apéndice, da los valores

de F.

129

BIOESTADÍSTICA

130

CAPÍTULO 1 Generalidades

1.1 INTRODUCCIÓN

Es usual encontrar en varios textos la palabra biometría como sinónimo de

bioestadística. Etimológicamente biometría proviene de dos raíces griegas, bios (vida) y

metron (medida). En consecuencia la biometría se ocupa del desarrollo teórico y

práctico para llevar a cabo mediciones en seres vivos, mientras que la bioestadística

facilita la aplicación de los métodos y técnicas estadísticas para analizar diversos

aspectos propios de los seres vivos, lo que indica una relación e integración obligatoria

entre la biología y la estadística. De todas maneras, en el lenguaje de los investigadores,

los dos términos se utilizan como equivalentes.

En las ciencias biológicas, como en todas las ciencias, mediante el proceso investigativo

se trata de entender una gran cantidad de fenómenos observados, por tanto se requiere

tener un conocimiento, lo más amplio posible, de un fenómeno particular y utilizar con-

ceptos y procedimientos estadísticos que conduzcan a encontrar explicaciones válidas

sobre el comportamiento del mismo y establecer las relaciones causa-efecto, lo cual

ayudará a tomar decisiones oportunas y acertadas.

Ahora bien, la palabra estadística tiene muchas definiciones de tipo lingüístico usual-

mente encontradas en enciclopedias y diccionarios; sin embargo, dado que en la época

actual el uso de la estadística abarca prácticamente todas las áreas del saber, entre las

que pueden mencionarse las ciencias sociales, la ingeniería, la química y, por supuesto,

las ciencias biológicas en sus diferentes aplicaciones, se hace difícil, en cierto modo,

expresar una definición única y categórica, así que antes que la definición, es más im-

portante tener una clara idea de la utilidad y conocer algunos aspectos importantes de la

evolución histórica de la estadística.

131

De acuerdo con Steel y Torrie (1986), la estadística debió comenzar como una

aritmética estatal para asistir a los gobernantes.

Los mismos autores señalan que una aplicación de la probabilidad empírica para asegu-

rar los embarques se puede encontrar en la historia de la navegación flamenca del siglo

XIV que, si bien hoy en día se puede considerar especulativa, seguramente dio origen a

la estadística utilizada en la actualidad por las empresas aseguradoras.

En el siglo XVII se originó la teoría de las probabilidades, desarrollada por Pascal y

Fermat. Un hecho histórico trascendental para el desarrollo contemporáneo de la es-

tadística fue la ecuación planteada para la curva normal de errores, publicada ori-

ginalmente en 1733 por de Moivre. El mencionado texto permaneció en el anonimato

hasta que Karl Pearson lo redescubrió en 1924. También es importante destacar que dos

astrónomos matemáticos, Laplace y Gauss, en el siglo XVIII, trabajando en forma

independiente, llegaron a las mismas conclusiones que obtuvo de Moivre, sin que tu-

vieran conocimiento de sus trabajos. La curva normal conserva gran importancia en

salud y producción animal y se la conoce universalmente con los nombres de Curva de

Gauss o Curva Laplaciana.

La utilización de la estadística para el análisis de fenómenos biológicos comenzó

aproximadamente en 1925, año en que el profesor Ronald Fisher publicó el libro

titulado Statistical methods for research workers. Searle (1989) y Hofer (1998)

presentaron un recuento histórico del uso de los componentes de varianza en los que se

puede apreciar que, después de Fisher, Tippett clarificó y extendió el método ANOVA

(analysis of variance) de estimación. En 1935, Yates utilizó la metodología ANOVA en

experimentos con cereales; Neyman, et al en 1935 consideraron la eficiencia de los

diseños de bloques aleatorizados y los diseños en cuadrado latino e hicieron uso

extensivo de los modelos lineales. Quizás estos trabajos son la primera aparición

reconocible de los modelos mixtos.

Entre 1943 y 1987 se extendió el uso de los modelos de componentes de varianza para

resolver problemas prácticos, especialmente por parte de los genetistas quienes apli-

caron esta técnica en humanos, ganado lechero, ganado de carne, maíz, trigo y aves,

entre otros. La mayoría de estas aplicaciones involucraron datos desbalanceados. Una

revisión histórica detallada de estos tópicos se puede encontrar en Solarte (2000).

132

En la actualidad se presenta un continuo crecimiento y auge de la estadística, dadas las

nuevas necesidades del hombre, que a diario requiere más respuestas a nuevos interro-

gantes por la ampliación del espectro investigativo.

Según Steel y Torrie (1986), "La estadística es la ciencia pura y aplicada, que crea,

desarrolla y aplica técnicas de modo que pueda evaluarse la incertidumbre de

inferencias inductivas". De la anterior definición se deduce que la estadística como

ciencia pura desarrolla conocimiento nuevo o teorías estadísticas, mientras que como

ciencia aplicada desarrolla métodos para recopilar, representar, condensar y analizar los

datos obtenidos con una técnica particular, según los objetivos del estudio y cualquiera

sea la disciplina interesada en alcanzarlos.

Sierra (1991) define a la estadística como "Ciencia formada por el conjunto de teorías y

técnicas cuantitativas que tienen por objeto la organización, presentación, descripción,

resumen y comparación de conjuntos de datos numéricos, obtenidos de poblaciones de

individuos o fenómenos en su conjunto o bien de muestras que representan las

poblaciones estudiadas, así como el estudio de su variación, propiedades, relaciones,

comportamiento probabilístico y la estimación, inferencia o generalización de los

resultados obtenidos de las muestras, respecto a las poblaciones que aquellas

representan".

Otra manera de definir a la estadística, usada con mayor frecuencia en varios textos

especializados, es la siguiente: "Conjunto de métodos que se utilizan para obtener,

recolectar, presentar, analizar e interpretar datos numéricos, con el objeto de extractar

conclusiones válidas, con base en las cuales se puedan tomar decisiones".

Algunos autores aseguran que la estadística no es una ciencia, sino un grupo de métodos

con base científica. Para dirimir discusiones de esta naturaleza, el lector interesado

puede remitirse a Bunge (1976) y Popper (1971).

Convencionalmente, la estadística se divide en dos grandes ramas: Estadística descrip-

tiva y Estadística inferencial. La primera hace referencia al conjunto de métodos para

resumir y presentar en forma clara una serie de observaciones. Aquí se incluyen Ios

cuadros, los gráficos, las medidas de tendencia central y de dispersión o variabilidad. La

estadística inferencial comprende el conjunto de métodos necesarios para obtener

133

conclusiones válidas para una población, como resultado del análisis de una muestra

extraída de la misma.

En este texto, tanto la parte descriptiva como la inferencial son temas de interés; sin

embargo, la estadística inferencial será de mayor importancia puesto que la producción

y la salud animal son áreas con intenso trabajo investigativo en procura de lograr

animales más productivos y eficientes, menos susceptibles a enfermedades y, por ende,

más útiles a la humanidad.

El profesional de las ciencias pecuarias debe cimentar una sólida formación en el campo

investigativo. Éste es uno de los aspectos de mayor relevancia en los planes de forma-

ción de recursos humanos con miras a lograr niveles de producción internacionalmente

competitivos, acorde con la actual tendencia mundial.

1.2 ESTADÍSTICA Y MÉTODO CIENTÍFICO

La investigación en producción y salud animal tiene como objetivo fundamental generar

nuevo conocimiento o nuevas aplicaciones, por lo que utiliza de manera rigurosa el

Método Científico.

La aplicación del método científico parte del conocimiento disponible sobre un pro-

blema concreto; para ello se revisan profundamente los hechos y teorías existentes, se

formulan hipótesis para ser contrastadas mediante la experimentación, se lleva a cabo

una evaluación objetiva de las hipótesis y, finalmente, con base en resultados experi-

mentales, se emiten las conclusiones del caso.

Un punto de bastante complejidad es el referente a la evaluación objetiva de las hi-

pótesis, especialmente cuando se trabaja con organismos vivos, ya que en muchas si-

tuaciones se desconocen, con la precisión deseada, las relaciones causa-efecto, dada la

amplia variación natural a que están sometidas las especies animales. Muchas veces los

investigadores de las ciencias animales estudian casos particulares para extenderlos a

situaciones generales, cumpliéndose así el procedimiento de inferencia incierta.

134

La estadística es una herramienta de mucha utilidad en el método científico. Su aplica-

ción es palpable en aspectos que van desde la elaboración de un plan para recolectar los

datos o diseñar uno o más experimentos, hacer el análisis de los resultados, el resumen,

presentación y caracterización de los datos hasta concluir con la evaluación de la

incertidumbre de las inferencias.

Para visualizar con más claridad la utilidad de la Biometría en el método científico

positivista, es conveniente analizar la Figura 1.2.1, adaptada de Martínez y Martínez

(1997).

A manera de resumen, se podría asegurar que el profesional pecuario debe incentivar su

capacidad de análisis para recopilar información e interpretar datos numéricos pro-

cedentes de la observación de los múltiples fenómenos que se presentan en las especies

animales, al igual que para el manejo apropiado de las técnicas estadísticas útiles en la

investigación científica.

Es necesario reiterar que la biometría es un instrumento de investigación ya sea en

nutrición animal, genética, farmacología, patología y, en general, en cualquier campo as

acción de los profesionales del agro y sobre estos campos se propondrán problemas

específicos de investigación; por lo tanto, los instrumentos de investigación, como las

técnicas y procedimientos biométricos, deben constituirse en algo familiar para el

profesional, de manera que sean usados en forma eficiente, al igual que las ayudas que

proporciona el software especializado disponible. De este modo, los profesionales

estarán capacitados para presentar resultados en forma crítica, clara y objetiva y

dispondrán de elementos, con base científica, a la hora de proponer soluciones.

135

Figura 1.2.1 Ciclo de La Ciencia: Conexión entre la Biometría y el Método

Científico

1.3 DEFINICIONES Y CONCEPTOS

Para un desarrollo más ágil en la lectura y comprensión de este texto es recomendable

familiarizarse con ciertos términos que se utilizarán en las temáticas siguientes. No es

conveniente memorizar el significado, sino formarse conceptos para su posterior aná-

lisis y aplicación; en algunas ocasiones será necesario diferenciar algunas expresiones

que en estadística significan una cosa y en el lenguaje cotidiano otra.

1.3.1 Datos. En producción y salud animal, los fenómenos naturales son la materia

prima para los trabajos de investigación. Cuando se realizan análisis estadísticos debe

tenerse en cuenta que, en la gran mayoría de situaciones, las observaciones estarán

representadas en forma numérica, así por ejemplo, en farmacología las observaciones

pueden ser los tiempos que tardan los animales en recuperarse luego de la aplicación de

un antibiótico o el número de animales curados; en mejoramiento genético las observa-

ciones podrían estar constituidas por el peso al nacer de los lechones provenientes de un

cruzamiento entre dos razas; en alimentación animal la ganancia de peso de los terneros

136

sometidos a diferentes dietas; en el manejo de praderas el rendimiento por hectárea de

las variedades de pasto. En general, las observaciones corresponden al fenómeno que se

desea estudiar y los números obtenidos de dichas observaciones constituyen los datos

que, en la mayoría de los casos, exhiben variación entre ellos.

1.3.2 Variables. En estadística se emplea la palabra variable para referirse a cualquier

característica o atributo de las entidades que interesan en una investigación; por ejem-

plo, en nutrición se tendrá como objetivo evaluar la calidad nutritiva de un aumento a

través de la medición de las variables conversión alimenticia o consumo del aumento. El

profesional de la acuicultura podría estar interesado en investigar la resistencia de una

variedad del Penaeus vannamei al síndrome de la mancha blanca. En virtud de que cual-

quiera de estas características, por regla general, presenta un valor diferente cuando se

observa en diversas entidades, ella recibe el nombre de variable. Si los valores numéri-

cos que toma una variable provienen de factores fortuitos y si un valor determinado no

se puede predecir con anticipación, ésta se denomina variable aleatoria.

Las variables aleatorias pueden ser cuantitativas o cualitativas. Una variable cuan-

titativa está representada por valores de carácter numérico y expresa una magnitud; por

ejemplo, el peso al nacer de los bovinos, la alzada de los equinos, la edad al primer

servicio de los caprinos, el número de galpones dedicados a la explotación de gallinas

ponedoras en una región, el tamaño de los alevinos de trucha arco iris, el número de co-

lonias de bacterias en un medio de cultivo, el número de animales enfermos, y muchas

otras. Las variables cuantitativas, a su vez, pueden ser continuas o discretas.

Una variable continua está representada por cualquier valor dentro de un intervalo, es

decir, que teóricamente puede tomar cualquier número real entre dos valores dados. La

longitud y el peso de los peces son ejemplos típicos.

Una variable discreta, también llamada discontinua, toma valores posibles que no se

pueden observar en una escala continua debido a la existencia de espacios entre estos

datos y a la ausencia de valores intermedios; en otras palabras, las variables discretas

solo toman valores enteros. Por ejemplo, el número de pezones de una vaca, el número

de productores de cuyes en un corregimiento, el número de lechones en un parto, el

número de ovas por hembra de tilapia, el número de animales recuperados después de

un tratamiento con macrólidos, y muchos otros.

137

Las variables cualitativas no se miden numéricamente, sino que se asignan a una o

varias categorías mutuamente excluyentes, es decir, una observación particular no es

posible asignarla a más de una clase. Un ejemplo común es la clasificación del ganado

Holstein según el color del pelo, que puede ser negro o rojo, caso en el que habrán dos

categorías. En el ganado Shorton, con el mismo criterio, se pueden formar tres catego-

rías; rojo, blanco o roano, este último también conocido como salinero.

En los análisis estadísticos se emplean algunos símbolos, en lugar de escribir la variable

en cada oportunidad. Por ejemplo, si Y representa cualquier variable de interés, entonces

Yi representará la i-ésima observación, es decir, cualquier observación, sin referirse a

una en particular; cuando sea necesario hacer referencia a una en particular, se

reemplazará el subíndice i por un número específico. El Ejemplo 1.3.1, que se ofrece a

continuación, permite una mejor comprensión.

Ejemplo 1.3.1: En una carnada de cuyes (Cavia porcellus) nacen vivos tres gazapos

que pesan 89, 93 y 110 g, respectivamente. Y es la variable peso al nacimiento: Y1 = 89

g, Y2 = 93 g y Y3 = 110 g.

En general, se identifica el conjunto de observaciones como Y1, Y2, Y3,..., Yn donde n

representa la última observación y los puntos el resto de observaciones existentes. En el

Ejemplo 1.3.1 planteado anteriormente, n = 3, Yi = cualquier observación, Y3 = 110 g.

1.3.3 Escalas de medida. Existen cuatro niveles generales de medición: nominal, ordi-

nal, de intervalo y de razón. Estos niveles conducen a cuatro tipos de escalas:

Escala nominal. La medida con una escala nominal implica la clasificación en

categorías, por nombres o designaciones de los fenómenos de interés; por

ejemplo, el sexo y la raza de los bovinos. Si a las categorías se les asigna

números que pueden ser 1, 2, 3 y 4, sólo es posible interpretarlos como

diferentes, esto es 1 ≠ 2 ≠ 3 ≠ 4, sin que se pueda afirmar que una es superior a

otra, así una clasificación de las razas bovinas de carne en hereford, shorton,

angus y limousine, identificadas como 1, 2, 3 y 4 no indica superioridad o

138

inferioridad de alguna de ellas con respecto a cualquier atributo estudiado en

esas razas.

Escala ordinal. La medida ordinal incluye las propiedades de la medida

nominal, pero además las categorías pueden ser ordenadas en el sentido mayor

que o menor que. Por ejemplo, por resistencia a la mastitis de las vacas jersey, se

podría sugerir un agrupamiento en tres categorías 1, 2 y 3, caso en el que el 3 es

el número correspondiente a la mayor resistencia. Sin embargo, el nivel de

medición ordinal no ofrece ningún tipo de información sobre la magnitud de las

diferencias entre categorías. Si éstas vienen dadas en términos de alto, medio y

bajo y se identificarán como 3, 2 y 1 respectivamente, esto no implica que exista

una unidad de diferencia entre cada categoría, sino simplemente que 3 > 2 > 1.

Escala de intervalo. Una medida de intervalo se realiza cuando se asignan

ciertos números a los objetos o acontecimientos estudiados, que además de

poseer las características de la escala ordinal permiten interpretar la diferencia

entre dos medidas, es decir, se puede indicar la cantidad en que un evento se

diferencia de otro. En esta escala el punto cero y la unidad de medida son

arbitrarios. Las escalas de medición en intervalo más conocidas son las

utilizadas para medir la temperatura. Las escalas Celsius y Fahrenheit, por

ejemplo, tienen un punto cero arbitrario, pero esto no indica ausencia de

temperatura, puesto que es posible registrar valores por encima o por debajo de

ese punto.

Escala de razón. Es la escala más potente de las cuatro existentes, ya que posee

todas las propiedades de las escalas anteriores y un punto de cero absoluto; por

lo tanto, es posible indicar cuántas veces un objeto es más grande que otro y la

cantidad que los diferencia. El peso vivo, la alzada, el tiempo de recuperación, el

rendimiento en canal, entre otros atributos, se miden en escala de razón.

Según el nivel de medición aplicado a las variables estudiadas, éstas se pueden clasificar

como nominales, ordinales, de intervalo o de razón. Es importante que el investigador

identifique la escala de medida de las variables, puesto que para cada una de ellas exis-

ten procedimientos estadísticos adecuados que posibilitan el mejor uso de la informa-

ción contenida en los valores del atributo.

139

1.3.4 Población y muestra. Etimológicamente, el término población proviene del latín

populus (pueblo) y éste del griego polós (mucho). En los textos de estadística se

encuentran definiciones más o menos comunes de población, también llamada universo.

En estadística la población se define como el conjunto de todos los valores posibles de

una variable medida en cualquier escala. Estos valores no necesariamente serán

diferentes entre sí, ni tampoco estarán obligatoriamente representados en número finito.

También es aceptado que una población es el conjunto de elementos reunidos bajo una

característica común.

Los conceptos antes mencionados bastan para establecer con claridad el significado del

término población; sin embargo, dado que en este caso el objeto de trabajo son las

poblaciones biológicas, es conveniente analizar la definición expresada por Gomes da

Silva (1982), para una población biológica, en los siguientes términos: "Sistema

constituido por partes que se integran armónicamente entre sí, para adaptarse a las

continuas alteraciones del ambiente en sus múltiples aspectos".

La anterior definición es válida tanto para las poblaciones animales como para las vege-

tales y de microorganismos y sobre todas éstas se realizan los trabajos de investigación

en producción y salud animal.

Las medidas calculadas sobre la población se llaman parámetros y el total de elementos

constituyen una población se denota con la letra N. Si se conocen todos los posibles

valores de una variable en la población, teóricamente podría ser estudiada y descrita

perfectamente.

En general, muestra es toda parte representativa de una población, lo que significa que

la muestra debe conservar las características esenciales de la población. Desde el punto

de vista del método científico, la muestra se considera como una parte extraída

correctamente de una población, para luego ser observada científicamente, con el

objetivo de obtener resultados válidos para la población de donde se obtuvo.

Estadísticamente es factible determinar los límites de error y la probabilidad sobre la

validez de los resultados obtenidos con la muestra cuando éstos se generalizan en toda

la población. Para disponer de una muestra representativa, es necesario incorporar el

principio de aleatoriedad y las leyes de las probabilidades, con el propósito de evitar

sesgos en la selección de las observaciones, lo que en la práctica constituye un proceso

140

de cierta complejidad. Los procedimientos generales para obtener muestras

representativas de una población se indicarán en el Capítulo 4.

Las medidas obtenidas con datos de la muestra se llaman estadígrafos o estadísticos y

el número de elementos que constituyen la muestra se denota por n, que en la gran

mayoría de los casos será menor que N, salvo que la muestra tenga el tamaño de la po-

blación, como sucede en ocasiones realmente excepcionales.

A manera de resumen, en concordancia con los conceptos iniciales contemplados hasta

aquí, un análisis de la Figura 1.3.1, proporciona una visión global de los mismos y una

rápida comprensión de los objetivos del texto.

Figura 1.3.1 Ciclo inferencial

Los parámetros, convencionalmente se identifican con letras griegas. Así la media se

reconoce universalmente como 𝜇, la varianza como 𝜎2, la desviación estándar con 𝜎, el

coeficiente de regresión con 𝛽, el coeficiente de correlación 𝜌 y los correspondientes

estadígrafos como ��, S2, b, r.

141

CAPÍTULO 2

Presentación, resumen y caracterización de la información

En estadística existen dos maneras de presentar y resumir datos, una gráfica y otra

numérica, en las que, por lo general, se utilizan las técnicas y procedimientos

descriptivos.

Por ser la investigación un proceso sistemático, lo más lógico es comenzar por agrupar

los datos, mediante un procedimiento comúnmente empleado en la construcción de las

tablas de distribución de frecuencias y el diseño de histogramas, barras simples, barras

compuestas, barras proporcionales, diagramas circulares o pasteles, polígonos de

frecuencia y gráficos de dispersión, entre los más importantes.

Las tablas de frecuencia y los gráficos son de utilidad para interpretar, presentar y

escribir los datos, pero tienen limitaciones cuando se quiere establecer comparaciones

entre conjuntos de datos. El cálculo de las medidas de tendencia central y dispersión,

que obviamente son métodos numéricos, contribuyen a solucionar, en parte, estos

inconvenientes.

2.1 TABLAS DE DISTRIBUCIÓN DE FRECUENCIA

Para construir una tabla de distribución de frecuencias es oportuno indicar que dichas

tablas se pueden elaborar con cualquier tipo de variable y, para este proceso, es

necesario precisar algunos conceptos de interés.

Se entiende por frecuencia el número de veces que una característica o un valor aparece

en un conjunto de observaciones y por distribución de frecuencia el método estadístico

rara describir el comportamiento de un conjunto de datos; éstos se ubican en categorías

o clases y se indica la frecuencia correspondiente en cada una de ellas.

Para agrupar los datos en categorías es conveniente seguir una serie de reglas que se

resumen a continuación. Sin embargo, es importante indicar que en la actualidad existe

software especializado para desarrollar estos procedimientos estadísticos en forma rá-

pida, eficaz y confiable. En lo que respecta a la presentación, resumen, caracterización

142

de la información y análisis estadístico, en general, los paquetes estadísticos Stat Gra-

phics, SPSS, Minitab, R, Stata y SAS, entre otros, son herramientas eficientes.

2.1.1 Construcción de tablas de distribución de frecuencia. En seguida se describen

cada uno de los pasos para este proceso.

a. Calcular el número de categorías (NC). Depende, fundamentalmente, de la can-

tidad de datos disponibles y del tipo de variable. Con base en estas consideracio-

nes, existen algunas normas para lograr un número óptimo de categorías como la

regla de Sturges (1926), citado por Milton (1994), la tabla sugerida por Milton

(1994), basada justamente en esta regla, y el procedimiento propuesto por

Carvajal, et al (1993):

Regla de Sturges: NC = 1 + 3,3 (log n)

Método sugerido por Carvajal et al: NC = √n

Tabla reportada por Milton (1994), según el tamaño de la muestra (Tabla

1 del Apéndice).

b. Calcular la amplitud del intervalo de clase (AIC). Para calcular el intervalo de

clase se siguen estos pasos:

Establecer el rango (R): R = valor máximo - valor mínimo.

Dividir el rango entre el número de categorías previamente escogido. Si

el resultado de esta división no es entero, puede aproximarse a la unidad

más cercana, cuidando que se tenga el mismo número de decimales que

los datos.

𝐼𝐶 = 𝑅

𝑁𝐶

Con esta operación se encuentra la longitud mínima requerida para

cubrir el rango.

c. Definir el límite inferior (Li) y el límite superior (Ls) de cada intervalo. El

límite inferior de la primera clase es el dato de menor valor, el resto de los

143

límites de clase se obtienen mediante la suma sucesiva de la amplitud a partir del

primer valor.

Debe tenerse en cuenta que el dato mayor no es necesariamente el límite superior de la

última clase, pero debe estar incluido dentro de ésta.

El límite superior es el mismo valor del límite inferior de cada una de las clases

siguientes, pero se recomienda que ninguna observación particular coincida con los

valores de los límites y para esto pueden usarse varias estrategias que se indican más

adelante.

d. Asignar las frecuencias de cada categoría. Para ello se deben tener en cuenta

las siguientes definiciones:

La frecuencia absoluta (fi) es el número de veces que aparece un

determinado valor, perteneciente a una población o muestra analizada,

entre los límites de cada clase.

La frecuencia relativa (fa) es el porcentaje de cada frecuencia absoluta

con respecto al total de datos de la población o muestra analizada.

La frecuencia absoluta acumulada (Fi) es la suma de todas las

frecuencias absolutas anteriores al límite superior de una clase dada. La

frecuencia absoluta acumulada correspondiente a la última categoría

coincide con el número total de observaciones.

La frecuencia relativa acumulada (Fa) es la suma de todas las

frecuencias relativas anteriores al límite superior de una clase dada.

Ejemplo 2.1.1: Solarte y García (2001) recolectaron varias muestras aleatorias

constituidas por 50 cuyes (Cavia porcellus) machos, en la granja Botana, con el fin de

analizar la variable peso al destete. Al pesar cada individuo se encontraron los

siguientes resultados, expresados en gramos:

218, 258, 188, 177, 205, 225, 230, 231, 230, 143, 205, 189, 305, 285, 277, 288, 186,

258, 308, 310, 148, 258, 258, 139, 209, 285, 304, 289, 218, 289, 257, 129, 309, 258,

278, 289, 297, 303, 285, 308, 287, 258, 258, 209, 187, 209, 157, 208, 258, 128.

144

Con los anteriores datos correspondientes a una de las muestras, se construyó una tabla

de distribución de frecuencias cuyo procedimiento se detalla a continuación.

Según la regla de Sturges: NC = 1+3,3 (log 50) = 6,61 7.

Según la fórmula de Carvajal et al: NC = 50 = 7,07 7.

Según Milton (Tabla 1 del apéndice): NC = 6

Cualquiera de las tres opciones es válida; en este caso se escogió NC= 6. Es

conveniente tener en cuenta que escoger muchas clases puede ocasionar problemas ya

que algunas de ellas quedarían si elementos y se originarían clases vacías. Por el

contrario, si se escogen pocas clases se pierde claridad de la información por exceso de

agrupamiento.

Al desarrollar los pasos descritos anteriormente, se tiene:

R = 310 – 128 = 182

AIC = 𝑅

𝑁𝐶=

182

6= 30,33 31

Definir los límites de cada intervalo. para esto es importante tener en cuenta que

los límites de las clases deben ser mutuamente excluyentes, de lo contrario se

deben establecer criterios para no ser ambiguos, es decir, que no debe haber

duda en cuanto a la clase a que pertenece una observación determinada.

El límite inferior de la primera clase se estableció con la observación menor (para este

ejemplo es 128) y, posteriormente, se sumó sucesivamente el valor de AIC (31), hasta

completar todos los límites.

Clases Límite inferior Límite superior

1 128 159

2 159 190

3 190 221

4 221 252

5 252 283

145

6 283 314

Calcular las frecuencias en cada categoría. Para esto, simplemente se cuentan los

datos que caen dentro de cada intervalo.

Clase uno: 128, 129, 139, 143, 148, 157. Subtotal 6 observaciones

Clase dos: 177, 186, 187, 188, 189. Subtotal 5 observaciones

Clase tres: 205, 205, 208, 209, 209, 209, 218, 218. Subtotal 8 observaciones

Clase cuatro: 225, 230, 230, 231. Subtotal 4 observaciones

Clase cinco: 257, 258, 258, 258, 258, 258, 258, 258, 258, 277, 278 subtotal 11

observaciones

Clase seis: 285, 285, 285, 287, 288, 289, 289, 289, 297, 303, 304, 305, 308, 308,

309, 310. Subtotal 16 observaciones

Total: 50 observaciones

Al agrupar los datos de esta manera se debe tener en cuenta que los intervalos se

consideran cerrados por la izquierda y abiertos por la derecha, es decir, intervalos de la

forma [). Por ejemplo, suponiendo que en la muestra apareciera el número 221, este se

lo debe clasificar en el intervalo 221-252 y no en el intervalo 190-221.

Otra manera de agrupar el mismo conjunto de datos es la siguiente:


1 128 158

2 159 189

3 190 220

4 221 251

146

5 252 282

6 283 313

En agrupaciones de este tipo deben tenerse en cuenta los límites reales de clase, que se

definen como el punto medio entre el límite superior de una clase y el límite inferior de

la siguiente, así:


1 127,5 158,5

2 158,5 189,5

3 189,5 221,5

4 221,5 251,5

5 251,5 282,5

6 282,5 313,5

En la tabla 2.1.1 se presenta la información completa para este ejemplo.

Tabla 2.1.1 Peso al destete de cuyes machos (cavia porcellus) en la granja Botana

de la Universidad de Nariño, Pasto, Colombia, 1995

Clase

Intervalos

de clase

Peso al

destete (g)

Frecuencia

absoluta fi

Frecuencia

relativa

(%) fa

Frecuencia

absoluta

acumulada

Fi

Frecuencia

relativa

acumulada

Fa

1 128-159 6 12 6 12

2 159-190 5 10 11 22

147

3 190-221 8 16 19 38

4 221-252 4 8 23 46

5 252-283 11 22 34 68

6 283-314 16 32 50 100

Total 50 100

Para diseñar tablas de este tipo, además de las consideraciones de procedimiento

descritas anteriormente, deben tenerse en cuenta los siguientes aspectos:

El titilo de la tabla debe ser claro y completo de tal manera que responda a las

preguntas ¿Qué es?, ¿Dónde? Y ¿Cuándo? (Carvajal, et al, 1993).

En la primera columna se indica la categoría, en la segunda la variable con su

unidad de medida y el intervalo correspondiente, en el resto de columnas las

respectivas frecuencias.

2.2 GRÁFICOS ESTADÍSTICOS

Los datos también se pueden presentar en forma gráfica mediante figuras geométricas

dibujadas a escala, con la intención de proporcionar una visión de fácil comprensión con

referencia a la variable estudiada; por este motivo el grafico debe ser sencillo y claro.

Para diseñar la figura es necesario construir previamente la respectiva tabla de

distribución de frecuencias, por lo tanto el grafico debe concordar con el de la tabla. En

las publicaciones científicas, la mayoría de editores de revistas especializadas

recomiendan no duplicar la información, es decir, si se decide presentar los datos en

tablas no se debe incluir el grafico para el resumen de los datos, así que el investigador

decidirá sobre la forma que proporcione mayor claridad.

Entre los gráficos más utilizados en estadística se pueden mencionar los histogramas y

polígonos de frecuencia y los diagramas circulares, comúnmente denominados pasteles.

148

2.2.1 Histograma. Se construye un rectángulo para cada categoría donde la base es el

intervalo y la altura la frecuencia respectiva que puede ser absoluto o relativa. Los datos

de la tabla 2.1.1, representados en un histograma, se pueden apreciar en la Figura 2.2.1,

donde, en el eje X se colocaron los intervalos y en el eje Y las frecuencias absolutas.

Figura 2.2.1 Peso al destete de cuyes machos (cavia porcellus) en la granja

Botana de la Universidad de Nariño, Pasto, 1995,

representado en un histograma

2.2.2 Polígono de frecuencias. Para construir un polígono de frecuencias se unen

mediante líneas rectas, los puntos medios localizados en la parte superior de cada

rectángulo del histograma. Es posible partir de una clase inferior teórica y terminar en

una superior, como se indica en la figura 2.2.2.



representado en un polígono de frecuencia

0

10

20

30

40

50

60

128-159 160-191 192-223 224-255 256-287 288-319

Frec

uen

cia

abso

luta

Intervalos de Clase

0

10

20

30

40

50

60

128-159 160-191 192-223 224-255 256-287 288-319

Frec

uen

cia

abso

luta

Intervalos de Clase

149

2.2.3 Ojiva o polígono de frecuencia acumulada. Se diseña para representar las

frecuencias acumuladas absolutas o relativas. Para su construcción se forman puntos

haciendo coincidir el límite inferior de cada clase con el valor de la frecuencia

acumulada respectiva, luego se unen estos puntos con líneas rectas. En el eje X se ubica

los intervalos y en el eje Y las frecuencias acumuladas, tal como se aprecia en la figura

2.2.3.



representado en una ojiva.

Esta figura corresponde a la ojiva denominada “menor que”, la que debe interpretarse

como el número de observaciones inferiores al límite superior de cada clase. Para este

caso no hay ninguna observación menor de 128, seis menores de 159, 11 menores de

190, y así sucesivamente, hasta concluir que 50 son menores de 314 gramos.

En la figura 2.2.4 se puede apreciar la gráfica de los datos en un diagrama circular,

donde las divisiones distinguibles del círculo representan cada una de las categorías.

0

10

20

30

40

50

60

128-159 160-191 192-223 224-255 256-287 288-319Frec

uen

cia

abso

luta

acu

mu

lad

a

Intervalos de clase

4%8%13%

16%24%

35%

128-159 160-191 192-223 224-255 256-287 288-319

150



representado en un diagrama circular.

A manera de resumen, respecto a la representación de la información en forma gráfica,

se deben tener en cuenta las siguientes recomendaciones:

a. Cuando la variable analizada es continua es preferible utilizar el histograma, el

polígono o el grafico de dispersión.

b. Para variables discretas son recomendables los histogramas o los diagramas

circulares. En el ejemplo 2.1.1, se resumieron los datos en un diagrama circular

solo como ilustración.

c. En el titulo de los gráficos no es necesario aclara el tipo de figura. En el ejemplo

se hizo la aclaración, exclusivamente con fines didácticos.

2.2.4 Curvas de frecuencia. En estadística, los datos que se procesan, por lo general,

pertenecen a muestras aleatorias extraídas de una población; por lo tanto, el histograma

y el polígono de frecuencias describen las variaciones que experimenta una variable o

característica en dicha muestra; sin embargo, si se aumenta el número de observaciones

y al mismo tiempo se disminuye la amplitud de los intervalos, el polígono de frecuencia

está formado por pequeños segmentos que se aproximan a una curva, tal como se

aprecia en la Figura 2.2.4 Este tipo de curva ideal recibe el nombre de curva de

frecuencia.

Figura 2.2.5 Representación de una curva de distribución de frecuencias

151

Las curvas de frecuencia son de gran utilidad en el análisis estadístico porque

proporcionan métodos simplificados para describir las características básicas de las

poblaciones, así como también en la inferencia estadística, donde se requiere conocer la

distribución de la variable en la población de donde se obtuvo la muestra. En la Figura

2.2.6 esta representadas las formas de curvas más comunes.

La curva simétrica se denomina distribución normal o curva normal; en ella, las

frecuencias de clase son mayores en el centro y disminuyen hacia los extremos de

manera similar. Esta curva tiene gran importancia en estadística puesto que proporciona

una adecuada representación de las distribuciones de una gran cantidad de variables,

tales como los datos meteorológicos de temperatura y precipitación pluvial, mediciones

efectuadas en organismos vivos, entre las que pueden mencionarse el peso y la talla,

calificaciones en pruebas de aptitud, rendimiento en cultivos y muchas otras.

Figura 2.2.6 formas de curvas de distribución de frecuencias más comunes en

estadística

Las curvas asimétricas con sesgo a la derecha o a la izquierda son modelos de

distribuciones asimétricas, bastante comunes en datos económicos y comerciales.

152

La curva J, llamada así por su forma, es frecuente en muchos estudios biométricos.

La forma de las curvas también proporciona información importante, por ejemplo, en el

caso de las bimodales, la aparición de dos modas pueden implicar un cambio en el

proceso durante el estudio de un fenómeno particular o que los datos provienen de dos

fuentes diferentes.

2.3 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN

Se mencionó anteriormente que los métodos para presentar la información en forma

gráfica o en tablas de frecuencia son útiles cuando se trata de ofrecer al lector una visión

general de los resultados, pero no son tan eficientes cuando se trata de establecer las

características más importantes de los datos en lo referente a su localización y

variabilidad.

Los métodos numéricos permiten extender los análisis y posibilitan comprender, de

modo más claro, la naturaleza de la distribución de cualquier variable de interés en

producción o salud animal. Estos métodos se orientan, básicamente, a describir el centro

de la distribución de las observaciones y la forma como estas varían en torno a ese valor

central. Dicho de otra manera, permiten calcular las medidas de posición, localización o

tendencia central y las medidas del espaciamiento o dispersión de los datos.

2.3.1 Medidas de tendencia central. Las medidas de tendencias central más utilizadas

son la media o promedio, la mediana y la moda o modo. A continuación se hará

referencia a cada una de ellas, con las correspondientes formas de cálculo, con datos

agrupados y sin agrupar.

2.3.1.1 la media o promedio aritmético. Es la medida de la tendencia central más

utilizada; se presenta como µ (mu) para la población y como Ȳ (Y barra) para la

muestra, de tal manera que µes el parámetro, cantidad fija y desconocida, mientras Ȳ es

el estadígrafo, el cual puede tomar diferentes valores al calcularse con diversas muestras

obtenidas de la misma población objeto de estudio. La media aritmética se expresa en

las mismas unidades de la variable original, sean litros, gramos, kilogramos hectáreas,

etc.

153

Conviene aclarar que existen otros tipos de medidas diferentes a la aritmética, tal como

se verá posteriormente, pero el uso generalizado de la palabra media o promedio, ha

hecho que se tome este término para referirse al promedio aritmético, sin indicarlo

expresamente.

La fórmula de cálculo de la media aritmética es la siguiente:

𝜇 =∑ 𝑌𝑖𝑁

𝑖=1

𝑁

Ȳ =∑ 𝑌𝑖𝑛

𝑖=1

𝑛

Dónde:

∑ 𝑌𝑖𝑁𝑖=1 = Sumatoria de los Yi, desde la primera hasta la última observación

𝑌𝑖 = Las observaciones

N y n = Tamaño de la población y muestra respectivamente

Aunque no existen normas precisas para calcular los decimales del valor de la media

algunos autores recomiendan utilizar un decimal más que los datos originales.

Ejemplo 2.3.1: Los datos que se muestran a continuación corresponden a la talla en

(cm) de una muestra de 10 ejemplares de bagre del Patía (Rhamdiaquelem), según

reporte de Ortega y Rodríguez (2004).

Ejemplares 1 2 3 4 5 6 7 8 9 10

Talla (cm) 35,0 27,0 34,5 34,9 34,0 32,0 22,0 37,0 26,0 33,0

De acuerdo con la formula (2.3.2), la media se calcula así:

154

Ȳ =∑ 𝑌𝑖

𝑛=

35,0+27,0+34,5+34,934,0+32,0+22,0+37,0+26,0+33,0

10

=31,54 cm

Como se observa, el valor de la media se calculó con un decimal más que los datos

originales.

En algunas situaciones los valores de la variable están afectados por una frecuencia

particular o peso relativo (W). En estos casos para calcular la media se deben multiplicar

los pesos relativos por los valores correspondientes de la variable y luego se divide este

resultado entre la sumatoria de dichos pesos. La media obtenida de este modo se

denomina media o promedio aritmético ponderado, cuya denominación corriente es

promedio ponderado (Ȳ,). La fórmula de cálculo es la siguiente:

Ȳ𝑤 =∑ 𝑌𝑖𝑊𝑖

∑ 𝑊𝑖

(2.3.3)

Ejemplo 2.3.2: en una estación pisicola localizada en el municipio de Repelon,

Atlantico, se explotan en policulivo cuatro especies icticas a saber: tilapia rojoja

(Oreochromissp), tilapia nilotica (Oreochromisniloticus), carpa espejo

(Cyprinuscaripiovar. Specularis) y cachama blanca (Piaractusbrachipomus), cuyos

pesos se indican en la Tabla 2.3.1 (Valencia y Rey, 1994), cada una en diferente

cantidad y como se sabe, cada especie posee distinta aptitud productora. Para calcular el

promedio lo más indicado es ponderar el peso de acuerdo con el número de animales de

cada especie.

Tabla 2.3.1 Peso individual de cuatro especies ícticas, en una estación

piscícola del municipio Repelón, Atlántico, Colombia

(Valencia y Rey, 1994)

155

Especie Peso (Yi) Nº Peces (Wi) 𝒀𝒊 𝑾𝒊

Orechomis sp 350 2.550 892,500

O. niloticus 320 3.800 1.216.000

C. Carpio var specularis 452 1.280 578.560

P. brachypomus 395 963 380.385

Sumatoria 8.593 3.067.445

Este ejemplo es típico puesto que existe un distinto número (frecuencia) de animales por

cada una de las especies y, como ya se mencionó, con un nivel productivo diferente.

��𝒊 = ∑ 𝒀𝒊𝑾𝒊

∑ 𝑾𝒊=

𝟑. 𝟎𝟔𝟕. 𝟒𝟒𝟓

𝟖. 𝟓𝟗𝟑= 𝟑𝟓𝟔, 𝟗𝟕 𝒈.

En otros casos se presentan relaciones de cambio que afectan a la variable estudiada.

En estas circunstancias lo más aconsejable es calcular la Media geométrica (G) que

permite asignar ponderaciones iguales a dichas relaciones.

Por definición, la Media geométrica es la raíz n-ésima del producto de los valores de la

variable, siempre y cuando estos valores sean positivos. Para su cálculo basta con

aplicar la siguiente formula.

G = 𝑛√(𝒀𝟏) (𝒀𝟐) … … . (𝒀𝒏)

(2.3.4)

Ejemplo 2.3.3: si se quiere medir el promedio de crecimiento a través del número de

colonias de la bacteria E. coli en un cultivo, durante un periodo de tres horas, lo más

recomendable es calcular G, dado que existe una relación entre el tiempo, medido en

horas, y el número de colonias bacterianas que crecen en el medio.

156

Horas de cultivo Número de colonias

1 2

2 4

3 5

Colonias/hora

G = 3√(𝟐) (𝟒)(𝟓) = 3,42

Existen otro tipo de medias tales como la Armónica (H) y la Cuadrática (MQ). La

primera tiene algunas aplicaciones prácticas en genética cuantitativa y en ciertas

comparaciones de medias en el diseño experimental; la segunda, principalmente en

física.

La media armónica se calcula así:

𝑯 = 𝟏

𝟏𝑵

∑𝟏𝒀𝒊

= 𝟏

∑𝟏𝒀𝒊

(2.3.5)

También se puede expresar la fórmula de cálculo mediante los inversos, así:

𝟏

𝑵=

∑𝟏𝒀𝒊

𝑵=

𝟏

𝑵 ∑

𝟏

𝒀𝒊

(2.3.6)

Ejemplo 2.3.4: Para el conjunto de observaciones 5, 7, 9, 6, 8, la madia armónica se

obtiene de la siguiente manera:

𝑯 = 𝟓

𝟏𝟓

+𝟏𝟕 +

𝟏𝟗 +

𝟏𝟔 +

𝟏𝟖

= 𝟓

𝟎, 𝟕𝟒𝟓𝟔𝟑𝟒= 𝟔, 𝟕𝟎

157

Con los inversos:

𝟏

𝑯=

𝟏

𝟓 𝟎, 𝟎𝟒𝟓𝟑𝟒 = 𝟎, 𝟏𝟒𝟗𝟏𝟐𝟔, 𝒂𝒔𝒊 𝒒𝒖𝒆 𝑯 =

𝟏

𝟎, 𝟏𝟒𝟗𝟏𝟐𝟔= 𝟔, 𝟕𝟎

Para calcular MQ, se utiliza la siguiente formula:

𝑀𝑄 = √∑ 𝒀𝒊

𝟐

𝑁

(2.3.7)

Ejemplo 2.3.5: con el mismo conjunto de datos utilizado para el cálculo de la media

armónica:

𝑴𝑸 = √𝟓𝟐 + 𝟕𝟐 + 𝟗𝟐 + 𝟔𝟐 + 𝟖𝟐

𝟓= √𝟓𝟏 = 𝟕, 𝟏𝟒

Hasta ahora se han indicado los procedimientos de cálculo cuando los datos están sin

agrupar, sin embargo, si estos se encuentran agrupados en tablas de distribución de

frecuencias, es decir, organizados en categorías y no se dispone de la información sin

agrupar, es posible tener una aproximación de las medidas de tendencia central, con

procedimientos particulares que se indican a continuación.

Para calcular el promedio aritmético, bajo estas circunstancias, simplemente se aplica la

siguiente formula:

�� = ∑ 𝒇𝒊𝒎𝒊

𝒏𝒊=𝟎

𝒏

(2.3.8)

Dónde:

𝒇𝒊 = Frecuencia absoluta de la i-ésima categoría.

158

𝒎𝒊 = Marca de clase o valor central de cada intervalo, calculado como el promedio

aritmético de los límites superior e inferior de cada clase.

Ejemplo 2.3.6: Para ilustrar la forma de cálculo se utilizarán los datos de la Tabla2.1.1.

Con el fin de facilitar los cálculos posteriores es conveniente organizar la información

tal como se indica a continuación.

Clase Frecuencia absoluta

𝒇𝒊 Marca de clase 𝒎𝒊 𝒇𝒊𝒎𝒊

1 6 143,5 861,0

2 5 174,5 872,5

3 8 205,5 1.644,0

4 4 236,5 946,0

5 11 267,5 294,5

6 16 298,5 4.776,0

Ʃ 50 12.042,0

Al aplicar (2.3.8): �� = 12,042

50= 240,84 𝑔.

Para finalizar, los aspectos generales referentes al promedio aritmético, es importante

tener en cuenta las siguientes características de esta medida de localización:

En el cálculo del promedio intervienen los datos de un conjunto.

El promedio aritmético es calculado en forma rígida, lo que implica que existe

un solo promedio para cada conjunto de datos.

El promedio es sensible a valores extremos.

159

Por estar definido algebraicamente, el promedio permite tratamiento algebraico.

La sumatoria de las desviaciones con respecto a la media es igual a cero:

∑(𝒀𝒊��) = 𝟎

𝑛

𝑖=1

Se utilizan con datos cuya escala es de intervalo o razón.

Puede ser empleado en el análisis de distribuciones simétricas.

Es la base de la inferencia estadística.

2.3.1.2 La Mediana (M). Es otra medida de tendencia central que tiene como propiedad

dividir los valores de un conjunto ordenado de datos en dos fracciones, de tal manera

que el 50 % de las observaciones se sitúan por encima y el 50% restante por debajo de

ella. Es decir, la mediana se define como el numero situado en la mitad de un conjunto

de datos ordenados de menor a mayor.

Cuando n es impar, la mediana es el número situado en la mitad del conjunto, pero

cuando n es par, la mediana será la media aritmética de las dos observaciones situadas

en la mitad. Si n es pequeño, es fácil detectar el centro del conjunto de observaciones,

pero a medida que n aumenta se hace más difícil. Para evitar confusiones, se aplica una

fórmula que permite detectar dicho valor central en un conjunto con un número de

elementos par o impar y ubicarla situación mediana (SM) que indica el sitio en que se

encuentra la mediana, la cual expresa de esta forma:

SM = 𝒏+𝟏

𝟐

(2.3.9)

Ejemplo 2.3.7: El siguiente conjunto impar de datos corresponde a valores de la

habilidad de transmisión predecible (PTA) para la proteína de la leche en lb. La PTA es

un estimativo del rendimiento medio de la progenie por efecto del potencial genético

heredado del padre. Las cifras en mención se obtuvieron de un catálogo de la

Cooperative Resources International (CRI, 2000): 78,81, 77, 56, 69, 41, 54. Para

calcular la mediana, primero deben ordenarse los datos de menor a mayor: 41, 54, 56,

69, 77, 78, 81.

160

A simple vista se puede detectar que 𝑴𝒆 = 69 ya que por debajo de 69 están los valores

41, 54 y 56, mientras que por encima están 77, 78 y 81. En otras palabras, el 50% de las

cifras son menores que 69 y el 50% mayores a esa cantidad.

Al aplicar (2.3.9) se tiene: SM = 𝟕+𝟏

𝟐 = 4

Es decir que la 𝑴𝒆 es la cuarta observación ordenada, o sea 69 lb.

Ejemplo 2.3.8: Con un conjunto par de datos, de la misma fuente y para la misma

variable, se tiene: 85, 78, 55, 69, 82, 70, 63, 84, que ordenado de menor a mayor queda:

55, 63, 69, 70, 78, 82, 84, 85.

Al aplicar (2.3.9): SM = 𝟖+𝟏

𝟐 = 4,5

La 𝑴𝒆 será el promedio de los dos valores centrales.

Por lo tanto: 𝑴𝒆 =𝟕𝟎+𝟕𝟖

𝟐 = 74

Es decir, el promedio de las observaciones 4 y 5. La cuarta observación es 70 y la quinta

es 78; el promedio de estos valores es 74, por lo tanto el 50% de los valores son

inferiores a 74 libras y el 50% restante es superior a la misma cantidad.

Como se observa, a diferencia del promedio, la mediana no se afecta por valores

extremos de la variable, es decir, por datos que están muy distantes del resto de

observaciones. Este tipo de datos se conoce con el nombre de “datos atípidos”,

“outliers” o “números aberrantes” (Milton, 1994). Los “outliers” se presentan en un

conjunto de datos con valores inusualmente grandes o pequeños o porque existen

errores de medición o registro en la base de datos. Si la situación es controlada por

primera vez, el investigador puede optar por efectuar los cálculos con y sin los datos

aberrantes y hacer la aclaración respectiva.

Calculo de la mediana con datos agrupados: Cuando los datos están

organizados en tablas de frecuencias, para calcular 𝑴𝒆 se requiere aplicar la

siguiente fórmula de trabajo:

161

𝑴𝒆 = 𝑳𝒊 +

𝒏𝟐 − 𝑭𝒊−𝟏

𝒇𝒊

(𝒂)

(2.3.10)

Dónde:

𝑳𝒊 = Límite inferior de la clase mediana. Se entiende por clase mediana la clase donde la

frecuencia absoluta acumulada contiene al 50%de los datos.

𝒏

𝟐 = Valor que define la clase mediana, es decir, divide los datos en dos partes iguales.

𝑭𝒊= Frecuencia absoluta de la clase mediana.

a = Tamaño del intervalo.

Ejemplo 2.3.9: Con los mismos datos de la Tabla 2.1.1, que se vuelve a presentar por

comodidad para el lector, se desarrollará la fórmula de cálculo.

Clase Peso al

destete (g)

Frecuencia

Absoluta 𝒇𝒊

Frecuencia

Relativa 𝒇𝒂

Frecuencia

Absoluta

Acumulada 𝑭𝒊

Frecuencia Relativa

Acumulada 𝑭𝒂

1 128-159 6 12 6 12

2 159-190 5 10 11 22

3 190-221 8 16 19 38

4 221-252 4 8 23 46

5 252-283 11 22 34 68

6 283-314 16 32 50 100

Total 50 100

162

Con base en la información de esta tabla se obtienen las siguientes cifras:

n = 50 𝒏

𝟐 =

𝟓𝟎

𝟐= 25

Como se observa, 25 está contenido en la frecuencia absoluta acumulada de la quinta

clase y, por ende, ésta es la clase mediana, cuyo intervalo es 252-283, así que el límite

inferior de la clase mediana (𝑳𝒊) es 252.

La frecuencia absoluta (𝒇𝒊) de la clase mediana es 11.

La frecuencia absoluta acumulada de la clase cuatro (𝒇𝟓−𝟏 = 𝒇𝟒), anterior a la clase

mediana, es 23.

El tamaño del intervalo (a) es 31

Al aplicar la (2.3.10) se tiene:

𝑴𝒆 = 𝟐𝟓𝟐 +

𝟓𝟎𝟐 − 𝟐𝟑

𝟏𝟏(𝟑𝟏) = 𝟐𝟓𝟕, 𝟔𝟑

La mediana tiene las siguientes propiedades:

Para su cálculo no se tienen en cuenta los extremos, por lo tanto no está

influenciada por éstos.

La mediana se utiliza con datos cuya escala es de razón, intervalo u ordinal.

Es aconsejable utilizarla en distribuciones notablemente asimétricas, cuyos

extremos no están bien definidos.

2.3.3.3 Cuartiles, deciles y percentiles. Ya se mencionó que la 𝑴𝒆 es una medida que

indica el punto donde el conjunto de datos se divide en dos fracciones, cada una de las

cuales contiene el 50% de los datos. De la misma manera es posible encontrar otras

medidas, denominadas cuartiles, que indican la división en cuatro fracciones del

conjunto que representan el 25%, el 50%, o el 75% de los datos.

El primer cuartil (𝑸𝟏) deja el 25% de los datos por debajo de su valor; el segundo (𝑸𝟐)

es la mediana, ya que deja el 50% de los datos por debajo de su valor, el tercero (𝑸𝟑)

deja el 75% de los datos por debajo de su valor. (𝑸𝟏) Es el cuartil inferior, (𝑸𝟐) el

cuartil medio y (𝑸𝟑) el cuartil superior.

163

De forma análoga que en la mediana, se puede encontrar la situación de los cuartiles,

mediante una formula, tal como se indica en seguida:

𝑺𝑸𝟏 = 𝒏 + 𝟏

𝟒

(2.3.11)

Si al aplicar (2.3.11) el resultado no es un entero, 𝑺𝑸𝟏 se aproxima al entero más

cercano.

Cuando 𝑺𝑸𝟏 cae entre dos enteros, es decir, en media unidad, entonces se redondea

hacia arriba. En el caso del cuartil 3:

𝑺𝑸𝟏 = 𝟑(𝒏 + 𝟏)

𝟒

(2.3.12)

Si 𝑺𝑸𝟏no es entero, se redondea al entero más cercano, pero si cae entre dos enteros, se

redondea hacia abajo.

Ejemplo 2.3.10: los siguientes datos corresponden a la producción de leche en kg por

lactancia (260dias) de las ovejas milchschaf, basados en la información de Larrosa y

Borean (1990).

380, 410, 410, 410, 430, 440, 445, 450, 453, 455, 458, 460, 460, 460, 464, 466, 470,

475, 480, 484, 485, 487, 490, 490, 490, 493, 493, 495, 495, 497, 497, 499, 499, 502,

502, 502, 505, 505, 505, 510, 510, 515, 520, 520, 530, 540, 540, 545, 548, 548, 550,

550, 550, 550, 555, 555, 560, 562, 563, 565.

Como se puede observar, el conjunto fue ordenado en forma ascendente para determinar

los cuartiles 𝑸𝟏 y 𝑸𝟑 mediante el uso de (2.3.11) y (2.3.12), respectivamente.

𝑺𝑸𝟏 = 𝟔𝟎 + 𝟏

𝟒=

𝟔𝟏

𝟒= 𝟏𝟓, 𝟐𝟓 ≈ 𝟏𝟓

164

Puesto que 𝑺𝑸𝟏 no es un número entero, se aproxima al entero más cercano, en este

caso a 15, lo que indica que 𝑸𝟏= 464, cifra de producción ubicada en la posición 15. Por

lo tanto se concluye que el 25% de los datos de producción lechera de las ovejas está

por debajo de 464 kg.

𝑺𝑸𝟑 = 𝟑(𝟔𝟎 + 𝟏)

𝟒=

𝟑(𝟔𝟏)

𝟒= 𝟒𝟓, 𝟕𝟓 ≈ 𝟒𝟔

Teniendo en cuenta 𝑺𝑸𝟑 no es un número entero, se redondea al entero más cercano, en

este caso a 46, así que 𝑸𝟑 es 540, es decir que el 75% de los animales tienen

producciones por debajo de este valor.

Ejemplo 2.3.11: Según reportes de los mismos autores del Ejemplo 2.3.10, la

producción de leche en kg por lactancia (150 días) de un rebaño de ovejas de la raza

manchega, fue la siguiente:

98, 100, 103, 103, 103, 105, 105, 108, 108, 108, 110, 110, 110, 110, 110, 111, 112, 112,

113, 113, 113, 114, 114, 115, 116, 116, 118, 118, 120, 123, 123, 123, 125, 125, 126,

128, 130, 130, 130, 131, 131, 132, 132, 133, 134, 135, 135, 135, 135, 135, 136, 137,

137, 138, 139, 139, 141, 141, 142, 142, 144, 146, 146, 146, 148, 149, 149, 149, 152.

Igual que en el ejemplo inmediatamente anterior, los datos fueron ordenados en forma

ascendente, con el fin de establecer los cuartiles 𝑸𝟏 y 𝑸𝟑, al aplicar (2.3.11) y (2.3.12),

se tiene.

𝑺𝑸𝟏 = (𝟔𝟗 + 𝟏)

𝟒=

(𝟕𝟎)

𝟒= 𝟏𝟕, 𝟓 ≈ 𝟏𝟖

Puesto que 𝑺𝑸𝟏 está entre dos números enteros (17 y 18), se aproxima al entero mayor,

en este caso a 18, lo que indica que 𝑸𝟏 es 112 kg, de tal modo que el 25% de los ovinos

tienen producciones inferiores a esta cantidad.

𝑺𝑸𝟑 = 𝟑(𝟔𝟗 + 𝟏)

𝟒=

𝟑(𝟕𝟎)

𝟒= 𝟓𝟐, 𝟓 ≌ 𝟓𝟐

165

Como se ve𝑺𝑸𝟑 se encuentra entre dos números enteros (52 y 53), así que debe

aproximarse al entero menor, en este caso a 52, para concluir que 𝑸𝟑 es 137 kg, lo que

significa que el 75% de los animales tienen producciones por debajo de este valor.

Cálculo de cuartiles con datos agrupados. Cuando los datos están agrupados,

los cuartiles pueden ser calculados mediante la fórmula:

𝑸𝒌 = 𝑳𝒊 +

𝒌𝒏𝟒 − 𝑭𝒂−𝟏

𝒇𝒊 (𝒂); 𝒌 = 𝟏, 𝟐, 𝟑

(2.3.13)

Dónde:

𝑳𝒊 = Límite inferior de la clase cuartílica donde está el cuartil.

n = Número total de datos.

𝑭𝒂−𝟏 = Frecuencia absoluta acumulada de la clase anterior a la cuartílica.

K = Posición del cuartil (1,3)

𝒇𝒊 = Frecuencia absoluta de la clase cuartílica.

a = Tamaño del intervalo.

Ejemplo 2.3.12: A continuación se presentan los datos del Ejemplo 2.3.11, agrupados

en una tabla de frecuencias.

Clase Límites de clase Marca de clase Fi Fi fa Fa

1 98,0 - 107,0 102,5 8 0,1159 8 O,1159

2 107 – 116,0 111,5 18 0,2609 26 0,3768

3 116,0 – 125,0 120,5 8 0,1159 34 0,4928

4 125,0 – 134,0 129,5 11 0,1594 45 0,6522

166

5 134,0 – 143,0 138,5 15 0,2174 60 0,8696

6 143,0 – 152,0 147,5 9 0,1304 69 1,0000

En caso de disponer de la información consignada en la tabla de frecuencias, los

cuartiles se calculan con (2.3.13). Antes de aplicar este procedimiento, es necesario

determinar la clase cuartílica que corresponde a la categoría cuya frecuencia acumulada

contiene el cuartil que se desea calcular. Para esto basta con desarrollar el término 𝑘𝑛

4 de

la formula (2.3.13), donde k se reemplaza por cuartil buscado.

Para determinar el primer cuartil, se establece primero la clase cuartílica 1.

𝑘𝑛

4=

1(69)

4= 17,25

Puesto que 17,25 está contenido en la frecuencia acumulada de la segunda categoría,

esta es la clase cuartílica uno y con base en esta información se continua con el

desarrollo de (2.3.13).

𝑸𝟏 = 𝟏𝟎𝟕 +

𝟏(𝟔𝟗)𝟒 − 𝟖

𝟏𝟖 (𝟗) = 𝟏𝟎𝟕 + 𝟎, 𝟓𝟏𝟑𝟗(𝟗) = 𝟏𝟏𝟏, 𝟔𝟐𝟓

𝑸𝟏 Se interpreta del mismo modo indicado en el ejemplo 2.3.6. Observe que el valor

obtenido con la fórmula no es exactamente igual al encontrado con los datos sin

agrupar; sin embargo, la discrepancia es mínima.

Del mismo modo se procede para encontrar el tercer cuartil.

𝑘𝑛

4=

3(69)

4= 51,75

Este valor está contenido en la frecuencia absoluta acumulada de la clase 5, por lo tanto

ésta es la clase cuartílica 3.

𝑸𝟑 = 𝟏𝟑𝟒 +

𝟑(𝟔𝟗)𝟒 − 𝟒𝟓

𝟏𝟓 (𝟗) = 𝟏𝟑𝟒 + 𝟒, 𝟎𝟓 = 𝟏𝟑𝟖, 𝟎𝟓

167

En este caso también existe una ligera discrepancia con respecto al 𝑸𝟑 calculado en el

Ejemplo 2.3.13, hecho que confirma que las medidas estadísticas obtenidas con datos

agrupados son una aproximación de los calores calculados cuando se dispone de la

información sin agrupar.

Los deciles dividen la distribución en 10 partes iguales y los percentiles en 100 partes

iguales. Al igual que en los casos de los cuartiles, los datos deben estar en orden de

magnitud creciente.

En forma análoga a lo que se hizo con la mediana y los cuartiles, la situación de los

percentiles (𝑺𝑷𝒌) viene dada por la fórmula general:

𝑺𝑷𝒌 = 𝒌(𝒏 + 𝟏)

𝟏𝟎𝟎; 𝒌 = 𝟏, 𝟐, 𝟑, … 𝟏𝟓, … 𝟗𝟗

Si al aplicar (2.3.14) 𝑺𝑷𝒌 no es entero, se redondea al entero más cercano.

Ejemplo 2.3.13: Para hallar el percentil 80 con los datos del Ejemplo 2.3.11, en primer

lugar se encuentra la posición del percentil según (2.3.14):

𝑺𝑷𝟖𝟎 = 𝟖𝟎(𝟔𝟗 + 𝟏)

𝟏𝟎𝟎= 𝟓𝟔

Por lo tanto el percentil 80 es el dato 56: 𝑺𝑷𝟖𝟎 = 139 kg.

Significa que el 80% de las producciones de leche de las ovejas manchegas están por

debajo de 139 kg.

Para hallar el percentil 15 con los mismos datos:

𝑺𝑷𝟏𝟓 = 𝟏𝟓(𝟔𝟗 + 𝟏)

𝟏𝟎𝟎= 𝟏𝟎, 𝟓 ≈ 𝟏𝟏

Por lo tanto el percentil 15 es el dato 11: 𝑃15= 108 kg y significa que el 15% de las

producciones de leche de las ovejas manchegas están por debajo de 108 kg.

Cálculo de percentiles con datos agrupados. La fórmula para calcular los

percentiles, cuando los datos agrupados es la siguiente:

168

𝑷𝒌 = 𝑳𝒊 +

𝒌𝒏𝟏𝟎𝟎 − 𝑭𝒊−𝟏

𝒇𝒊(𝒂; 𝒌 = 𝟏, 𝟐, 𝟑, … , 𝟗𝟗

(2.3.13)

Todos los términos de (2.3.15) deben interpretarse como en (2.3.13).

Ejemplo 2.3.14: Con los datos de la tabla del Ejemplo 2.3.12, se procede a determinar

los percentiles 9, 25,95.

P9= 98 +9(69)

100−0

8(9)=98+0.77625 (9)= 104,986

P9= 107 +25(69)

100−8

18(9)=107+0.514(9)= 111,625

P9= 143 +95(69)

100−60

9(9)=143+0.617(9)= 148,55

La utilidad de las medidas calculadas como cuartiles, deciles y percentiles es

fundamentalmente descriptiva y para la clasificación de los individuos en forma

comparativa. Desde el punto de vista práctico ofrecen una orientación general de lo que

sucede en la población analizada. El profesional pecuario puede, de manera ágil,

establecer comparaciones con los estándares de la especie que este bajo su cuidado o

administración.

3.3.3.4 La Moda o Modo (M0). Es el dato que más se repite en un conjunto de

observaciones. En algunos casos ningún valor se repite más que otro y se concluye que

la distribución no tiene moda; cuando hay un solo valor que se repite más que los otros,

la distribución es un unimodal; si dos datos se repiten igual número de veces es

bimodal y, en general, cuando existen más de dos valores que se repiten el mismo

número de veces la distribución es multimodal.

Ejemplo 2.3.15: A continuación se desarrollan algunos ejemplos sobre el cálculo de la

moda.

169

a). Los siguientes datos son una muestra aleatoria de peso vivo individual a las

12 semanas, medido en gramos, de 14 cuyes (cavia porcellus), recolectados por

García y Solarte (2001) en la granja Botana de la Universidad de Nariño: 984,

967, 768, 872, 849, 1022, 756, 842, 942, 780, 647, 765, 770, 810. Ya que en esta

muestra ningún dato se repite más que otro, se concluye que el conjunto de datos

no tiene M0.

b). En ora muestra aleatoria, recolectada por los mismos autores, se encontraron

los siguientes datos: 984, 900, 768, 872, 849, 1022, 756, 842, 900, 780, 647,

765, 900, 810. El dato que corresponde a 900 g se repite tres veces, por lo tanto

M0 es 900.

c). De esa misma población, se obtuvo una muestra para analizar el tamaño de

camada al nacimiento, en la cual se encontraron los siguientes resultados: 2, 2, 3,

3, 3, 5, 4, 4, 4, 5, 5, 3, 2, 2, 6, 4, 6, 3, 3, 6, 5, 4, 5. En esta muestra, los tamaños

de camada 4 y 3 se repiten seis veces, así que hay dos modas: M01 =4; Mo2 = 3.

d). Una muestra de mayor tamaño para la misma variable condujo a los

siguientes.resultados:2, 1, 2, 3, 7, 3, 3, 5, 4, 5, 4, 4, 4, 5, 5, 3, 2, 7, 2, 6, 4, 6, 3, 3,

6, 5, 4 , 1, 5. En este caso la distribución es multimodal (tremedal) y las modas

son 3,4 y 6, ya que estos tamaños de camada aparecen seis veces cada uno.

Calculo de la moda con datos agrupados. Para calcular la moda con datos

agrupados, se debe utilizar la siguiente formula:

Dónde:

𝑀0 = 𝐿𝑖 + (∆1

∆1+∆2)(a)

Li= límite inferior de la clase modal. Se entiende por clase modal de mayor

frecuencia absoluta.

∆1= Valor resultante de la diferencia entre la frecuencia absoluta de la clase modal

menos la frecuencia absoluta de la clase inmediatamente anterior.

∆2= Valor resultante de la diferencia entre la frecuencia absoluta de la clase modal

menos la frecuencia absoluta de la clase inmediatamente siguiente.

a = amplitud de intervalo.

170

Ejemplo 2.3.16: Para los datos de la Tabla 2.1.1, la moda se calcula de la siguiente

manera:

Li = 283 en el límite inferior de la clase 6, definida como la clase modal, por tener la

mayor frecuencia absoluta.

∆1= 16-11 = 5

∆2= 16-0 = 16

a = 31

Al calcular con (2.316) se tiene:

𝑀0 = 283 + (5

5 + 16) (31) = 290,38

De acuerdo con el anterior resultado, los valores más frecuentes están alrededor de

290,38.

La Moda se puede utilizar con datos cuya escala es de razón, intervalo, ordinal o

nominal. Es aconsejable usarla con distribuciones marcadamente asimétricas.

2.3.2 Medidas de dispersión. Las medidas de tendencia central dan una idea del lugar

hacia done tienden a concentrarse la mayoría de observaciones, si indicar el grado de

dispersión de los valores de la variable con relación a ese “valor central”. Para describir

en forma más completa de comportamiento de cualquier variable de interés, también es

necesario conocer las medidas de variabilidad.

Las medidas de dispersión más utilizadas son la varianza, la desviación estándar, el

rango, el coeficiente de variación y el recorrido intercuartílico.

2.3.2.1 La varianza y la desviación estándar. Son las medidas de dispersión más

utilizadas. La varianza o cuadrado medio se define, matemáticamente, como el

171

promedio aritmético del cuadrado de las desviaciones de cada observación con respecto

a la medida.

En el caso de la varianza, el parámetro se representa por l letra griega sigma al cuadrado

(𝜎2) y el estadígrafo por la letra S al cuadrado (S2). Para la desviación estándar el

parámetro se representa por (𝜎) y el estadígrafo por S. simbólicamente (𝜎2) se define

mediante la siguiente formula:

𝜎2 = (𝑌1 − 𝜇)2 + (𝑌2 − 𝜇)2 + (𝑌3 − 𝜇)2+. . . . . +(𝑌𝑁 − 𝜇)2(𝑌1 − 𝜇)2

𝑁

= ∑(𝑌𝑖 − 𝜇)

𝑁

2

Para calcular S2 se utiliza la siguiente formula:

𝑆2 = (𝑌1 − ��)2 + (𝑌2 − ��)2 + (𝑌3 − ��)2+. . . . . +(𝑌𝑁 − 𝜇)2(𝑌1 − ��)2

𝑛 − 1

= ∑(𝑌𝑖 − ��)

𝑛 − 1

2

La varianza se expresa en las mismas unidades de la variable original, elevada al

cuadrado, y la desviación estándar en las mismas unidades de los datos y por esto en la

presentación y análisis de resultados se prefiere S en lugar de S2. Para facilitar las

labores de cálculo de S2 se puede usar la siguiente fórmula de trabajo:

𝑆2 = ∑ 𝑌𝑖

2 − (∑ 𝑌𝑖)

2

𝑛𝑛 − 1

El término (∑ 𝑌𝑖)2

𝑛 se denomina factor de corrección y se identifica como C.

La expresión ∑ 𝑌𝑖2 se conoce con el nombre de suma de cuadrados sin ajustar.

172

Ejemplo 2.3.17: Los datos consignados en la Tabla 2.3.3 corresponde a las

producciones de leche en kilogramos por vaca/ día, de las campeonas de los terneros y

exposiciones de Gyr lechero, organizadas por la Asociación Brasileña de Criadores de

Cubu (ABCZ, 2001).

Tabla 2.3.3 Producción de leche en kg/vaca/día de las campeonas Gry

lechero en Brasil

Vaca Producción

(Yi )

(Yi )2 Vaca Producción

(Yi) (Yi )2

Hamada 19,62 384,944 Victoria 24,85 617,523

Lagosta 17,06 291,044 Realeza 19,15 366,723

Doncella 19,17 367,489 Brasilia 22,70 515,290

Evilha 18,02 324,720 Amizade 22,70 515,290

Jarra 18,85 355,323 California 24,38 594,384

Mentira 19,10 364,810 Entrancia 21,65 468,723

Gaviota 18,91 357,588 Fagacia 12,25 150,063

Faianca 17,93 321,485 Fada 34,60 1.197,160

Lucrecia 19,81 392,436 Delicia 27,20 739,840

Maravilha 21,25 451,563 Indigena 28,30 800,890

Gabarra 25,94 672,884 Enamorada 27,50 756,250

Amalia 18,75 351,563 Fieira 23,90 571,210

Tala 21,72 471,385 Cabedella 20,30 412,090

Rebarba 19,58 383,376 Fragancia 25,30 640,090

173

Zema 20,43 417,385 FB Gambia 26,40 696,960

Valentia 21,70 470,890 Cabina 17,60 309,760

Omaga 22,36 499,970 Gaviota 30,20 912,040

Varanda 20,91 437,228 ∑ 770,09 17.580,739

En la tabla 2.3.3 se agregó una columna con la producción elevada al cuadrado, para

disponer de todos los datos requeridos en (2.3.19):

(∑ 𝑌𝑖)2

= (770,09) = 593.038,608

(∑ 𝑌𝑖)2

= 17.580,736

n = 35

Al remplazar en (2.3.19) se tiene:

𝑆2 = 17.580,739 −

(770,09)2

3535 − 1

= 18,7288 𝐾𝑔2

𝑆 = √𝑆2 = √18,7288 = 4,3277 𝑘𝑔

Calculo de la varianza con datos agrupados. Cuando los datos están

agrupados, la varianza se calcula de la siguiente manera:

Dónde:

fi= Frecuencia absoluta de la i-ésima clase.

mi = Marca de clase de la i-ésima categoría.

n = Tamaño de la muestra.

174

Ejemplo 2. 3. 18: los datos de la Tabla 2.3.3 se agruparon y, además, para facilitar los

cálculos correspondientes, se complementaron de la siguiente manera:

Clase Límite de

clase mi fi fimi mi2 fimi2

1 12,25-15,98 14,115 1 14,115 199,233 199,233

2 15,98-19,71 17,845 12 214,140 318,444 3.821,328

3 19,71-23,44 21,575 11 237,325 465,480 5.120,286

4 23,44-27,17 25,305 6 151,830 640,343 3.842,058

5 27,17-30,90 29,035 4 116,140 834,031 3.372,124

6 30,90-34,63 32,765 1 32,765 1.073,545 1.073,545

∑ 35 766,315 17.428,574

∑ 𝑓𝑖𝑚𝑖2 =17.428,574

(∑ 𝑓𝑖𝑚𝑖2)2= (766,315)2 = 587.238,679

𝑆2 = 17.428,574 −

(587.238,679)2

3534

= 19,127 𝐾𝑔2

La desviación estándar para estar muestra es la siguiente:

𝑆 = √𝑆2 = √19,127 = 4,373 𝑘𝑔

Usualmente la varianza, tanto con datos agrupados con sin agrupar, se calcula con un

digito decimal más que la medida.

2.3.2.2. El coeficiente de variación o variabilidad (CV). Es una cantidad cuyo uso

más importante es evaluar los resultados experimentales donde se estudia la misma

característica, generalmente por personas distintas y bajo condiciones diferentes.

175

El CV se define como la desviación estándar expresada con porcentaje de la medida, de

acuerdo con la siguiente formula:

𝐶𝑉 = 𝑆

��(100)

Para establecer sin un CV es grande o pequeño es preciso disponer de datos similares

para la variable analizada. Por ejemplo, los materiales vegetales tienen cada uno su

propio CV, lo mismo sucede con las especies animales.

A diferencia dela S, el CV es una medida relativa de variación. La primera se expresa en

las mismas unidades de la variable y la segunda en porcentaje.

Ejemplo: 2.3.19: con la información contenida en la tabla 2.3.3 se calcula el coeficiente

de la variación, de la siguiente manera:

�� = 22,00 𝑘𝑔 S = 4,3277 kg

𝐶𝑉 = 4,3277

22,00(100) = 19,67%

No es posible establecer si este CV es alto o bajo puesto que no se dispone de

información que reporte el CV para el ganado gyr en la característica analizada.

2.3.2.3 El rango (R). Es otra medida de dispersión que se define y calcula de la manera

indicada en la construcción de tablas de frecuencias. Tiene escaso uso en el proceso de

inferencia ya que no es un estadígrafo satisfactorio, aunque con muestras de 10 es

frecuentemente útil.

2.3.2.4 El Rango Intercuartílico (RIQ). Es una medida de variabilidad resistente a los

“outliers”. Si es RIQ es grande debe interpretarse que, en un conjunto de datos

ordenados, existe una grande dispersión de estos con respecto al valor central; si por el

contrario RIQ es pequeño, gran parte de las observaciones se encontraran cerca de

centro. EI RIQ se calcula restando el 𝑄1 del 𝑄3

Ejemplo 2.3.20: en el ejemplo 2.3.11 se calcula 𝑄1= 18 y 𝑄3 = 52, entonces:

𝑅𝐼𝑄 = 52 − 18 = 34

176

En este caso es posible afirmar que no existe una gran dispersión de los datos y que la

tendencia es el agrupamiento en torno al valor central representado por la mediana.

2.3.3 Asimetría y curtosis. Las distribuciones también pueden diferir entre sí en simetría

y grado de apuntamiento. Una distribución es simétrica cuando la media, la mediana y

la moda coinciden en el mismo punto, como se indica en la figura 2.3.1.

Pero si la distribución es asimétrica, entonces la media, la mediana y la moda se ubican

en puntos diferentes. Si Moda <Mediana<Media, la curva es asimétrica con sesgo

positivo. Si Media>Mediana>Moda, la curva es asimétrica con sesgo negativo (Figura

2.3.2).

Figura 2.3.1 Representación de una distribución simétrica.

Una medida asimétrica es el coeficiente de Asimetría (𝐶𝐴), definido por la siguiente

fórmula.

𝐶𝐴 = ∑ (𝑋𝑖 − ��)3𝑛

𝑖=1

𝑛𝑆3

(𝐶𝐴) = 0, la curva es simétrica.

(𝐶𝐴) > 0, la curva es asimétrica con sesgo positivo.

(𝐶𝐴) < 0, la curva es asimétrica con sesgo negativo.

177

Sesgo Positivo

Sesgo Negativo

Figura 2.3.2 distribuciones asimétricas con sesgo positivo y negativo.

La Curtosis es una medida de la agudeza o grado de apuntamiento de una distribución,

determinada por el Coeficiente de Curtosis (𝐶𝐴𝑝) o apuntamiento (figura 2.3.3).

Figura 2.3.3 Tipos de curtosis (A: Mesocúrtosis, B: Leptocúrtica C:

Platicúrtica)

178

El coeficiente de curtosis se calcula mediante (2.3.2.3)

𝐶𝐴𝑝 = ∑ (𝑋𝑖 − ��)4𝑛

𝑖=1

𝑛𝑆4

(𝐶𝐴) = 3, la curva es mesocúrtica o normal.

(𝐶𝐴) > 0, la curva es leptocúrtica.

(𝐶𝐴) < 0, la curva es platicúrtica.

En estadística inferencia es muy importante el concepto de normalidad de las muestras.

Los conceptos de asimetría y curtosis son una herramienta útil para establecer si la

muestra proviene de una población normal. Si la muestra es bastante asimétrica y el

coeficiente de curtosis es bastante alejado de tres, se descarta normalidad; en caso

contrario, es decir, si los datos son simétricos y el coeficiente de curtosis cercano a tres,

los datos provienen de una población bastante parecida a la normal y, en este caso, lo

más razonable es utilizar una prueba estadística de normalidad.

Ejemplo 2.3.21: En un ensayo con peces Ángel o Escalares (Pterophyllum scalare), se

recopilo información sobre longitud estándar medida en centímetros, cuyos valores

están consignados en la tabla 2.3.4.

Tabla 2.3.4 longitud estándar de peces Ángel (pterophyllum scalare), Pasto,

Colombia, 2002.

15 13 12 14 14 10

14 12 11 13 7 8

11 10 10 9 7 8

8 9 7 7 12 13

15 15 11 14 10 5

179

13 14 14 6 5 4

15 12 12 7 6 10

12 13 15 5 7 8

8 9 10 9 11 12

12 12 13 12 12 13

Aplicando (2.3.22) y (2.3.23) se calcularon los coeficientes de asimetría y curtosis,

respectivamente, de la siguiente manera:

CA = ∑ (Xi− X)3n

i=1

nS3 = −578,877

60∗27,1208= −0,3557

𝐶𝐴𝑝 = ∑ (𝑋𝑖 − ��)4𝑛

𝑖=1

𝑛𝑆4=

9.917,46

60 ∗ 81,4838= 2,0285

De acuerdo con estos resultados la muestra analiza no es simétrica, ya que 𝐶𝑎 <0, lo que

indica que tiene sesgo ligeramente negativo. En cuanto a la curtosis, se concluye que la

curva generada por los datos de la muestra es platicúrtica.

Es importante mencionar que en trabajos experimentales el tamaño de la muestra debe

ser suficientemente grande como para establecer de manera confiable de forma de la

curva.

2.3.4 Diagramas de caja. El diagrama de caja es una herramienta útil en el análisis de

un conjunto de datos invariado, debido a que facilita el análisis de la simetría, detecta

valores atípicos y vislumbra un ajuste de los datos a una distribución de frecuencias

determinada.

La mitad central de los datos que va desde el primero hasta el tercer cuartil se los

representa mediante un rectángulo, la mediana se lo identifica con un segmento de recta

180

vertical que va dentro del rectángulo. Un segmento de recta se extiende desde el primer

cuartil hasta el valor mínimo, como se muestra en la figura 2.3.4.

Figura 2.3.4 diagrama de cajas y bigotes

Ejemplo 2.3.22: De un experimento reportado por Milton (1994), donde se administró

CO a diferentes presiones atmosféricas, para establecer la influencia sobre el

crecimiento del Pseudomonas fraji, medido como el cambio porcentual en la más

celular después de una hora, se extractaron los siguientes resultados:

Presión en atmósfera de CO2

0,0 0,083 0,29 0,50

62,6 50,9 45,5 29,5

59,6 44,3 41,1 22,8

64,5 47,5 29,8 19,2

59,3 49,5 38,3 20,6

58,6 48,5 40,2 29,2

64,6 50,4 38,5 24,1

30,2 32,7

181

27,0 24,4

En la figura 2.3.5 se indican los diagramas de cajas para los cuatro tratamientos. Allí se

puede apreciar que en el tratamiento a se presenta el mayor crecimiento de la más

celular y luego en tratamiento b; el tratamiento de menor crecimiento es el d. la mayor

variabilidad se observa en los tratamientos c y d, respectivamente, puesto que sus cajas

son las más largas. En cuanto a la simetría, los tratamientos a y b exhiben las

distribuciones más simétricas puesto que sus respectivas medianas están situadas cerca

de la mitad de las cajas y los tratamientos c y d son asimétricos, el primero con sesgo a

la derecha y el segundo con sesgo a la izquierda.

Figura 2.3.5 Diagramas de caja para el crecimiento de la masa celular del

Pseudomonas fragi, según la presión de CO2

182

CAPÍTULO 3

Conceptos básicos de Probabilidad

3.1. INTRODUCCIÓN

En el Capítulo 1 se mencionó que la teoría de las probabilidades se inició a principios

del siglo XVII, aplicada a los juegos de azar. En la actualidad se considera una rama de

las matemáticas que juega un papel predominante en la inferencia estadística.

Desde el capítulo inicial se ha insistido en la inconveniencia de formular definiciones

exactas de los aspectos estadísticos de mayor importancia, dentro de los cuales las

probabilidades no son la excepción. Al abordar este tema se pretende, básicamente,

manejar en forma adecuada ciertos conceptos y procedimientos que permitan tener una

idea clara de las probabilidades y su importancia en los temas de inferencia estadística

que se estudiarán posteriormente.

La teoría de las probabilidades se utiliza con más frecuencia de lo que se cree, no solo

en las ciencias animales sino en muchas disciplinas. Por ejemplo, en Genética es posible

predecir el desempeño de la progenie con base en la información de los padres y otros

ascendientes; también es factible determinar la frecuencia con que aparecerán ciertos

fenotipos en una determinada población, tales como el color del pelo o una enfermedad

de origen hereditario, entre otros. En el control de calidad de productos lácteos o

cárnicos de una factoría, es posible determinar la proporción de unidades procesadas y

empacadas que no cumplirán con las normas sanitarias o de calidad admitidas para su

comercialización. También se usan los conceptos de la teoría de las probabilidades en la

planificación y seguimiento de programas para el control y/ o erradicación de

enfermedades de los animales.

Se advierte al lector que la teoría de las probabilidades es un campo bastante amplio que

exige niveles de abstracción y conocimientos matemáticos avanzados cuando se estudia

este tema con profundidad. Sin embargo, en esta obra no se intentara abordar estudios

de esa naturaleza. Para los interesados en profundizar en este tema se recomiendan,

entre varias, las obras de Meyer (1973) y Parzen en (1960).

183

3.2 CONCEPTOS BÁSICOS PARA EL ESTUDIO DE LAS PROBABILIDADES

Con el propósito de iniciar el estudio del tema es necesario recalcar que en las ciencias

animales la observación de fenómenos, bajo cierto conjunto de condiciones, constituye

la materia prima para la labor profesional y de investigación. Así por ejemplo, en una

población bovina se observan vacas con o sin cuernos; en una piara, cerdos con o sin

síntomas de alguna enfermedad; en un rebaño, animales de diferente peso al nacimiento;

animales sometidos al mismo tratamiento que tardan tiempos diferentes en su

recuperación; en un medio de cultivo, bacterias resistentes a determinados antibióticos,

y muchos otros fenómenos.

Al observar repetidamente al mismo fenómeno, no siempre se llega a resultados

idénticos y, por el contrario, la variación de estos es una característica notoria, pero en

un gran número de repeticiones, un resultado aparecerá varias veces con cierta

frecuencia, que se denomina regularidad estadística, y los fenómenos donde se aprecia

dicha regularidad reciben el nombre de fenómenos aleatorios.

La representación numérica de la regularidad estadística se hace con números

comprendidos entre cero y uno, como indicación de la frecuencia relativa con que se

presentan los diferentes resultados en una serie de repeticiones independientes entre sí.

Ejemplo 3.2.1: En un matadero se sacrifican novillos de tres razas diferentes: cebú,

normando o shorton. Un profesional agropecuario se encarga de realizar una inspección

generala cada animal, previamente al sacrificio. En un momento dado a la pregunta ¿de

qué raza será el próximo novillo que será inspeccionado? Aparentemente esta pregunta

no tiene respuesta, ya que el novillo puede ser de cualquiera de estas tres razas. Sin

embargo, si se realiza un “experimento” consisten en determinar y anotar la raza de

cada novillo, aparecerán resultados particulares, como los presentados a continuación.

Cebú: 120

Normando: 28

184

Shorton: 2

Total: 150

Con estos resultados se establecen las siguientes frecuencias relativas:

Para el ganado cebú: 150

120= 0,8

Para el normando:28

150= 0,19

Para el shorton:2

150= 0,01

Si se continúa registrando la información seguramente se obtendrán valores de

frecuencia relativa diferentes a los anteriores, pero a medida que se repita este

procedimiento hasta alcanzar un número “grande” de registros, las fluctuaciones de los

valores de dichas frecuencias en las sucesivas repeticiones se volverán más pequeñas,

hasta estabilizarse. A esta estabilización de las frecuencias relativas, cuando el número

de repeticiones de un experimento es grande, se le llama regularidad estadística,

característica típica de los experimentos aleatorios que, por ahora, se definirán como los

procedimientos que se llevan a cabo para registrar una observación.

El evento o suceso aleatorio se define como un resultado posible en un experimento.

Para el ejemplo 3.2.1, los sucesos posible son que el próximo novillo sea cebú,

normando o shorton, es decir, hay tres resultados probables, cuya frecuencia relativa es

una sucesión grande de observaciones llevadas a cabo aleatoriamente, se acerca un valor

límite estable a medida que un número de observaciones tiende al infinito. Por lo tanto,

ese valor límite estable puede considerarse como la probabilidad de ocurrencia del

evento aleatorio. El espacio muestral, denotado con la letra S, contiene las descripciones

de todos los posibles resultados de un experimento.

En el ejemplo 3.2.1 se puede observar, como en todos los experimentos aleatorios, que

los valores de las frecuencias relativas están comprendidos entre 0 y 1, los cuales

reflejan las expectativas de ocurrencia de un suceso determinado, tal modo que

probabilidades próximas a uno indican que ese tipo de evento generalmente se produce,

no que vaya a producirse con certeza; probabilidades cercanas a cero conducen a pesar

que el suceso difícilmente se producirá, mas no indican que no vaya a producirse.

185

Probabilidades cercanas a 0,5 indican que es tan verosímil que el suceso se produzca,

como que no se produzca.

Después de analizados los anteriores conceptos, al formular la pregunta ¿de qué raza

será el próximo novillo a ser inspeccionado?, el profesional responderá que es una

pregunta que no tiene respuesta, pero si se preguntase ¿Cuál es la probabilidad de que el

próximo novillo a ser inspeccionado sea de una raza específica, de las tres que se

sacrifican? Tendrá elementos para responderla correctamente en términos

probabilísticos. Si la frecuencia relativa estable es de 0,8 para la raza cebú, podría

contestar que de los próximos 10 novillos que entran a sacrificio, ocho serán cebú y

seguramente el dato predicho coincidirá con el real y a medida que se incremente el

número de observaciones su predicción coincidirá en mayor medida con lo que ocurrirá

realmente.

De lo expresado hasta esta parte se puede concluir que la estadística no se ocupa de

experimentos donde es posible anticipar el resultado, sino de aquello donde los

resultados están sujetos al azar, es decir, los experimentos aleatorios.

3.3 ESPACIO MUESTRAL

Con el fin de ampliar el concepto de espacio muestral (s), se presentan algunos

ejemplos:

Ejemplo 3.3.1: En un experimento de campo conducente a detectar mastitis con la

prueba CMT, en un hato de 10 vacas, el espacio muestral se describe de la siguiente

manera: S= {0,1,2,3,4,5,6,7,8,9,10}. Esto significa que en S están contenidos todos los

resultados posibles del experimento, 0 indica que ninguna vaca resulte positiva a la

prueba; 1 que se detecta una vaca enferma, y así sucesivamente hasta 10

Ejemplo3.3.2: De un recipiente que contiene seis bolas idénticas, excepto por su color,

ya que cuatro son blancas y dos son rojas se extrae una bola, se observa y anota su color

186

e inmediatamente se devuelve al recipiente. En este caso el espacio muestral es S {roja,

blanca}.

Ejemplo 3.3.3: De un recipiente que contiene seis bolas idénticas, numeradas del 1 al 6

se extraen dos, primero una luego otra, sin devolver al recipiente la primera antes de

sacar la segunda. En este caso, el espacio muestral se describe del siguiente modo:

S= {(1-2), (1-3), (1-4), (1-5), (1-6), (2-1), (2-2), (2-3), (2-4), (2-5), (2-6),(3-1), (3-2), (3-

3), (3-4), (3-5), (3-6), (4-1), (4-2), (4-3), (4-4), (4-5),(4-6), (5-1), (5-2), (5-3), (5-4),(5-

5), (5-6), (6-1), (6-2), (6-3), (6-4), (6-5)}.

Es decir, bajo las condiciones especificadas para el experimento del Ejemplo 3.3.3, hay

treinta resultados posibles.

Ejemplo 3.3.4: En el control de apareamiento, realizado rutinariamente en una piara,

cuando nace una cría se anota, en su correspondiente registro, el tamaño de camada de

donde proviene el padre y el tamaño de camada del cual proviene la madre.

Suponiendo que el padre haya nacido en una camada de tamaño siete y la madre en una

de tamaño cinco, este apareamiento se registrara como el par ordenado (5,7); la

observación (7,12) corresponderá al tamaño de camada 7para el padre y 12 para la

madre. Como los tamaños de camada pueden tomar cualquier valor entero entre 1 y 16,

tanto para los machos como para las hembras, existe una gran cantidad de resultados

difíciles de describir individualmente; por lo tanto, el espacio muestral se describe de

mejor manera así: se denomina X el tamaño de camada de los padres, Y el tamaño de

camada de las madres, en consecuencia el espacio muestral se describe así:

S= {los padres ordenados (X, Y) tal que X es un entero del 1 al 16, Y es un entero del

uno 1 al 16}.

Del análisis de los tres ejemplos se desprenden varios hechos:

El espacio muestral (S) no siempre es fácil de describir.

187

S cambia según las condiciones en que se lleve a cabo el experimento, por eso es

preferible hablar de un espacio muestral referido a un experimento concreto.

S puede ser de tamaño finito, pero existen otros espacios de tamaño infinito que

se describen adoptando alguna notación específica, que se explicara más

adelante.

Un espacio muestral no necesariamente está constituido por números.

En todas las descripciones de S convencionalmente se usan {} con el fin de

indicar que realmente se está trabajando con conjuntos, dentro de los cuales se

hace una lista de todos sus elementos. Por ejemplo se entiende “cualquier

colección de conceptos o de objetos perfectamente especificada” (Meyer, 1974).

El tamaño de un conjunto está definido por el número de elementos que pertenecen a él.

Un conjunto es finito si su tamaño es cualquiera de los números finitos, así por ejemplo,

el conjunto de granjas que posee la universidad de Nariño es de 5, S = {Botanas,

Chimangual, La Quinta. Mar Agrícola, Guamués}; si el conjunto de vacas en

producción láctea en una de las granjas es 10:

S= {01, 02, 03, 04, 05, 06, 07, 08, 09, 10}.

En este caso, los elementos del conjunto se representan con el código que identifica a

cada animal.

Un conjunto infinito puede ser numerable, por ejemplo, el conjunto de los números

impares es infinito numerable, en donde S= {1, 3, 5, 7, 9,…..}; en cambio, el número de

puntos en la recta real en el intervalo 0 a 1 es infinito no numerable y se representa

como S = {𝑋|0 ≤ 𝑋 ≤ 1}

En muchos textos el espacio muestral se representa con la letra U para resaltar que se

trata del conjunto universal que, como se sabe, contiene todas las descripciones.

3.4 EVENTOS

Para definir un evento es necesario relacionarlo con el espacio muestral S, ya que un

evento ocurre si sólo si el resultado observado corresponde a una de las descripciones

contenidas en S; así, en el Ejemplo 3.3.2 se pueden presentar varios eventos: extraer

188

una bola blanca, extraer una bola roja, sacar primero una bola roja y luego una blanca,

sacra primero una bola blanca y luego otra blanca. Se observa que todos los casos

descritos aparecen en S. Hecha esta precisión, un evento se considerará como un

subconjunto de S.

Para especificar un conjunto se utilizan, convencionalmente, letras mayúsculas y

algunos símbolos; por ejemplo, para indicar que un elemento pertenece a un conjunto se

utiliza el símbolo∈; para especificar que un elemento no pertenece a un conjunto se usa

el símbolo∄. El símbolo I debe leerse como “tal que “, que especifica una condición

particular de los elementos del conjunto. El símbolo ∁ indica que todos los elementos de

un conjunto son también elementos de otro, de este modo la expresión A ∁ B, deberá

entenderse como A es un subconjunto de B.

Dado que S contiene todas las descripciones posibles, también es un subconjunto de sí

mismo, por lo que constituye un evento llamado evento seguro.

Cuando se estudian fenómenos aleatorios, realmente el interés se centra en los eventos

que pueden ocurrir y, concretamente, en la probabilidad de su ocurrencia y no en el

espacio muestral, sino en los subconjuntos, que son los eventos.

3.5 OPERACIONES CON CONJUNTOS

Con los eventos y el espacio muestral, considerados en términos de conjuntos, es

posible efectuar varias operaciones algebraicas; las de mayor utilidad son las de adición

y la multiplicación, cuyas reglas se resumen a continuación.

3.5.1 La suma o unión de conjuntos (A U B). Es el conjunto de las descripciones que

están contenidas en A,∩ en B o en ambos, entonces (A U B) ocurre si y solo si ocurre A

o bien ocurre B o si ocurren ambos, es decir, cuando el resultado observado tiene como

descripción muestral un elemento de A, de B o de ambos.

189

Ejemplo3.5.1: Si se define S = {Y} Y es un Bos Taurus puro de las razas angus,

Hertford, Holstein, pardo suizo}.

Considerando los siguientes subconjuntos: A= {Y} Y es una vaca Holstein}, B = {Y} Y

es una vaca pardo suizo}, el conjunto definido como las vacas productoras de leche A U

B = {Y} Y es una de las vacas de las razas Holstein o pardo suizo}.

3.5.2 El producto o intersección de conjuntos (A ∩ B). Corresponde al conjunto de

elementos presentes tanta en A, como en B, o sea que (A ∩ B) ocurre si y solo si A y B

ocurre. Si A y B son eventos mutuamente incluyentes no pueden ocurrir juntos, por lo

tanto (A ∩ B) = ∅

Ejemplo 3.5.2: Definidos los conjuntos:

A = {Y} Y es una vaca pardo suizo lactante}.

B = {Y} Y es una vaca pardo suizo en gestación}

El conjunto restante de:

A ∩ B = {Y} Y es una vaca pardo suizo lactante y gestante a la vez}.

3.5.3 Complemento de A ( �� ). Si A es un evento, puede calcularse la probabilidad de

que A ocurra o no. Si A es el conjunto, �� es su complemento, es decir, representa todas

las descripciones presentes en S que no están en A por lo tanto, �� ocurre si y solo si A

no ocurre.

Ejemplo 3.5.3: Siendo el espacio muestral S = {Y} Y es un perro}, en el cual se define

el conjunto A = {Y} Y es un perro vacunado contra el parvovirus}, entonces �� = {Y }

Y es un perro no vacunado contra el parvovirus}.

Las operaciones de unión, intersección y el complemento se pueden representar con los

diagramas de Venn de la Figura 3.5.1.

190

𝐴 ∪ 𝐵 𝐴 ∩ 𝐵 ��

Figura 3.5.1 Diagramas de Venn para las operaciones con conjuntos

𝑬𝒋𝒆𝒎𝒑𝒍𝒐 𝟑. 𝟓. 𝟒: 𝑈𝑛𝑎 𝑏𝑜𝑙𝑠𝑎 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 12 𝑏𝑜𝑙𝑎𝑠 𝑖𝑑é𝑛𝑡𝑖𝑐𝑎𝑠, 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑎𝑠 𝑑𝑒𝑙 1 𝑎𝑙 12.

S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,12}

Si se toman dos subconjuntos de S:

A = {1, 2, 3, 4, 5, 6}

B = {4, 5, 6, 7, 8, 9,}

Los resultados de las tres operaciones son los siguientes:

A U B = {1, 2, 3, 4, 5, 6, 7, 8, 9}

A ∩ B = {4, 5, 6}

�� = {7, 8, 9, 10, 11,12}

Conviene también indicar que dos conjuntos son iguales (A = B), si y solo si cada una

de las descripciones en A pertenece también a B y viceversa.

Las operaciones de unión e intersección definidas anteriormente, se pueden extender a

más de dos conjuntos, así:

𝐴 𝑈 𝐵 𝑈 𝐶 = 𝐴𝑈(𝐵𝑈𝐶) 𝑜 ( 𝐴𝑈𝐵) 𝑈𝐶

∩ 𝐴 ∩ 𝐵 ∩ 𝐶 = 𝐴 ∩ (𝐵 ∩ 𝐶) 𝑜 (𝐴 ∩ 𝐵) ∩ 𝐶

𝐿𝑎𝑠 𝑝𝑟𝑜𝑝𝑖𝑒𝑑𝑎𝑑𝑒𝑠 𝑐𝑜𝑛𝑚𝑢𝑡𝑎𝑡𝑖𝑣𝑎𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜𝑠 𝑖𝑛𝑑𝑖𝑐𝑎𝑛 𝑞𝑢𝑒:

a. 𝐴 𝑈 𝐵 = 𝐵 𝑈 𝐴

b. 𝐴 ∩ 𝐵 =B ∩ A

S A B S A B A

191

Y las propiedades asociativas:

a. A U (B U C ) = (A U B ) U C

b. A ∩ (B ∩ C ) = (A ∩ B ) ∩ C

Existen otros conjuntos que contienen unión, intersección y complementación. Los más

importantes se indican enseguida:

a. A U (B ∩ C ) = (A U B ) ∩ ( A U C )

b. A ∩ (B U C ) = (A ∩ B ) U (A ∩ C )

c. A ∩ ∅ =∅

d. A U ∅ =A

e. ( 𝐴 ∩ 𝐵) = �� ∪ ��

f. ( 𝐴 ∪ 𝐵) = �� ∩ ��

Como ya se señaló, ∅ es el conjunto vacio que en las operaciones de unión e

intersección se comparta como el cero (0) entre los números.

3.6 PROBABILIDAD DE UN EVENTO

Con los elementos señalados hasta ahora se podría deducir que, dado un experimento,

descrito por un espacio muestral S, la probabilidad es una función que asigna a cada

evento un número real no negativo, denotado por P [ A ], llamada probabilidad del

evento A, que debe satisfacer los siguientes principios:

a. P [ A ] ≥ 0 para todos los eventos A de S

b. P [ S ] = 1

c. Si A y B son eventos que se excluyen mutuamente en S, entonces:

P [A U B] = P [A] + P [B]

d. Si 𝐴1, 𝐴2, … … es una serie de eventos mutuamente excluyentes, entonces

P[𝐴1 ∪ 𝐴2 ∪ … … . ] = 𝑃[𝐴1] + 𝑃[𝐴2] + … … … …

De estos principios fundamentales se derivan las siguientes propiedades:

a. 𝑆𝑖 𝐴1, 𝐴2, … … 𝐴𝑛 son eventos mutuamente excluyentes en un espacio muestral

S, entonces:

𝑃[𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ … … .∪ 𝐴𝑛] = 𝑃[𝐴1] + [𝐴2] + [𝐴3] + … … . +[𝐴𝑛]

b. 𝑃[∅] = 0, 𝑑𝑜𝑛𝑑𝑒 ∅ es el evento vacío, también llamado evento imposible.

192

c. 𝑃[��] = 1 − 𝑃[𝐴]

d. 𝑃[𝐴 ∪ 𝐵] = 𝑃[𝐴] + 𝑃[𝐵] − 𝑃[𝐴 ∩ 𝐵], 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑝𝑎𝑟 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝐴 𝑦 𝐵

3.7 CÁLCULO DE PROBABILIDADES CON ESPACIOS MUESTRALES

FINITOS

Con el fin de caracterizar P [A] en modelos con espacio muestral finito se considerara,

en primer lugar, el suceso que está constituido por un solo resultado, denominado

suceso elemental que se denota por A = {a,}. Bajo estas condiciones a cada suceso

elemental {a,} se le asigna un número p., llamado la probabilidad de {a,} que satisface

las siguientes condiciones:

a. 𝑝𝑖 ≥ 0, 𝑖 = 1,2, … … . . , 𝑘

b. 𝒑𝟏 + 𝒑𝟐 + … … … . +𝒑𝒌 = 𝟏

La probabilidad P [A] de un evento A se define, entonces como la suma de las

probabilidades de los sucesos elementales.

Ejemplo 3.7.1: Si se lanza un dado una vez, el espacio muestral asociado a este

experimento será: S= {1, 2, 3, 4, 5, 6}, el evento denotado A = {2} que consiste en el

que el resultado del experimento sea el número 2, es un evento elemental.

En cambio si el resultado del experimento consiste en obtener un numero par, entonces

A = {2, 4, 6,}, y este no es suceso elemental. Debe distinguirse, además, que 2 es un

elemento de un espacio muestral S, mientras que {2} es un evento elemental.

Ejemplo 3.7.2: En una bolsa se colocan seis bolas idénticas, numeradas del 1 al 6; el

experimento consiste en extraer una bola.

El espacio muestral estará dado por S = {1, 2, 3, 4, 5, 6}

Considerando un suceso particular:

A = [x] X = la primera bola extraída es la marcada con el numero 6}, A es un evento

elemental.

193

3.7.1 Suceso igualmente probables. Por lo general se asume q cuando los espacios

muéstrales son finitos, los resultados son igualmente probables o equiprobables; sin

embargo, esta es una apreciación equivocada, puesto que hay muchos experimentos

para los cuales no se garantiza esta suposición. Por ejemplo, no es tan probable que

entren a sacrificio al matadero de pasto novillos blanco azul belga como Holstein

mestizos, es decir, los eventos no son equiprobables pese a que el espacio muestral es

finito.

El procedimiento para calcular P [A], cuando los eventos son iguales probables, está

dado por:

𝑃[𝐴] = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑝𝑎𝑟𝑎 𝐴

𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠

Se recalca que (3.7.1) es una consecuencia de suponer resultados equiprobables, sólo

aplicable cuando se satisface esta suposición y no constituye una definición general de

probabilidad.

Ejemplo 3.7.3: si se lanza un dado normal y se pregunta ¿cuál es la probabilidad de que

el resultado sea el número 4? El evento es A = {4}; S = {1, 2, 3, 4, 5, 6}. En S hay seis

resultados posibles de los cuales uno es favorable para A; por lo tanto, de acuerdo con

(3.7.1), 𝑃[𝐴] = 1

6

Ejemplo 3.7.4: en el mismo experimento del Ejemplo 3.7.3 se pregunta ¿cuál es la

probabilidad de obtener el número 3? La respuesta es 𝑃[𝐴] = 1

6

Ejemplo 3.7.5: Considerando el mismo experimento del Ejemplo 3.7.3, ¿cuál es la

probabilidad de obtener un número par? Esto es A = {2, 4, 6,}

De acuerdo con el mismo procedimiento [𝐴] = 3

6=

1

2

194

Ejemplo 3.7.6: Se lanza una vez una moneda, ¿cuál es la probabilidad de que el

resultado sea cara?

𝑆 = {𝑐𝑎𝑟𝑎, 𝑠𝑒𝑙𝑙𝑜}, 𝑃[𝐴] = 1

2= 0.5

Ejemplo 3.7.7: ¿Cuál es la probabilidad de obtener tres caras, si se lanzan al mismo

tiempo tres monedas? El problema debe abordarse así:

a. Definir S. En cada moneda hay dos resultados posibles que son cara © y sello

(s); si en el experimento se lanzan tres monedas, se puede obtener los siguientes

resultados:

S= {ccc, css, csc, sss, ssc, scs, ccs, ssc}

b. ¿Cuántos de esos resultados son favorables para A? Hay un solo resultado

favorable que es el evento perdido: A = {ccc}

c. Aplicar (3.7.1): 𝑃[𝐴] = 1

8= 0.125.

Ejemplo 3.7.8: Se lanza una moneda dos veces y se pregunta: ¿cuál es la probabilidad

de obtener una cara? En este caso S = {cc, cs, sc, ss} y A = {aparece una cara}

Como se puede observar, el número de casos favorables en A son dos, cs y sc, luego

𝑃[𝐴] = 2

4=

1

2= 0.5

Ejemplo 3.7.9: En el mismo experimento del Ejemplo 3.7.8, se pregunta: ¿cuál es la

probabilidad de obtener dos caras? La respuesta es 𝑃[𝐴] = 1

4

Ejemplo 3.7.10: En el mismo experimento, si la pregunta fuese: ¿cuál es la

probabilidad de obtener una cara y un sello? La respuesta es 𝑃[𝐴] = 1

2

195

En los ejemplos 3.7.3 a 3.7.10, es claro que el interés se centra en la elección al azar de

uno o más elementos de un conjunto dado; por lo tanto, es necesario formular algunas

indicaciones generales de utilidad, en los siguientes casos.

Escoger al azar un objeto: Si se dispone de n objetos o elementos,

convencionalmente designados como 𝑎1, 𝑎2, … … . . 𝑎𝑛, escoger al azar un objeto

significa que cada uno de ellos tiene la misma probabilidad de ser elegido. En

este caso:

𝑃[𝑒𝑙𝑒𝑔𝑖𝑟 𝑎¡] = 1

𝑛

Escoger al azar dos objetos entre n objetos: significa que cada uno de los

pares de objetos, sin considerar el orden en que son tomados, tienen la misma

probabilidad de ser elegidos.

Si se desea elegir dos objetos al azar de entre {𝑎1, 𝑎2, 𝑎3, 𝑎4}, obtener 𝑎1, 𝑎2 es tan

posible como obtener 𝑎2 𝑦 𝑎3 y así para cualquier par. Este hecho conduce a preguntar

¿cuántos pares diferentes hay en esa colección de objetos? Si hay k de tales pares, la

probabilidad de escoger cada par se define como:

𝑃[𝑒𝑙𝑒𝑔𝑖𝑟 𝑢𝑛 𝑝𝑎𝑟 𝑎1] = 1

𝑘

La manera de calcular k se explicará más adelante.

Escoger al azar n elementos de entre N objetos donde n ≤ N: significa que

cada n-tuplo (en algunos textos llamadas n-adas o r-plas) tiene tanta

probabilidad de ser escogido como cualquier otro n-tuplo una colección de 3, 4,

5 o más objetos.

Si se desea elegir tres objetos al azar de entre {𝑎1, 𝑎2, 𝑎3, 𝑎4, 𝑎5, 𝑎6 }, obtener

𝑎1, 𝑎2 𝑦 𝑎3, es tan probable como obtener 𝑎2, 𝑎3, 𝑎4 y así para cualquier triada y en

general n-tuplo. Este hecho conduce a preguntar ¿cuántos n-tuplo diferentes hay en esa

colección de objetos? Si hay K de tales n-tuplos, la probabilidad de escoger cada uno se

define como:

𝑃[𝑒𝑙𝑒𝑔𝑖𝑟 𝑢𝑛 𝑛 − 𝑡𝑢𝑝𝑙𝑜] = 1

𝑘

196

3.7.2 Métodos de enumeración: en los ejemplos presentados hasta ahora, para el

cálculo P [A], con eventos equiprobables ha sido fácil calcular el número de casos

favorables y el número total de casos posibles, para luego aplicar la correspondiente

fórmula y calcular cualquier probabilidad perdida; sin embargo, existen situaciones

donde estos cálculos se complican, por lo que surge la necesidad de contar con un

procedimiento de enumeración que facilite encontrar una determinada probabilidad.

Ejemplo 3.7.11: En un refrigerador se encuentran almacenados 50 vasos con yogur, de

los cuales 10 no son aptos para su comercialización, porque han sobrepasado la fecha de

vencimiento, y 40 están en perfecto estado, sin que se pueda distinguir, a simple vista,

unos de otros. Se eligen seis vasos al azar, sin devolver el refrigerador el vaso escogido

antes de elegir el próximo, y se pregunta ¿cuál es la probabilidad de que la mitad de los

vasos seleccionados no sean aptos para comercializarse.

Para resolver este problema deben seguirse varias etapas:

a. Se deben sacar seis vasos de entre 50.

b. Establecer de cuántas maneras se pueden escoger seis de entre 50.

c. Entre todos esos resultados posibles, cuáles tienen la característica de

corresponder con el 50% de vasos no aptos para comercializarse.

Como ésta existen situaciones similares donde se dificulta resolver los literales b y c

como condición previa para calcular la probabilidad perdida. En consecuencia se

requiere estudiar algunos procedimientos sistemáticos de enumeración, introduciendo

así el estudio del análisis combinatorio que se trata a continuación.

3.7.2.1 Principio de la multiplicación o del conteo. El análisis combinatorio parte de

un principio básico que indica que “si un suceso cualquier puede ocurrir de n1 maneras

y cuando este ha ocurrido otro suceso puede ocurrir n2 maneras, entonces el número de

maneras en que los dos pueden ocurrir en el orden especificado es n1 x n2” (Spiegel,

1991). De este principio resulta fundamental considerar que las palabras claves en la

definición son “el orden especificado”

Ejemplo 3.7.12: en una finca los animales se identifican individualmente con una placa

metálica cuya numeración está constituida por cuatro dígitos que van del 0 al 9, sin

197

permitir repeticiones. Bajo ese sistema ¿cuántas placas de marcación pueden

elaborarse?

El primer número puede ser cualquiera del 0 al 9, el segundo cualquiera excepto el

primero, el tercero cualquiera diferente al primero y segundo y el cuarto cualquiera

diferente de los tres primeros, puesto que ningún dígito puede estar repetido. Con base

en lo anterior la respuesta es 10 x 9 x 8 x 7 = 5.040 placas de marcación diferentes.

Ejemplo 3.7.13: Si en el mismo sistema del Ejemplo 3.7.12, no se permite que las

placas empiecen por 0, ¿cuántas marcas pueden formarse?

La respuesta es: 9 x 8 x 7 x 6= 3.024

Ejemplo 3.7.14: La clave para acceder al menú principal de un computador está

compuesta por tres letras. ¿Cuántos códigos de acceso pueden formarse si se permiten

repeticiones de letras?

Dado que en el alfabeto español tiene 28 letras y éstas se pueden repetir, entonces:

R= 28 x 28 x 28 = 21.952

Ejemplo 3.7.15: Con la información del ejemplo 3.7.14, sin permitir repeticiones de

letra, ¿cuántas claves pueden formarse?

R= 28 x 27 x 26= 19.656

Ejemplo 3.7.16: Si el sistema de marcación de los animales en una finca tiene siete

dígitos del 0 al 9, no se permiten repeticiones y los dos primeros números corresponden

a las dos últimas cifras del año de nacimiento, ¿cuántas marcas pueden formarse para

los animales nacidos en 1996?

El primer número solo puede ser el 9, así que únicamente hay un resultado posible, al

igual que en el segundo solo puede ser 6, el tercer dígito puede ser cualquiera entre el 0

198

y el 9, así que existen 10 resultados posibles, el cuarto puede ser cualquiera menos el

tercero, y así sucesivamente hasta el séptimo, de tal manera que la respuesta es:

R= 1 x 1 x 10 x 9 x 8 x 7 x 6= 30.240

Ejemplo 3.7.17: si se lanza un mismo dado tres veces, ¿cuántos son los resultados

posibles?

R= 6 x 6 x 6=216

Ejemplo 3.7.18: si se lanza un dado tres veces, imponiendo la condición de que todos

los números sean diferentes en cada lanzamiento, ¿cuántos son los resultados posibles?

R= 6 x 5 x 4 = 120

Ejemplo 3.7.19: si se lanza un dado tres veces ¿Cuál es la probabilidad de que todos los

números sean diferentes?

El número posible de casos está dado por 6 x 6 x 6 = 216

El número de casos favorables para A= 6 x 5 x 4= 120

𝑃[𝐴] = 120

216=

5

9

Ejemplo 3.7.20: si se lanza un dado tres veces ¿Cuál es la probabilidad de que el primer

número sea seis y los demás cualquier número?

Número total de casos 6 x 6 x 6 = 216

Número de resultados favorables para A= 1 x 6 x 6 = 36

199

𝑃[𝐴] = 36

16=

1

6

Ejemplo 3.7.21: El tema de la síntesis de proteínas es complejo, pero por ahora es

suficiente con indicar brevemente algunos aspectos de importancia. Para una revisión

profunda del tema puede consultarse, entre muchas obras, las de Suzuki, et al (1986),

Darnell, et al (1984) y Wallace, et al (1991).

En la síntesis de proteínas los aminoácidos se encadenan para formar péptidos y luego

cadenas polipeptídicas, es decir, una proteína. Para que este mecanismo funcione se

hace necesario la intervención del ADN y ARN.

El ADN o ácido desoxirribonucleico, es una macromolécula de doble hélice compuesta

de un glúcido con cinco átomos de carbono, una pentosa llamada desoxirribosa, un

grupo fosfato y cuatro bases nitrogenadas que son adenina (A), guanina (G), timina (T)

y citosina (C). La unión del azúcar la base nitrogenada y el fosfato recibe el nombre de

nucleótido. El ARN o ácido ribonucleico se sintetiza a partir de una de las dos cadenas

de ADN y en su estructura la desoxirribosa es reemplazada por la ribosa y la timina por

el uracilo (U).

En el código molecular ADN-ARN, el orden en que aparezcan las bases nitrogenadas es

de mucha importancia puesto que, según la secuencia en que se ubiquen los

nucleótidos, se sintetizará una u otra proteína, de hecho las mutaciones puntuales se

originan por alteración en el orden de las bases.

Cada segmento de ARN compuesto por tres nucleótidos, no necesariamente distintos,

forman una “palabra” denominada técnicamente codón, que es específica para

transportar o codificar a un determinado aminoácido, así por ejemplo la palabra UUU

codifica para el aminoácido fenilalanina, AUG para a metionina, UUA para a leucina,

AUU para la isoleucina, ACU para la treonina, GGG para la glicina y así existen

secuencias específicas para transportar los 20 aminoácidos, incluyendo, además, señales

al inicio y terminación de la síntesis.

200

Con base en las anteriores explicaciones ¿cuántas palabras de tres letras para codificar

aminoácidos se puede formar en el código genético?

𝑹 = 𝟒 × 𝟒 × 𝟒 = 𝟔𝟒

Efectivamente, 64 palabras codifican para los 20 aminoácidos e incluyen las señales de

inicio y parada de la síntesis de proteína y constituyen el denominado código genético.

Es importante aclarar que a pesar de la existencia, como ya se dijo, de 20 aminoácidos

que son: fenilalanina, lisina, serina, tirosina, cistina, triptófano, leucina, prolina,

histidina, glicina, arginina, isoleucina, metionina, treonina, aspargina, ácido aspártico,

valina, glutamina, alanina y cisteína, existen 64 codones, hecho que indica que hay más

de un codón para codificar el mismo acido. Así por ejemplo, para la leucina los codones

son CUU, CUC, CUA, CUG.

¿Cuántas palabras que empiecen por U se pueden formar?

𝑅 = 1 × 4 × 4 = 16

¿Cuál es la probabilidad de encontrar nucleótidos que tengan alguna base repetida?

El procedimiento para responder la pregunta es el siguiente:

En primer lugar se define el evento.

𝐴{𝑋|𝑋 𝑒𝑠 𝑢𝑛 𝑛𝑢𝑐𝑙𝑒ó𝑡𝑖𝑑𝑜 𝑐𝑜𝑛 𝑎𝑙𝑔𝑢𝑛𝑎 𝑏𝑎𝑠𝑒 𝑟𝑒𝑝𝑒𝑡𝑖𝑑𝑎}

Determinar el número de casos en que ninguna base se repite:

4 × 3 × 2 = 24

Haciendo uso de la propiedad del evento complementario, se puede establecer el

número de nucleótidos con alguna base repetida, así:

64 − 24 = 40

Calcular la probabilidad con (3.7.1): P [A]=40

64= 0,635

Los ejemplos hasta ahora presentados son casos sencillos en donde se permiten o no

repeticiones. En otras situaciones puede existir un mayor grado de complejidad que

201

hace necesario la aplicación de otros conceptos y procedimientos, como se explica

enseguida.

3.7.2.2. Permutaciones. Una permutación de n objetos tomados de r en r, es una

elección donde importa el orden en que r objetos se toman de entre n. El número de

permutaciones se denota como nPr o P(n, r) o también Pn, r y está dado por la fórmula

general:

nPr = 𝑛!

(𝑛−𝑟)!

Ejemplo 3.7.22: ¿Cuántas permutaciones son posibles con las letras a, b, c tomadas de

dos en dos?

De acuerdo con (3.7.5) 3P2 = 3!

(3−2) != 6

Ejemplo 3.7.23: ¿Cuántas permutaciones son posibles con las letras a, b, c tomadas de

tres en tres?

3P3 =3!

(3−3) != 3! = 6

Se puede generalizar el Ejemplo 3.7.23 así: El número de permutaciones de n objetos

tomados de n en n es igual a n!

Ejemplo 3.7.24: ¿Cuántas permutaciones se pueden formar con las letras de la palabra

microorganismos?

Se puede observar que en este ejemplo la situación es diferente a las estudiadas en los

Ejemplos 3.7.22 y 3.7.23, puesto que ahora hay n objetos, pero n1 son de un tipo, n2 de

otro, y así hasta nk. La palabra tiene 15 letras (objetos), de las cuales tres son o, dos son

202

i, dos son m, dos son r, y sólo una letra para c, g, n, a. Así, el número de permutaciones

será:

𝑃 =15!

3! .2! .2! .2! .2! .1! .1! .1! .1!= 13.621.608.000

Ejemplo 3.7.25: ¿Cuántas permutaciones son posibles con las letras de la palabra

“casas”?

𝑃 =5!

2! .2! .1!= 30

Este caso es idéntico al del ejemplo inmediatamente anterior.

De los ejemplos 3.7.24 y 3.7.25 se puede formular la siguiente generalización: El

número de permutaciones de n objetos, donde n1 son de un tipo, n2, de otro tipo y nk

de otro diferente, y además n1+n2+….+nk=n está dado por la siguiente expresión:

𝑃 =𝑛!

𝑛1! × 𝑛2! × 𝑛𝑘!

3.7.4. Combinaciones. Una combinación de n objetos tomados de r en r es una

selección de r de ellos, sin importar el orden en que se toman. La notación general

para las combinaciones es la siguiente:

nCr = ( 𝑛

𝑟) =

𝑛!

𝑟! (𝑛−𝑟)!

Ejemplo3.7.26: ¿Cuántas combinaciones son posibles con las letras a, b, c tomadas de

dos en dos?

3C2= ( 3

2) =

3!

2! (3−2)!= 3

Ejemplo 3.7.27: En un corral hay 20 novillos brahaman, se escogen siete para

sacrificarlos. ¿De cuántas maneras se pueden escoger los siete novillos?

203

20C7= ( 20

7) =

20!

7! (20−7)!= 77.520 𝑚𝑎𝑛𝑒𝑟𝑎𝑠

Ejemplo 3.7.28: Se dispone de cinco novillas shorton y de siete angus; se escogen al

azar dos novillas shorton y tres angus para un experimento. ¿De cuántas formas se

puede hacer esta elección?

Las novillas shorton se pueden escoger de 5C2 maneras y las angus de 7C3.

El número total de maneras está por 5C2 x 7C3.

𝑅 = (5

2) (

7

3) =

5!

2! (5−2)!×

7!

3! (7−3)!= 10 × 35 = 350

Ahora ya es posible resolver el Ejemplo 3.7.11. La solución contempla los siguientes

pasos:

En primer lugar se establece de cuántas formas en total se pueden escoger seis de entre

50 vasos. Evidentemente se trata de una combinación, ya que no interesa el orden en

que los vasos son elegidos.

50C6= ( 50

6) =

50!

6! (50−6)!

En segundo lugar se debe conocer cuántos resultados cumplen con la condición de tener

el 50% de los vasos no aptos para consumo. Se sabe que entre los 50 vasos hay 10 no

aptos para consumo, se escogen en total seis, lo que implica que en esa muestra la mitad

serían no aptos, así que hay 10C3 maneras de escogerlos.

10C3= ( 10

3) =

10!

3! (10−3)!

Finalmente se debe establecer cuántos resultados cumplen con la condición de tener el

50% de los vasos aptos para consumo. Esto implica que hay 40C3 maneras de escoger

vasos con esta condición:

40C3= ( 40

3) =

40!

3! (40−3)!

204

Es importante notar que el número total de maneras de escoger los seis vasos de entre

50, al igual que el número de maneras de escoger los tres vasos aptos de entre 40 y los

tres vasos no aptos de entre 10 son, en los tres casos, eventos igualmente probables. En

consecuencia, definido A= {3 vasos aptos, 3 vasos no aptos}, la probabilidad de la

ocurrencia de A está dada por (3.7.1):

𝑃[𝐴] =(

103 ) (

403 )

(506 )

=120(9880)

15.890.700=

1.185.600

15.890.700= 0,074

Del ejemplo 3.7.28 se pueden extraer las siguientes generalizaciones:

Cuando se dispone de N objetos y se eligen al azar sin reemplazo n de esos objetos

habrá 𝑁

𝑛 maneras de escogerlos, todas con la misma probabilidad de ser elegidas.

Si N objetos están constituidos por r1 y r2 clases de objetos que satisfacen la condición

r1+r2=N, de donde se eligen al azar n de ellos, la probabilidad de que esos n objetos

escogidos al azar sin reemplazo contengan un evento particular A, con elementos de r1

y r2, elegidos de L1 maneras de entre r1 y L2 maneras de entre r2, donde L2 = n-L1, está

dada por:

𝑃[𝐴] =(

𝑟1

𝐿1) (

𝑟2

𝐿2)

(𝑁𝑛)

La fórmula (3.7.8) puede extenderse a los casos donde N esté constituida por r1, r2,…., rk

clases de objetos y calcular la probabilidad de un evento particular A que contenga

elementos de r1, r2,…., rk escogidos de L1, L2,…., Lk maneras, donde se deben satisfacer

las siguientes condiciones:

𝑟1 + 𝑟2+. . . +𝑟𝑘 = 𝑁

𝐿1 + 𝐿2 + ⋯ + 𝐿𝐾 = 𝑛

205

𝑃[𝐴] =(

𝑟1

𝐿1) (

𝑟2

𝐿2) … (

𝑟𝑘

𝐿𝑘)

(𝑁𝑛)

Ejemplo 3.7.29: En un refrigerador de un laboratorio están depositados 30 frascos

idénticos que contienen medio para cultivos celulares, delos cuales 15 contienen MME

(medio mínimo esencial), 9 con RPMI y 6 con un medio de cultivo ideado en el

laboratorio. Se escoge al azar 6 frascos y se pide calcular las siguientes probabilidades:

¿Cuál es la probabilidad de que se haya extraído 4 con MME, 1 con RPMI y 1 del

laboratorio?

𝐴 = {4 𝑀𝑀𝐸, 1 𝑅𝑃𝑀𝐼, 1 𝐿𝑎𝑏𝑜𝑟𝑎𝑡𝑜𝑟𝑖𝑜}

𝑁 = 30

𝑛 = 6

𝑟1 = 15

𝑟2 = 9

𝑟3 = 6

𝐿1 = 4

𝐿2 = 1

𝐿3 = 1

𝑃[𝐴] =(

154

) (91

) (61

)

(306 )

=(1.365)(9)(6)

593.775= 0,1241

De este ejemplo es posible indicar la siguiente generalización:(𝑛

1) = 𝑛

¿Cuál es la probabilidad de que todos contengan MME?

206

𝑃[𝐴] =(

156 ) (

90) (

60)

(306 )

=(5.005)(1)(1)

593.775= 0,008429

El caso general que se puede deducir de este ejemplo es el siguiente: (𝑛

0) = 1

Cuando se seleccionan objetos al azar es fundamental especificar si estos se escogen

con o sin reemplazo; cuando se duce que la selección es con reemplazo o con

sustitución se indica que un objeto seleccionada tendrá otra oportunidad de ser elegido

en un muestreo siguiente y por lo tanto interesa el orden en que se hace la elección.

Cuando la selección se hace sin reemplazo no existe interés en el orden en que se

escogen los objetos, así que el número total de muestras (NM), de tamaño r, que

pueden obtenerse de una población, bajo esta condición está dado por (𝑁

𝑟)

Cuando el muestreo es con reemplazo, el número total de muestras (NM), de tamaño r,

que pueden obtenerse de una población está dado por 𝑁𝑟.

Ejemplo 3.7.30: En un bioterio hay 20 ratones (Mus musculus). Un veterinario necesita

escoger cuatro individuos para inocularlos con una cepa rugosa de Brucella abortus

¿Cuántas muestras de cuatro ratones son posibles, si el muestreo se hace con

reemplazo?

𝑁𝑀 = 𝑁𝑟 = 204 = 160.0000

¿Cuántas muestras de cuatro ratones son posibles, si el muestreo se hace sin reemplazo?

𝑁𝑀 = (20

4) =

20!

4! (20 − 4)!= 4.845

En la práctica, tanto en producción y salud animal, cuando se trata de escoger unidades

experimentales para investigación, inspección o análisis de animales, insumos o

productos, las muestras se obtienen sin reemplazo.

207

3.7.5. Cálculo de probabilidades cuando los resultados no son equiprobables. En

situaciones como éstas, lo más apropiado es calcular la probabilidad de un evento

particular en términos de frecuencia relativa, tal como se indicó al inicio del capítulo.

Ejemplo 3.7.31: Un laboratorio lanza al mercado una nueva vacuna contra la fiebre

aftosa. En total fueron vacunados 2.600 animales, de los cuales 1.680 no desarrollaron

la enfermedad. Si se pregunta ¿Cuál es la probabilidad de que un animal vacunado no

desarrolle la enfermedad?

𝑃[𝐴] =1.680

2.600= 0,64

El Ejemplo 3.7.31 se puede generalizar para cualquier situación en que un experimento

es repetido varias veces y se registren los resultados observados. Bajo esta condición, la

probabilidad aproximada de que un suceso A se produzca, está dado por:

𝑃[𝐴] ≈𝑓

𝑛=

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑒 𝐴

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑟𝑒𝑎𝑙𝑖𝑧𝑎 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜

3.7.6. Otras reglas para calcular probabilidades. En el cálculo de probabilidades se

requieren otras reglas que se resumen a continuación.

Regla general de la adición. Si A y B son dos sucesos cualesquiera, la probabilidad de

que ocurra el uno o el otro está dada por:

𝑃[𝐴𝑜𝐵] = 𝑃[𝐴] + 𝑃[𝐵] − 𝑃[𝐴𝑦𝐵]

Donde 𝑃[𝐴𝑜𝐵] = 𝑃[𝐴 ∩ 𝐵] y significa que A y B pueden ocurrir juntos. En esta clase

de problemas resulta clave para saber si se aplica o no (3.6.11), la utilización de la letra

“o” cuando se pide una probabilidad específica.

208

Ejemplo 3.7.32: Se lanza un dado una vez. ¿Cuál es la probabilidad de obtener un 2 o

un 3? Si se define A= {Obtener el número 2} y B= {Obtener el número 3}, la respuesta

está dada por:

𝑃[𝐴𝑜𝐵] = 𝑃[𝐴] + 𝑃[𝐵] − 𝑃[𝐴 ∩ 𝐵] =1

6+

1

6− 0 =

2

6=

1

3

En este ejemplo, la intersección es el conjunto vacío, ya que al lanzar un dado no es

posible obtener un resultado 2 y 3 al mismo tiempo.

En general, la probabilidad de ocurrencia de uno o de otro suceso mutuamente

excluyente, es igual a la suma de las probabilidades individuales de cada suceso.

Ejemplo 3.7.33: Se estima que en el departamento de Nariño el 30% de las vacas en

producción padecen de hipocalcemia (A), el 3% sufren de cetosis (B) y el 2% son

hipocalcémicas y sufren cetosis (A y B). Si se escoge una vaca al azar, ¿Cuál es la

probabilidad de que el animal seleccionado sea hipocalcémico o tenga cetosis?

𝑃[𝐴𝑜𝐵] = 𝑃[𝐴 ∪ 𝐵] − 𝑃[𝐴 ∩ 𝐵] = [0,3 + 0,03] − 0,02 = 0,31

En este ejemplo los sucesos no son mutuamente excluyentes, ya que los dos pueden

ocurrir juntos, es decir, existe la probabilidad de que una vaca sea hipocalcémica y al

mismo tiempo tenga cetosis; por lo tanto, hay intersección y se debe restar esta

probabilidad.

Regla de la multiplicación. La probabilidad de que dos sucesos independientes ocurran

simultáneamente es igual al producto de sus respectivas probabilidades.

Dos sucesos A y B son independientes si y sólo si cumplen con la condición:

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴]. 𝑃[𝐵]

}

209

Ejemplo 3.7.34: Se lanza un dado dos veces, ¿Cuál es la probabilidad de obtener el

número 4 en el primer lanzamiento y el 5 en el segundo? Definido A= {4 en el primer

lanzamiento], B= {5 en el segundo lanzamiento}:

𝑃[𝐴𝑦𝐵] = 𝑃[𝐴 ∩ 𝐵] =1

6×

1

6=

1

36

Aquí la clave para saber si se aplica o no (3.6.12) es la utilización de la letra “y” cuando

se pide una probabilidad específica.

En general, dos sucesos se definen como independientes cuando la ocurrencia de un

evento no afecta la ocurrencia de otro.

Ejemplo 3.7.35: Se escogen individuos al azar y se le pregunta sobre su tipo de sangre

y edad. Como se puede observar, los dos eventos, tipo de sangre y edad, son

independientes. Conociendo que la probabilidad de encontrar personas con sangre tipo

A es 0,39 y con más de 30 años de edad es 0,42. ¿Cuál es la probabilidad de encontrar

un individuo con sangre tipo A y más de 30 años de edad?

Definidos: A: {Es el evento tiene sangre tipo A} P [A]=0,39

B: {Es el evento tiene más de 30 años} P [B]=0,42

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴]. 𝑃[𝐵] = (0,39). (0,42) = 0,1638

3.7.7. Probabilidad condicional. Muchas veces es necesario encontrar la probabilidad

de un evento A, sabiendo que ha ocurrido antes un evento B que afecta la ocurrencia de

A. En este caso, el evento B es un espacio muestral nuevo. Esta podría denominarse

210

probabilidad del evento A dado que el evento B ha ocurrido P [A/B] o simplemente

probabilidad de A dado B, que se define como:

𝑃 [𝐴

𝐵] =

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 [𝐴 ∩ 𝐵]

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝐵

Sean A y B dos eventos de un espacio muestral S, donde P[‘B]>0, la probabilidad

condicional de que ocurra el evento A dado que el evento B ya ocurrió, se simboliza por

P[A/B] y se define como:

𝑃 [𝐴

𝐵] =

𝑃 [𝐴 ∩ 𝐵]

𝑃[𝐵], 𝑃[𝐵] > 0

Ejemplo 3.7.36: Estudios demostraron que los ejemplares de una cierta raza de liebres

de alta montaña mueren antes de lo normal, aún en ausencia de depredadores o de

enfermedad conocida alguna. Dos de las causas de muerte identificadas son: baja

cantidad de azúcar en la sangre y convulsiones. Se estima que el 7% de los animales

presenta ambos síntomas, el 40% tienen bajo nivel de azúcar en la sangre y el 25% sufre

convulsiones. ¿Cuál es la probabilidad de que un animal elegido al azar tenga bajo nivel

de azúcar en la sangre, dado que sufre de convulsiones?

El interés se centra en los siguientes eventos:

C: {El animal escogido al azar tiene convulsiones}

S: {El animal escogido al azar tiene bajo nivel de azúcar en la sangre}

Del enunciado del Ejemplo 3.7.36 se tiene que:

P [C] =0, 25

P [S] =0, 40

P [C ∩ S] =0, 07

𝑃 [𝑆

𝐶] =

𝑃 [𝑆 ∩ 𝐶]

𝑃[𝐶]=

0,07

0,25= 0,28

211

La probabilidad de que un animal elegido al azar sufra convulsiones dado que tenga

bajo nivel de azúcar en la sangre es:

𝑃 [𝑆

𝐶] =

𝑃 [𝑆 ∩ 𝐶]

𝑃[𝐶]=

0,07

0,40= 0,175

En el anterior ejemplo se puede apreciar que: P [A/B]≠ P [B/A]

Por lo general esto se cumple si A y B son eventos de un espacio muestral S, con:

P [A]>0 y P [B]>0.

En muchos casos el interés puede reducirse solamente a un subconjunto de la población

inicial. Si se define 𝑛 [𝐴 ∩ 𝐵] como el número de casos favorables a [𝐴 ∩ 𝐵], 𝑛 [𝐵]

como el número de casos favorables a [B] y N como el número total de casos (3.7.13) se

puede expresar así:

𝑃 [𝐴

𝐵] =

𝑛 [𝐴 ∩ 𝐵]

𝑛[𝐵]=

𝑛 [𝐴 ∩ 𝐵]𝑁

𝑛[𝐵]𝑁

=𝑃[𝐴 ∩ 𝐵]

𝑃[𝐵], 𝑃[𝐵] > 0

Donde 𝑃[𝐴 ∩ 𝐵] y 𝑃[𝐵]se determinan a partir del espacio original S.

Algunas veces hay interés en determinar la probabilidad de que ocurran conjuntamente

dos eventos A y B, es decir, la probabilidad de que ocurra el evento A y el evento B.

Si en un experimento pueden ocurrir los eventos A y B, y éstos son sucesos de un

espacio muestral S, entonces:

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴]. 𝑃[𝐵/𝐴]

Ejemplo 3.7.37: En un recipiente hay tres bolas blancas y dos negras. Se extraen dos

bolas al azar, primero una y luego otra, sin reemplazo, ¿Cuál es la probabilidad de que

las dos bolas sean negras?

Se define: A= {La primera bola extraída es negra}

B= {La segunda bola extraída es negra}

212

𝐴 ∩ 𝐵 es el evento de que ocurra A y luego B.

La probabilidad de extraer en primer lugar una bola negra es 2

5.

La probabilidad de extraer una segunda bola negra de la que restan es 1

4 ya que el

espacio muestral original se ha modificado, puesto que en el recipiente quedan cuatro

bolas, de las cuales una es negra.

Entonces: 𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴]. 𝑃[𝐵/𝐴] =2

5×

1

4=

2

20=

1

10

Ejemplo 3.7.38: En la replicación del ADN, a veces se presentan errores que pueden

dar lugar a mutaciones observables en el organismo. En ocasiones, tales errores están

inducidos químicamente. En un experimento se expone un cultivo de bacterias a la

presencia de un producto químico que tiene un 40% de probabilidad de producir error.

Sin embargo, el 65% de los errores es silencioso, en el sentido de no dar lugar a una

mutación observable. ¿Cuál es la probabilidad de que se observe una colonia mutada?

Sean los eventos:

A: {Inducir a error}

B: {Dar lugar a una mutación observable}

La probabilidad de que se observe una colonia mutada es equivalente a la probabilidad

de que se induzca al error y que se produzca o dé lugar a una mutación observable, es

decir:

P [Observar una colonia mutada]= 𝑃[𝐴 ∩ 𝐵]

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴]. 𝑃[𝐵/𝐴] = 0,40 × (1 − 0,65)

= 0,40 × 0,35 = 0,14

213

Ejemplo 3.7.39: En un experimento con cabras (Capra hircus) se evalúa la variable

incremento de peso en función del sexo y de dos raciones, una con la adición de

metionina y otra sin este aminoácido. El espacio muestral puede expresarse así:

Hembras Machos Total

Dieta 1 10 15 25

Dieta 2 12 13 25

Total 22 28 50

Se elige una cabra al azar, ¿Cuál es la probabilidad de que hay sido sometida a la dieta

2, dado que es macho? También es posible formular la misma pregunta en estos

términos: si se elige al azar una cabra macho ¿Cuál es la probabilidad de que hay sido

sometida a la dieta 2?

Definidos los eventos:

A: {La cabra elegida es sometida a la dieta 2}

B: {El animal escogido es macho}

𝑃 [𝐴

𝐵] =

𝑛 [𝐴 ∩ 𝐵]

𝑛[𝐵]=

13

28= 0,46

Ejemplo 3.7.39: Los bovinos de la raza normando poseen lunetas, es decir, una aureola

de pelos pigmentos alrededor de los ojos, condición conocida también como “anteojo”.

Algunos animales no poseen tal condición y se los considera más susceptibles a padecer

oftalmias. En una población de normandos se ha calculado que la probabilidad de

encontrar animales sin anteojos es 0,23 y entre éstos, la probabilidad de elegir un animal

con oftalmia es de 0,18. Si se escoge al azar un novillo sin anteojos de esa población,

¿Cuál es la probabilidad de que tenga la enfermedad?

Los eventos son:

A: {El novillo carece de anteojos}

214

B: {El novillo tiene la enfermedad}

La probabilidad de que el novillo elegido al azar tenga la enfermedad, dado que carece

de anteojos, se la expresa como 𝑃[𝐵/𝐴].

𝑃 [𝐵

𝐴] =

𝑃 [𝐵 ∩ 𝐴]

𝑃[𝐴]

Puesto que 𝑃 [𝐵 ∩ 𝐴] = 0,18 y 𝑃[𝐴] = 0,23, entonces:

𝑃 [𝐵

𝐴] =

0,18

0,23= 0,7826

Ejemplo 3.7.40: En un hato dedicado a la producción de leche, una vaca determinada

ha tenido tres partos, en uno de los cuales tuvo un hijo hembra. ¿Cuál es la probabilidad

de que el segundo hijo sea macho? Si se considera únicamente partos de un solo hijo, se

tiene:

M: {Es el evento de que el hijo sea macho}

N: {Es el evento de que sea una hembra}

El espacio muestral S estará formado por los siguientes eventos.

𝑆 = {𝑀𝑀𝑀, 𝑀𝑀𝐻, 𝑀𝐻𝑀, 𝐻𝑀𝑀, 𝑀𝐻𝐻, 𝐻𝑀𝐻, 𝐻𝐻𝑀, 𝐻𝐻𝐻}

Sea:

A: {La vaca señalada tenga por lo menos una cría hembra}. Este evento es equivalente a

que la vaca tenga una a más crías hembras y se expresa como:

𝐴 = {𝑀𝑀𝐻, 𝑀𝐻𝑀, 𝐻𝑀𝑀, 𝑀𝐻𝐻, 𝐻𝑀𝐻, 𝐻𝐻𝑀, 𝐻𝐻𝐻}

B: {Evento de que el segundo hijo sea macho}. Entonces:

𝐵 = {𝑀𝑀𝑀, 𝑀𝑀𝐻, 𝐻𝑀𝑀, 𝐻𝑀𝐻}

215

Entonces la probabilidad de que el segundo hijo sea macho, dado que esta vaca tienen

por lo menos una cría hembra, se la expresa como:

𝑃 [𝐵

𝐴] =

𝑛 [𝐴 ∩ 𝐵]

𝑛[𝐴]

𝑛[𝐴] = 7

𝐵 ∩ 𝐴 = {𝑀𝑀𝑀, 𝐻𝑀𝑀, 𝐻𝑀𝐻}

𝑛[𝐴 ∩ 𝐵] = 3

Por lo tanto: 𝑃 [𝐵

𝐴] =

𝑛 [𝐴∩𝐵]

𝑛[𝐴]

3.7.8. Eventos independientes. Cuando se presentan dos eventos, la ocurrencia del

primero, de alguna manera, puede alterar o no la probabilidad de ocurrencia del

segundo, estos es, los eventos pueden ser dependientes o independientes. El concepto de

independencia estática es muy importante en las áreas de la estadística aplicada.

Sean A y B dos eventos de una espacio muestral S, se dice que los eventos A y B son

independientes si y sólo si:

𝑃 [𝐵

𝐴] = 𝑃[𝐴] 𝑦 𝑃 [

𝐵

𝐴] = 𝑃[𝐵]

3.7.9. Teorema de Bayes. Este teorema se utiliza para hallar 𝑃 [𝐴

𝐵] cuando 𝑃[𝐴 ∩ 𝐵] y

𝑃[𝐵] no se conocen de inmediato. Es muy empleado en Teoría de la Decisión para

evaluar nueva información y revisar estimaciones anteriores de la probabilidad de que

las cosas se encuentran en un estado o en otro.

Teorema de Bayes: Si A1, A2,…, An son n eventos mutuamente excluyentes, cuya unión

es el conjunto universal, B es un evento arbitrario tal que 𝑃[𝐵] > 0, 𝑃 [𝐵

𝐴𝑘] 𝑦 𝑃[𝐴𝑘] son

conocidos para k=1, 2,…, n, entonces:

216

𝑃 [𝐴𝑖

𝐵] =

𝑃[𝐴𝑖]𝑃 [𝐵𝐴𝑖]

𝑃[𝐴1]𝑃 [𝐵𝐴1

] + 𝑃[𝐴2]𝑃 [𝐵𝐴2

] + ⋯ + 𝑃[𝐴𝑛]𝑃 [𝐵

𝐴𝑛]

Ejemplo 3.7.41: En una estación acuícola de la costa Pacífica de Nariño, se presenta

con alta frecuencia el síndrome viral de la mancha blanca (White spot) en camarones

(Penaeus vannamei), cuyo principal síntoma es la coloración rojiza de la cola. Se ha

encontrado en diferentes muestras tomadas que el 90% de los animales con coloración

rojiza tienen el virus de la mancha blanca, mientras que únicamente el 5% de los

camarones que no tiene esta característica están afectados por la mancha blanca. Si la

proporción de camarones con coloración rojiza es de 0,45, ¿Cuál es la probabilidad de

que un camarón atacado por la mancha blanca, seleccionado al azar, tenga coloración

rojiza?

Sean los eventos:

A1= {El camarón tiene coloración rojiza en la cola}

A2= {El camarón no tiene coloración rojiza}

B= {El camarón se encuentra afectado por la mancha blanca}

Según el enunciado del ejemplo se tiene que:

𝑃 [𝐵

𝐴1] = 0,90

𝑃 [𝐵

𝐴2] = 0,05

𝑃[𝐴1] = 0,45

𝑃[𝐴2] = 0,55

El evento, el camarón tiene coloración rojiza dado que está afectado por la mancha

blanca se simboliza como 𝑃 [𝐴1

𝐵], según el Teorema de Bayes en (3.7.1.6)

217

𝑃 [𝐴1

𝐵] =


]


] + 𝑃[𝐴2]𝑃 [𝐵𝐴2

]=

(0,45)(0,90)

(0,45)(0,90) + (0,55)(0,05) = 0,94

Ejemplo 3.7.42: Las estadísticas indican que en Estados Unidos la probabilidad de que

una madre muera durante el parto es de 0,00022. Si no es de raza negra, la probabilidad

de muerte es de 0,00017, mientras que si lo es ésta aumenta a 0,00064; se supone que el

10% de los partos corresponden a mujeres negras. Hallar la probabilidad de que una

madre que muere en el parto sea de raza negra.

Sean los eventos:

A1= {La mujer es de raza negra}

A2= {La mujer no es de raza negra}

B= {La mujer muere}

Según el enunciado del problema:

𝑃 [𝐵

𝐴1] = 0,00064

𝑃 [𝐵

𝐴2] = 0,00017

𝑃[𝐴1] = 0,10

𝑃[𝐴2] = 0,90

La probabilidad de que una madre que muere en el parto sea de raza negra se simboliza

mediante

𝑃 [𝐴1

𝐵] =


]


] + 𝑃[𝐴2]𝑃 [𝐵𝐴2

]

218

=(0,10)(0,00064)

(0,10)(0,00064) + (0,9)(0,00017)

= 0,295

219

CAPÍTULO 4

FUNCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS,

DISCRETAS Y CONTINUAS

Hasta ahora se han estudiado los principios básicos más importantes del cálculo de

probabilidades; en este capítulo se intentará relacionar dichos conceptos con el análisis

de datos encaminados a extraer conclusiones para la población con base en la

información obtenida de la muestra y, de este modo, concatenar la teoría de

probabilidad con la estadística aplicada. Antes de abordar esta temática es necesario

recordar inicialmente el concepto de las variables aleatorias, también conocidas con el

nombre de variables estocásticas y su clasificación en continuas y discretas, lo que en

gran ida determina la capacidad para predecir el valor que tomarán las variables bajo

determinada situación, sin perder de vista que, dada la condición del azar, las

predicciones se hacen en términos de incertidumbre, por lo que resulta más apropiado

describir el comportamiento de las variables con las funciones de probabilidad y de

probabilidad acumulada.

4.1 VARIABLE ALEATORIA

Cuando se describe un espacio muestral en un experimento, un resultado particular no

necesariamente un número. Por ejemplo, un animal en un hato puede ser clasificado

"enfermo" o "sano"; en cambio, en otras situaciones experimentales se realiza una

observación y el resultado se registra como un número, es decir, se asigna un número

real x a cada elemento de un espacio muestral S.

Una variable aleatoria X es una función que asocia un número real con cada elemento

del espacio muestral. En este capítulo se utilizará la letra mayúscula X para denotar una

variable aleatoria, y su correspondiente letra minúscula para algunos de sus valores.

220

4.1.1 Rango de una variable aleatoria X. Es el conjunto de los valores posibles que

puede remar la variable cuando se realiza un experimento particular.

Ejemplo 4.1.1: Un experimento consiste en lanzar dos monedas normales. Si X es la

variable aleatoria número de caras que aparecen, el espacio muestral se lo puede

expresar como: S ={cc, es, se, ss}.

Al punto muestral ss, la variable aleatoria X le hace corresponder el número O, puesto

que no hay caras, a los puntos muéstrales es y se les hace corresponder el número 1 y al

punto muestral ce le hace corresponder el número 2. Entonces, el rango de la variable

aleatoria X es el conjunto {0, 1, 2}.

Ejemplo 4.1.2: Si el experimento consiste en lanzar dos dados corrientes, el espacio

muestral viene dado S = {(1, 1), (1, 2),..., (6, 6)}. Sea X la variable aleatoria que hace

corresponder a cada punto (a, b) de S el máximo de sus números, es decir:

X(a, b) = máximo (a, b)

Para los casos: X(1, 5) = 5, X(5, 6)= 6, X(6, 6) = 6. Aquí el rango de X viene dado por el

conjunto {1, 2, 3, 4, 5, 6}

4.1.2 Variables aleatorias discretas. Una variable aleatoria X es discreta cuando toma

solamente un número finito o infinito numerable de valores, es decir, su rango es finito

o infinito numerable.

4.1.3 Función de probabilidad para variables aleatorias discretas. Luego de definir

una variable aleatoria X sobre el espacio muestral de un experimento, se determina la

221

probabilidad de que ésta tome un valor determinado, entonces, la función de

probabilidad hace corresponder a cada valor posible de X el valor de su probabilidad.

La probabilidad de que la variable aleatoria X tome un valor determinado x es igual a la

suma de las probabilidades de los puntos muéstrales para los cuales X = x y se

simboliza por:

p[x] = P [X = x], donde deben cumplirse las siguientes propiedades:

a. 𝑝[𝑥] ≥ 0, para todo x de X.

b. ∑ 𝑝[𝑥] = 1

A la colección de pares (Xi, P(Xi)) se la denomina Distribución de probabilidad de X y

es posible representarla en forma de tabla.

Ejemplo 4.1.3: En el ejemplo 4.1.2 se quiere calcular (Xi, P[Xi]).

S= {(1, 1), (1, 2), … , (6, 6)}

X(a, b) = máximo (a, b)

Rango = {1, 2, 3, 4, 5, 6}

Se puede apreciar que la probabilidad de cada punto muestral de S = 1

36 detallada en la

siguiente forma:

222

p[1] = P[X = 1] = P[{(1,1) }] = 1

36

p[2] = P[X = 2] = P[{(1,2), (2,2), (2,1)}] = 3/36

p[3] = P[X = 3] = P[{(1,3), (2,3), (3,3), (3,2), (3,1)}] = 5/36

p[4] = P[X = 4] = P[{(1,4), (2,4), (3,4), (4,4), (4,3), (4,2), (4,1)}] = 7/36

En forma similar: p[5] = P[X = 5] = 9

36— y p[6] = P[X - 6] =

11

36

Esta distribución de probabilidad representada en forma de tabla se esquematiza del

siguiente modo:

Xi 1 2 3 4 5 6

P[Xi| 1/36 3/36 5/36 7/36 9/36 11/36

A su vez, la tabla representada gráficamente adopta la forma de la Figura 4.1.1:

Figura 4.1.1 Representación gráfica de la distribución de probabilidad

223

4.1.4 función de distribución acumulativa. La función de distribución acumulativa de

la variable aleatoria X es la probabilidad de que X sea menor o igual a un valor

específico x y está dado por:

F(x)=P[ X ≤ x ] = ∑ 𝑝(𝑋𝑖)Xi ≤ x

Ejemplo 4.1.4: Para el ejemplo 4.1.3:

F(1)= P[X ≤ 1] = p[1] = 1/36

F(2) = P[X ≤ 2] = p[1] + p[2] = 1/36 + 3/36 = 4/36

F(3) = P[X ≤ 3] = p[1] + p[2] + p[3] = 9/36

F(4) = P[X ≤ 4] = p[1] + p[2] + p[3] + p[4] = 16/36

F(5) = P[X ≤ 5] = p[1] + p[2] + p[3] + p[4]+ p[5]= 25/36

F(6) = P[X ≤ 6] = p[1] + p[2] + p[3] + p[4]+ p[5] + p[6] = 36/36

La función de distribución acumulativa F(x) de una variable aleatoria discreta X cumple

las siguientes propiedades:

a. 0 ≤ F(x) ≤ 1, para todo x.

b. Si Xi ≥ Xj, entonces F(Xi) > F(Xj), lo que significa que es una función no

decreciente.

224

Si se desea hallar la probabilidad de que una variable aleatoria tome un valor mayor que

x, se tiene:

c. P[X>x] = 1 - F(x)

Para variables aleatorias de valor entero, se tiene además que:

d. P[ xi ≤ X ≤ xj ] = F (xj) – F(x i -1)

e. P[X ≥ x] = 1 - F(x i -1)

Ejemplo 4.1.5: En el Ejemplo 4.1.3 se tiene que:

P[X > 3] = 1 - F(2)= 1 – 4/36 = 32/36

P[ 3 ≤ X ≤ 5 ] = F (5) – F(2) = 25/36 – 4/36 = 21/36

Ejemplo 4.1.6: En una planta procesadora de camarón, se sabe por experimentación

que el número de colas por libra al empacar es como se muestra enseguida:

Colas por libra 49 50 51 52 53 54 55

Probabilidad 0,05 0,12 0,20 0,24 0,17 0,14 0,08

Con base en esta información, se pide calcular las siguientes probabilidades:

225

a. ¿Cuál es la probabilidad de que al tomar una bolsa ésta tenga por lo menos 53

colas/lb?.

b. ¿Cuál es la probabilidad de que tenga 50 colas/libra o más?.

c. ¿Cuál es la probabilidad de que tenga como mínimo 50 colas/Ib?.

Si se define X como la variable aleatoria número de colas/libra al empacar, entonces:

a) P[X > 53] = 1 - F(53) = 1- (p[49J +p[50] + p[51] + p[52]) = 1- 0,61 = 0,39

b) P[X>50] = 1-F(50) = 1-0,05 =0,95

c) P[X < 50] = F(50) = p[49] + p[50] + p[51] = 0,37

4.1.5 Valor esperado o esperanza matemática de una variable aleatoria discreta. El

valor esperado de una variable aleatoria, se obtiene al hallar el valor medio de la

variable, t todos sus valores posibles. El valor esperado es una media técnica o ideal.

El valor esperado de una variable aleatoria X se representa, generalmente, por E[X] o la

Ietra griega 𝜇 y se expresa como:

E[X] = µ = ∑ 𝑥 . 𝑝(𝑥)𝑥 ∈𝑋

El valor esperado posee propiedades análogas a las establecidas para la media

aritmética:

a. Si c es una constante, entonces E[c] = c

b. Si a y b son constantes, entonces E[aX + b] = aE[X] + b

226

c. Si g(x) y h(x) son funciones de una variable aleatoria X, entonces

E [g(x) ± h(x) = E [g(x) ± E [ h(x) ]

e. E [ X - µ] = 0

Ejemplo 4.1.7: Hallar el valor esperado en el Ejemplo 4.1.6.

µ = E[X] = ∑ xi 9𝑖=3 . Ptxil = 49 x 0,05 + 50x0,12 + 51x0,2 + 52x0,24 + 53x0,17 +

54x0,14 + 55x0,08 = 52,1 = 52 colas/Ib

Lo que significa que en promedio se espera que las bolsas tengan 52 colas/Ib.

4.1.6 Varianza de una variable aleatoria. Si X es una variable aleatoria con valor

esperado de E[X], la varianza de X se representa por V[X] o cr2 y se la puede expresar

como:

V[X]= ὂ 2 = E[X2] - (E[X])2 = ∑ 𝑥𝑖2 𝑝[𝑥] − µ2

La raíz cuadrada positiva de la varianza es la desviación típica o. La varianza, como se

indicó en el primer capítulo, mide la dispersión de los datos alrededor de la media.

Propiedades análogas a las de la varianza de observaciones se cumplen para la varianza

de una variable aleatoria:

a. Si a es una constante, entonces V[a] = O

b. Si a y b son constantes, entonces V[aX + b] = a2 V[X]

227

Ejemplo 4.1.8: Con la información indicada en el Ejemplo 4.1.6, la varianza se calcula

de la siguiente manera:

ὂ 2 = ∑ 𝑥𝑖2 𝑝[𝑥] − µ2

µ = 52,1, Entonces µ2 = 2.714,41

∑ 𝑥𝑖2 9𝑖=9 • p[Xi] = 2.401x0,05 + 2.500x0,12 + 2.601x0,2 + 2.704x0,24 + 2.809x0,17 +

2.916x0,14+ 3.025x0,08 =39,78

ὂ2 = 2716,98 - 2714,41 = 2,57

4.2 DISTRIBUCIONES DE PROBABILIDAD ESPECIALES PARA VARIABLES

DISCRETAS

4.2.1 La Distribución binomial: La variable aleatoria binomial es un tipo específico de

variable discreta, que representa únicamente dos clases de respuesta: éxito o fracaso,

obtenidos en un número n de pruebas independientes. Los casos que se mencionan a

continuación ilustran de mejor manera este enunciado.

• Si 1.000 partos no gemelares de vacas holstein son sucesos independientes; sólo

existen dos posibles resultados en cuanto al sexo de las crías: que sean machos o que

sean hembras. Al disponer de los resultados de todos esos partos será posible

contabilizar las crías que corresponden a cada sexo.

228

• Se vacunan 5.000 cerdos contra la PPA (peste porcina africana). Hay dos posibles

resultados: que los animales contraigan la enfermedad (no fueron protegidos por la

vacuna) o que no contraigan la enfermedad (fueron protegidos por la vacuna); al final

del ensayo es posible contabilizar el número de animales sanos y enfermos. Se asume

que la efectividad de la vacuna (probabilidad de protección) se mantiene constante de

un ensayo a otro.

Generalmente se define como "éxito" la constatación de la característica de interés para

el investigador; así en el ejemplo de la vacuna, "éxito" se referirá a la probabilidad de

encontrar un animal enfermo.

Si las n pruebas son independientes, significa que el resultado de una no afecta el

resultado de cualquier otra y, además, la probabilidad de éxito permanece constante a lo

largo del experimento, es posible establecer la función de probabilidad de este tipo de

variables, así:

P(x,n,p) = (𝑛𝑥

) px (1-P) n - x x = 0,l,2,...,n

Dónde:

p = probabilidad de éxito en una sola prueba

1-p = q: probabilidad de fracaso

n = número de pruebas

x = número de éxitos en n pruebas

(𝑛

𝑥) =

𝑛 !

𝑥! (𝑛 − 𝑥)!

229

El valor esperado de la variable aleatoria binomial es E[X] = \í = np y la varianza es

V[X]= ὂ2 = np(1-p).

La función de distribución acumulativa de la variable aleatoria binomial está dada por:

F(x) = P[X≤x] = p[0] + p[1] + … + p(x)

Ejemplos 4.2.1: Al lanzar una moneda tres veces, ¿cuál es la probabilidad de que

aparezcan los siguientes resultados?:

a) 3 caras, b) 2 caras, c) 1 cara, d) Ninguna cara, e) Por lo menos 2 caras, f) Como

máximo 2 caras.

n = 3, ya que el experimento se repite 3 veces.

p = 0,5 es la probabilidad de obtener una cara en un lanzamiento, la probabilidad del

fracaso (q) se obtiene así: ( q = 1 - p = 1 -0,5 = 0,5.

Los experimentos son independientes, ya que el resultado del primer lanzamiento no

afecta el de los siguientes. En consecuencia, se cumplen los supuestos del modelo

binomial, por lo tanto es posible calcular las probabilidades pedidas con la fórmula

(4.2.1), donde X es el número de caras que podrían aparecer:

a) P[X = 3] = (33) |0,53 . 0,53-3 =

3 ¡

3!(3−3)! 0,53 . 0,53-3 = (6

6) . 0,125 . 1 = 0,725

b) P[X = 2] = (32) |0,52 . 0,53-2 =

3 ¡

2!(3−2)! 0,52 . 0,53-2

230

= 6/ 2 . 0,25 . 0,5 = 0,375

c) P [X = 1] = (31) |0,51 . 0,53-1 =

3 ¡

1!(3−1)! 0,51 . 0,53-1

= 6/ 2 . 0,5 . 0,25 = 0,375

d) P [X = 0] = (30) |0,50 . 0,53-0 =

3 ¡

0!(3−0)! 0,50 . 0,53 = 0,125

e) P[X ≥ 2] = p[2] + p[3] = 0,375 + 0,125 = 0,5

Al aplicar las propiedades de las variables aleatorias discretas

P[X ≤ 2] = 1 - F(1) = 1 - (p[0] + p[1] = 1-0,5 = 0,5 se tiene:

f) P[X ≤ 2] = F(2) = p[0] + p[l] + p[2] = 0,875

Cuando el tamaño de muestra es grande, el cálculo de probabilidades mediante la

ecuación (4.2.1) es dispendioso, por lo tanto, se recurre al uso de valores que ya están

tabulados para diferentes valores de n, p, x. En la Tabla 2 del Apéndice se presentan las

cifras de la función de distribución acumulativa binomial.

Ejemplo 4.2.2: El cálculo de probabilidades para el literal f) del Ejemplo 4.2.1, con el

uso de la mencionada tabla, se lleva a cabo de la siguiente manera:

Se halla F(2), ya que F(2) = P[X ≤ 2]

231

Teniendo en cuenta que, en el lanzamiento de una moneda, la probabilidad de que

aparezca una cara es p = 0,5 y que n = 3, ya que se lanzan tres monedas, en la Tabla 2

del Apéndice, en lugar se localiza n = 3 y aquí se ubica x = 2, luego en la intersección

entre p = 0,5 y x = 2 se encuentra F(2) = 0,875.

En esta tabla también se puede hallar P(X = x), con la siguiente fórmula:

P[X = x] = F(x) - F(x-1)

Para el literal b) del Ejemplo 4.2.1 se procede así:

P[X = 2] = F(2) - F(1) = 0,875 - 0,5 = 0,3750

Ejemplo 4.2.3: En una población de cerdos afectados de Neumonía por Bortedella,

enfermedad caracterizada por tos, disnea, debilitamiento, taquinea y alta mortalidad, el

40% se recupera después de recibir tratamiento a base de quinolonas. Si se extrae una

muestra aleatoria de 20 cerdos, calcular las siguientes probabilidades:

a) Que cinco o menos se recuperen

b) Por lo menos seis se recuperen

c) Entre 7 y 10 inclusive se recuperen

d) ¿Cuál es el valor esperado de animales recuperados?

Se define X como la variable aleatoria "número de cerdos que se recuperan". Se tiene

que n = 20 y p = 0,4. Así que las respuestas serán:

• P[X ≤ 5] =F(5) = 0,1256

232

• P[X ≥ 6] = 1- F(5) = 1 - 0,1256 = 0,8744

• P [7 ≤ X ≤ 10] = F(10) - F(6) = 0,8725 - 0,2500 = 0,6225

• E[X] = np = 20 x 0,4 = 8, lo que significa que en una muestra aleatoria de 20 cerdos

se espera que en promedio se recuperen ocho animales.

4.2.2 La Distribución Poisson. Es una familia de distribuciones discretas, llamada de

esta forma en homenaje a Simeón Denis Poisson, quien la describió a finales del siglo

XIX. Las variables aleatorias de Poisson implican la observación de un conjunto discre-

to de sucesos en un intervalo continuo de tiempo, longitud o espacio, pero el concepto

de intervalo no se trata, en este contexto, como en la forma matemática usual. Por

ejemplo, si al analizar una muestra de 1,0 ce de semen bovino se buscan espermatozoi-

des con cola enrollada, el suceso es el espermatozoide con la característica anotada y el

"intervalo" es el centímetro cúbico de semen. Un veterinario contabiliza semanalmente

el número de llamadas que recibe en su consultorio solicitándole realizar cesáreas en

equinos; en este caso, el suceso que toma valores discretos es el número de llamadas y

el intervalo es una semana.

Definida X como el número de sucesos de interés en un intervalo de unidades de tamaño

S, con el propósito de establecer la función de probabilidad de X es necesario considerar

los siguientes aspectos:

a. La unidad de medida básica del problema

b. La media del número de sucesos ocurridos por unidad de medida

c. El tamaño del intervalo de observación

Establecidos los anteriores criterios, la función de probabilidad de X estará dada por:

𝑝[𝑥] = 𝑒Ằ𝑠 (Ằ𝑠)𝑥

𝑥 ¡

233

x = 1,2, …, k

Ằ > 0

S > 0

Dónde:

e = Base del logaritmo natural (2,718282)

Ằ = µ : Media de la ocurrencia del suceso particular

s = Intervalo del experimento

ὂ = Ằ

F(x) = P[X≤x] = p[0] + p[1] + … + p[x]

Cuando una variable aleatoria discreta adopta esta forma recibe el nombre de variable

aleatoria Poisson y su función de probabilidad está expresada en (4.2.2).

Los anteriores conceptos se resumen al indicar que una distribución Poisson describe la

frecuencia de un evento que puede tomar valores discretos 0, 1, 2, 3,...., k,

correspondientes un suceso cuyo número promedio de ocurrencias es bajo en relación

con el número total e reces que éste podría ocurrir, tal como se observa en los ejemplos

antes anotados. Dado que la probabilidad del suceso es pequeña, frecuentemente se

menciona a la distribución Poisson como una función de distribución de sucesos

"raros".

Ejemplo 4.2.4: Luria y Delbruck, citados por Suzuki et al (1992), realizaron una prueba

experimental, conocida con el nombre de prueba de fluctuación, con células de E. Coli,

para calcular la tasa de mutación. Un estudio específico tenía como objetivo determinar

234

un tipo particular de mutación consistente en detectar bacterias que se vuelven

resistentes al Fago T1, virus que ataca y mata a la mayoría de células de E. coli.

Cuando se siembra un número elevado de bacterias y de fagos, la mayoría de las

bacterias muere, pero las resistentes al Fago T1 sobreviven y producen colonias que se

pueden aislar. Este tipo de células imitantes se conocen con el nombre de células

resistentes a T1 o Tonr. Con el método de Luna y Delbruck se estableció que la media

(𝜇) de los sucesos mutacionales por división celular era de 3 x 108. Si se observan 108

células, ¿cuál es la probabilidad de que ninguna sea mutante?

Para responder la pregunta, se aplica el siguiente procedimiento:

a. Calcular Ằ = 3x10-8 , s = 108, Ằs = 3

b. Aplicar la fórmula (4.2.1), teniendo en cuenta que el valor de X = O

P[X = 0] = 𝑒−3(3)0

0! =0,04978

Ejemplo 4.2.5: Mediante análisis de cariotipo se ha establecido que una de las

anomalías específicas en cromosomas sexuales es el síndrome de Klinefelter, donde el

individuo afectado presenta cariotipo anormal XXY, que en el fenotipo se expresa con

disminución del tamaño de los testículos, hialinización de los túbulos seminíferos,

escaso desarrollo de los caracteres sexuales secundarios, de tal suerte que los pacientes

tienen apariencia de varón, pero son positivos para la prueba de la cromatina sexual.

Diversos estudios han estimado una tasa promedio del síndrome en 1,2 por cada 1.000

nacimientos. Si se analizan 5.000 láminas con preparados celulares para establecer el

cariotipo, ¿cuál es la probabilidad de encontrar la anormalidad en tres de ellas?

Se procede de la misma manera que en el ejemplo inmediatamente anterior:

235

a. Ằs = 0,0012 x 5.000 = 6

b. Aplicar la fórmula (4.2.1)

P[X = 3] = 𝑒−6(6)3

3 ! =0,089

Existe una importante aplicación de la distribución Poisson cuando se considera una va-

riable aleatoria binomial, donde n es grande y la probabilidad de éxito (p) es muy

pequeña, de tal modo que la probabilidad de fracaso (q) se acerca a 1,0. En estos casos

se ha demostrado que la distribución Poisson con parámetro Xs = np se aproxima a la

Binomial; en la práctica, esta aproximación es buena si n es mayor o igual a 30 y p

menor o igual a 0,05, y muy buena cuando n es mayor o igual a 100 y np es menor o

igual a 10.

Ejemplo 4.2.6: La probabilidad de que un perro muera como consecuencia de la

aplicación de una vacuna pentavalente contra moquillo, hepatitis infecciosa,

parvovirosis, parainfluenza canina y leptospirosis es de 0,00002. Si se administra la

vacuna a 100.000 caninos, asumiendo éstos como un conjunto independiente de

ensayos, ¿cuál es la probabilidad en cada uno de los siguientes casos?:

a. Que mueran como máximo 2 perros

b. Que mueran 3 o más animales

c. Que mueran entre 5 y 8 inclusive

d. Que mueran exactamente 3 perros

Esencialmente se trata de un experimento binomial, con n = 100.000 y p = 0,00002.

Puesto que p está muy próxima a cero y n es muy grande, para calcular las

probabilidades pedidas se aproximará a una distribución de Poisson con

Ằ = np = 100.000x0,00002 = 2

236

Al igual que para la distribución binomial, para la distribución de Poisson también

existen tablas. En el Tabla 3 del Apéndice se dan los resultados correspondientes de la

función de distribución F(x, Xs), para diferentes valores de x y Ks.

Si X es la variable aleatoria: muere un determinado número de perros, entonces:

a. P[X ≤ 2] = F(2) = 0,6767.

En la tabla de la distribución de Poisson se encuentra que para hs = 2 y X = 2, por lo

tanto F(2) = 0,6767.

b. P[X ≥ 3] = 1-F(2) = 1-0,6767 = 0,3233.

c. P[5 ≤ X ≤ 8] = F(8) - F(4) = 0,9998 - 0,9473 = 0,0525.

d. P[X = 3] = F(3) - F(2) = 0,8571 - 0,6767 = 0,1804.

4.2.3 La distribución Multinomial: Es una generalización de la distribución binomial,

donde, si los sucesos ay ay...., a^ pueden ocurrir con frecuencias

pv py ...., p^ respectivamente, entonces, la probabilidad J de que av ay ...., ak ocurran xv xy

...., xk veces, respectivamente, se calcula de la siguiente forma:

F(Xk) = 𝑁 !

𝑋1! 𝑋2! 𝑋𝑘 !

𝑃1𝑋1 𝑃2

𝑋2… 𝑃𝐾𝑋 𝑘

P[𝑋1, 𝑋2,…, 𝑋𝑘 ]=

𝑛!

𝑋1! 𝑋2! 𝑋𝑘 !

𝑃1𝑋1 𝑃2

𝑋2… 𝑃𝐾𝑋 𝑘

Dónde:

X1 + x2+... +xk = n

P1+p2+...+pk = 1 y (4.2.3) es el término general en el desarrollo multinomial

237

(p1 + p2’ + pk)n

Ejemplo 4.2.7: Si se lanza un dado 15 veces, ¿cuál es la probabilidad de obtener dos

veces cada cara del dado?

De acuerdo con (4.2.2), la respuesta es:

P[xv xy xy xv xy x6] = 15!

2! 2! 2! 2! 2! 2!(

1

6)2 (

1

6) 2 (

1

6) 2 (

1

6) 2 (

1

6) 2 (

1

6) 2

= 1307674368000

64(9,8464)10-15 =0,00020

Ejemplo 4.2.8: En el cruzamiento entre animales heterocigóticos para el color del

manto en la raza holstein, en 12 nacimientos, ¿cuál es la probabilidad de que tres crías

sean negras homocigóticas, cinco negras heterocigóticas y cuatro rojas?

Con la aplicación del mismo procedimiento, se tiene:

P[𝑋1, 𝑋2,…, 𝑋𝑘 ]=

12!

3! 5! 4! (

1

4) 3 (

2

4) 5 (

1

4) 4 =

479001600

17280 ( 1, 9073)10−6 = 0,0528

La probabilidad de que las doce crias próximas a nacer, tres sean negras homocigotas,

cinco negras heterocigotas y cuatro rojas es 5,28%.

En los experimentos multinominales, se espera que el número de veces que ocurrirá a1,

a2,…. ak en n ensayos, se estima por np1, np2,….npk. asi, en en ejemplo 4.2.8, sobre las

crías holstein, se esperan tres negras homocigóticas (12*0,25) y tres rojas (12*0,25).

238

4.3 VARIABLES ALEATORIAS CONTINUAS

Antes de iniciar este tema e conveniente indicar que por simple convención las variables

aleatorias continuas se identificaran en este texto con la letra Y.

Una variable aleatoria Y es continua si los valores que toma consisten en uno o más

intervalos de la recta real, es decir, si su rango es infinito no numerable.

Para las variables aleatorias discretas se asignan probabilidades a todos los valores

puntuales de la variable. Para el caso continuo esto no es posible, puesto que el rango es

no numerable así que la probabilidad de Y tome un valor específico: P[Y=y] = 0.

Una variable aleatoria continua está caracterizada por una función f(y) que recibe el

nombre de función de densidad y esta proporciona un medio para calcular la

probabilidad en un intervalo a ≤ Y ≤ b.

La función f(y) es una función de densidad de probabilidad así:

a) f(y) ≥ 0 para -∞ < y < ∞

b) ∫ 𝑓 (𝑦)𝑑𝑦 = 1+∞

−∞

c) P [ a ≤ Y ≤ b] = ∫ 𝑓 (𝑦)𝑑𝑦𝑏

𝑎

La primera propiedad dece que f es no negativa, la segunda afirma que f se

constituye de manera que el área bajo su curva, limitada por el eje de las Y, es igual

a uno cuando se calcula en el rango de Y para el que está definido f(y), y la tercera

propiedad expresa como calcular la probabilidad de que Y tome un valor desde y=a

hasta y=b está caracterizada por una función f(y)

Dado que para una variable aleatoria continua la probabilidad de que Y tome un valor

específico es cero se tiene que:

𝑃[á ≤ 𝑦 ≤ 𝑏] = 𝑃[𝑎 ≤ 𝑦 < 𝑏] = 𝑃[𝑎 < 𝑦 ≤ 𝑏] = 𝑃[𝑎 < 𝑦 < 𝑏]

Gráfico 1

239

𝑃[𝑎 < 𝑦 < 𝑏] = ∫ (𝑦)𝑑𝑦𝑏

𝑎

La función de distribución acumulativa F(y) de una variable aleatoria continua Y, con

función de densidad de probabilidad f(Y) está dada por.

𝐹(𝑦) = 𝑃[𝑌 ≤ 𝑦] = ∫ 𝑓(𝑡)𝑑𝑡 𝑝𝑎𝑟𝑎 − ∞ < 𝑦 < ∞

𝑃[𝑌 ≤ 𝑦]

De aquí se desprende que 𝑃[𝑎 < 𝑌 < 𝑏] = 1 − 𝐹(𝑦)

También se tiene que 𝑃[𝑌 > 𝑦] = 𝑃[𝑌 ≥ 𝑦] = 1 − 𝐹(𝑦)

El valor esperado de una variable aleatoria continúa Y, se define como:

𝐸[𝑌] = ∫ 𝑌𝑓(𝑦)𝑑𝑦∗∞

−∞

La varianza se define como

𝑉{𝑌} = 𝜕2 = ∫ (𝑌 − 𝜇)∗∞

−∞2∫(𝑌)𝑑𝑦

240

4.3.1 La distribución normal. La distribución normal es una “familia” de variables

aleatorias continuas, descritas por primera vez por Moivre 1773, como el valor límite

de la densidad binomial con un numero de ensayo grande. Los resultados encontrados

por de Moivre pasaron prácticamente inadvertidos durante 50 años y fueron Gauss

Laplace, quienes al estudiar problemas de astronomía, en forma independiente,

presentaron la distribución normal como una descripción de los errores en las medidas

astronómicas.

La distribución normal es de gran utilidad ya que constituye una excelente

aproximación para una cantidad apreciable de distribuciones que tiene mucha

importancia práctica y posee varias propiedades matemáticas que conducen a deducir

resultados teóricos de interés.

La distribución normal ha tenido especial importancia en producción y salud animal

para el correcto análisis e interpretación de datos especialmente experimentales. El

desarrollo de la teoría de selección animal, así como el estudio de una amplia gama de

variables relacionados con la fisiología de los animales domésticos ha tenido como

base a la distribución normal.

Una variable aleatoria Y, que toma todos los valores reales -−∞ < 𝑦 < ∞ tiene una

distribución normal o Gaussiana así su función de densidad de probabilidad es de la

siguiente forma:

𝑓(𝑦) =1

√2𝜋𝜎𝑒[

−12

{𝑟−𝜇

𝜎)], −∞ < 𝑌 < ∞

Donde 𝜎2 es la varianza µ es la media y la base de los logaritmos naturales, para lo cual

se cumple la condición −∞ < 𝜇 < ∞ 𝑦 𝜎 > 0

En adelante aparecerán con muchas frecuencias a la distribución normal, por lo que será

necesario abreviar la anterior notación con una más breve donde se indica que Y tiene

distribución N(µ, 𝜎2), si su función densidad está determinada por(4.3.3)

Como se puede apreciar en (4.3.3) existirán muchas distribuciones normales que se

diferenciaran una de otra por su media o varianza .la formula antes mencionada no es

difícil de desarrollar, ya que para calcular probabilidades será necesario establecer áreas

bajo la curva mediante el uso de integrales; sin embargo, el trabajo con tablas de

241

distribución de probabilidades facilita enormemente este labor, por lo tanto no interesa

la complejidad de la ecuación.

4.3.1.1.1 Propiedad de la distribución normal. La distribución normal tiene las

siguientes propiedades:

a) La grafica de la densidad para cualquier variable aleatoria normal es una curva

simétrica en forma de campana, conocida como Curva de Gauss o Curva

Laplaciana, cuyo centro es µ punto en el que indica donde está centrada la curva

la curva a lo largo del eje horizontal , tal como indica la figura (4,3,1)

b) La curva tiene unos puntos de inflexión los cuales indican los valores de Y

iguales a una desviación estándar a cada lado de µ, entonces cada punto de

inflexión representa 𝑌 = 𝜇_ + 𝜎 La situación de estos puntos determina la forma

de curva, de tal modo que entre más grande es 𝜎mas lejos estarán localizados

los puntos de inflexión Y, en consecuencia, la curva será mas plana, por lo tanto

es fácil esclarecer con claridad que µ es el parámetro de localización, y 𝜎 es el

parámetro de forma.

c) Todas las variables aleatorias normales son continuas y su probabilidad de

ocurrencia se calcula al encontrar las áreas correspondientes bajo la curva.

d) En una distribución normal la media, la moda y la mediana son iguales.

e) El coeficiente de asimetría en una curva normal, es igual a cero y el de la

curtosis se hace ,por lo general, con referencias a la normales.

f) La curva es simétrica, lo que indica que a cada lado de la media se localiza el

50% de los datos, lo que quiere decir que el área total bajo la curva es uno, tal

como se aprecia En la Figura 4.3.1

Funciones de probabilidad para variables aleatorias, discretas y continúas.

242

Figura 4.3.1 CURVA NORMAL

FIGURA 4.3.2. AREA BAJO LA CURVA EN UNA DISTRIBUCCION NORMAL

g) Entre µ±𝜎 se localiza aproximadamente el 68% de los datos, entre 𝜇 ± 2𝜎 el

95% de los datos entre 𝜇 ± 3𝜎𝑒𝑙 99% de los datos, de la manera indicada en la

figura 4.3.2.

4.3.1.2. Función de distribución normal de una distribución normal. Si Y es una

variable aleatoria normal, con media µ y varianza 𝜎 es decir Y-N (𝜇, 𝜎2) entonces la

función de distribución acumulada F (y) es:

𝐹(𝑌)𝑌 = 𝑃[𝑌 ≤ 𝑦]

Esto corresponde al área bajo la función de densidad a la izquierda de y, como se ilustra

en la figura 4.3.3

243

Figura 4.3.3 Función de distribución normal

Cualquier probabilidad puede obtenerse a partir de la función de distribución

acumulada; por ejemplo, la probabilidad acumulada en un intervalo (a,b) está

determinada por 𝑃[𝑎 < 𝑦 << 𝑏] = 𝐹𝑏𝑦 − 𝐹𝑎𝑌

Como la normal es variable continua, la probabilidad en un punto es cero, por lo tanto

𝑃[𝑎 < 𝑦 < 𝑏] = 𝑃[𝑎 ≤ 𝑦 ≤ 𝑏] = 𝑃[𝑎 < 𝑦 ≤ 𝑏] = 𝑃[𝑎 ≤ 𝑦 ≤ 𝑏]

También se tiene que: 𝑃[𝑌 ≥ 𝑦 ≥] = 𝑃[𝑌 > 𝑦] = 𝐹[𝑌𝑌]

Ya se mencionó que para calcular estas probabilidades se tendrá que resolver integrales

de funciones de densidad normales, para diferentes valores de µ𝑦𝜎2.afortunadamente la

probabilidad de cualquier distribución normal puede expresarse en términos de las

probabilidades de una normal determinada, denominada normal estandarizada o

tipificada Z que tiene como media cero y varianza uno, para lo cual ya se ha calculado

y tabulado las probabilidades. Esto puede realizarse por medio de la transformación.

𝑍 =𝑌 − 𝜇

𝜎

Es decir si Y se distribuye N (µ y𝜎2) entonces Z= 𝑦−𝜇

𝜎 se distribuye en N(0,1)

En la tabla 4 del apéndice se encuentra tabulada la función de distribución acumulada

de una variable aleatoria normal estándar. En esta tabla se dan valores de:

𝐹(𝑍)𝑍 = 𝑃[𝑍 ≤ 𝑧]

Con el fin de ilustrar el uso de la tabla. Para valores de z desde -3,5 hasta 3,5 se allá la

probabilidad de que z sea menor o igual que 1.96. en la columna de la izquierda de la

tabla 4 del apéndice se localiza el número 1.9 y luego en esta fila se desplaza

244

horizontalmente hasta encontrar la columna bajo 0,06 donde se encuentra el valor

0,975. Es decir 𝑃[𝑍 ≤ 0,975] que geométricamente se puede expresar como el área

bajo la curva a la izquierda 1,96

1,96

EJEMPLO 4.3.1: dado una distribución normal estándar, calcular 𝑃[𝑍 > 1,96]

1,96

La probabilidad que se pide es

𝑃[𝑍 > 1,96 ≫] = 1 − 𝑃[𝑍 ≤ 1,96]

= 1 − 𝐹𝑍(1,96)

= 1 − 0,975

= 0,0250

EJEMPLO 4.3.2 Dada una distribución normal estándar

Calcular 𝑃[−1,97 ≤ 𝑧 ≤ 0,86]. La probabilidad pedida corresponde al área de la parte

sombreada en la figura siguiente

Esta probabilidad se calcula así:

245

𝑃[−1,97 ≤ 𝑧 ≤ 𝑜, 86] = 𝐹𝑍(0,86) − 𝐹𝑍(−1,97)

Al utilizar la tabla 5 del apéndice se obtiene 𝐹𝑍(0,86) = 0,8050𝑦

𝑭𝒁(−𝟏, 𝟗𝟕) = 𝟎, 𝟎𝟐𝟒𝟒. 𝑷𝒐𝒓 𝒍𝒐 𝒕𝒂𝒏𝒕𝒐 ∶ 𝑷[−𝟏, 𝟗𝟕 ≤ 𝒛𝟎 ≤ 𝟎, 𝟖𝟔]

= 𝟎, 𝟖𝟎𝟓𝟏 − 𝟎, 𝟎𝟐𝟒𝟒 = 𝟎, 𝟕𝟖𝟎𝟕

En ocasiones es necesario calcular probabilidades de una variable aleatoria normal Y,

con media µ y varianza 𝜎2 en un intervalo, por ejemplo (a≤ 𝑦 ≤ 𝑏).

𝑃[𝑎 ≤ 𝑦 ≤ 𝑏] = 𝑝 [𝑎 − 𝜇

𝜎≤ 𝑧 ≤

𝑏 − 𝜇

𝜎] = 𝐹𝑍 [

𝑏 − 𝜇

𝜎] − 𝐹𝑍 [

𝑎 − 𝜇

𝜎]

Donde Z es la variable aleatoria normal estándar y 𝐹𝑍(𝑍) representa la función de

distribución acumulada.

Ejemplo 4.3.3: Si Y, representa el peso al sacrificio de los cerdos Pietrain y se

distribuye según una normal, con µ=100 y𝜎 = 10, calcular las siguientes

probabilidades:

Funciones de probabilidades para variables aleatoria, discretas y continuas.

a. Encontrar pesos de cerdos entre 95 y 120 kg = 𝑃[95 ≤ 𝑌 ≤ 120]

b. Encontrar pesos de cerdos menores a 𝑎 85 𝑘𝑔 = 𝑃[𝑦 < 85]

c. Encontrar pesos de cerdos mayores o iguales a 108 kg =𝑃[𝑦 ≥ 108]

Las probabilidades perdidas obtiene la siguiente forma:

a)P[95 ≤ 𝑦 ≤ 120] = 𝑃 [95−𝜇

𝜎≤ 𝑧 ≤

120−𝜇

𝜎]

= 𝑃 [95−100

10≤ 𝑧 ≤

120−100

10]

= 𝑃[−0,5 ≤ 𝑧 ≤ 2]

= 𝑍𝑧(2)−𝑍𝑍(−0,5)

=0.9772-0,3085=0,6687

246

b)P[𝑦 < 85] =P[𝑧85−𝜇

𝜎]

= 𝑃 [𝑧 <85 − 100

10]

= 𝑃[𝑧 < 1,5] = 𝐹𝑍 − (−1,5) = 0,0668

c) 𝑃[𝑦 ≥ 108] = 𝑃 [𝑧 >108−𝜇

𝜎] = 𝑃 [𝑧 >

108−100

10]

= 𝑃[𝑧 > 0,8] = 1 >> −𝑃[𝑧 ≤ 0,8]

= 1 − 𝐹𝑧(0,8) = 1 − 0,7881 = 0,2119

Ejemplo 4.3.4. Si la producción de vacas Holstein se aproxima a una distribución

normal, con media de 5.000L y la varianza de 16.000L2. Hallar la probabilidad de

encontrar vacas con producción mayor o igual de 5.180L.

La probabilidad buscada es

𝑃[𝑦 ≥ 5.180] = 𝑃 [𝑧 ≥5.180 − 𝜇

𝜎]

Como 𝜇 = 5000𝑦𝜎2 = 16.000 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝜎 = 126,49 se tiene que

𝑃[𝑦 ≥ 5.180] 𝑃 [𝑧 ≥5.180−5.000

126.49] = 𝑃(𝑧 ≥ 1,42)

= 1 − 𝑃[𝑧 ≤ 1.42]

= 1 − 𝐹𝑍(1,42) = 1 − 0,925.22 = 0,778

La probabilidad de encontrar vacas con producciones con lactancia mayor o iguales a

5.180 L es del 7,78%, es decir se esperaría que el 7,78% de los animales tengan una

producción igual o superior al valor indicado

Ejemplo 4.3.5 E en la misma población ¿cuál es la probabilidad de encontrar vacas

con producciones superior a 5.300 L y menores de 5.400L?

LA PROBABILIDAD ES

247

𝑃[5.300 < 𝑦 < 5.400] = 𝑃 [5.300−5.00

126.49< 𝑧 <

5.400−5.000

126.49]

= 𝑃[2,37 < 𝑧 << 3,16] = 𝐹𝑧(3,16)-𝐹𝑧(2,37)

0.9992-0,9911=0,0083

Esto significa que el 0,83% de las vacas de la población analizada tienen producciones

en el rango indicado. Si se conoce N, es posible estimar el mínimo de los animales con

la producción indicada. Por ejemplo: Si en la población hay 600 vacas, se espera que

0,083multiplicado por 600= 4,98≈5 vacas estén produciendo la cantidad en el intervalo

indicado

Ejemplo 4.3.6. En una ex población truchicola se calculó µ=17,8cm de longitud

estándar y 𝜎2 = 64𝑐𝑚2.En el mercado nacional no se aceptan truchas con longitud

menor de 15,3 cm ¿Cuál es la probabilidad de encontrar animales con esa condición?

Asumiendo que la variable se distribuya aproximadamente con un normal, la

probabilidad se la calcula de la siguiente manera

𝑃[𝑦 < 15,3] = 𝑃 [𝑧 <15,3−17,8

8] = 𝑃[𝑧 < −0,3125]

𝐹𝑧(−0,3125) = 0,3783

Ejemplo 4.3.7 Si en la mencionada explotación hay 4.000 animales, se espera que de

estos 4.000 * 0,3783=1.513,2≈1.513 individuos no cumplan las condiciones del

mercado

Ejemplo 4.3.8. Suponiendo que las truchas con talla superior a 21 cm se pagan mejor

en el mercado, ¿Cuál es la probabilidad de encontrar animales con esa producción.

𝑃[𝑦 > 21] = 𝑃 [𝑧 <21−17,8

8] = 𝑃[𝑧 > 0,4] = 1 − 𝑃[𝑧 ≤ 0,4]

= 1 − 𝐹𝑧(0,4) = 1 − 0.6554 = 0,3446

Lo que quiere decir que aproximadamente el 34,5% de los animales tienen la talla que

garantiza el mejor precio, y en un numero seria 4.000*0,3446≈1.378 animales,

aproximadamente.

248

En los cálculos de la probabilidad efectuados hasta el momento se conoce el valor de un

Z0 determinado; sin embargo; muchas veces es necesario hacer lo contrario, es decir,

dada la probabilidad hallar Z0. A continuación se ilustra estos casos

Ejemplo 4.3.9. Dada una distribución normal estándar, encuentre el valor𝑍0 , tal que

a. 𝑃[𝑍 ≤ 𝑧0] =0,9750

b. 𝑃[𝑍 > 𝑧0] = 0,6500

La solución siguiente

a. En la figura anterior se observa que el área a la izquierda de 𝑧0es de 0,975. En

el interior de la tabla 4 del Apéndices se busca el numero 0,975 o el que más

se aproxime. Una vez hallado este número, se observa que a la izquierda, en la

primera columna se encuentra 1,9 y hacia arriba en la primera fila, se encuentra

el número 0,06, es decir 𝑧0= 1,96

b. P(𝑍 > 𝑧0) = 0,6500

Con el área a la derecha de 𝑧0 es de 0,6500, entonces el área a la izquierda de 𝑧0es

0,3500; en la tabla 4 se busca el numero mas próximo es 0,3483 y en consecuencia

𝑧0 =-0,39

0,975

0,6500

249

Ejemplo 4.3.10 Con los datos del ejemplo 4.3.6, hallar la longitud mínima del 10% de

las truchas de mayor tamaño

Sea 𝑧0 la longitud mínima necesaria para estar en el 10% de los animales de mayor

tamaño

𝑃[𝑦 > 𝑧0] = 0,10, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠

𝑃[𝑦 ≤ 𝑧0] = 0,90

𝑃 [𝑧 ≤𝑧0−17,8

8] = 0,90 En la tabla 4 de apéndice se encuentra z que le corresponde a

0,90 es decir,

𝑧0, 90 = 1,28

Por lo tanto 𝑧0−17,8

8= 1,28

𝑧0 = 1,28𝑦8 + 17,8 = 28,04

Es decir la longitud mínima es de 28,04 cm para estar en el 10% superior

4.3.2 Teorema central del límite Muchas de la variables aleatorias que se encuentran

en la práctica son promedio de variables aleatorias independientes la media Y es un

estadístico muy importante en problemas de toma de decisiones para medias

poblacionales desconocidas.

El problema central del límite dice como se distribuye la media muestra Y. sea 𝑌1,𝑌2,,,,,,

variables aleatorias independientes, con idéntica distribución de la media µ y varianza

𝜎2 el promedio muestra y𝑌1,𝑌2,,,,,, Yn

𝑛 tiene una distribución con media

250

CAPÍTULO 5

Distribución de muestrales y estimación

Una vez analizados los conceptos fundamentales de probabilidad y de distribución de

probabilidad, se puede abortar la estadística inferencial, la cual se encarga de

generalizar las conclusiones que se obtienen en la muestra, para tomar decisiones sobre

la población de donde se obtuvo la muestra.

Para hacer afirmaciones que tengan validez sobre toda la población, con base en el

comportamiento observado en la muestra, es necesario que esta conserve las

características esenciales de la población, es decir. Que sea representativa. Para

garantizar inferencias válidas a cerca de la población es importante que la muestra reúna

ciertos requisitos, entre otros la de ser aleatoria.

5.1 MUESTRA ALEATORIA

Un conjunto de observaciones 𝑌1, 𝑌2,… , 𝑌𝑛 extraídas de una población finita de tamaño

N, es una muestra aleatoria de tamaño n, si se elige de tal manera que cada subconjunto

de n elementos de la población tenga la misma probabilidad de ser seleccionado.

Una manera de seleccionar una muestra aleatoria de una población finita es enumerar

todos los elementos de la población mediante fichas y extraer n miembros de manera

aleatoria; en este sentido, aleatorio significa total imparcialidad en la selección de la

muestra. Otra técnica más formal consiste en emplear una tabla de números aleatorios

como la indicada en la Tabla 5 del Apéndice (Steel y Torrie, 1.985). Esta tabla está

formada por los dígitos 0,1,2,3,4,5,6,7,8 y 9, distribuidos en 100 filas por 100 columnas,

dando origen a 10.000 números aleatorios, de los cuales 5.094 son pares y 4.906 son

impares. Si un número apareciese con más frecuencia que otro, sólo se debe al azar. En

la citada Tabla existen 1.015 ceros, 1.026 unos, 1.013 doses, 975 treses, 976 cuatros,

932 cincos, 1.067 seis, 1.013 sietes, 1.023 ochos y 960 nueves. Su uso se ilustra con el

siguiente ejemplo:

251

Ejemplo 5.1.1: Se define una población conformada por 40 cerdos Large White de la

que se necesita conformar una muestra al azar con 10 de ellos, a fin de analizar la

variable peso a los 90 días. Para esto es necesario disponer de los registros donde esté

consignado el peso individual a esa edad y la correspondiente identificación de cada

animal, tal como se aprecia en la Tabla 5.1.1.

Suponiendo que, para los fines de un estudio particular, una muestra aleatoria de 10

datos es suficiente para tener una idea clara y confiable del comportamiento productivo

de toda la piara habría que responder la pregunta, ¿cuáles son los 10 cerdos que se

deben elegir para desarrollar el estudio?

Tabla 5.1.1 Registro del peso individual a los 90 días, de una población de

cerdos Large White.

N° del

animal Peso (kg)

N° del

animal Peso (kg)

N° del

animal Peso (kg)

00 72 14 68 28 68

01 89 15 78 29 69

02 69 16 81 30 74

03 78 17 88 31 69

04 85 18 74 32 77

05 80 19 103 33 59

06 73 20 87 34 85

07 61 21 68 35 61

08 68 22 59 36 63

09 87 23 61 37 68

10 89 24 68 38 68

11 72 25 85 39 64

252

12 67 26 67

13 92 27 66

Para garantizar la elección al azar pueden seguirse estos pasos:

1.- Disponer del listado de animales, identificados con un código, en este caso con dos

dígitos del 00 al 39. Cada animal tendrá registrado su peso.

2.- En la Tabla 5 del Apéndice se marca arbitrariamente la fila. En el ejemplo se marcó

el 15 y con el mismo procedimiento se marcó la columna 20. Luego se empiezan a

seleccionar los dígitos de dos en dos, a partir del punto de corte de la fila 15 con la

columna 20, y se leen los números de izquierda a derecha, hasta completar diez parejas.

Así se encontraron las parejas de 6 y 3, 8 y 5, 2 y 4, 4 y 8, 4 y 0,0 y 2, 5 y 9, 2 y 8, 8 y 5

y 7 y 2. Según las cifras encontradas deberían seleccionarse como parte de la muestra

los cerdos 63, 85, 24, 48, 40, 02, 59, 28, 85, y 72.

Como el tamaño de la población es N=40, las cifras 63, 85, 24, 48, 40, 02, 59, 28, 85, y

72 no existen en el listado, por lo tanto se descartan. En consecuencia, hasta el

momento, de los 10 cerdos que se necesitan, únicamente se han logrado seleccionar tres

que son 24, 02 y 28, aún faltan 7. Para seleccionar los 7 restantes, simplemente se

continúa formando parejas de dígitos desde el punto donde se encontró la última cifra,

es decir en 72. Por lo tanto las siguientes cifras son: 03, 10 y 01 sirven para la muestra y

se seleccionan, así que ya se dispone de seis animales seleccionados. Los dígitos 79 y

69 se descartan. Todavía hacen falta cuatro animales, pero ya se terminó la fila de

números. Por lo tanto se debe bajar una fila y se procede a formar nuevas parejas, pero

de derecha a izquierda, descartando las cifras que nos sirvan, hasta completar la

muestra.

En el ejemplo se tuvo esta situación: 20, 07, 56, 09 y 00, de estos dígitos el 56 se

descarta, el resto se aceptan y así se completa el tamaño requerido de la muestra. En

conclusión, se han seleccionado al azar los cerdos identificados con los códigos 24, 02,

28, 03, 10, 01, 20, 07, 09 y 00, tal como se observa en la Tabla 5.1.2

253

3.- Estos números corresponden a las 10 animales escogidos al azar, consignados en la

Tabla 5.1.2.

Tabla 5.1.2. Muestra aleatoria de 10 cerdos Large White para analizar la

variable peso a los 90 días

N° del

animal

Peso a los 90 días

(kg)

24 68

02 69

28 68

03 78

10 89

01 89

20 87

07 61

09 87

00 72

El procedimiento antes descrito equivale a introducir 40 balotas marcadas con los

dígitos 00 y 39 en una bolsa y extraer al azar 10 de ellas, mezclando bien las balotas

luego de cada extracción y volviendo a meter en la bolsa la balota que se ha sacado, es

por esta razón que este procedimiento se denomina muestreo con reemplazo. Si no ese

introdujera de nuevo en la bolsa las balotas ya sacadas, el muestreo será sin

reemplazo.

254

Para obtener tamaños de muestra mayores, por ejemplo, tomar 100 observaciones de

una muestra de 500, el procedimiento es el mismo, sólo que la numeración de los

individuos a muestrear se hace con tres dígitos, iniciando con 000 y terminando con

499. Luego se escogen de la tabla combinándose de tres cifras, hasta completar el

tamaño requerido.

Es importante reiterar que la técnica antes detallada no es el único procedimiento de

elegir individuos al azar de una población; existen otros procedimientos alternativos de

muestreo donde se incluye el uso de calculadora e incluso computadores personales.

Se ha indicado en repetidas ocasiones que, al hacer inferencias estadísticas, el interés

radica en hacer afirmaciones sobre los parámetros de las poblaciones como la media μ y

la varianza 𝜎2, utilizando los estadísticos X y 𝑆2 , que se calculan a partir de las

muestras aleatorias.

Si se tiene una población finita de tamaño, se podrán obtener varias muestras de tamaño

n. Por lo general, para cada muestra extraída se obtendrán valores diferentes de los

estadísticos X y 𝑆2 , así que se puede pensar en cada cantidad como una variable

aleatoria con cierta distribución de probabilidad. Por ejemplo, si el estadístico es la

media, la distribución se conoce como distribución muestral de medias, o si es la

varianza, la distribución se denomina distribución muestral de varianzas. La

distribución de probabilidades de los posibles resultados muestrales proporciona una

base para realizar inferencias.

5.2 DISTRIBUCIÓN DE MUESTREO DE LA MEDIA MUESTRAL ��

Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria de una población, de tal manera que E[𝑋𝑖] =μ

y V[𝑋𝑖]=𝜎2 , i= 1, 2, 3, …, n, ��= 𝑋1+𝑋2+⋯+𝑋𝑛

𝑛 entonces la estadística se denomina

media muestral.

El valor esperado o media de ��, simbolizado como 𝜇��, se lo halla de la siguiente

manera:

𝜇�� = 𝐸[��] = 𝐸 [𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛

𝑛] =

1

𝑛(𝐸[𝑋1] + 𝐸[𝑋2] + ⋯ + 𝐸[𝑋𝑛])

255

= 1

𝑛[𝜇 + 𝜇 + ⋯ + 𝜇] =

1

𝑛𝑛𝜇 = 𝜇

Es decir, la media de la distribución de muestreo de la media muestral es la media

poblacional μ.

La varianza de la media muestral ��, simbolizada por 𝜎��2, se calcula como:

𝜎��2 = V[��] = 𝑉 [

𝑛] =

1

𝑛2(𝑉[𝑋1] + 𝑉[𝑋2] + ⋯ + 𝑉[𝑋𝑛])

= 1

𝑛2 𝑛𝜎2 =

𝜎2

𝑛

Es decir, la varianza de la distribución maestral de la media es 𝜎2

𝑛

La desviación estándar de la distribución muestral de la media es

d.e. (��) = 𝜎2

√𝑛

esta cantidad se conoce con el nombre de error estándar de la media. Se puede

apreciar que a medida que el tamaño de la muestra crece, el error estándar de la media

disminuye, es decir, si el tamaño de la muestra crece, la precisión de la media muestral

para estimar la media poblacional aumenta. Si n es mayor que el 5% de N, la varianza

V[��] hay que multiplicarla para el factor de corrección para población finita, con lo

que: 𝑁−𝑛

𝑁−1.

V [��]= 𝜎2

𝑛*

𝑁−𝑛

𝑁−1 y d.e.( ��)=

𝜎

√𝑛√

𝑁−𝑛

𝑁−1

Se puede demostrar que si la muestra aleatoria 𝑌1 + 𝑌2 + ⋯ + 𝑌𝑛, proviene e una

población normal con media μ y varianza 𝜎2, entonces la estadística �� se disminuye

normal con media μ y varianza 𝜎2

𝑛, es decir, la variable aleatoria

�� − 𝜇𝜎

√𝑛

= 𝑍

Donde Z es normal estándar.

256

Si la población de donde se extrajo la muestra no es normal, el teorema central del

límite asegura que la aproximación (5.2.5) es buena para muestras grandes n≥30.

La aproximación (5.2.5) es buena para muestras pequeñas si la distribución de donde se

extrajo la muestra es normal o es bastante parecida a una normal, es decir, es simétrica y

tiene una alta concentración de los datos alrededor del punto de simetría.

Ejemplo 5.2.1: En una población comercial de cuyes, el peso vivo individual promedio

a la semana 12 de edad es 850g y la desviación estándar 200g. Hallar la probabilidad de

que en una muestra de 60 animales, el peso promedio sea menor que 900g.

El problema pide calcular P [�� < 90 ], conociendo que n=60, μ=850 y σ=200, como n

es grande, se tiene que:

��− 𝜇��

𝜎��= 𝑍, donde 𝜇�� = 𝜇 𝑦 𝜎 =

𝜎

√𝑛

Es decir, ��− 𝜇

𝜎

√𝑛

= 𝑍 por lo tanto:

P [�� < 90 ]= P [ ��− 𝜇

𝜎

√𝑛

< 900− 𝜇

𝜎

√𝑛

]= P [𝑍 < 900− 850

200

√60

]= P[Z<1,93] = 𝐹𝑍(1,93)= 0,9732

que es el valor correspondiente a la probabilidad pedida.

5.3 DISTRIBUCIÓN DE MUESTREO DE LA PROPORCIÓN MUESTRAL

Sea X el número de éxitos en una muestra binomial de n observaciones, donde p es la

probabilidad de éxitos, en la mayoría de aplicaciones, el parámetro p será la proporción

de individuos de una población que poseen ciertas características de interés, tal como la

presencia de una determinada patología.

Un estimador de p es la proporción muestral, ��= 𝑥

𝑛 por lo tanto:

257

E [��] = E[𝑋

𝑛]=

𝐸[𝑋]

𝑛 =

𝑛𝑝

𝑛 = p

Es decir, el valor esperado o media de la proporción muestral es la proporción p de

éxitos en la población:

V [��] = V[𝑋

𝑛]=

𝑉[𝑋]

𝑛2 = 𝑛𝑝(1−𝑝)

𝑛2 = 𝑝(1−𝑝)

𝑛

Esto es:

𝜎2𝑝=

𝑝(1−𝑝)

𝑛

De la aproximación de la distribución binomial a la normal se tiene que para n grande

𝑥−𝑛𝑝)

√𝑛𝑝(1−𝑝) es aproximadamente normal estándar, siendo posible demostrar que:

𝑝−𝑝

𝜎 ��

=

𝑝−𝑝

√𝑝(1−𝑝)

𝑛

es normal estándar.

Ejemplo 5.3.1: De una población de cíclicos Herus serverus, se toma una muestra de

200 individuos. Suponiendo que la proporción de machos es p=0,40; hallar la

probabilidad de que en la muestra la proporción estimada de machos esté entre 0,35 y

0,45.

Se tiene que p= 0,40 y n= 200, entonces:

P[0,35≤ �� ≤ 0,45] = P [0,35−𝑝

𝜎 ��

≤ 𝑍 ≤0,45−𝑝

𝜎 ��

]

Ahora: 𝜎 𝑝 =√

𝑝(1−𝑝)

𝑛 = √

0,40∗0.60

200= 0,035 entonces:

P[0,35≤ �� ≤ 0,45] = P [0,35−0,40

0,035≤ 𝑍 ≤

0,45−0,40

0,035]

= P[-1,43≤ 𝑍 ≤ 1,43]

= 𝐹𝑍(1,43) − 𝐹𝑍(−1,43)

= 0,9236 – 0,0764 = 0,8472

258

5.4 DISTRIBUCIÓN MUESTRAL DE LA VARIANZA 𝐒𝟐

Es necesario recordar que la varianza muestral S2 = ∑(𝑋𝑖− ��)2

𝑛−1 es una medida de la

variabilidad e indica la dispersión de los datos alrededor de la media. El estadístico S2

es un estimador de la varianza poblacional 𝜎2. Antes de desarrollar la distribución de

muestreo S2 es conveniente hacer una introducción a una nueva distribución,

denominada Chi-cuadrado.

5.4.1 Distribución chi-cuadrado. Si 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑣 son variables aleatorias

independientes y cada una de ellas se distribuye como una variable normal estándar,

entonces la suma de 𝑋12 + 𝑋2

2 + ⋯ + 𝑋𝑣2 se distribuye como chi-cuadrado (𝑋𝑣

2) con v

grados de libertad.

Los grados de libertad v se construyen en un parámetro asociado a la distribución y

representa el número de variables cuyos cuadrados se suman.

Figura 5.4.1 Distribución 𝑿𝒗𝟐

El rango es el intervalo [0,∞]

El valor esperado o media E [𝑋𝑣2] = v

La varianza V [𝑋𝑣2]= 2v

259

Como se puede observar, la forma de la distribución es asimétrica con sesgo positivo y

la función de distribución acumulativa está dada por:

𝑃 = [𝑋 ≤ 𝑋(1−∝;𝑉)2 ] = 1−∝

Donde 0≤∝≤ 1 𝑦 𝑋(1−∝;𝑉)2 es el valor del cuartil que le corresponde a la 𝑋2 para 1-∝ y

v dados.

En la Tabla 6 del Apéndice están tabulados los valores de los cuantiles para diferentes

cifras de 1-∝ y v.

Ejemplo 5.4.1: Se pide calcular es el valor de X correspondientes a una variable

distribuida como chi-cuadrado, en una muestra aleatoria de 10 elementos, con una

confiabilidad del 95%.

Simbólicamente el anterior enunciado se resume de este modo:

𝑃 = [𝑋 ≤ 𝑋(0,95;10)2 ] = 𝑃 = [𝑋 ≤ 18,13] = 0,95.

Para encontrar el valor pedido se busca en la Tabla 6 del Apéndice, en el punto de cruce

entre v=10, que son los grados de libertad, es decir, n y 1-∝= 0,95. En este punto se

encuentra el valor 18,31, cuya representación gráfica aparece en la Figura 5.4.2.

260

Figura 5.4.2 Valor de X en una distribución chi- cuadrado para una

muestra de 10 observaciones con 𝜶= 0,5

Las aplicaciones más importantes de la distribución chi-cuadrado para resolver

problemas específicos aplicados a la producción y salud animal aparecerán más

adelante.

5.4.2. Distribución muestral de la varianza 𝑺𝟐. Si S2 es la varianza calculada en una

muestra aleatoria de tamaño n, extraída de una población con varianza 𝜎2, entonces:

E[S2]= 𝜎2.

Si la población de donde se extrajo la muestra normal, entonces se tiene que la

estadística.

(𝑛 − 1)S2

𝜎2≈ 𝑋(𝑛−1)

2

Donde 𝑋(𝑛−1)2 es la distribución chi-cuadrado con (n-1) grados de libertad.

Ejemplo 5.4.2: Un programa de mejoramiento genético de ovinos africanos pretende

seleccionar los reproductores por la conversión alimenticia, de tal manera que se

seleccionan los individuos de mejor valor genético para la característica en cuestión. Se

sabe que el valor genético es una variable que sigue una distribución normal con

261

varianza 1,75. Se extrae una muestra aleatoria de 20 animales y se pide hallar la

probabilidad de que la varianza muestral sea superior a 3,10.

Se tiene que n=20 y 𝜎2 = 1,75

La probabilidad que se pierde es:

𝑃[S2 > 3,10] = 𝑃[(𝑛 − 1)S2

𝜎2 > (𝑛 − 1)3,10

1,75]

Como, (𝑛 − 1)S2

𝜎2 ≈ 𝑋192 entonces

𝑃[S2 > 3,10] = 𝑃[𝑋192 > 19

3,10

1,75]

= 𝑃[𝑋192 > 33,66]= 1- P[𝑋19

2 ≤ 33,66]

En la Tabla 6 del Apéndice, para 19 grados de libertad, se encuentra que el valor

próximo a 33,66 es 32,85; en la parte superior de esta columna se halla el valor de la

probabilidad 0,975, entonces:

P [𝑋192 ≤ 33,66] ≈ 0,975 𝑦 por lo tanto:

P [𝑋192 > 33,66] ≈ 1 − 0,975 ≈ 0,025 , es decir: P[𝑆

2 > 33,66] ≈ 0,025.

5.4.3 Estimador. En párrafos anteriores de ese texto se ha mencionado varias veces que

un aspecto de gran importancia en la estadística inferencial radica en la estimación de

parámetros a partir de sus correspondientes estadísticos, así que es oportuno ahora

definir el término estimador.

262

Dado un parámetro ϴ, un estimador ϴ de ϴ es una estadística que estima a ϴ. Por

ejemplo, el estadístico �� es un estimador de μ, S2 es un estimador de 𝜎2 y la proporción

muestral p es un estimador de la proporción P, que se pueden simbolizar de la siguiente

manera:

�� = μ

𝑆 2

= 𝜎2

��= P

A esta clase de estimadores se los denomina estimadores puntuales.

Para estimar un parámetro es posible definir varios estadísticos, por ejemplo, a la media

poblacional μ se la puede estimar con la mediana muestral. Existen algunas

características deseables de los estimadores puntuales que sirven para decidir en

términos de éstas, qué estimador es mejor.

5.4.3.1 Estimador insesgado. Un estimador 𝜃 de 𝜃, es insesgado si E[𝜃] = 𝜃, es decir,

el valor medio del estimador es igual al parámetro que se busca estimar. Es importante

que el estimador sea insesgado, puesto que la distribución muestral del estimador se

encontrará alrededor del parámetro objetivo y, en consecuencia, los valores de estos

estimadores difieren del verdadero valor del parámetro con menor probabilidad que los

otros estimadores. Entre los estimadores insesgado se tiene la media muestral ��, la

proporción muestral p, la varianza muestral 𝑆2 = ∑ (𝑋1− ��)2𝑛

𝑖=1

𝑛−1 es decir, E[��] =

𝜇, 𝐸 [ ��] = 𝑝 𝑦 𝐸[𝑆2] = ��2

El estimador ��2 = ∑ (𝑋1− ��)2

𝑛−1 es sesgado, es decir, E[��2] ≠ ��2. Es por esto que, para

estimar la varianza 𝜎, se utiliza 𝑆2 𝑦 𝑛𝑜 ��2.

Dado un parámetro 𝜃 pueden existir dos estimadores insesgados que estiman al

parámetro; en este caso, para decidir qué estimador es “mejor”, se utilizan el criterio de

eficacia relativa.

263

5.4.3.2 Eficiencia relativa. Sean 𝜃 1 𝑦 𝜃 2 dos estimadores insesgados del parámetro 𝜃,

la eficiencia relativa de 𝜃 1 respecto de , 𝑠𝑒 𝑙𝑎 𝑑𝑒𝑓𝑖𝑛𝑒 𝑐𝑜𝑚𝑜 𝑉[�� 2 ]

𝑉[�� 1 ] .

SI, 𝑉[𝜃 1 < 𝑉[𝜃 2 ] entonces 𝜃 1 es más eficiente que 𝜃 2 . Es decir, entre dos

estimadores insesgados de un parámetro es más eficiente el que menos variabilidad

tenga. Por ejemplo,

𝑉[𝑚𝑒𝑑𝑖𝑎]

𝑉[𝑚𝑒𝑑𝑖𝑎𝑛𝑎]= 0,6369

De aquí se deduce que 𝑉[𝑚𝑒𝑑𝑖𝑎] < 𝑉[𝑚𝑒𝑑𝑖𝑎𝑛𝑎], o sea, la media es más eficiente que

la mediana para estimar la media poblacional μ.

5.4.3.3 Estimadores insesgados de varianza mínima. Sea 𝜃 un estimador insesgado

del parámetro 𝜃. Si 𝑉[𝜃 ] es menor que la varianza de cualquier otro estimador

insesgado de 𝜃, se dice entonces que 𝜃 es un estimador insesgado de varianza mínima

de 𝜃. Entre los estimadores insesgados de varianza mínima más comunes se tiene:

c.- La media muestral, cuando la muestra proviene de una distribución normal.

d.- La varianza muestral, cuando la muestra proviene de una distribución normal.

e.- La proporción muestral binomial.

Por lo tanto, se puede concluir que la media muestral, la varianza muestral y la

proporción muestral son estimadores aceptables de la media poblacional, la varianza

poblacional y la proporción poblacional, respectivamente.

5.5 INTERVALOS DE CONFIANZA

En ciertos casos, los estimadores puntuales, aunque poseen ciertas propiedades

deseables, no coinciden con el parámetro que buscan estimar; algunas veces es

preferible estimar un parámetro mediante un intervalo, es decir, un rango de valores

entre los que posiblemente se encuentren el verdadero parámetro que se quiere estimar.

264

5.5.1 Estimador por intervalo. Dado un parámetro 𝜃, un estimador por intervalo es un

intervalo 𝜃 1 < 𝜃 < 𝜃 2 , donde 𝜃 1 𝑦 𝜃 2 se denominan límite inferior y superior,

respectivamente, y dependen del valor del estadístico 𝜃 para una muestra en particular

y de la distribución muestral de 𝜃 . A los estimadores por intervalo se los conoce como

intervalos de confianza.

A la probabilidad de que un intervalo de confianza contenga al parámetro a estimar, se

le denomina coeficiente de confianza.

P (𝜃 1 < 𝜃 < 𝜃 2 ) = 1- ∝

Donde 0 <∝< 1 y 1- ∝ es el coeficiente de confianza.

Es importante tener en cuenta que uno o los dos extremos del intervalo varían de

manera aleatoria de una muestra a otra, es decir, la longitud y la localización del

intervalo son aleatorias y no se podrá estar seguros de que el parámetro objetivo esté

contenido en el intervalo.

Si se estima un parámetro 𝜃 mediante un intervalo de confianza con una confiabilidad

(1- ∝)100 =95%, es decir, P(𝜃 1 < 𝜃 < 𝜃 2 ) = 95%, en la práctica significa que si se

realiza un muestreo repetitivo en la población estudiada, se espera que el 95% de los

intervalos que se calculen deberán contener al parámetro 𝜃 y, sólo por el azar, un 5% de

ellos no contendrá el parámetro.

5.5.2 Intervalo de confianza para media μ. Suponiendo que se tiene una muestra

aleatoria grande (𝑛 ≥ 30) de una población con media desconocida μ y varianza 𝜎2

conocida, además, la población de donde se extrajo la muestra es normal o bien, si no

fuera así, el teorema central del límite asegura que n grande la distribución de

�� es normal con 𝜇�� = 𝜇 y 𝜎 𝑌2 =

𝜎2

𝑛 entonces, un intervalo de confianza para la media

poblacional 𝜇 al (1 - ∝)100% de confiabilidad está dado por:

�� ± 𝜎

√𝑛 𝑍1−∝ 2⁄

265

Donde 𝑍1−∝ 2⁄ es el valor que se encuentra en la Tabla de la distribución normal

estándar para un coeficiente de confianza 1-∝ y �� ± 𝜎

√𝑛 𝑍1−∝ 2⁄ y son los límites de

�� ± 𝜎

√𝑛 𝑍1−∝ 2⁄ confianza ϴ1 𝑦 ϴ2, respectivamente (Figura 5.5.1).

Para calcular un intervalo de confianza para μ con una confiabilidad del (1 - ∝)100%, se

ha supuesto que se conoce 𝜎2, pero en la práctica 𝜎2no se conoce; por lo tanto, para

efecto del cálculo de los límites de confianza, se reemplazará 𝜎2 por la varianza de la

muestra 𝑆2, siempre que n≥ 30.

Ejemplo 5.5.1: En la granja de Botana de la Universidad de Nariño, se tomó una

muestra aleatoria de 39 cuyes (Cavia porcellus), con el fin de estimar el peso promedio

a las 12 semanas mediante un intervalo de confianza al 90% de confianza. Los datos

obtenidos fueron los siguientes: 661, 861, 702, 733, 720, 708, 985, 1030, 812, 798, 800,

968, 1002, 981, 700, 721, 1100, 1090, 1032, 847, 580, 920, 710, 830, 945, 975, 875,

810, 1005, 1050, 945, 925, 940, 936, 1050, 884, 1025, 975, 885.

De los anteriores datos se tiene que: ��= 885,15

𝑠 = √∑(𝑌𝐼 − ��)2

𝑛 − 1

𝑛

𝑖=1

= √17625 = 132,76

𝜎2=S= 132,76

Al calcular 𝑍1−∝ 2⁄ para una confiabilidad del 90%, se tiene que:

266

1- ∝= 0,90

∝ = 0,10

∝ 2⁄ = 0,05

1− ∝ 2⁄ = 0,05

En la Tabla 4 del Apéndice, para 1− ∝ 2⁄ = 0,95 le corresponde un valor Z= 1,64, es

decir, 𝑍1− ∝ 2⁄ = 𝑍0,95=1,64.

�� − 𝜎

√𝑛 𝑍1−∝ 2⁄ = 885,15 −

132,76

√39 1,64 = 850,28 ≈ 850,30

�� − 𝜎

√𝑛 𝑍1−∝ 2⁄ = 885,15 −

132,76

√39 1,64 = 920

Expresándolo en términos de probabilidad se tiene que:

P [850,3 <μ< 920] = 0,90.

Esto significa que la verdadera media del peso a las 12 semanas de los cuyes de la

granja estudiada está en el intervalo comprendido entre 850,3g y 920g, con una

probabilidad del 90%.

.5.3 Tamaño de la muestra para estimar μ. Cuando se realiza un experimento, surge

la pregunta: qué tan grande debe ser la muestra? Si se toma una muestra demasiado

grande se puede ocasionar desperdicio de tiempo y dinero, en cambio, si la muestra es

demasiado pequeña, los resultados podrían carecer de validez desde el punto de vista de

la inferencia estadística.

El tamaño de la muestra necesario para estimar la media poblacional μ a partir de la

media muestral ��, con una confiabilidad (1 - ∝)100% y un error de estimación е, está

dado por:

267

𝑛 = 𝑍 (1−∝ 2)⁄

2 𝜎2

𝑒2

Si se conoce el tamaño de la población N y éste es pequeño, se puede utilizar:

𝑛 = 𝑁𝑍 (1−∝ 2)⁄

2 𝜎2

𝑒2(𝑁 − 1) + 𝑍 (1−∝ 2)⁄2 𝜎2

Donde 𝑍1−∝ 2⁄ es el valor que se encuentra en la tabla normal estandarizada para una

confiabilidad de 1−∝. Esta confiabilidad la fija el investigador y, por lo general, se

trabaja con nivel del 95% y 99%, dependiendo de los alcances de las conclusiones y

recomendaciones. Para los niveles antes indicados los valores Z son 1,96 y 2,57,

respectivamente.

El error máximo de estimación e, es la distancia máxima que podrían admitirse entre la

estimación de la verdadera media con respecto al parámetro |�� – μ|. Esta cantidad es

arbitraria y la fija el investigador.

La desviación estándar 𝜎 corresponde al valor de este parámetro en la población de

donde se extraerá la muestra, lo que indica que (5.5.3) y (5.5.4) se pondrán utilizar para

calcular el tamaño de muestra, siempre y cuando 𝜎 sea conocida. Sin embargo, como se

ha mencionado, en la mayoría de los casos este valor no se conoce; por lo tanto, habrá

necesidad de estimarlo, utilizando cualquiera de los procedimientos indicados a

continuación:

a. De la población objeto de estudio, se extrae una muestra piloto o preliminar,

cuyo tamaño debe ser n≥ 30. Con los datos obtenidos se calcula S y este valor

“reemplaza” a 𝜎 en las fórmulas correspondientes.

b. Se puede utilizar 𝜎 de estudios similares realizados previamente.

c. Si los datos se distribuyen aproximadamente normal, se puede emplear una

estimación burda de 𝜎 con la expresión (1

6rango), para lo cual se requiere

conocer los valores máximo y mínimo de la variable en la población.

268

Ejemplo 5.5.2: Un estudio pretende estimar el peso medio del barbudo negro (Rhamdia

quelem) a la edad de un año, en un estanque experimental ubicado en la cuenca media

del río Cauca. De antemano se debe establecer el número de animales a capturar,

sabiendo que la desviación estándar para la característica en cuestión es de 50g, la

confiabilidad del 95% y el error de estimación máximo admitido de 5 gramos.

De acuerdo con los anteriores datos, ¿Cuál debe ser el tamaño de muestra para estimar

la media?

Como ejemplo de poblaciones grandes utiliza (5.5.3), sabiendo que: ơ = 50,1 –α es 95%

por lo tanto 𝑍1−∝/2 = 1,96, 𝔢 = 5/𝑔.

𝑛 =1.962𝑥502

52= 384,16 ≈ 384 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠

Ejemplo 5.5.3: Con los mismos datos del ejemplo 5.5.2, pero utilizando un error de

estimación de 10g, ¿Cuál sería el tamaño de muestra?

𝑛 =1.962𝑥502

102= 96,04 ≈ 96 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠

Ejemplo 5.5.4: Con los mismos datos del ejemplo 5.5.3, pero utilizando 1-α de 99%;

¿Cuál será el tamaño de la muestra?

𝑛 =2.572𝑥502

102= 165,12 ≈ 165 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠

Ejemplo 5.5.5: Con los mismos datos del ejemplo 5.5.4, pero utilizando error de

estimación de 5g, ¿Cuál sería el tamaño de muestra?

𝑛 =2.572𝑥502

52= 660,49 ≈ 660 𝑎𝑛𝑖𝑚𝑎𝑙𝑒𝑠

De los ejemplos anteriores se podrá establecer claramente que entre mayor sea el nivel

de confiabilidad y menos el error de estimación requerido, el tamaño de la muestra

aumenta.

269

Muchas veces trato al estimar la media de una población cuando se desconoce la

varianza 𝜎2 Y es imposible obtener una muestra De tamaño n mayor igual 30, es decir,

se trata de poblaciones pequeñas. En estos casos (n<30), no es apropiado pretender

estimar 𝜎2Con el puesto que: Ŷ−𝜇

𝑆

√𝑛

no se distribuye normal estándar.

Para enfrentar este tipo de situaciones, es necesario introducir una nueva distribución

denominada distribución t de student.

5.5.4 DISTRIBUCIÓN T DE STUDENT. Dado una muestra aleatoria de tamaño n,

procedente de una población normal con media 𝜇 , La estadística:

Ŷ − 𝜇

𝑆

√𝑛

Sigue una propiedad t con n– 1 grados de libertad.

Entre las propiedades de la distribución t de student se tienen las siguientes:

a.- es simétrica respecto al centro

b. la forma es similar a la normal pero es menos elevada en el centro y tiene colas más

largas.

c. el rango esta entre - ∞ y + ∞

d. la distribución t de Student se aproximan a la normal a medida que los grados de

libertad n-1 se aproximan al infinito.

e. el valor esperado o media es cero, E(t)=0

270

Normal

t de Student

Figura 5.5.2 Curva de densidad de t de Student

La varianza de un t con v grados de libertad es

𝑉(𝑡𝑣) =𝑣

𝑣 − 2, 𝑣 > 2

L a función de distribución acumulativa está dada por P (T≤𝑡1−𝛼,𝑣) = 1 − 𝛼, donde 0 ≤

α ≤ 1 y 𝑡1−𝛼,𝑣es el valor cuantil que le corresponde a la distribución t para 1-α y v

dados.

𝑡1 − 𝛼, 𝑣

Así para: P (T≤𝑡0,90,15) = T ≤ 1,341 = 0,90

En la tabla 6 del Apéndice, en el cruce entre v=15 y 1-α= 0, 90, se encuentra el valor

1,341.

1-α

271

1,341

P (T≤𝑡0,10,15) = 𝑃( T ≤ −1,341) = 0,10

0,10

-1,341

Así para: P (T≤𝑡0,90,15) = T ≤ 1,341 = 0,90

5.5.5 Intervalo de confianza para u con una muestra pequeña y varianza 𝝈𝟐

desconocida.

Dada una muestra aleatoria de tamaño n < 30, con media Ŷ y varianza 𝑆2, procedente

de una población aproximadamente normal con media µ y varianza 𝜎2desconocida, un

intervalo de confianza para µ y varianza 𝜎2 desconocida, un intervalo de confianza para

µ al (1-α) 100% de confiabilidad viene dado por:

Ŷ-𝑡1−𝛼

2,𝑛−1

𝑆

√𝑛 < 𝜇 < �� + 𝑡1−

𝛼

2,𝑛−1

𝑆

√𝑛

(5.5.7)

0,90

272

Donde 𝑡1−𝛼

2,𝑛−1es el valor de t con n-1 grados de libertad y 𝑃 [𝑇 ≤ 𝑡1−

𝛼

2,𝑛−1] = 1 −

𝛼

2

Ejemplo 5.5.6: Un veterinario tomo una muestra al azar 15 perros de raza Labrador

dorado para estimar el consumo medio del alimento en un periodo de un mes,

calculando una media de 22,5 kg y una varianza de 35𝑘𝑔2, se pregunta ¿Cuál es el

intervalo de confianza al 95% para el verdadero consumo medio?. De acuerdo con

(5.5.7) la respuesta esta dad por el desarrollo de las siguientes operaciones:

�� = 22.5

𝑆2= 35

S= √35 = 5,916

IC= �� ± 𝑆

√𝑛 𝑡1−

𝛼

2,𝑛−1 = 22,5 ±

5,916

√14 2,160 = 22,5 ± 3,415

Este mismo intervalo de confianza expresado con una probabilidad, según la o indicado

en (5.5.7) es del siguiente modo:

𝑃 [22.5 − 5,916

√14 2,160 < 𝜇 < 22,5 +

5,916

√14 2,160 ] = 95 %

𝑃[19,085 < 𝜇 < 25,915] = 95%

En este caso se plantea que la probabilidad de que la verdadera media de consumo se

encuentra entre 19,085 y 25,915 kg es del 95%.

Ejemplo 5.5.7: En el caso del problema planteado en el Ejemplo 5.5.6, asumiendo que

no s posible tomar una muestra de más de 10 animales, con los que se calcula un

consumo de 19,7 kg y una varianza de 8 𝑘𝑔2, ¿Cuál es el intervalo de confianza de 95%

de confiabilidad?

El procedimiento para resolverlo es exactamente igual. Se dispone del valor medio y de

la varianza; con este último dato se calcula el error estándar que, en este caso, es de

0,2828; por lo tanto, el intervalo de confianza se calcula de la siguiente manera:

273

𝑃[19,7 − (0,2828)2,262 < 𝜇 < 19,7 + (0,2828)2,262 ] = 95%

𝑃[19,0603 < 𝜇 < 20,3396] = 95%

En este caso, se interpretaría este resultado como una probabilidad, cuyo significado es

que la verdadera media se encuentra entre 19,0603 y 20,3396, es decir, que en una serie

grande de muestreos sucesivos sobre la misma población, el valor medio calculado se

encontrara entre los límites indicados, en el 95% de las veces.

5.5.6 Intervalo de confianza para la diferencia de medias. Un problema se presenta

con frecuencia en inferencia estadística, es el que se refiere a la comparación entre dos

medias poblacionales.

Para completar las medias poblacionales está en dos muestras aleatorias independientes,

una de cada población, con tamaño 𝑛1 y 𝑛2 y la inferencia sobre µ1 - µ2 se basa en los

resultados muéstrales de Ŷ1 - Ŷ2.

Si las poblaciones de donde provienen las muestras son normales e independientes, con

varianzas 𝜎12 y 𝜎2

2 conocidas, las distribución muestral de (Ŷ1 - Ŷ2) es normal con

media (µ1 - µ2) y varianza 𝜎1

2

𝑛1 +

𝜎22

𝑛2. Por lo tanto, la variable aleatoria es normal estándar.

(Ŷ1 − Ŷ2) − (µ1 − µ2)

√𝜎1

2

𝑛1+

𝜎22

𝑛2

= 𝑍

(5.5.8)

Si 𝑛1 y 𝑛2 son grandes, la distribución de (Ŷ1 - Ŷ2) ser aproximadamente normal con

media

(µ1 - µ2) y varianza 𝜎1

2

𝑛1 +

𝜎22

𝑛2 , sin tener en cuenta las distribuciones de las poblaciones de

donde se extrajeron las muestras.

274

5.5.7 Intervalo de confianza para µ𝟏 - µ𝟐, con varianzas 𝝈𝟏𝟐 y 𝝈𝟐

𝟐 conocidas. Dadas

dos muestras aleatorias con tamaños 𝑛1 y 𝑛2 y con medias muestrales (Ŷ1 - Ŷ2)

respectivamente, procedentes de dos poblaciones normales e independientes, con

medias (µ1 - µ2) y varianzas conocidas 𝜎12 y 𝜎2

2 respectivamente, un intervalo de

confianza para (µ1 - µ2) al (1-α) 100% de confiabilidad viene dado por:

(Ŷ1 − Ŷ2) − 𝑍1−𝛼

2 √

𝜎12

𝑛1+

𝜎22

𝑛2< (µ1 − µ2) < (Ŷ1 - Ŷ2) + 𝑍1−

𝛼

2 √

𝜎12

𝑛1+

𝜎22

𝑛2

(5.5.9)

Donde 𝑍1−𝛼

2 es tal que 𝑃 [𝑍 < 𝑍1−

𝛼

2 ] = 1- α/2

Si las poblaciones no son normales, se obtiene un intervalo de confianza bastante

aceptable cuando 𝑛1 y 𝑛2 ≥ 30; además, es posible reemplazar 𝜎12 y 𝜎2

2 por 𝑆12 y 𝑆2

2

respectivamente.

Ejemplo 5.5.8: Un mejorador asegura que, gracias a su programa de selección genética,

ha obtenido un nuevo fenotipo de oreochromis aureus, cuyo rendimiento medio en peso

final comercial es superior al fenotipo estándar de la estándar de la misma especie. Se

sabe que las varianzas para cada una de las especies son 𝜎12= 0,012 y 𝜎2

2= 0,018. Se

tomó una muestra al azar de 90 ejemplares para cada uno de los grupos, calculando un

valor medio de Ŷ1= 0,523 kg y Ŷ2= 0,475. Se pregunta ¿Cuál es el intervalo de

confianza para la verdadera diferencia de medias entre el grupo mejorado y el grupo

estándar?

(0,523 − 0,475) − 1,96√0,012

90+

0,018

90< (µ1 − µ2) <(0,523 −

0,475)+1,96√0,012

90+

0,018

90

𝑃[0.048 − 1,96 (0,01825) < (µ1 − µ2) < 0.048 + 1,96 (0,01825) ]

𝑃[0,0122 < (µ1 − µ2) < 0,0837] = 95 %

275

Con una confiabilidad del 95 %, se asegura que la diferencia de las medias de los dos

grupos esta entre 0,0122 y 0,0837 kg.

Si 𝜎12 y 𝜎2

2 no se conocen, pero se pueden suponer iguales 𝜎12 = 𝜎2

2= 𝜎2 y las muestras

son pequeñas 𝑛1 y 𝑛2 < 30 y 𝜎12, se recurre a la distribución t.

Si el muestreo se lleva a cabo sobre poblaciones normales e independientes, con

varianzas iguales pero desconocidas 𝜎12 = 𝜎2

2= 𝜎2 , la variable aleatoria.

(Ŷ1 − Ŷ2) − (µ1 − µ2)

𝑆𝑃√1𝑛1

+ 1

𝑛2

= 𝑇

Se distribuye t con 𝑛1 + 𝑛2 – 2 grados de libertad. 𝑆𝑝2 Es un estimador combinado de la

varianza común 𝜎2 .

𝑆𝑝2 =

(𝑛1 − 1) 𝑆12+ (𝑛2 − 1)𝑆2

2

𝑛1 + 𝑛2 – 2

5.5.8 Intervalo de confianza para (µ𝟏 - µ𝟐) con muestras pequeñas y varianzas

iguales 𝝈𝟏𝟐 = 𝝈𝟐

𝟐 pero desconocidas. Dadas dos muestras aleatorias con tamaños 𝑛1 y

𝑛2 < 30 y medias muéstrales (Ŷ1 y Ŷ2) respectivamente, procedentes de dos poblaciones

normales e independientes con medias (µ1 y µ2) y varianzas desconocidas pero iguales

𝜎12 = 𝜎2

2 un intervalo de confianza para (µ1 - µ2) al (1-α) 100% de confiabilidad, viene

dado por:

(Ŷ1 − Ŷ2) − 𝑡1−𝛼

2,𝑣 𝑆𝑃 √

1

𝑛1+

1

𝑛2< (µ1 − µ2) < (Ŷ1 - Ŷ2) + 𝑡1−

𝛼

2 𝑆𝑃 √

1

𝑛1+

1

𝑛2

Donde 𝑡1−𝛼

2,𝑣es el valor de t con v= 𝑛1 + 𝑛2 − 2 grados de libertad y P[𝑇 ≤ 𝑡1−

𝛼

2,𝑣 =

1 −𝛼

2, 𝑆𝑝

2] Es un estimador combinado de la varianza común que se expresa como

276

𝑆𝑝2 =

(𝑛1 − 1) 𝑆12+ (𝑛2 − 1)𝑆2

2

𝑛1 + 𝑛2 – 2

El intervalo es bastante aceptable si las poblaciones de donde provienen las muestras

son aproximadamente normales.

Ejemplo 5.5.9: En una región con poca tradición en la ovina cultura se tomaron dos

muestras conformadas por 11 ejemplares machos, en dos fincas. En cada una de las

explotaciones se calcularon las respectivas medias y varianzas, para el variable peso a la

edad adulta, con los siguientes resultados:

Finca 1: 𝑛1 = 11

Ŷ1= 56,5 Kg

𝑆12= 146, 8 𝑘𝑔2

Finca 2: 𝑛2 = 11

Ŷ2= 57,8 Kg

𝑆22= 154, 2 𝑘𝑔2

Se pregunta, ¿Cuál es el intervalo de confianza para la diferencia de las dos medias?

Para responder este interrogante se aplica la expresión (5.5.12), donde será necesario

utilizar además (5.5.13) para obtener 𝑆𝑝2:

𝑆𝑝2 =

(11 − 1) 146,8+ (11 − 1)154,2

11 + 11 – 2= 150,5

𝑆𝑝= √𝑆𝑝2 = √150,5 = 12,27 𝐾𝑔

Como ya se dijo, el intervalo de confianza se calcula con (5.5.12):

-7,4 – 10,914 < (µ1 − µ2) < −7,4 + 10,914

277

-18,314 < (µ1 − µ2) < 3,514

Esto indica que (µ1 - µ2) puede tomar cualquier valor en (-18,314 a 3,514), y como cero

pertenece al intervalo, entonces (µ1 - µ2), es decir (µ1 - µ2), al 95 % de confiabilidad.

5.5.9 Intervalos de confianza para proporciones. Son útiles cuando se está interesado

en estimar la proporción de individuos de una población con una determinada

característica, como es el caso de establecer la proporción de animales vacunados contra

fiebre aftosa, que no se desarrollaron la enfermedad, las vacas positivas a cualquier

enfermedad los peces que sobreviven a una variación térmica brusca y en muchos

otros casos similares. Se debe recordar que p es la proporción de individuos poseedores

de cierta característica en una población de interés y un estimador de p es la proporción

muestral ��=𝑋

𝑛, donde X es el número de éxitos en n ensayos independientes, siempre y

cuando n sea grande y la variable sea aleatoria, entonces: es normal estándar.

�� − 𝑝

√𝑝(1 − 𝑝)𝑛

= 𝑍

5.5.9.1 intervalos de confianza para p con muestra grande. Sea �� la proporción

observada de éxitos en una muestra aleatoria de tamaño n, un intervalo de confianza

para p al (1-α) 100% de confiabilidad, viene dado por:

�� − 𝑍1−𝛼

2 √

𝑝(1−𝑝)

𝑛< 𝑝 < �� + 𝑍1−

𝛼

2 √

𝑝(1−𝑝)

𝑛

Donde 𝑍1−𝛼

2es tal que P[𝑍 ≤ 𝑧1−

𝛼

2] = 1 − 𝛼/2

El intervalo es confiable cuando n es grande y p y (1-p) no están demasiado cercanos a

1 o a 0. Generalmente se considera que estas condiciones se satisfacen si np y n (1-p)

son mayores que 5.

278

Ejemplo 5.5.10: en un estudio de prevalencia por muestreo, realizado con Colombia,

150 vacas de raza Guernesey resultaron positivas a brucelosis en un amuestra de 335

animales. ¿Cuál es el intervalo de confianza para la verdadera a proporción de animales

enfermos con un 1 –α= 0,95?

En primer lugar se debe calcular �� = 150

355= 0,42

Por lo tanto 1-p= q = 1- 0,42= 0,58

Para establecer el intervalo de confianza se aplica (5.5.15), por lo tanto:

0,42 − 1,96 √0,42(0,48)

355< 𝑝 < 0,42 + 1,96 √

0,42(0,48)

355

0,42 – 0,047 < p < 0,42 + 0,047

0,373 < p < 0,467

Por consiguiente, se puede asegurar que en la zona estudiada, la prevalencia se

encuentra entre 0,373 y 0,467. Estos valores, expresados en términos porcentuales

indican que las hembras positivas a brucelosis están entre 37,3 y 46,7%, afirmación que

se hace con el 95 % de confiabilidad.

5.5.9.2 tamaños de muestra para estimar p. El tamaño de muestra necesario para

estimar la proporción poblacional p a partir de la proporción muestral ��, con una

confiabilidad del (1-α) 100% y un error de estimación 𝔢 viene dado por:

n=𝑍

1−𝛼2

2 P(1−p)

𝑒2

Donde 𝑍1−∝/2 es el valor tabular de la normal estándar para un valor 1- α dado.

Z es la proporción de individuos con la característica de interés para el investigador. Α

es el error máximo admitido para la estimación del parámetro.

279

Como en el caso del tamaño de muestra para estimar la media, la confiabilidad 1-α y el

error de estimación 𝔢 son arbitrarios, y los fija el investigador dependiendo de los

alcances e implicaciones de sus resultados y conclusiones. Para proporciones, el error

máximo de estimación 𝔢 es una medida que indica la distancia entre la estimación y el

verdadero valor de la proporción |�� − 𝑝|.

Cuando p no se conoce, asume que p= 0,5 y de esta manera se obtendrá el máximo

valor de n.

Este valor proporciona el máximo tamaño muestral.

Si el tamaño de la población es relativamente pequeño y n > 0,05N, se puede utilizar el

factor de corrección para poblaciones finitas:

𝑛1 =𝑛

1 + 𝑛𝑁

Ejemplo 5.5.11: Un médico veterinario debe establecer la prevalencia de la neumonía

en zootica en una población de cerdos. Los registros de una entidad oficial indican que

total existen 2800 animales. Se asumen que la enfermedad ataca por igual a machos y

hembras de cualquier edad. No existe información previa sobre la proporción de

animales enfermos (��). La profesional pregunta: ¿Cuál es el tamaño de muestra para

estimar la prevalencia de la enfermedad, con una confiabilidad del 95 % y un error de

estimación del 5 %?

En primer lugar debe aplicarse (5.5.16), con p= 0,5 y α= 0,05:

n=𝑍

1−𝛼2

2 P(1−p)

𝑒2 = 1,962(0,5)(0,5)

0,052 = 0,9604

0,0025= 384,16

Debido a que no es posible muestrear fracciones de animales, es necesario aproximar el

tamaño de muestra requerido a 385 cerdos que se escogerán irrestrictamente al azar, lo

que indica que todos los individuos tienen la misma probabilidad de ser elegidos y

formar parte de la muestra.

280

Por otra parte, N x 0,05= 2800 x 0.05= 140 y n=384; estas cifras indican que el tamaño

inicial de muestra n es mayor que N (0,05); por lo tanto es necesario hacer la corrección

por tamaño finito, aplicando (5.5.17):

𝑛1(𝑡𝑎𝑚𝑎ñ𝑜 𝑓𝑖𝑛𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎) = 384

1 + 384

2800

= 384

113714= 337,69

En consecuencia, el veterinario deberá muestrear 338 animales.

Ejemplo 5.5.12: Con los mismos datos del Ejemplo 5.5.11, pero asumiendo que se

conoce un dato de prevalencia esperada del 20%, ¿Cuál será el tamaño de la muestra?

𝑛 =1,962(0,2)(0,8)

0,052 = 0,614656

0,0025= 245,86

𝑛1(𝑡𝑎𝑚𝑎ñ𝑜 𝑓𝑖𝑛𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎) = 246

1 + 246

2800

= 246

10878= 226,13

En este caso, la cantidad de animales a muestrear es 226

Ejemplo 5.5.13: Con los mismos datos del Ejemplo 5.5.12, pero con una confiabilidad

del 90% y error de estimación del 10%, ¿Cuál será el tamaño de la muestra?

𝑛 =1,642(0,2)(0,8)

0,12 =

0,430336

0,01= 43,034

5.5.9.3 Estimación de la diferencia entre dos proporciones. Muchas veces el

investigador está interesado en comparar dos proporciones provenientes de dos

poblaciones independientes, para establecer si estadísticamente son iguales o diferentes.

281

Así en el caso de probar la eficacia de dos tratamientos para el control de la saprolegnia

en truchas, cuando se utiliza yodo o azul de metileno, el interés se centra en estimar la

diferencia entre las proporciones de animales curados en cada uno de los tratamientos.

Para cumplir este objetivo se seleccionan dos muestras aleatorias independientes, de

tamaño 𝑛1 y 𝑛2` a partir de dos poblaciones binomiales, ya que los resultados son que

el animal se cure o no la enfermedad.

Un estimador 𝑃1 - 𝑃2 está dado por ��1 - ��2 DONDE ��1 =𝑋1

𝑛1 es la proporción muestral de

individuos que poseen la característica de interés en la primera población y ��2 =𝑋2

𝑛2 es la

proporción muestral en la segunda población.

Para muestras grandes 𝑛1 y 𝑛2` la distribución de ��1 - ��2 se aproxima a la normal, con

media 𝑃1 - 𝑃2 y varianza ��1(1−��1)

𝑛1 +

��2(1−��2)

𝑛2 es decir,

(𝑃1−𝑃2 )− (𝑃1−𝑃2)

√��1(1−��1)

𝑛1 +

��2(1−��2)

𝑛2

= 𝑍 (5.5.18)

5.5.9.4 Intervalo de confianza entre dos proporciones 𝑷𝟏 - 𝑷𝟐 con muestras

grandes. Sea ��1 la proporción de éxitos observados en un amuestra aleatoria de tamaño

𝑛1 procedente de una población con proporción de éxitos 𝑃1′ y sea ��2 la proporción de

éxitos observados de una muestra aleatoria independiente, de tamaño 𝑛2` procedente

de una población con proporción de éxitos 𝑃2 . Si los tamaños de muestras 𝑛1 y 𝑛2 son

grandes, un intervalo de confianza para 𝑃1 - 𝑃2 al (1-α) 100% de confiabilidad, viene

dado por:

(𝑃1 − 𝑃2 ) − 𝑍1−𝛼

2,√(

��1(1−��1)

𝑛1 +

��2(1−��2)

𝑛2 ) < (𝑃1 − 𝑃2) < (𝑃1 − 𝑃2 )+𝑍1−

𝛼

2,

√(��1(1−��1)

𝑛1 +

��2(1−��2)

𝑛2 )

1

𝑛2

282

(5.5.19)

Ejemplo 5.5.14: Un ingeniero en producción Acuícola utilizo dos tratamientos para el

control de la aspergillosis en molinesias, uno con sal marina y otro con formaldehido.

Para este propósito distribuyo los tratamientos en cinco acuarios, cada uno con 50

ejemplares afectados, es decir, en total fueron tratados 250 animales en cada grupo. Al

final del experimento se constató que la sal marina curo 96 peces y el formaldehido 103.

¿Cuál es el intervalo de confianza para la verdadera diferencia de las proporciones de

animales curados en cada tratamiento con confiabilidad del 95%?

En el primer lugar se calculan las proporciones de éxito en cada tratamiento, así:

��1=

96250

=0,384

��2=

103250

=0,412

De acuerdo con (5.5.19):

(0,384 − 0,412) − 1,96√(0,384(0,616)

250 +

0,412(0,588)

250 ) < (𝑃1 − 𝑃2) < (0,384 −

0,412)+1,96√(0,384(0,616)

250 +

0,412(0,588)

250)

-0,028 – 1,96(0,04376) < (𝑃1 − 𝑃2) < −0,028 + 1,96 (0,04376)

-0,1137696 < (𝑃1 − 𝑃2) < 0,0577696

5.5.10 Intervalos de confianza para la varianza. Es necesario recordar que si 𝑆2 =

⅀(𝑋1−𝑋) 2

𝑛−1 es la varianza de una muestra aleatoria de tamaño n, procedente de una

población normal con varianza 𝜎2, entonces, la distribución de muestreo (n-1)𝑆2

𝜎2 es chi-

cuadrado, con (n-1) grados de libertad.

283

5.5.10.1 Intervalo de confianza para 𝝈𝟐. Si 𝑆2es la varianza de un amuestra aleatoria

de una población normal con media µ y varianza 𝜎2, un intervalo de confianza para

𝜎2al (1-α) 100% de confiabilidad viene dado por:

(𝑛 − 1)𝑆2

𝑋𝛼2,𝑛−1

2 < 𝜎2 < (𝑛 − 1)𝑆2

𝑋𝛼2,𝑛−1

2

Ejemplo 5.5.15: Con el fin de establecer un programa de producción piscícola con

Oreochromis sp, se midió el caudal de una fuente de agua durante un periodo de seis

meses, tomando una muestra semanal. Al final del periodo se estimó una varianza de

42𝐿2/𝑠𝑒𝑔. ¿Cuál es el intervalo de confianza para la varianza, con una confiabilidad del

95%?

Teniendo en cuenta que se tomaron 24 muestras, de acuerdo con (5.5.20):

(24 − 1)142

11,69 < 𝜎2 <

(24 − 1)142

38,08

42 – 27,44 < 𝜎2 < 42 + 27,44

14,56 < 𝜎2 < 69,44

Con el 95 % de confianza, el intervalo para la varianza esta entre 14,56 y 69,44 𝐿2

𝑠𝑒𝑔.

5.5.10.2 Intervalo de confianza para el cociente de dos varianzas. Muchas veces

surge la necesidad de comparar la variabilidad de dos procesos distintos, es decir, se

está interesado en comparar 𝜎12 y 𝜎2

2. Una manera de hacerlo es obtener su cociente 𝜎12

/ 𝜎22entonces, si las dos varianzas son iguales, dicho cociente será igual a 1.

Para la construcción de un intervalo de confianza para 𝜎12 /𝜎2

2es necesario

introducir la distribución F, donde, si 𝑆12 y 𝑆2

2 son las varianzas aleatorias

independientes de tamaños 𝑛1 y 𝑛2′ procedentes de dos poblaciones normales

284

con varianzas 𝜎12 y 𝜎2

2, respectivamente, se tiene una variable aleatoria F, tal

que:

𝑆12

𝜎12

𝑆22

𝜎22

= 𝐹

Sigue una distribución F con (𝑛1 − 1) grados de libertad en el numerador y (𝑛2 − 1)

grados de libertad en el denominador.

Figura 5.5.3 Distribución de F

𝐸[𝐹𝑣1,𝑣2] = 𝑣2

𝑣2 − 2 , 𝑣2 > 4

𝑉[𝐹𝑣1,𝑣2] = 𝑣2

2 (2𝑣2 + 2𝑣1 − 4)

𝑣1(𝑣2 − 2 )2 ( 𝑣2 − 4) , 𝑣2 > 4

285

En la tabla 7 del Apéndice se muestran los valores 𝐹1−∝,𝑉1,𝑉2′ tales que:

P ( F ≤ 𝑓1−∝,𝑉1,𝑉2) = 1 − 𝛼

𝑓1−∝,𝑉1,𝑉2′

Ejemplo 5.5.16: calcular P[𝐹 ≤ 𝑓0,90,5,10]

En la tabla 7 del Apéndice, para 1-α= 0, 90,5 grados de libertad en el numerador y 10

grados de libertad en el denominador, se encuentra que 𝑓0,90,5,10= 2,52, por lo tanto

P[𝐹 ≤ 2,52]= 0,90.

2,52

En la tabla se encuentran valores para α < 0,5. Si se desea para α > 0,5, se aprovecha la

siguiente propiedad:

1 -α

0,90

286

𝑓∝,𝑉1,𝑉2 = 1

𝑓∝,𝑉1,𝑉2

En el siguiente caso:

P[𝐹 ≤ 𝑓0,10,10,5] =P[𝐹 ≤ 1

𝑓0,9,5,10]= P[𝐹 ≤

1

2,52]= P [𝐹 ≤ 0,3968] = 0,10

Los anteriores conceptos sirven como base para calcular el Intervalo de confianza para

el cociente de dos varianzas 𝜎12 /𝜎2

2. Cuando 𝑆12 y 𝑆2

2con las varianzas de dos muestras

aleatorias independientes de tamaños 𝑛12y 𝑛2respectivamente, procedentes de dos

poblaciones normales con varianzas 𝜎12 y 𝜎2

2, respectivamente, un intervalo de

confianza para 𝜎12 /𝜎2

2, al (1-α) x 100% de confiabilidad, viene dado por:

𝑆12

𝑆22 𝑋

1

[𝑓1−

𝛼2

;𝑣2;𝑣1]

< 𝜎1

2

𝜎22 <

𝑆12

𝑆22 𝑥 𝑓

1−𝛼2

;𝑣2;𝑣1

Donde 𝑓1−∝/2,𝑉1,𝑉2 Es un valor f con 𝑣1= 𝑛1- 1 y 𝑣2= 𝑛2 – 1 grados de libertad que

P[𝐹 ≤ 𝑓1−𝛼/2]= 1-α/2.

Ejemplo 5.5.17: En una población de Cavia porcellus, se estimó la varianza para el

peso al destete en 64,49 𝑔2, medida sobre 25 individuos de una línea mejorada y en otra

población, con 31 individuos, la varianza fue de 61,72 𝑔2. Se pide calcular el intervalo

de confianza para el cociente de varianzas, con 1-α= 0,90.

1 - α = 0,90

1 - 𝛼 2⁄ = 0,95

𝑓1−∝/2,24,30 = 1,89

𝑓1−∝/2,30,24 = 1,94

De acuerdo con (5.5.22) se tiene:

287

64,49

61,72 𝑋

1

1,94<

𝜎12

𝜎22 <

64,49

61,72 𝑥 1,89 = 0,5386 <

𝜎12

𝜎22 < 1,9784

De acuerdo con los resultados, el intervalo de confianza para el cociente de las dos

varianzas esta entre 0,5389 y 1,9748, con un 95 % de confiabilidad. Como 1 está en el

intervalo se puede afirmar que las os varianzas son iguales.

288

CAPÍTULO 6

Prueba de hipótesis

En el capítulo anterior se analizó la estimación puntual y por intervalo de un parámetro.

En este capítulo se considera otro enfoque de la inferencia estadística que se refiere a la

toma de decisiones sobre las poblaciones basada en el análisis de una muestra. Los dos

conceptos se fundamentan en la evidencia experimental que se obtiene a través de un

muestreo aleatorio. Muchas de estas decisiones tienen que ver con aceptar o rechazar

una afirmación sobre un parámetro o sobre la forma de la distribución de la población

de interés, las cuales se denominan hipótesis estadísticas y al procedimiento mediante el

cual se toma la decisión sobre la hipótesis se lo conoce como prueba o contraste de

hipótesis.

Ejemplos 6.0.1: Un procesador de leche afirma que el producto de su empresa contiene

en promedio 0.36 kilogramos de grasa por litro. Para verificar esta afirmación se toma

una muestra aleatoria de la leche procesada en la planta y se determina la cantidad de

grasa por litro, para luego generalizar este resultado muestral a toda la población, en

este caso, a toda la leche procesada en la planta.

Ejemplo 6.0.2: Un profesional tiene que definir, sobre la base de experimentos, la

efectividad del yodo y el azul de metileno en el control de saprolegnia en trucha arco

iris. Los animales afectados por el hongo se dividen en dos grupos al azar: el uno es

tratado con yodo y el otro con azul de metileno. Al terminar el ensayo es posible

establecer la proporción de animales curados en cada grupo y, mediante la prueba de

hipótesis, determinar si existen diferencias significativas entre dichas proporciones.

Para abordar este tema con mayor claridad es necesario recurrir a ciertas definiciones

como son: hipótesis nula, hipótesis alterna, región crítica, errores tipo I y tipo II, nivel

de significancia y potencia de la prueba.

289

En primer lugar se debe tener en cuenta que en el análisis de este tipo de problemas se

consideran dos clases de hipótesis estadísticas: la hipótesis nula (H0) y la hipótesis

alterna (H1).

La hipótesis nula es una afirmación o explicación tentativa sobre un fenómeno

particular, la cual debe ser comprobada. El rechazo de una hipótesis nula conduce a la

formulación de una hipótesis alternativa. Generalmente la hipótesis alternativa coincide

con la hipótesis planteada por el investigador y la hipótesis nula es la negación de la

hipótesis alternativa., de este modo, uno de los propósitos de todo experimento es decir

si la prueba de campo o laboratorio tiende a refutar o a apoyar la hipótesis nula,

aclarando que “rechazar una hipótesis significa concluir que es falsa”, mientras que

“aceptar una hipótesis significa no tener suficiente evidencia para rechazarla”.

En la mayoría de los casos es deseable que una hipótesis nula, referida a un parámetro

de la población, sea planteada de tal manera que se especifique un valor exacto del

parámetro, mientras que la hipótesis alternativa permite la posibilidad de contrastar

varios valores.

El en Ejemplo 6.0.1, la hipótesis nula sería:

H0: El contenido promedio de grasa por litro es de 0.36kg.

H0: µ=0.36

La hipótesis alternativa podría ser una de las siguientes:

H1: El contenido promedio de grasa por litro es mayor que 0.36 kg.

H1: El contenido promedio de grasa por litro es menor que 0.36 kg.

H1: El contenido promedio de grasa por litro es diferente de 0.36 kg.

Las hipótesis nula y alternativa podrían ser escritas como:

H0: µ=0.36

H1: µ>0.36

290

H0: µ=0.36

H1: µ<0.36

H0: µ=0.36

H1: µ≠0.36

Para el Ejemplo 6.0.2 la hipótesis nula se plantea como:

H0: La proporción de truchas curadas al recibir el tratamiento con yodo, es igual a la

proporción de truchas curadas al recibir un tratamiento con azul de metileno.

H0: Py= Pa

De la misma forma que en el caso anterior, las hipótesis nula y alternativa se podrían

plantear como:

H0: Py=Pa

H1: Py>Pa

H0: Py=Pa

H1: Py<Pa

H0: Py=Pa

H1: Py≠Pa

Después de platear las hipótesis nulas y alternativa y de recoger información muestral,

debe tomarse una decisión sobre la hipótesis nula. Las dos posibles decisiones respecto

a H0 son aceptarla o rechazarla y al tomar una de estas decisiones se pueden cometer

dos tipos de error.

291

El primero o error tipo I, consiste en rechazar H0, cuando en realidad ésta es verdadera.

El otro tipo de error es el denominado error tipo II que consiste en aceptar H0 cuando

en realidad ésta es falsa.

En la Tabla 6.0.1 se pueden apreciar los estados de la naturaleza y las decisiones sobre

la hipótesis nula.

Tabla 6.0.1 Estados de la naturaleza y decisiones sobre la hipótesis nula.

Decisiones sobre H0

Estados de la naturaleza

H0 es verdadera H0 es falsa

Aceptar H0 Decisión correcta Error tipo II

Rechazar H0 Error tipo I Decisión correcta

Como se mencionó anteriormente, la decisión de aceptar o rechazar una hipótesis

estadística se basa en una muestra, es decir es un proceso inferencial en el cual siempre

existirán riesgos de tomar una decisión falta, los que se expresan en términos

probabilísticos. Así, la probabilidad de rechazar H0, cuando Ho es verdadera, se define

como la probabilidad del error tipo I y se denota por α, donde 0≤α≤1.

P (rechazar H0/H0 es verdadera)=a

La probabilidad de aceptar H0, cuando Ho es falsa, se define como la probabilidad del

error tipo II y se denota por β, donde 0≤β≤1.

P (aceptar H0/H0 es falsa)=β

El valor que toma α se denomina nivel de significancia y entre más grande sea α mayor

será la probabilidad de rechazar H0 equivocadamente, es decir, existe mayor

probabilidad de cometer error tipo I.

Al verificar una prueba de hipótesis es difícil establecer la gravedad de los errores tipo I

y II, además, para un tamaño de muestra dado, una disminución del tamaño del error

292

tipo I o α, implica un aumento en el tamaño del error tipo II ό β, consiste en realizar

técnicamente el muestreo y utilizar el máximo tamaño de muestra.

En la práctica, lo que comúnmente se hace es fijar el máximo tamaño del error tipo I,

que puede tolerarse en una situación dada a criterio del investigador, dependiendo de los

alcances y de la gravedad de las recomendaciones., por ejemplo, si se trata de lanzar al

mercado un nuevo producto que potencialmente afecte la salud de los humanos, el valor

de α debe ser lo más pequeño posible. En la mayoría de los trabajos de investigación,

incluidos los de salud y producción animal, α oscila entre 1 y 5%.

Cuando se escoge un nivel de significancia α y se rechaza una hipótesis nula, se dice

que los resultados de la muestra son significativos al α*100%.

En revistas técnicas y libros especializados se utiliza el valor p para representar el

mínimo nivel de significancia α que permite, con los datos analizados, rechazar la

hipótesis nula. Por ejemplo, si en un ensayo de fertilización del Brachiaria decumbens,

se reporta que el rendimiento de materia verde por hectárea con dos niveles de fósforo,

no presento diferencias significativas, se reportará como (p>0.5); si por el contrario se

observaron diferencias estadísticas significativas en las medias de los rendimientos se

reportará como (p≤0.05).

6.1 REGIÓN CRÍTICA O REGIÓN DE RECHAZO

Como se mencionó anteriormente, al plantear una hipótesis el procedimiento mediante

el cual se toma la decisión de aceptarla o rechazarla es la prueba o contraste de

hipótesis., dicha decisión se basa en un estadístico de prueba definido como una

cantidad numérica calcula con la información obtenida de una muestra, teniendo en

cuenta el parámetro sobre el cual se hace la inferencia y la distribución muestral de los

estadístico correspondiente.

La hipótesis nula se rechaza para ciertos valores del estadístico de prueba, tales valores

constituyen lo que se conoce como región crítica o región de rechazo de la prueba., al

complemento se lo denomina zona de no rechazo o zona de aceptación.

293

Ejemplo 6.1.1 En el Ejemplo 6.0.1 el procesador de leche Afirma que su producto tiene

un contenido promedio de grasa por litro de 0.36 kg.

H0: µ=0.36

Para un tamaño de muestra dado, supóngase que se decide rechazar H0 si se obtiene un

promedio muestral Y‾ menor que 0.34.

En este ejemplo, Y‾ =0.34 es el valor crítico y el conjunto de valores menores que 0.34

constituyen la región crítica o región de rechazo de la prueba.

Para mostrarlo gráficamente se supone que el contenido de grasa por litro se distribuye

aproximadamente como una normal o que n es lo suficientemente grande, de tal manera

que la distribución de muestreo Y‾ se aproxime a una distribución normal.

En la Figura 6.1.1 se observa que la región crítica es la parte sombreada a la izquierda

del punto crítico y la región situada a la derecha de dicho punto es la región de

aceptación o no rechazo de H0. El área de la región crítica está dada por α que

constituye, como se ha indicado, el nivel de significancia de la prueba, es decir,

P [rechazar H0|µ=0.36]=α.

Por ejemplo, si α=0.05, entonces el tamaño de la región crítica es el 5.0% del área total

comprendida bajo la curva normal y P [Y‾<0.34|µ=0.36]=0.05 significa que hay

aproximadamente cinco ocasiones en 100 en que se rechazaría la hipótesis cuando en

realidad debería ser aceptada, es decir, que la confiabilidad es del 95% para tomar una

decisión adecuada. En este caso, se dice que la hipótesis ha sido rechazada al nivel de

significancia del 5.0%.

294

Figura 6.1.1 Regiones de aceptación y de rechazo de la hipótesis nula en

una distribución normal.

6.2 HIPÓTESIS UNILATERALES Y BILATERALES

En algunos problemas de pruebas de hipótesis se involucran hipótesis alternativas

unilaterales, también conocidas como pruebas de hipótesis a una cola, tal como se

indican a continuación:

H:0 θ=θ0 ό H0: θ=θ0

H1: θ>θ0 H1: θ<θ0

Se dice que H1 es una hipótesis alternativa unilateral, debido a que los posibles valores

de θ bajo a H1 se encuentran a un solo lado del valor propuesto bajo H0.

Si H1: θ> θ0, la región crítica se encuentra en la cola superior de la distribución del

estadístico de prueba mientras que si H1: θ< θ0, la región critica se encuentra en la cola

inferior de la distribución del estadístico de prueba. En cierto sentido, el símbolo de

desigualdad señala la dirección en la que se ubica la región crítica.

A una prueba de la forma.

H0: θ= θ0

295

H1: θ≠ θ0

Se la denomina prueba bilateral o de dos colas puesto que la región crítica está dividida

en dos partes iguales ubicadas en cada cola de la distribución del estadístico de prueba.

La hipótesis alterna H1: θ≠ θ0 implica que puedan presentarse dos situaciones, ya sea que

θ> θ0 ό que θ0.

Al realizar un procedimiento para probar hipótesis, la hipótesis nula siempre se plantea

como una igualdad, de tal manera que se especifica un solo valor para poder controlar la

probabilidad de error tipo I, mientras que la hipótesis alternativa puede ser unilateral o

bilateral, dependiendo del interés del investigador.

Resumiendo, una prueba o contraste de hipótesis consta, esquemáticamente, de los

siguientes pasos:

a) Identificación del parámetro de interés.

b) Planteamiento de la hipótesis nula y alternativa (H0 y H1).

c) Elección del nivel de significancia.

d) Definición del estadístico de prueba.

e) Establecimiento de las regiones de aceptación y de rechazo para el estadístico.

f) Cálculo del valor del estadístico de prueba a partir de una muestra aleatoria.

g) Decisión sobre el rechazo o aceptación de la hipótesis, dependiendo si el

estadístico de prueba se ubica en la región de rechazo o en la de aceptación.

6.3 CONTRASTES RELACIONADOS CON LA MEDIA µ

El objetivo fundamental de estas pruebas consiste en establecer si una media

poblacional µ es igual o diferente de cierto valor supuesto µ0, para lo cual se contrasta

una de las siguientes hipótesis respecto al parámetro µ:

H0:µ=µ0 H0:µ=µ0 H0:µ=µ0

H1:µ≠µ0 H1:µ>µ0 H1:µ<µ0

296

Los contrastes con respecto a µ varían en su procedimiento, dependiendo

fundamentalmente del conocimiento de σ2, en consecuencia, se pueden presentar las

situaciones que se describen a continuación.

6.3.1 Contraste de hipótesis para la media poblacional µ con varianza poblacional σ2

conocida. Sea Y‾ la media de una muestra aleatoria de tamaño n, procedente de una

población normal, con media µ y varianza σ2 conocida.

En este caso se pueden contrastar las siguientes hipótesis:

H0:µ=µ0

H1:µ≠µ0

Donde µo es un valor específico.

El contraste sobre la media poblacional tiene como estadístico de prueba la media

muestral Y‾, que por lo general se estandariza para utilizar un estadístico de prueba

basado en la distribución normal estándar. Bajo H0: µ = µ0 y por lo tanto la media

muestral Y‾ tiene una distribución normal con media µ0 y desviación estándar 𝛔

√𝒏 ; esto

es, la variable aleatoria.

𝑍Y‾ − µ0

σ/√𝒏

Donde (6.3.1) corresponde a una variable normal estándar.

La hipótesis nula H0:µ=µ0 se rechaza si la media muestral Y‾ es mayor o menor que el

valor postulado µ0 para la media poblacional µ. Por lo tanto, o se rechaza si se observa

un valor alto o un valor bajo para el estadístico de prueba (6.3.1).

Si α es la probabilidad de rechazar H0, cuando H0 es verdadera, la probabilidad de que Z

este ubicada en la región Z>Z1-α/2 o Z<Zα/2 es α.

Por lo tanto H0 se rechaza si: Z> Z1-α/2 ό z< Zα/2, donde Zα/2 y Z1-α/2 son los valores

cuantiles de la normal estándar.

297

Ejemplo 6.3.1: Un grupo investigador asegura que, mediante cruzamientos, ha logrado

obtener un híbrido de conejo, cuyo rendimiento promedio en canal es de 2.28 kg. Por

experiencia se sabe que σ=0.65kg. Un productor está interesado en adquirir ejemplares

del mencionado híbrido y para ello solicita a un profesional pecuario, un estudio que

confirme si efectivamente se alcanza el rendimiento indicado. El profesional toma una

muestra aleatoria de 25 animales y calcula un rendimiento promedio de 2.02kg. Con

base en esta información y utilizando un nivel de significancia de α=0.05, ¿se puede

afirmar que el rendimiento promedio es el indicado por los investigadores?

Siguiendo el esquema planteado en el numeral 6.2, para resolver este interrogante se

procede del siguiente modo:

a) El parámetro de interés es la media poblacional µ.

b) Las hipótesis nula y alternativa son:

H0:µ=2.28

H1:µ≠2.28

En este caso, la hipótesis alterna es bilateral, ya que se desea rechazar la H0 si la media

es significativamente mayor o menor que 2.28.

c) Se define α=0.05.

d) El estadístico de prueba es Y‾−μ0

σ/√𝒏𝑍

e) H0 se rechaza si: Z> Z1-α/2 = Z0.975=1.96 ό

Z<Zα/2 =Z0.025=-1.96

298

f) El valor del estadístico de prueba es:2.02−2.28

0.65/√25= −2

g) Decisión: Dado que Z=-2<-1.96, es decir, Z=-2 se ubica en la zona de

rechazo, por lo tanto H0: µ=2.28 debe rechazarse.

Para informar sobre los resultados de la prueba puede recurrirse a una explicación

planteada de la siguiente manera: con un nivel de significancia del 5% se asegura que el

rendimiento promedio en canal de los híbridos de conejo es diferente de 2.28kg.

En realidad, los datos proporcionan evidencia suficiente para asegurar que existe un

rendimiento promedio menor de 2.28kg, tal como se puede apreciar en la figura

siguiente, donde se observa que el valor crítico cae en la región donde se encuentran

valores negativos:

Por otra parte, es necesario recordar que el valor p es el mínimo nivel de significancia α,

para el cual los datos observados indiquen la necesidad de rechazar la hipótesis nula. En

este caso, el mínimo valor α con el cual se rechaza la hipótesis H0: µ=2.28kg, viene

dado por la probabilidad de encontrar un Z< -2, es decir, P(Z<-2)=0.0228; como el

contraste es a dos colas α/2=0.0228, por lo tanto, α=0.0456. Esto significa que si la

hipótesis nula fuera cierta, la probabilidad de encontrar una media muestral alejada de

2.28kg es 0.0456.

6.3.2 Relación entre contraste de hipótesis en intervalo de confianza. Para las

hipótesis H0:µ=µ0 y H1: µ≠ µ0, los puntos críticos son:

𝑎 = µ0 − Z1−α/2𝜎

√𝑛 y

299

𝑏 = µ0 + Z1−α/2

𝜎

√𝑛

H0 se rechaza si Y‾<a o Y‾>b, es decir, H0: µ= µ0 frente a la alternativa H1:µ≠µ0 se

rechaza si en el intervalo de confianza para µ al (1-α) 100% de confiabilidad no

contiene el valor µ0.

Considerando ahora el contraste H0:µ=µ0, H1:µ>µ0, la hipótesis nula H0:µ=µ0 se rechaza

si la media muestral Y‾ es mayor que el valor postulado µ0 para la media poblacional µ.

Por lo tanto, H0 se rechaza si se observa un valor mayor para el estadístico de prueba.

𝑍 =Y‾µ0

𝜎/√𝑛

Es decir, si α es el nivel de significancia, H0 se rechaza si Z>Z1-α.

Donde Z1-α es tal que P[Z>Z1-α]=α

Para la hipótesis planteada, el punto crítico es 𝑏 = µ0 + 𝑍1−𝛼𝜎

√𝑛 y por lo tanto H0 se

rechaza si la media muestral Y‾> µ0+ Z1-α 𝜎

𝑛

300

De la misma forma, para contrastar H0:µ=µ0, H1:µ<µ0

H0 se rechaza si se observa un valor menor para el estadístico de prueba

𝑍 =Y‾ − µ0

𝜎√𝑛⁄

Si α es el nivel de significancia, H0 se rechaza si Z<Zα.

Donde P [Z<Zα]=α

De manera equivalente H0 se rechaza si Y‾ < µ0 + 𝑍1−𝛼𝜎

√𝑛

En el Ejemplo 6.3.1 se dijo que existe una fuerte evidencia de que el rendimiento

promedio en canal de los híbridos de conejo es menor que 2.28kg, dado que el valor

crítico se ubicó en la región de la curva con valores negativos.

Para afianzar esa afirmación se debe contrastar la hipótesis:

H0:µ=2.28

H1:µ<2.28

301

Siguiendo el esquema planteado en el numeral 6.2, se tiene:

a) El parámetro de interés es la media poblacional µ.

b) Las hipótesis son:

H0:µ=2.28

H1:µ<2.28

c) α=0.05

d) el estadístico de prueba es: 𝑍 =Y‾−μ0𝜎

√𝑛⁄

e) H0 se rechaza si Z< Zα=Z0.05=-1.65

f) El valor de este estadístico de prueba es:

2.02 − 2.28

0.65/√25− 2

g) Dado que Z=-2<Z0.05=-1.65, como se muestra en la siguiente figura, H0 se

rechaza, es decir, con un nivel de significancia de 5% se concluye que el

rendimiento promedio en canal de los conejos híbridos es menor de 2.28kg.

Es importante que, por lo general, cuando se hacen pruebas de hipótesis relacionadas

con variables productivas, se asume que la variable sigue una distribución normal y, si

bien, esta afirmación es confirmada por múltiples trabajos de investigación, es

conveniente analizar los datos de cada caso particular para confirmar la normalidad de

las variables analizadas. En caso de encontrarse una desviación marcada de la

normalidad en los datos, los procedimientos indicados para las pruebas de hipótesis no

serían los más adecuados.

302

6.3.3 Contraste de hipótesis para la media poblacional µ con muestras grandes (n≥30)

y varianza σ2 desconocida. En la mayoría de situaciones prácticas no se conoce σ2, pero

por lo general, si el tamaño de muestra es grande (n≥30), el teorema central del límite

permite concluir que la distribución de la media muestral es aproximadamente normal y,

por lo tanto, se pueden utilizar los mismos procedimientos de contraste desarrollados

para el caso en que σ2 es conocida, para lo cual se debe sustituir σ2 por S2.

Ejemplo 6.3.2: Un investigador asegura que un rebaño selecto de vacas Holstein, cuyo

promedio de producción es 34L/día, podría llegar a producir 41L/día siempre y cuando

se incorpore en la dieta proteínas de origen animal y vitaminas liposolubles, en las

cantidades que él sugiere. Con una muestra aleatoria de 50 vacas, sometidas a una dieta

como la indicada, se calculó un promedio de producción de 39 L, con una desviación

estándar de 6,0 litros. Se pregunta ¿existen razones suficientes para creer que el

promedio producción es menos de 41 L? Esta pregunta se puede responder

desarrollando el procedimiento para prueba de hipótesis. Como ợ2 es desconocida y el

tamaño de muestra es mayor de 30, se aplica el mismo proceso general, así:

a) El parámetro de interés es la media µ.

b) Ho: µ= 41

Ho: µ < 41

c) ∝= 0,05

d) El estadístico de prueba es ��− μ0

𝜎/√𝑛= 𝑍, donde ợ≅ 𝑆

e) Ho se rechaza si Z < 𝑍∝ = 𝑍0,05 = −1,65

f) El valor del estadístico de prueba es: 39−42

6 /√50= −2,36

g) Decisión: Dado queZ = −2,36 < −1,65, como se muestra en la figura

siguiente:

303

-2,36 -1,65

Ho se rechaza y, por lo tanto, se concluye que el promedio de producción de las vacas

que se sometieron a dicha dieta es menor que 41 L, afirmación que se hace con un nivel

de significancia del 5%.

6.3.4 Contraste de hipótesis para la media poblacional µ con muestras pequeñas (µ

<30) y ớ2 desconocida. Sean 𝑌 y S la media y la desviación estándar, respectivamente,

de una muestra aleatoria de tamaño n, procedente de una población normal, con media

µ y varianza ớ2 desconocida, el contraste de hipótesis bilateral:

Ho: µ= µ0

Ho: µ ≠µ0

𝑇 = �� − µ0

𝑆

√𝑛

El cual tiene una distribución t con n-1 grados de libertad. Usando el mismo

procedimiento general de prueba de hipótesis anteriormente indicado, Ho se rechaza así:

𝑇 > 𝑡1− ∝/(2,𝑛−1)

𝑇 < 𝑡∝/(2,𝑛−1)

Para el contraste de hipótesis:

304

Ho: µ=µ0

Ho: µ > µ0

Ho se rechaza si 𝑇 > 𝑡1−∝,𝑛−1

Para el contraste de hipótesis:

Ho: µ=µ0

Ho: µ < µ0

Ho se rechaza si 𝑇 < 𝑡𝜇,𝑛−1

6.6.3: Una compañía dedicada a la comercialización de camarón congelado, imprime las

etiquetas de las bandejas “contiene 12 oz”. Con una muestra de 22 bandejas se calculó

una media de ��= 11,84 onzas y una desviación estándar (S) de 0,5 onzas. Si se supone

que los pesos de las bandejas siguen en forma adecuada una distribución normal, con un

nivel de significancia del 5,0% ¿aseguraría que la afirmación del productor es correcta?.

Al igual que en los ejemplos anteriores, debe seguirse el procedimiento general de

prueba de hipótesis:

a) El parámetro que en los ejemplos anteriores, debe seguirse el procedimiento

general de prueba de hipótesis:

b) Se plantea la hipótesis

Ho: µ=12

Ho: µ < 12 (a una cola)

c) ∞= 0,05

d) El estadístico de prueba es: ��− μ0

𝑆

√𝑛

e) Ho: se rechaza si T < t∞ n-1 = t 0,95,21 = -1,712

f) El valor del estadístico de prueba: 11,84−12

0,5

12

= −1,5

g) Decisión

Dado que T = -1,5 > t0,05, 21 = -1,712, es decir, t= -1,5, cae en zona de aceptación

como se muestra en la figura siguiente, en cuyo caso, Ho no se rechaza y por lo

305

tanto µ= 12 onzas, y la afirmación sobre el contenido de los envases (12 onzas)

es correcta.

-1,712 -1,5

6.4 CONTRASTES RELACIONADOS CON LA DIFERENCIA DE MEDIAS

El objetivo fundamental de estos contrastes consiste en establecer si existe diferencia

entre dos medias µ1 y µ2 de dos poblaciones independientes, para ellos se recurre a uno

de los siguientes contrastes:

Ho: µ1 = µ2 Ho: µ1 = µ2 Ho: µ1 = µ2

Ho: µ1≠µ2 Ho: µ1> µ2 Ho: µ1< µ2

A veces es de interés analizar si la diferencia µ1 - µ2 es igual, mayor o menor que un

número real cualquiera δ, es decir, se analizan los siguientes contrastes:

Ho: µ1 - µ2 = δ Ho: µ1 - µ2 = δHo: µ1 - µ2 = δ

Ho: µ1−µ2 ≠δHo: µ1 - µ2 >δHo: µ1 - µ2<δ

6.4.1 Contraste de hipótesis para la diferencia de medias con varianzas 𝝈𝟏𝟐 y 𝝈𝟐

𝟐

conocidas. Sean dos muestras aleatorias con tamaños n1 y n2 y con medias muestrales

��1 y ��2, respectivamente, procedentes de dos poblaciones normales e independientes,

con medias µ1 y µ2 y varianzas 𝜎12 y 𝜎2

2 conocidas. En casos como este, la mayoría de

306

veces el investigador puede establecer la igualdad o diferencia de las medias, para lo

cual se recurre a realizar la correspondiente prueba de hipótesis que se basa en el

siguiente estadístico de prueba:

𝑍 =(�� − 𝑌2) − (𝜇1 − 𝜇2)

√𝜎1

2

𝑛1+

𝜎22

𝑛2

En (6.4.1) Z tiene una distribución normal estándar y los contrastes de hipótesis se

apoyan en este resultado.

En el contraste bilateral:

Ho: µ1 = µ2

Ho: µ1≠ µ2

El estadística de prueba indicado en (6.4.1) se puede expresar del siguiente modo:

𝑍 =(�� − 𝑌2)

√𝜎1

2

𝑛1+

𝜎22

𝑛2

La regla de decisión consiste en rechazar Ho si 𝑍 > 𝑍1−∝/(2) ó 𝑍 < 𝑍∝

2

Para constatar la hipótesis alternativa unilateral:

Ho: µ1 = µ2

Ho: µ1> µ2

La regla de decisión consiste en rechazar Ho cuando 𝑍 > 𝑍 1−∝

Para la otra hipótesis unilateral:

Ho: µ1 = µ2

Ho: µ1< µ2

307

Ho se rechaza cuando 𝑍 < 𝑍∝

Es muy común en producción y salud animal el uso de la prueba de hipótesis para

establecer la igualdad de dos medias, ya que por dos motivos de costos sólo se pueden

comparar dos tratamientos o probar la efectividad de dos sistemas de producción, y

muchos casos similares.

Ejemplo 6.4.1: En los peces de la tribu tilapinae, se recurre a la técnica de triploidía

inducida, cuyo objetivo consiste en producir animales con un juego cromosómico

adicional que en muchas ocasiones presentan un rendimiento medio superior a los

diploides normales y como ventaja adicional no se reproducen. En un experimento

donde se conocían previamente las varianzas, se comparó el peso final de los diploides

normales y los triploides, encontrándose los siguientes resultados:

Diploides: 𝑛1 = 60; ��= 0,320 kg 𝜎12= 0,86 kg2

Triploides: 𝑛2= 60, 𝑌2 = 0,360, 𝜎22= 0,94 kg2

Con base en los anteriores datos, con ∝ = 0,05 se debe decidir si las medidas de los dos

grupos son iguales o diferentes.

a) El parámetro de interés es la diferencia de medias µ1 - µ2

b) Las hipótesis son:

Ho: µ1 = µ2

Ho: µ1≠ µ2

c) ∝= 0.05

d) El estadístico de prueba es:

𝑍 =(�� − 𝑌2)

√𝜎1

2

𝑛1+

𝜎22

𝑛2

e) Ho se rechaza así: 𝑍 > 𝑍1−∝

2= 𝑍0,975 = 1,96 ó

𝑍 < 𝑍∝2

= 𝑍0,025 = −1,96

f) El valor del estadístico de prueba es:

308

0,320 − 0,360

√0,8660 + √0,94

60

= −0,04

√0,03=

−0,04

0,1732= −0,23

g) Decisión: Dado que 𝑍 = −0,23 > 𝑍∝

2= −1,96

-1,96 -0,23

Ho no se rechaza; por lo tanto, con un nivel de significancia del 5% se asegura que las

medas son iguales.

6.4.2 Contraste de hipótesis para la diferencia de medias con muestras grandes (n1 y

n2 ≥ 𝟑𝟎) y 𝝈𝟏𝟐, 𝝈𝟐

𝟐 desconocidas. Si los tamaños de muestras n1 y n2 son grandes, el

teorema central del límite garantiza que la distribución de la diferencia de medias

muestrales es aproximadamente normal y, en consecuencia, se puede utilizar el

procedimiento empleado cuando σ12, σ2

2 se conocen, reemplazando 𝑆12 por σ1

2 y 𝑆22 por

σ22.

Ejemplo 6.4.2: En las razas bovinas para leche, luego de muchos años de

investigación, se aprobó la aplicación de hormona del crecimiento (GH) como factor

importante para el incremento de la producción láctea. En un experimento se comparó la

producción promedio de dos hatos de vacas Guernesey de segundo parto, uno que no

recibió ningún tratamiento y otro tratado con GH. Al final de la lactancia se encontraron

los siguientes resultados:

Grupo Control (sin tratamiento): 𝑛1 = 43, 𝑌1 = 3.200 𝑘𝑔, 𝑆12 = 126.000 𝑘𝑔2.

309

Grupo experimental (con tratamiento): 𝑛1 = 48, 𝑌2 = 3.260 𝑘𝑔, 𝑆22 =

109.000 𝑘𝑔2.

Con base en los anteriores datos muestrales debe decidirse si se justifica el uso de GH, e

igualmente debe recurrirse a una prueba de hipótesis, con ∞ =0,05.

a) El parámetro de interés es 𝜇1 − 𝜇2.

b) Ho: 𝜇1 = 𝜇2.

H1: 𝜇1 < 𝜇2. (La producción promedio sin tratamiento es menor que la

producción promedio con tratamiento)

c) ∝ =0,05

d) El estadístico de prueba es: 𝑍 = 𝑌1 − 𝑌2

√𝑆1

2

𝑛1+

𝑆22

𝑛2

e) Ho se rechaza si 𝑍 < 𝑍∝ = 𝑍 0,05 = −1,65

f) El valor del estadístico de prueba es

𝑍 = 3.200 − 3.260

√126.00043 +

109.00048

= −60

√5.201=

−60

72,12= −0,83

g) Decisión: Dado que 𝑍 = −0,83 > 𝑍∝ = −1,65

-1,65 -0,83

Ho no se rechaza, es decir, la producción promedio de los dos grupos es igual, lo

que conduce a no recomendar la aplicación de la hormona del crecimiento (GH).

6.4.3 Contraste de hipótesis para la diferencia de medias con muestras pequeñas

(𝒏𝟏 𝒚 𝒏𝟐 < 30) y varianzas desconocidas pero iguales (𝝈𝟏𝟐 = 𝝈𝟐

𝟐). Dadas dos muestras

aleatorias con tamaños 𝑛1, 𝑛2 < 30 y medias muestrales 𝑋1 𝑦 𝑋2

, respectivamente,

310

procedentes de dos poblaciones normales e independientes con medias 𝜇1 𝑦 𝜇2 y

varianzas 𝜎12 𝑦 𝜎2

2 desconocidas pero que se suponen iguales 𝜎12 = 𝜎2

2 = 𝜎2.

Si las varianzas muestrales son 𝑆12 𝑦 𝑆2

2, un estimador de la varianza común𝜎2 es:

𝑆𝑝2 =

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆2

2

𝑛1 + 𝑛2 − 2

Bajo estas condiciones, en el capítulo anterior se vio que la variable aleatoria

𝑇 = (𝑋1 − 𝑋2) − (𝜇1 − 𝜇2)

𝑆𝑝√1

𝑛1+ √

1𝑛1

Tiene una distribución 𝑡 𝑐𝑜𝑛 𝑛1 + 𝑛2 − 2 grados de libertad. Este es el estadístico de

prueba en el cual se apoya el contraste de hipótesis.

El contraste bilateral

𝐻𝑜: 𝜇1 = 𝜇2

𝐻𝑜: 𝜇1 ≠ 𝜇2

Tiene como estadístico de prueba

𝑌1 − 𝑌2

𝑆𝑝 √

1𝑛1

+ 1

𝑛2

Y la regla de decisión es rechazar Ho si:

𝐻𝑜 ∶ 𝜇1 = 𝜇2

𝐻𝑜 ∶ 𝜇1 > 𝜇2

La regla de decisión es rechazar Ho si:

𝑇 > 𝑡1−∝/2;(𝑛1+ 𝑛2)−2ó

𝑇 > 𝑡∝/2;(𝑛1+ 𝑛2)−2

311

Donde 𝑡1−∝/2 es el valor de 𝑡 𝑐𝑜𝑛 (𝑛1 + 𝑛2) − 2 grados de libertad y 𝑃 (𝑇 ≤

𝑡1−∝/2) = 1−∝/2

Para el contraste unilateral:

𝐻𝑜: 𝜇1 = 𝜇2

𝐻𝑜: 𝜇1 > 𝜇2

La regla de decisión es rechazar 𝐻𝑜: 𝑠𝑖 𝑇 > 𝑡1−∝(𝑛1+𝑛2)

Para el otro contraste unilateral:

𝐻𝑜: 𝜇1 = 𝜇2

𝐻𝑜: 𝜇1 < 𝜇2

La regla de decisión es rechazar 𝐻𝑜: 𝑠𝑖 𝑇 < 𝑡𝑎,(𝑛1+ 𝑛2)−2

Ejemplo 6.4.3: En el Prochilodus magdalenae (bocachico), como en todas las especies

ícticas, el diámetro de los huevos es un indicador de mucha importancia ya que él

depende en buena medida el tamaño de las larvas y, por consiguiente, su capacidad de

adaptación al medio, mejorando así la supervivencia. La utilización de hormonas

estimulantes de la maduración gonadal, además de producir mayor cantidad de ovocitos,

incrementan el tamaño de los huevos; por esta razón se planteó un experimento

consistente en probar el efecto del extracto pituitaria de carpa (Cyprinuscarpio) (EPC) y

la hormona coriónica humana (HCG) en el tamaño de los huevos de la especie en

mención, midiendo el diámetro en mm, los resultados del citado experimento fueron los

siguientes:

EPC HCG EPC HCG

1,5 1,3 1,6 1,4

1,2 1,0 1,5 1,5

1,8 1,6 1,8 1,5

312

1,1 0,9 1,9 1,7

1,4 0,7 1,6 1,4

1,0 0,9 1,6 1,4

1,6 1,4 1,7 1,5

1,6 1,4

Con base en los datos, se pide decidir cuál de los dos tratamientos es más recomendable

para incrementar el tamaño de las ovas.

El procedimiento para realizar una recomendación técnicamente formulada consiste en

efectuar una prueba de hipótesis.

a) El parámetro de interés de 𝜇𝐸𝑃𝐶 − 𝜇𝐻𝐶𝐺

b) 𝐻𝑜: 𝜇𝐸𝑃𝐶 = 𝜇𝐻𝐶𝐺

𝐻1: 𝜇𝐸𝑃𝐶 ≠ 𝜇𝐻𝐶𝐺

Esto indica que en Ho se asegura que el diámetro medio de las ovas es igual en

los dos tratamientos, mientras que en H1 se plantea que el diámetro medio es

diferente.

c) ∝ = 0,05

d) Se asume que las varianzas son iguales (efectivamente lo son), así que el

estadístico de prueba es:

𝑌1 + 𝑌2

𝑆𝑝√1𝑛1

+ 1

𝑛2

= 𝑇 𝐷𝑜𝑛𝑑𝑒 𝑆𝑝 = √(𝑛1 − 1)𝑆1

2 + (𝑛2 − 1)𝑆22

𝑛1 + 𝑛2 − 2

e) Ho se rechaza si:

𝑇 > 𝑡1−∝/2,𝑛1+𝑛2−2= 𝑡0,975,28 = 2,05 ó

𝑇 < 𝑡∝/2,𝑛1+ 𝑛2−2= 𝑡0,025,28 = −2,05

f) Para calcular el estadístico de prueba, en primer lugar se calculan los

estadígrafos más importantes, así:

313

𝑆𝑝 = √(15 − 1)0,0664 + (15 − 1)0,0849

28= √

1,1182

28= √0,7565

= 0,2750

√1

𝑛1+

1

𝑛2= √

1

15+

1

15= 0,3651

El estadístico de prueba es:

𝑇 = 𝑌1 − 𝑌2

𝑆𝑝√1𝑛1

+ 1

𝑛2

= 1,526 − 1,306

0,2750 × 0,3651= 2,19

g) Dado que 𝑇 = 2,19 > 𝑡0,975,28 = 2,05

EPC HCG

N 15 15

Media 1,5260 1,3060

Varianza 0,0664 0,0849

Desviación

estándar

0,2576 0,2915

314

2,05 2,19

Ho se rechaza y se concluye que las medias son diferentes, razón por la cual se puede

decir que hay suficiente evidencia para recomendar el extracto pituitario de carpa (EPC)

como tratamiento para incrementar el tamaño de ovas.

Ejemplo 6.4.4: Algunos autores aseguran que el selenio es uno de los principales

oligoelementos para una adecuada producción de la avena forrajera (Avena sativa). En

un experimento se evaluó el efecto de la adición de este mineral en los programas de

fertilización midiendo la producción de materia seca por hectárea (Tn /Ha) con el

objetivo de recomendar su adición en las prácticas culturales. Los resultados al final del

trabajo de investigación fueron los siguientes:

Con selenio: 𝑛1 = 9, 𝑌1 = 9,69 𝑇𝑛, 𝑆12 = 0,336 𝑇𝑛2

Sin selenio: 𝑛2 = 10, 𝑌2 = 7,33 𝑇𝑛, 𝑆22 = 1,073 𝑇𝑛2

Con base en estos resultados se debe recomendar la incorporación del selenio en los

programa de fertilización.

a) 𝐻𝑜 : 𝜇 𝑐𝑜𝑛 𝑠𝑒𝑙𝑒𝑛𝑖𝑜 = 𝜇 sin 𝑠𝑒𝑙𝑒𝑛𝑖𝑜

𝐻1 : 𝜇 𝑐𝑜𝑛 𝑠𝑒𝑙𝑒𝑛𝑖𝑜 > 𝜇 sin 𝑠𝑒𝑙𝑒𝑛𝑖𝑜

b) ∝ = 0,05

c) Si se supone que las varianzas son iguales, el estadístico de prueba es como en

(6.4.4):

𝑇 = 𝑌1 − ��2

𝑆 √1

𝑛1+

1𝑛2

315

d) Ho se calcula si 𝑇 > 𝑡1−∝,𝑛−1+𝑛2−2 = 𝑡0,975,17 = 1,74

e) Se calcula el estadístico de prueba:

𝑆𝑝 = √(9 − 1)0,336 + (10 − 1)1,073

17= √0,7262 = 0,8522

√1

𝑛1+

1

𝑛2= √

1

15+

1

15= 0,3651

𝑇 = 9,69 − 7,33

0,8522 × 0,4595= 6,03

f) Dado que 𝑇 = 6,03 > 𝑡0,95;17 = 1,74 Ho se rechaza y por lo tanto se puede

concluir que el rendimiento medio de materia seca por hectárea cuando se utiliza

selenio es mayor que cuando no se utiliza.

Cuando las varianzas 𝜎12 𝑦 𝜎2

2 son diferentes, el estadístico de prueba se calcula de la

siguiente manera:

𝑇´ = 𝑌1 − 𝑌2

√𝑆2

1

𝑛1+

𝑆22

𝑛2

(6.4.5)

Se utiliza para indicar que el estadístico de prueba no se distribuye exactamente como

una t de Student, sino en una forma suficiente aproximada a ésta, con 𝜗grados de

libertad, donde 𝜗 se calcula como:

𝜗 =[𝑆1

2

𝑛1+

𝑆22

𝑛2]

2

[𝑆1

2

𝑛1⁄ ]

2

𝑛1 + 1 +[𝑆2

2

𝑛2⁄ ]

2

𝑛2 + 1

(6.4.6)

316

Ejemplo 6.4.5: Los carbohidratos son la fuente más importante de energía y de los

principales precursores de grasa y lactosa en la leche de las vacas. Un experimento tuvo

como objetivo evaluar dos dietas con diferentes fuentes de maíz, con el propósito de

recomendar la que produjera mayor contenido graso en la leche (kg/L) de vacas jersey

de segundo parto. Los resultados al final de experimento fueron los siguientes:

Dieta con trigo: 𝑛1 = 12, 𝑌1 = 0,31𝑘𝑔, 𝑆1 2 = 0,001454 𝑘𝑔2

Dieta con maíz: 𝑛2 = 12, 𝑌2 = 0,26𝑘𝑔, 𝑆2 2 = 0,001159 𝑘𝑔2

Con estos valores se debe decidir cuál de las dos fuentes de carbohidratos es la más

recomendable y para ello se realiza una prueba de hipótesis, asumiendo que las

varianzas son diferentes.

De acuerdo con los datos parece que la dieta con trigo produce un promedio mayor en el

contenido graso de la leche, entonces contrastamos esta hipótesis.

a) 𝐻𝑜: 𝜇1 = 𝜇2

𝐻𝑜: 𝜇1 > 𝜇2 (La dieta con trigo produce mayor contenido graso en la leche)

b) ∝= 0,05

c) Si las varianzas son diferentes, el estadístico de prueba es como en (6.4.5):

𝑇´ = 𝑌1 − 𝑌2

√𝑆1

2

𝑛1+

𝑆22

𝑛2

d) Ho: se rechaza su 𝑇´ > 𝑡1−∝,𝜗

e) Se calcula el estadístico de prueba con (6.4.5):

𝑇´ = 0,31 − 0,26

√0.00145412 +

0,01150912

= 1,521

Se calculan los grados de libertad con (6.4.6):

𝜗 =[𝑆1

2

𝑛1+

𝑆22

𝑛2]

2

[𝑆1

2

𝑛1⁄ ]

2

𝑛1 + 1 +[𝑆2

2

𝑛2⁄ ]

2

𝑛2 + 1

=(0,0010802)2

0,000000084956= 13,73 ≈ 14

317

Entonces se encuentra el valor t de la tabla:

𝑡1−∝;𝜗 = 𝑡0,95;14 = 1,761

f) Dando que 𝑇´ = 1,521 < 𝑡0,95 = 1,761

Ho no se rechaza, es decir, la producción media de grasa cuando se utiliza trigo en la

dieta no es mayor que cuando se utiliza maíz. Por consiguiente se recomienda

cualquiera de las dos dietas y se deben evaluar otros factores tales como el costo o la

disponibilidad de la materia prima en la zona.

1,54 1,761

6.4.4 Contraste de hipótesis para la diferencia de medias: datos pareados. En los

contrastes de hipótesis con respecto a la diferencia de medias, se asumió que las

muestras son independientes. En ocasiones se presentan casos en los que las muestras

no son independientes; esto, por lo general, sucede cuando las observaciones de las dos

muestras se asocian por pares, por ejemplo, cuando los mismos individuos escogidos al

azar se comparan antes y después de haber recibido algún tratamiento o cuando los

grupos control y experimental deban aparearse considerando alguna característica de

interés.

El objetivo de la asociación por pares es hacer que las unidades experimentales dentro

de cada nivel o grupo sean, en lo posible, lo más homogéneas, de tal manera que las

318

CAPÍTULO 7

Principios básicos de las relaciones entre variables

7.1 ASPECTOS GENERALES

En la producción y en la salud animal, establecer si dos o más variables tienen algún

tipo de relación ayuda a tomar determinaciones técnicas importantes. Por ejemplo, al

319

planear el manejo alimenticio de un hato debe establecerse si el consumo de alimento en

materia seca o verde está determinado por el peso vivo de los animales, el contenido

graso o de fibra de las reacciones; en el mejoramiento genético de las especies

productivas es fundamental saber si dos o más rangos de importancia en la producción

están o no relacionados, es el caso de la grasa y la proteína de la leche, en nutrición

animal es importante determinar si la calidad nutritiva de un forraje depende de la edad

al corte del pasto; en las explotaciones porcinas es fundamental establecer si la

composición de la dieta afecta el espesor de la grasa dorsal de los animales destinados al

sacrificio; en la administración de medicamentos es imprescindible conocer si la dosis

aplicada de un determinad fármaco afecta la composición del producto final, como

carne o leche e incluso el volumen de producción; en la alimentación animal debe

comprobarse si la conversión alimenticia está influenciada por la edad del animal; en el

manejo reproductivo el peso de la hembra al primer servicio puede ser una variable que

influya en el peso de la crías o el tamaño de la camada, lo mismo puede suceder con la

edad de los parentales; en piscicultura el peso y la talla son variables que guardan algún

tipo de relación y, como las anteriores, podrían citarse múltiples situaciones similares.

A continuación se presentan los procedimientos estadísticos que permiten confirmar o

no la pertenencia de la relación funcional entre variables y el tipo de dicha relación

7.1.1. Relaciones funcionales de dependencia. En este caso específico se trata de

establecer si una variable aleatoria, que en adelante se denominara Y, tiene una

relación funcional de dependencia con una o más variables, que en adelante se

denominaran X. El objetivo de los análisis de esta naturaleza consiste en desarrollar una

ecuación que permita estimar el valor medio de Y, conociendo los valores de X. Cuando

el interés se centra en este tipo de problemas se hace referencia a la regresión.

En los análisis de regresión, pueden presentarse varias situaciones, la primera que se

menciona en este texto se refiere al cambio observado en una variable aleatoria Y por

efecto o influencia de una variable X, caso en el que se utilizan los análisis de regresión

simple, pero además, el cambio de Y puede ser lineal, exponencial, potencial, etc.

Cuando el cambio observado en Y se explica por el efecto de una sola variable X, se

hablara de regresión simple.

320

7.1.2 Regresión lineal simple. Cuando el cambio observado en Y por efecto el cambio

X se explica de una forma tal que se puede representar en una línea recta se habla de

regresión lineal. Para encontrar la ecuación que relacione las variables, por lo general,

se inicia con la recolección de los datos que toma Y cuando varían los valores de X,

luego se marcan los puntos X, Y sobre un sistema de coordenadas y se obtiene lo que en

estadística se llama nube de puntos o diagramas de dispersión (figura 7.1.1). A partir

de esta figura es posible observar una curva denominada aproximante, que sugiere el

tipo de relación existente. Como ilustración se presenta el diagrama de dispersión

correspondiente a la variación observada en el consumo de forraje (expresado en

gramos por día) en cuyes (cavita porcellus) por efecto de la variación en la edad de los

animales, expresada en días, según el estudio realizado por Lagos y Velasco(2005), en

la tabla 7.1.1

Días Consumo (g/ animal/ día )

1 10

2 15

3 34

4 45

5 40

6 69

7 120

8 100

9 160

10 200

Tabla 7.1.1 consumo de forraje (g/ animal/día) en cuyes (cavia porcellus)

321

Como se aprecia, la nube de puntos sugiere una relación lineal entre las variables X; Y

el trazado de una línea confirma con mayor claridad este hecho.

Una vez establecida la existencia de dependencia lineal se procede a encontrar una

ecuación que describa el comportamiento de Y por efecto de la acción de X; para

alcanzar este objetivo debe estimarse dos parámetros denominadosᵦ₀ y ᵦr

El primer término representa el intercepto, es decir el punto de corte con el eje Y,

mientras que el segundo indica la pendiente de la recta. Para efectos de conclusiones y

recomendaciones prácticasᵦ₀ indica el valor medio de Y cuando X tiene un valor igual a

cero., valor que no siempre tendrá explicación biológicas y ᵦ₁ deberá interpretarse como

el cambio promedio de Y, por cada aumento de una unidad en X. definidos los dos

parámetros anteriores, ahora es posible describir el valor de Y con la siguiente ecuación.

𝑌𝑖=ᵦ0+ ᵦ₁Xi

Dónde:

0

100

200

300

400

0 5 10 15Y c

on

sum

o g

X (dias )

Consumo (g/ animal/ día )

11 254

12 296

13 300

14 310

Grafico 7.1.1 diagrama de dispersión de los datos de la Tabla 7.1.1

322

𝑌𝑖 Valor que toma la variable aleatoria en estudio o también denominada variable

dependiente

ᵦ₀ y ᵦ₁parámetros cuyo significado ya fue explicado

Xi = Valor que toma X, variable no aleatoria, denominada variable independiente,

predictoria o regresora.

Con respecto a los valores de la variable independiente X, es conveniente advertir que

estos pueden seleccionarse antes de desarrollar la ecuación, como en el caso donde la

temperatura se fija en intervalos de 2°C, para observar el consumo de alimento en un

plantel avícola, de tal modo que el primer valor de X es de 20°C y luego se incrementan

a 22,24,26 °C etc., hasta llegar al máximo biológico establecido por el investigador, de

acuerdo con el comportamiento típico de la especie.

En este caso es claro que el estudio de la regresión es controlado, pero cuando los

valores de X se escogen entre una gama de posibles valores, el estudio de la regresión es

observacional, como en el caso de los análisis bromatológicos, donde los valores que

toma X pueden ser las cifras de humedad de una planta cuando esta se recolecta para

llevar acabo los análisis.

Así los estudios sean controlados u observacionales, el propósito de los estudios de

regresión lineal simple será idéntico en los dos casos es decir encontrar la recta que

mejor ajuste el comportamiento de las observaciones X, Y.

Para mayor claridad de los procedimientos que se indicaran más adelante conviene

hacer las siguientes precisiones: Al observar los puntos trazados en la figura 7.1.1, es

fácil notar que no todos los puntos “caen” exactamente sobre la recta, algunos tienen un

desvió positivo, otros negativos y otros cero, pero en todo caso a cada punto (Xi Yi) le

corresponde un valor ɛ₁˴, ɛ₂˴, ɛ₃˴…ɛɳˏ. Estas desviaciones en adelante se denominaran

error o residuo, aclarando que los ɛᵢ son aleatorios.

Una medida que podría indicar la calidad del ajuste de la curva es la sumatoria de los ɛᵢ

al cuadrado Σ ɛᵢ₂ ya que entre más pequeño sea este valor, mejor será el ajuste, así que

en la práctica, lo que realmente se busca es que esta expresión sea mínima para obtener

los mejores estimadores de ᵦ₀ y ᵦ₁. Una recta que ajuste los datos, con la condición

323

antes citada se denomina recta de mínimos cuadrados. Para mayor claridad se presenta a

continuación algunos aspectos importantes, para la estimación de los citados

parámetros:

a) Considerar el módulo de la regresión lineal simples:

𝑌𝑖=ᵦ0+ ᵦ₁Xi

b) Como ya se dijo, las Xi se conocen a priori, ᵦ₀ y ᵦ₁ son parámetros

desconocidos. Se mencionó que la ecuación (7.1.1), expresa el valor medio de

Y, así que podría ser expresado de esta manera.

𝐸(𝑌𝑖)=ᵦ0+ ᵦ₁Xi

c) Si se consideran los desvíos ɛᵢ como valores aleatorios N(0,o², es posible escribir

esta expresión

𝑌₁ = ᵦ0+ ᵦ₁𝑥₁+ ɛ₁

𝑌₁ = ᵦ0+ ᵦ₁𝑥₂+ ɛ₂

d) Se dijo que esta es una expresión válida para cada valor de Y, así que si se

considera todos los valores de Y, incluidos en el análisis se tendrá:

𝑌₁ = ᵦ0+ ᵦ₁𝑥₁+ ɛ₁

𝑌₁ = ᵦ0+ ᵦ₁𝑥₂+ ɛ₂

De cada una de las anteriores expresiones despeje ɛ

ɛᵢ = 𝑌𝑖− ᵦ0− ᵦ1x1ᵢ=1,2,…,n

La suma de los cuadrados de las desviaciones de las observaciones son respecto a la

recta es

𝑄 = 𝛴ɛᵢ² = 𝛴(𝑌𝑖−ᵦ0 − ᵦ₁𝑥₁)

Esta es una función de los parámetros desconocidos ᵦ0 − ᵦ₁. Los estimadores de

mínimos cuadrados ᵦ0 y ᵦ₁respectivamente, se obtienen mediante la diferenciación de

(7.1.5) con respecto a ᵦ0 y ᵦ₁ y después al igualar cada derivada parcial a cero.

324

𝜕𝑄

𝜕𝛽₁= 2𝛴(𝛾ᵢ − ᵦ0 − ᵦ𝑋ᵢ)(−1)

𝜕𝑄

𝜕𝛽₁= 2𝛴(𝛾ᵢ − ᵦ0 − ᵦ𝑋ᵢ)(−1)

Después de simplificar se obtiene:

ɳᵦ0+ ᵦ1𝛴𝑥ᵢ = 𝛴𝑌ᵢ

ᵦ1𝛴𝑋ᵢ + ᵦ1𝛴𝑋ᵢ₂= 𝛴𝑋ᵢ𝑌ᵢ

Estas ecuaciones reciben el nombre de ecuaciones normales de mínimos cuadrados.

Resolviendo el sistema de ecuaciones, se obtiene:

ᵦ0 = ��-ᵦ₁ ��= 𝛴 𝑌ᵢ

𝑛 - ᵦ₁

𝛴 𝑌ᵢ

𝑛

ᵦ₁=𝛴(𝑋ᵢ− �� )(𝑌ᵢ− �� )

𝛴(𝑋ᵢ− ��)²=

𝛴𝑋ᵢ𝑌ᵢ−(𝛴𝑋ᵢ)(𝛴𝑌ᵢ)

𝑛

𝛴𝑋ᵢ²−

(𝛴 𝑋ᵢ)²

𝑛

Por lo tanto la ecuación de regresión estimada para el modulo (7.1.3) es :

�� = ᵦ0 + ᵦ₁ 𝑋

Ejemplo 7.1.1.: Un investigador en nutrición animal está interesado en establecer si el

contenido de fibra de la dieta, expresado en kg/100kg de alimento, afecta el consumo

voluntario en consejos nueva Zelanda. Para alcanzar su objetivo prepara diferentes

dietas con diversos contenidos de fibra y suministra a varios grupos de conejos,

homogéneos en cuanto a edad, sexo, raza, y peso las diferentes raciones, encontrando

los siguientes resultados.

7.1.9

325

Kg de fibra/

100 kg de

ración (X)

Consumo

voluntario

(Kg/día ) (Y)

Kg de

fibra/100kg de

ración (X)

Consumo

voluntario

(Kg/día) (Y)

19,0 0,30 23,1 0,16

20,3 0,23 23,0 0,20

20,0 0,24 22,5 0,18

20,1 0,26 22,8 0,19

19,7 0,29 22,0 0,19

20,4 0,22 21,0 0,22

Para establecer la relación funcional de dependencia entre la fibra de la dieta (X) y el

consumo voluntario (Y), en primer lugar se construye el diagrama de dispersión, que

proporciona la figura 7.1.2.

326

Puesto que la figura 7.1.2 sugiere una relación lineal se procede a establecer la recta de

mejor ajuste y para esto se necesitara estimar los valores de β₀ y β₁.

Las cifras necesarias para su cálculo se obtienen de la siguiente manera:

Xᵢ Yᵢ Xᵢ Yᵢ 𝑿ᵢ𝟐 𝒀ᵢ

𝟐

19,0 0,30 5,700 361,00 0,0900

20,3 0,23 4,669 412,09 0,0529

20,0 0,24 4,800 400,00 0,0576

20,1 0,26 5,226 404,01 00676

19,7 0,29 5,713 388,09 0,0841

20,4 0,22 4,488 416,16 0,0484

23,1 0,16 3,696 533,61 0,0256

23,0 0,20 4,600 529,00 0,0400

22,5 0,18 4,050 506,25 0,0324

22,8 0,19 4,332 519,84 0,0361

22,0 0,19 4,180 484,00 0,0361

21,0 0,22 4,620 441,00 0,0484

253,9 2,68 56,074 5395,05 0,06192

Se puede apreciar que:

Figura 7.1.2 diagrama de dispersión de las variables fibra de

la dieta (X) y consumo voluntario (Y)

327

∑ 𝑋ᵢ = 253,9

12

ᵢ=1

∑ 𝑌ᵢ = 2,68

12

ᵢ=1

∑ 𝑋ᵢ𝑌ᵢ = 56,074

12

ᵢ=1

∑ 𝑋ᵢ2 = 5395,05

12

ᵢ=1

∑ �i�2 =12ᵢ=1 0, 6192

Con las anteriores cantidades es posible calcular los estimadores de los parámetros,

como en (7.1.7) y (7.1.8) así:

ᵦ₁=𝛴𝑋ᵢ𝑌ᵢ−

(𝛴𝑋ᵢ)(𝛴𝑌ᵢ)

𝑛

𝛴𝑋ᵢ²−

(𝛴 𝑋ᵢ)²

𝑛

=56,074−

253,9𝑥 2,68

12

5395,05−(253,9)²

12

= -0,02745

ᵦ0 = ��-ᵦ₁ ��= 2,68

12-(− 0,02745 ×

253,9

12)= 0,804

ᵦ₁ En la recta representa la pendiente, la interpretación aplicada de este valor indica que

el consumo de alimento en los consejos Nueva Zelanda, en promedio disminuye en

0,02745 kg por cada aumento de un kilo de fibra en la dieta.

ᵦ0 Representa el punto de corte o intercepto con el eje Y. podría interpretarse como el

valor del consumo cuando la dieta no tiene fibra, que en este caso si tiene lógica desde

el punto de vista aplicado.

Conocidos los valores de los estimadores, ahora es posible hacer uso de una las

importantes propiedades de la regresión, consiste en predecir el valor medio de Y para

cualquier valor de X, siempre y cuando este se encuentre en el rango de valores

utilizados para calcular los estimadores de los parámetros. Así si se desea estimar el

328

valor medio de Y cuándo la dieta de la fibra se fije en 20,5 kg basta con aplicar el

siguiente procedimiento.

�� = ᵦ₀+ ᵦ₁𝛽 X₁ = 0.804+ (-0,02745X 20,5) = 0,242

Se puede concluir que el consumo medio de alimento será de 0,242 kg, para la cantidad

de fibra indicada. No se podrá utilizar la ecuación de predicción para valores de fibra

menores de 19 o mayores de 23,1 kg.

El paso siguiente consiste en llevar acabo la prueba de hipótesis para la regresión. El

procedimiento general de la prueba de hipótesis no varía en referencia al indicado para

la prueba de medias o proporciones con algunas particularidades específicas. El

propósito de la prueba pretende generalizar el comportamiento de las variables deducido

con los datos de la muestra, para la población de donde se extrajo esa muestra

Para ellos es necesario hacer una consideración previa, antes de realizar el análisis de

varianza. En la figura 7.1.3, ara cada punto observado Yᵢ se verifica que:

Y₁

��ᵢ ��= ᵦ₀+ ᵦ₁ X

��

Figura 7.1.3. Ecuación de regresión lineal con

verificación en los puntos de intersección

329

(𝑌ᵢ − ��)= (��ᵢ-��)+ (Yᵢ- ��ᵢ)

Siendo ��ᵢ

El valor estimado de Y en dicha observación y �� la media muestral de la variable Y, se

demuestra que:

𝛴(𝑌ᵢ − ��)²= 𝛴(��ᵢ − ��)² + 𝛴(𝑌ᵢ − ��ᵢ)²

DONDE:

𝛴(𝑌ᵢ − ��)²= se denomina suma total de cuadrados (SCT), y representa la variación total

de las observaciones respecto a su media.

𝜮(��ᵢ − ��)².- se denomina suma de cuadrados debido a la regresión (SCR), y representa

la variación de las observaciones que es atribuible al efecto de X sobre Y.

𝛴(𝑌ᵢ − ��ᵢ)².- Se le denomina suma de cuadrados debido al error (SCE) y representa la

variación de las observaciones con respecto a la recta de regresión estimada.

Reemplazando en (7.1.10), se tiene que:

SCT= SCR+SCE

SCT= 𝛴(𝑌ᵢ − ��)= 𝛴�i�2-(𝛴𝑌ᵢ)²

𝑁

SCR= 𝜮(��ᵢ − ��)²= (ᵦ1)²(𝜮(𝑿ᵢ − ��)² = ᵦ² [𝜮𝑿𝟏𝟐 −

(𝛴 𝑋ᵢ)²

𝑛]

7.1.3. Prueba de hipótesis sobre la significación del modelo de regresión.- Permite

tomar una decisión global con respecto a la aceptación o rechazo del modelo. Para esto

puede utilizarse el análisis de varianza.

Las hipótesis se plantean del siguiente modo

Ho: β₁= 0 X e Y no estarán relacionadas linealmente

330

H₁: β₁≠0 X e Y están relacionadas linealmente

La tabla de análisis de varianza (ANAVA) para la regresión lineal simple es la

siguiente:

Fuentes de

variación GL

Suma de

cuadrados

Cuadrado

medio Fc Ft

Regresión 1 SCR 𝑆𝐶𝑅

1

𝐶𝑀𝑅

𝐶𝑀𝐸

Error n-2 SCE CMR=𝑆𝐶𝐸

𝑛−2

total n-1 SCT

DONDE:

CMR se denomina cuadrado medio de la regresión

CME se denomina cuadrado medio del error

𝐶𝑀𝑅

𝐶𝑀𝐸= Fc

Tiene una distribución F con 1 y n-2 grados de libertad (GL)

Ho se rechaza si Fc ≥Ft es decir si Fc ≥ 𝑓1−∞;1,𝑛−2

EJEMPLO 7.1.2: a continuación se presenta el resultado del análisis para los datos del

ejemplo 7.1.1

Fuentes de GL SC CM Fc Ft

331

variación

Regresión 1 0,01731 0,01731 51,51 10,04*

Error 10 0,00336 0,000336

Total 11 0,02067

SCT= 𝛴�i�2 − (𝛴𝑌ᵢ)²

𝑁= 0, 6192-

(2,68)2

12= 0,02067

SCR= (ᵦ1)² [𝜮𝑿𝟏𝟐 −

(𝛴 𝑋ᵢ)²

𝑛]= (-0, 02742)²[5395,05 −

(253,9)²

12]= 0, 02067

SCE = SCT-SCR= 0,000336

CMR=𝑆𝐶𝑅

1= 0, 01731

CME= 𝑆𝐶𝐸

10= 0,000336

Fc= 𝐶𝑀𝑅

𝐶𝑀𝐸=

0,01731

0,000336= 51,51

SI ∞ = 0,01, entonces 𝑓1−∞;1,𝑛−2= 𝑓0,99;1,10= 10,04

Dado que Fc = 51,51 es mayor que Ft= 10,04 se rechaza Ho y se concluye con el 99%

de confiabilidad que hay relación lineal entre la fibra de la dieta y el consumo de

alimento.

Otra medida que es necesario calcular al realizar análisis de regresión es el coeficiente

de determinación R² que es una medida relativa del grado de asociación lineal entre las

dos variables tanto para X como para , Y el cual viene dado por:

R²=𝑠𝑢𝑚𝑎 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛 (𝑆𝐶𝑅)

𝑠𝑖𝑚𝑎 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑡𝑜𝑡𝑎𝑙(𝑆𝐶𝑇)

Ejemplo 7.1.3. PARA EL EJEMPLO 7.1.2 SE TIENE QUE

332

R²= 𝑆𝐶𝑅

𝑆𝐶𝑇=

0,01731

0,02067= 0,8374

Expresándolo como porcentaje: R² = 83,74%

Esto significa que el 83,74% de la variación observada con el consumo se explica por la

variación en el contenido de fibra de la dieta

También es conveniente expresar el valor de Sβ₁ como un límite de confianza, tal como

se indicó en los casos de la media y la proporción. El procedimiento es básicamente

igual, solo que en el caso de la regresión se debe calcular la expresión S ᵦ₁ O error

estándar de β1 cuyo cálculo se obtiene así:

𝑆𝛽12 =

𝐶𝑀𝐸

Σ(𝑋𝑖 − ��)2

Un intervalo de confianza para β1 al (1- 𝛼) 100% de confiabilidad viene dado por:

β1 ± Sβ1 t1- 𝛼/2, n-2

Ejemplo 7.1.4: Para el Ejemplo 7.1.3, un intervalo de confianza para β1 al 95% de

confiabilidad viene dado por:

β1 ± Sβ1 t0.957, 10

𝑆𝛽1 = √𝐶𝑀𝐸

Σ(Xi − ��)2= √

0,000336

22,9492= 0,00302

T0, 975, 10 =2,228

Reemplazando se obtiene: -0,02745 ± 0,00382*2,228

En consecuencia se tiene que β1 Está comprendido entre -0,035 y – 0,019, con una

confiabilidad del 95%.

Es de interés construir un intervalo de confianza a partir de la respuesta media e un

valor especifico de X1 por ejemplo Xp.

Un intervalo de confianza al (1−∝)100% de confiabilidad alrededor de la respuesta

media E (Yp) viene dado por:

𝑌𝑝 ± 𝑡1−∝/2;𝑛−2 𝑆(𝑌𝑝)

333

Donde 𝑌𝑝se lo calcula a partir del modelo de regresión ajustado 𝑌𝑝 = 𝛽0 + 𝛽1𝑋 y

𝑆2(𝑌𝑃) = 𝐶𝑀𝐸 [1

𝑛+

(𝑋𝑝−��)2

Σ(𝑋1−��)2]

Ejemplo 7.1.5: En el Ejemplo 7.1.3, que se viene analizando, se supone que se desea

construir un intervalo de confianza al 95% de confiabilidad para la media de 𝑌𝑝𝑒𝑛 𝑋𝑝 =

20,5 kg.

El valor estimado es 𝑌𝑝= 0,804 + (-0,02745 x 20,5) = 0,242 y la desviación estándar

estimada es:

𝑆2(𝑌𝑝) = {0,000336 [1

12+

(20,5 − 21,158)2

22,9492]}

1/2

= 0,005859

Y 𝑡1−𝛼

2,𝑛−2 = 𝑡0.975,10 = 2,228

Por lo tanto, un intervalo de confianza para la media de 𝑌𝑝′ 𝐸(𝑌𝑝) es

0,242 ± 2,228 x 0,005859 = (0,229, 0,2550).

Un intervalo de confianza de E(Yp) se ¡refiere a la verdadera respuesta promedio en

𝑋 = 𝑋𝑝 (esto es, el parámetro de la población)y no a observaciones futuras.

Una aplicación importante en un modelo de regresión es la predicción de observaciones

nuevas o futura de Y, si X0 es el valor que se quiere pronosticar, entonces:

𝑌0 = 𝛽0 + 𝛽1𝑋0

Es el estimador puntual del valor futuro de la respuesta 𝑌0.

Un intervalo de predicción para una observación futura 𝑌0 en el valor 𝑋0 al

(1−∝)100% de confiabilidad, está dado por:

𝑌0 ± 𝑡1−

∝2

,𝑛−2𝑆(𝑌0)

334

Dónde: 𝑆2(𝑌0) = 𝐶𝑀𝐸 [1 +1

𝑛+

(𝑋0−��)2

Σ(𝑋𝑖−��)2]

Ejemplo 7.1.5: En el mismo Ejemplo 7.1.3, se quiere construir un intervalo de

predicción al 95% de confiabilidad para la predicción 𝑌0 en el valor 𝑋0 = 20,5kg.

El valor estimado es 𝑌0 = 0,804 + (-0,02745x 20,5) = 0,242

𝑆2(𝑌𝑝) = {0,000336 [1

12+

(20,5 − 21,158)2

22,9492]}

1/2

= 0,005859

𝑡1−𝛼

2,𝑛−2 = 𝑡0.975,10 = 2,228 , por tanto el intervalo es 0,242 ± 2,228 x 0,0192

(0,199 a 0,285)

Con una confiabilidad del 95%, el pronóstico 𝑌𝑥=020.5 para X = 20,5 está comprendido

entre (0,199 y 0,285).

7.2 CORRELACIÓN LINEAL

Cuando dos o más variables de interés son aleatorias y ninguna de ellas se considera

dependiente de la otra el análisis de correlación permite establecer si las variables en

cuestión están o no correlacionadas.

335

Si se analizan únicamente dos variables la correlación será simple y cuando se involucra

a más de dos variables el estudio es de correlación será múltiple. El grado de asociación

lineal entre dos o más variables está determinado por el coeficiente de correlación de

Pearson o correlación producto momento y su forma de cálculo se expresa así:

𝜌 =

Σ(𝑋𝑖 − 𝜇𝑥)(𝑌𝑖 − 𝜇𝑦)𝑁

√Σ(𝑋𝑖 − 𝜇𝑥)2

𝑁 . √Σ(𝑋𝑖 − 𝜇𝑥)2

𝑁

=𝐶𝑜 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑋, 𝑌)

√𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑋. √𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑌

=Σ(𝑋𝑖 − 𝜇𝑥)(𝑌𝑖 − 𝜇𝑦)

√Σ(𝑋𝑖 − 𝜇𝑥)2. √Σ(𝑌𝑖 − 𝜇𝑦)2

El estadígrafo se denota por la letra r y se calcula del mismo modo, sólo que en lugar de

los parámetros 𝜇 𝑦 𝜎 se utilizan los estadígrafos correspondientes.

El coeficiente de correlación puede tomar valores entre -1 y 1 incluyendo el cero. Un

valor negativo indica asociación en un modo tal que mientras una variable aumenta la

otra disminuye; un valor de cero indica que las dos variables son independientes, no

están asociadas linealmente o no existe correlación lineal, y un valor positivo sugiere

que cuando una variable aumenta la otra también lo hace.

Establecer si dos o más variables están correlacionadas es un factor importante en

muchos aspectos de la producción animal, especialmente en los programas de

mejoramiento genético puesto que si se decide mejorar por selección una característica

de importancia económica se debe conocer si al mejorar un rasgo se desmejora otra,

caso en el cual la selección no tendría un efecto positivo. En cambio cuando dos rasgos

tienen correlación positiva al mejorar uno también de modo simultáneo, se mejora el

otro, logrando así un impacto positivo en los planes de mejora.

336

Ejemplo 7.2.1 A continuación se presenta un ejemplo con datos reales medidos en

1.999 y utilizados por Cerón, et al (2.003), donde se presentan las cifras de producción

de leche por lactancia ajustada a 305 días, expresada en kilogramos y el puntaje total

por tipo (tabla 7.2.1). El objetivo del análisis consiste en establecer sí estas dos variables

aleatorias están correlacionadas.

En los planes de mejoramiento de los bovinos lecheros se ha discutido ampliamente si

la morfología de los animales es un aspecto relevante para alcanzar los objetivos de

producción. Uno de los aspectos importantes para dirimir la discusión consiste en

establecer matemáticamente si hay relación funcional de asociación entre el puntaje y la

producción. Sí esta es positiva, podría diseñarse un plan de mejoramiento que busque

mejorar simultáneamente los dos rasgos.

Las cantidades necesarias para calcular el coeficiente de correlación muestral 𝑟 son las

siguientes:

𝑟 =Σ(𝑌1 − ��1)(𝑌2 − ��2)

√Σ(𝑌1 − ��1)22. √Σ(𝑌2 − ��2)2

=Σ𝑋𝑖𝑌𝑖 −

(Σ𝑋𝑖)(Σ𝑌𝑖)𝑛

√ΣX𝑖2 −

(Σ𝑋𝑖)2

𝑛 . √ΣY𝑖2 −

(Σ𝑌𝑖)2

𝑛

Σ(𝑌1 − ��1)2 = 666,08 Σ(𝑌2 − ��2)2 = 5,499003 × 107

Σ(𝑌1 − ��1)(𝑌2 − ��2) = −6546,8

De acuerdo con los anteriores valores el coeficiente de correlación se calcula de la

siguiente manera:

337

𝑟 =−646,8

√666,08√5,499003 × 107= −0,00337

Una prueba de hipótesis especial respecto al coeficiente de correlación poblacional 𝜌se

plantea como:

𝐻0:𝜌 = 0

𝐻1:𝜌 ≠ 0

La estadística de prueba es: 𝑇 =𝑟√𝑛−2

√1−𝑟2

Y tiene una distribución t con n-1 grados de libertad.

𝐻0 Se rechaza sí:

𝑇 > 𝑡1−

𝛼2

;𝑛−2𝑜 𝑇 < 𝑡𝛼

2;𝑛−2

En este ejemplo, la prueba de hipótesis se plantea como:

𝐻0:𝜌 = 0 El puntaje por tipo y la producción de leche no están correlacionados

linealmente.

𝐻1:𝜌 ≠ 0 El puntaje por tipo y la producción de leche están correlacionados

linealmente.

338

La estadística de prueba es:

𝑇𝑐 =𝑟√𝑛 − 2

√1 − 𝑟2=

−0,00337√48

√1 − (−0,00337)2= −0,0233

Para α = 0.05 se tiene que 𝑡𝛼

2,𝑛−2 = 𝑇0.025.48 = −2.0 como -0.0233 no es menor que 2.0

entonces, H0 no se rechaza.

7.3 REGRESIÓN LINEAL SIMPLE CON NOTACIÓN Y OPERACIONES

MATRICIALES

Tomando nuevamente los datos del Ejemplo 7.1.1, el problema puede resolverse con

notación matricial. En primer lugar se escribe el modelo de la siguiente forma:

𝑌 = 𝑋𝛽 + 𝜀

-2.0 -0.0233

339

Donde Y representa el vector de observaciones, X es una matriz de parámetros

observables, β es un vector de parámetros desconocidos y 𝜀 es un vector de errores

aleatorios.

El procedimiento para obtener los valores de las incógnitas, es decir los valores betas o

estimadores de los parámetros que ajustan la línea de regresión es el de mínimos

cuadrados, de tal manera que 𝛽= (𝑋`𝑌)−1𝑋`𝑌

𝑋`𝑌 = [𝑛 ∑𝑋1

∑𝑋1 ∑𝑋12] , 𝑋`𝑌 = [

∑𝑋1

∑𝑋1𝑌1] , 𝛽 = [

𝛽0

𝛽1]

Reemplazando las expresiones por los valores obtenidos con los datos de la tabla 7.2.1

se tiene:

𝑋`𝑌 = [12 253.9

253.9 5395.05] , 𝑋`𝑌 = [

2.6856.074

] , 𝛽 = [𝛽0

𝛽1]

[𝛽0

𝛽1] = [

19.59058063 −0.9219652129−0.9219652129 0.04357456697

] [2.68

56.074] = [

0.8044787392−0.02746650205

]

Como puede observarse, para encontrar los estimadores de los beta basta con invertir

X`X y luego multiplicar dicha inversa por el vector X`Y.

Para llevar a cabo el análisis de varianza se construye una tabla tal como se hizo en el

ejemplo anterior, solo que los cálculos en forma matricial son diferentes.

Tabla 7.3.1 análisis de varianza de la regresión lineal simple con notación matricial

340

F.V GL SC CM Fc Ft

Regresión K Β`X`Y-FC SCR/GLR CMR/CME

Error n-1-k (YY-FC)-( Β`X`Y-FC) SCE/GLE

Total n-1 YY-FC

a) Se debe calcular el factor de corrección así: FC=∑𝑌2

𝑛= 𝑛��2

b) Calcular la suma cuadrado total: SCT =YY-FC = ∑𝛾2-FC

c) Calcular la suma cuadrado de la regresión: SCR=β`X´Y-FC

SCE = SC total corregida – SC de la regresión corregida

Al reemplazar las expresiones indicadas en la tabla por sus correspondientes valores se

tiene:

Fc = 0.5985

Y`Y = 0.6192 – Fc = 0.0207

β`X`Y= [0.8044787392 − 0.027466502] [2.68

56.074] = 0.6158463851 − 𝐹𝑐 =

0.017346.

SCE= 0.027 – 0.017346= 0.0003354

Estos valores coinciden con los datos del ejemplo 7.1.1 y lógicamente las conclusiones

son las mismas, ya que lo único que se ha variado es la forma de cálculo.

Para llevar a cabo las pruebas de hipótesis utilizando procedimientos matriciales es

necesario calcular la matriz de varianzas y covarianzas para esto basta con multiplicar la

matriz (𝑋`𝑌)−1 por el cuadrado medio del error. Para el ejemplo se tiene:

341

[19.59058063 −0.9219652129

−0.9219652129 0.04357456697] 𝐶𝑀𝐸

Para facilitar los cálculos posteriores, la matriz de (𝑋`𝑌)−1 se denominara en adelante,

matriz de coeficientes y se denotara por C.

𝐶 = [𝐶00 𝐶01

𝐶10 𝐶11]

Para llevar a cabo la prueba de hipótesis para 𝛽0se procede así:

𝐻0:𝛽 = 0

𝐻1:𝛽 ≠ 0

Como ya se mencionó, esta prueba no tiene mayor importancia, la hipótesis nula indica

que el punto de corte de los ejes es cero y la hipótesis alterna indica lo contrario.

Para probar la hipótesis se contrasta el valor T calculado con el valor T de la tabla.

𝑇𝑐 =𝛽0

√𝐶00 − 𝐶𝑀𝐸=

0.804478

√(19.59058)(0.0003354)=

0.804478

0.081= 9.93

El valor tabular para una confiabilidad del 95% y 10 grados de libertad en el error es

2.306, por lo que se rechaza la hipótesis nula.

Para β, el valor:

𝑇𝑐 =𝛽1

√𝐶11 − 𝐶𝑀𝐸=

−0.02746

√(0.04357)(0.0003354)=

−0.02746

0.003822= 7.184

342

Tal como se había probado, en este caso se rechaza la hipótesis nula y se concluye que

hay dependencia lineal entre consumo y fibra.

Los intervalos de confianza para los estimadores de los parámetros se calculan de la

siguiente manera;

𝐼𝐶𝛽𝑖 = 𝛽𝑖 ± √𝐶ü 𝐶𝑀𝐸 𝑇∝ 2⁄ , 𝑛−2

En el ejemplo el intervalo de confianza para β1, sería:

ICβ1 = -0,02746± (0,003822 x 2,228) = -0,02746 ± 0,0085

El coeficiente de determinación se calcula del siguiente modo:

𝑅2 =𝐵´𝑋´𝑌 − 𝐹𝐶

𝑌´𝑌 − 𝐹𝐶=

0,017346

0,207= 0,837

La interpretación de esta cifra se indicó en el desarrollo anterior del mismo ejemplo sin

uso de la notación matricial.

7.4 ANÁLISIS DE REGRESIÓN NO LINEAL

El modelo de regresión de la línea recta es el más simple y más comúnmente usado

entre las expresiones matemáticas con las que se representa la relación entre dos

variables. En ocasiones, este modelo es inapropiado, porque la ecuación que se ajusta al

conjunto de puntos puede ser no lineal. La no linealidad se determina visualmente a

partir del diagrama de dispersión, en otras ocasiones, el conocimiento teórico del

problema o la experiencia sugieren que el modelo no es lineal. Existe un gran número

de modelos no lineales que cumplen dicha función en el caso en que la línea recta no

sea la apropiada.

343

Aquí sólo se hace referencia a tres de los tipos más usados de estos modelos: La

recíproca, la exponencial y la parabólica.

Suponiendo que los estimadores 𝛽1, 𝛽2 𝑦 𝛽2 sean iguales a, b y c respectivamente.

El modelo recíproco es: 𝑌 = 𝑎 +𝑏

𝑥

Este modelo, mediante la transformación 𝑍 =1

𝑋 se lo expresa como una línea recta 𝑌 =

𝑎 + 𝑏𝑍.

El modelo exponencial es 𝑌 = 𝑎𝑏𝑥

344

En este caso, utilizando logaritmos:

Log 𝑌 = Log 𝑎 + 𝑋(Log 𝑏) (7.4.1)

Haciendo la transformación W = Log Y, g= Log a y h= Log b, el modelo se lo expresa

como una recta:

𝑊 = 𝑔 + ℎ𝑋 (7.4.2)

Ejemplo 7.4.l: Los siguientes datos corresponden al número de bacterias por unidad de

volumen presentes en un cultivo de Salmonella sp, durante seis horas.

En el diagrama de dispersión se puede apreciar que el crecimiento de las bacterias es

exponencial.

6

0

275

4

5

32

47

65

92

132

190

3

2

Número de horas xNúmero de bacterias Por

unidad de volumen

1

345

Se ajusta un modelo 𝑌 = 𝑎𝑏𝑥

Tomando logaritmos se tiene: Log Y = log a + X (log b).

Si W= log Y, g = Log a y h= log b, el modelo se expresa como una línea recta:

W= g + h X

Y se resuelve de la misma manera que el modelo de línea recta, teniendo en cuenta los

datos:

Los valores de los estimadores h y g se calculan como:

ℎ =Σ𝑋𝑖𝑊𝑖 −

(Σ𝑋𝑖)(Σ𝑊𝑖)𝑛

Σ𝑋𝑖2 −

(Σ𝑋𝑖)2

𝑛

= 0,154

𝑔 = �� − ℎ�� = 1,507

Por lo tanto, el modelo se expresa como: W = 1,507 + 0,154X

Teniendo en cuenta las transformaciones, se tiene que:

X W= log y

0 1,505

1 1,672

2 1,813

3 1,964

4 2,121

5 2,279

6 2,439

346

Log a= g, entonces a = 10g = 101,507 = 32,137

Log b = h, entonces b = 10h,= 100,154 = 1,426

Y el modelo exponencial se expresa como: 𝑌 = 𝑎𝑏𝑥 = 32,137(1,426)𝑋

Así por ejemplo, para X = 6 el pronóstico bajo este modelo es:

𝑌 = 32,137(1,426)6 = 270

Este valor está bastante cercano del valor observado: Y = 275, para X = 6

El modelo parabólico Y = a + bX + cX2

Para hallar los valores de los estimadores a, b y c resuelve el sistema:

∑𝑌𝑖 = 𝑛𝑎 + 𝑏 ∑𝑋𝑖 + 𝑐∑𝑋𝑖2

∑𝑋𝑖𝑌𝑖 = 𝑎∑𝑋𝑖 + 𝑏 ∑𝑋𝑖2 + 𝑐∑𝑋𝑖3

∑𝑋𝑖2𝑌𝑖 = 𝑎∑𝑋𝑖2 + 𝑏 ∑𝑋𝑖3 + 𝑐∑𝑋𝑖4

b>0, c>0

b>0, c<0

b<0,c<0

b>0, c<0

b<0, c<0

347

Ejemplo 7.4.2: en la tabla 7.4.1 se presentan los datos de producción láctea de búfalas

en el Brasil (Cerón 2001), donde X son los días de lactancia, Y es la producción en

litros. Con esta información se pretende establecer un modelo que explique la

producción en función de los días de lactancias.

El diagrama de dispersión es el siguiente

Se ajusta un modelo parabólico de segundo orden:

𝑌 = 𝑎 + 𝑏𝑋 + 𝑐𝑋2

Para esto se resuelve el sistema:

82.521 = 41ª + 10.822b + 3.397.468c

23.959.748= 10.822ª + 3.397.468b + 1.204.890.664c

7.715.665.498= 3.397.468ª + 1.204.890.664b + 468.431.174.152c

Al resolverlo se tiene que:

A= -1.198,11 b= 22,16 c=-0.032

Por lo tanto, el modelo es Y= -1.198,11 + 22,16X – 0.32𝑋2

348

7.5 ANÁLISIS DE RESIDUALES: VALIDACIÓN DEL MODELO

Otra estrategia para evaluar cuanto el ajuste de la recta de regresión de mínimos

cuadrados, a los datos observados en la muestra utilizada, consiste en construir un

gráfico de dispersión de los residuos, contra los valores predichos de la variable �� o

contra X.

Se debe recordar que el i-esimo residuo 𝑒𝑖 es la diferencia entre el valor observado Yi y

el correspondiente valor estimado ��𝑖

𝑒𝑖 = Yi - ��𝑖 para todo i = 1, 2,3……, n

A las cantidades 𝑑𝑖 =𝑒𝑖

𝑆=

𝑒𝑖

√𝐶𝑀𝐸 para todo i=1, 2, 3….., n

Se les denomina residuales estandarizadas

Si el modelo de regresión lineal simple es correcto, los residuales estandarizados tienen

una distribución normal estándar, por lo que los residuales estarán aleatoriamente

distribuidos (sin mostrar ningún patrón) alrededor del intervalo (-2; 2) como se muestra

en la figura.

Las gráficas residuales con aspecto similar al de la Figura 7.5.1 indica que el modelo es

inadecuado, es decir, que es necesario añadir al modelo términos de orden superior( no

solo lineal) para poder expresar la relación entre X e Y.

7.6 REGRESIÓN LINEAL MÚLTIPLE

La notación matricial indicada para la regresión simple se puede extender al caso donde

el interés se centra en establecer la relación funcional de dependencia entre una variable

Y con dos o más variables independientes X. como se sabe el consumo de alimento no

depende únicamente del contenido de fibra de la ración, sino también de otros factores

tales como el peso vivo del animal, la temperatura del galpón, la densidad de

alojamiento y muchas otras variables.

Las operaciones matriciales indicadas en el numeral anterior son de mucha utilidad para

afrontar estudios de esta naturaleza. Las pruebas de hipótesis y los conceptos que deben

manejarse son básicamente extensiones de análisis simple.

349

Ejemplo 7.6.1: para establecer la relación de dependencia lineal del consumo (Y) con

respecto al peso corporal 𝑋1, la temperatura del galpón 𝑋2 y el diámetro de las

partículas del alimento 𝑋3 en gallinas ponedoras Isabrown, se recopilaron los datos

consignados en la tabla 7.6.1

El modelo lineal para estos datos se puede expresar con la siguiente ecuación.

𝑌𝑖= 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3

Este modelo teóricamente se puede extender a cualquier número de variables

independientes:

𝑌𝑖= 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + … . 𝛽𝑘𝑋𝑘 En este caso se indica que las X varían de 1 a K

En forma matricial, el modelo es el mismo para cualquier número de variables

independientes solo que el tamaño de las matrices que contiene las ecuaciones normales

aumentan a medida que se incluyen más variables en los análisis, así para una variable

independiente, el tamaño de X´X es 2*2 y el XY es 2*1; para dos variables

independientes.

En general las matrices anteriores se pueden identificar de la siguiente forma para k

variables independientes.

Los modelos de la regresión lineal múltiple generan matrices de rango completo, por lo

tanto la matriz X´X tiene inversa que al multiplicarla por el vector XÝ dará como

resultado la estimación de los parámetros.

La tabla de análisis de varianza, las pruebas de hipótesis, el cálculo de los intervalos de

confianza y del coeficiente de determinación se hacen del modo indicado en el numeral.

Para mayor claridad a continuación se desarrolla el procedimiento para los datos de la

tabla 7.6.1

En primer lugar se organiza la información y se lleva a cabo los cálculos necesarios para

facilitar la posterior construcción de las matrices. Las expresiones necesarias son las

indicadas a continuación.

350

Variable ∑𝑌𝑖 ∑𝑌𝑖2 ∑𝑌𝑋1𝐼 ∑𝑌𝑋2𝐼

Consumo 990.52 22888.1 1641.57 25225.1

Variable ∑𝑋1𝐼 ∑𝑋𝑖2 ∑𝑋1𝑖𝑋2𝐼 ∑𝑋1𝑖𝑋3𝐼

Peso Corporal 69.73 114.19 1775.24 245.588

Variable ∑𝑋2𝐼 ∑𝑋2𝑖2 ∑𝑋2𝑖𝑋1𝐼 ∑𝑋2𝑖𝑋3𝐼

Temperatura 1095.9 28067.5 1775.24 3891.44

Variable ∑𝑋3𝐼 ∑𝑋3𝑖2 ∑𝑋2𝑖𝑋3𝐼 ∑𝑋3𝑖𝑋2𝐼

Granulometría 152.7 546.73 245.588 3891.44

Con las cifras anteriores se construyen las matrices correspondientes a las ecuaciones

normales.

𝑋´𝑋 [43 69.73 1095.9

69.73 114.19 1775.241095.9 1775.24 28067.5

152.7 245.588 3891.44

] , 𝑋`𝑌 [990.52

1614.5725225.1

], 𝛽 = [

𝛽0

𝛽1

𝛽2

]

Para obtener los estimadores de los parámetros β se invierte X´X y se multiplica ese

resultado por X`Y

(𝑋´𝑋)−1 = [90.91042 −23.0053 −0.5271−23.0053 6.3571 0.09393−0.5271 0.09393 0.0086701

−11.30503

2.901080.04332

]

(𝑋´𝑋)−1. 𝑋`𝑌 = 𝛽 = [18.723285.67754

−0.064048]

De acuerdo con los anteriores resultados los valores del vector solución β se interpretan

del siguiente modo

351

𝛽0 18.72328477 punto de corte del eje Y con los ejes 𝑋1𝑋2𝑋3 Valor del consumo

cuando el peso corporal, la temperatura del galpón y el tamaño de las partículas del

alimento valen cero.

𝛽1 5.677543238 incremento promedio en el consumo por cada aumento de un kg en el

peso vivo de las aves.

𝛽2 -0.06404879725 disminución promedio del consumo por cada aumento de un grado

centígrado en la temperatura del ambiente del galpón.

𝛽3 -0.9186985828 disminución promedio del consumo por cada aumento de un mm en

el tamaño de las partículas de alimento.

De acuerdo con las anteriores cifras se puede observar que a mayor peso vivo mayor

consumo, mientras que a mayor temperatura y diámetro de las partículas el consumo

disminuye.

El paso siguiente consiste en realizar las pruebas de hipótesis para cada uno de los

parámetros así que deben realizarse los cálculos necesarios de las sumas de los

cuadrados, las que luego se descomponen en las diferentes fuentes de variación. Las

cifras necesarias son las siguientes.

𝐹𝑐 =(∑𝑌𝑖)

2

𝑛=

(990.52)2

43= 22816.97373 = 𝑛��2 = 43 ∗ (90.10232558)2

SC total = Y`Y – FC = 22884.1 – 22816.97373 = 67.1627

SC regresión = β XY-FC= 2.287978788 *104-22816.97373=62.81415

La SC del error se obtiene por diferencia de la SC total corregida menos SC regresión

corregida.

Lo más práctico es construir la tabla de análisis de varianza donde se indican las

respectivas sumas de cuadrados para cada fuente de variación.

FV GL SC CM Fc Ft

Regresión 3 62.81415 20.9380500 187.78 2.84

352

Error 39 4.34855 0.1115012

Total 42 67.16270

Como el Fc es mayor que el Ft se concluye con 95% de confiabilidad que por lo menos

una de las variables independientes X influye sobre el consumo, es decir que el

consumo depende linealmente de por lo menos una de las variables independientes. Para

establecer si solo es una o son más variables independientes las que presentan esta

influencia deben efectuarse las pruebas de hipótesis específicas para cada una de las

variables, utilizando la distribución de probabilidad T de Student.

La regla general para obtener el T calculando (Tc) es la siguiente:

𝑇𝑐 = 𝛽𝑖

√𝐶𝑖𝑖𝐶𝑀𝐸 𝐷𝑂𝑁𝐷𝐸 𝐼 = 1,2 … . . , 𝑘

𝐶𝑖𝑖 = Jesimo coeficiente de la diagonal de la matriz de coeficientes.

Los coeficientes de la matriz C se obtienen de la matriz inversa X`X.

𝑇𝑐 = 𝛽𝑖

√𝐶𝑖𝑖𝐶𝑀𝐸=

5.677543238

√ 6.35717012 ∗ 0.1115012=

5.677543238

0.8419216691= 6.74

El Tt para 39 Gl con α del 5% es 2.021, así que se deben rechazar la hipótesis nula y

concluir que el consumo depende linealmente del peso vivo de las gallinas, puesto que

|6.74| es mayor que el valor de la tabla.

𝑇𝑐 = −0.06404879725

√0.008670169059 ∗ 0.1115012=

−0.06404879725

0.03109235041= −2.06

Como |−2.061| es mayor que 2.021 se rechaza la hipótesis nula y se concluye que el

consumo depende linealmente de la temperatura del galpón.

𝑇𝑐 = −0.9186985828

√1.547773715 ∗ 0.1115012=

−0.9186985828

0.4154258376= 2.21

353

Ya que |2.21| es mayor que 2.021, se rechaza la hipótesis nula y la conclusión es que el

consumo depende del tamaño de las partículas del alimento.

7.7 PREDICCIÓN DE RESPUESTAS FUTURAS

La predicción de la respuesta promedio Ῠ= X β, donde X = [1 X1 X2……Xk]

Ejemplo 7.7.1: la predicción Ῠ para el punto X1= 28, X2=28 y X3=3.3 viene dado por:

Ῠ = [1 1.9 28 3.3] [

18.725.68

−0.064−0.92

]

= (1*18.72)+ (1.9*5.68)-(28*0.64)-(3.3*0.92)=24.684

Un intervalo de confianza al 95% de confiabilidad para la respuesta promedio Ῠ=

24.684.

Ῠ𝒑 ± 𝒕𝟎.𝟗𝟕𝟓.𝟑𝟗𝑺Ῠp

𝑆ῨP2 = 𝐶𝑀𝐸 [𝑋`𝑝(𝑋`𝑋)−1]𝑋𝑝

= [1 1.9 28 3.3 ] [90.910 −23.005 −0.527

−23.005 6.357 0.094−0.527 0.094 0.009

−11.3052.9010.043

] 1

1.928

= 0.555

Por lo tanto

𝑆ῨP = √0.1115012 ∗ 0.555 = 0.248763

Ῠ𝒑 ± 𝒕𝟎.𝟗𝟕𝟓.𝟑𝟗 ≈ 2.021

Y el intervalo de confianza es: 24.684 ± 2.021 * 0.248763 = (24.18 25.19)

Un intervalo de predicción al (1-α) 100% de confiabilidad para una observación futura

Ῠ𝟎 en el valor 𝑿𝟏𝑿𝟐……..𝑿𝒌 viene dada por:

354

Ῠ𝒑 ± 𝒕𝟏−

𝜶𝟐

;𝒏−𝒌−𝟏𝑺Ῠ0

Donde

Ῠ𝟎 ±𝑿𝟎��

𝑿𝟎 = 𝟏 𝑿𝟏 𝑿𝟐 … … 𝑿𝒌

𝑆Ῠ02 =CME [1 + 𝑋0(𝑋`𝑋)−1𝑋0]

En el ejemplo, un intervalo de predicción para el punto 𝑿𝟏 = 𝟏. 𝟗, 𝑿𝟏 = 𝟐𝟖 𝒚 𝑿𝟑 = 𝟑. 𝟑

al 95% de confiabilidad, viene dado por:

24.684 ± 2.021 ∗ √0.1115012(1 + +0.555)

24.684 ± 2.021 ∗ 0.4164

24.684 ± 0.8416

(23.84 a 25.53)