Electronic Signatures & PDF - Planet PDF - The PDF User Community
Glosario_AD1.pdf
-
Upload
eva-fernandez -
Category
Documents
-
view
13 -
download
0
Transcript of Glosario_AD1.pdf
-
Glosario
A
Acumulada
(Frecuencia, proporcin o porcentaje) En toda distribucin de frecuencia se puede obtener la
frecuencia acumulada (o proporcin acumulada o porcentaje acumulado). Para obtener los
valores, simplemente hay que ir acumulando (sumando), desde la categora de menor valor de la
variable a la de mayor valor, las frecuencias absolutas (ver frecuencia absoluta), proporciones o
porcentajes, de cada categora de respuesta. Por ejemplo,
la frecuencia absoluta acumulada del grado "moderado" de
preocupacin por la situacin poltica es 108, resultado de
sumar las frecuencias de los grados anteriores (18 + 42 =
60) y la suya propia (60 + 48 = 108), indicando que 108
personas presentan una preocupacin moderada o menos
por las cuestiones polticas. Con el mismo procedimiento
se obtendran las proporciones y porcentajes acumulados.
Amplitud del
intervalo
Es la diferencia entre el lmite exacto superior y el lmite exacto inferior, o entre el lmite
aparente superior y el lmite aparente inferior ms la unidad de medida.
Amplitud
intercuartil
Es la diferencia entre el tercer cuartil (o percentil 75) y el primer cuartil (o percentil 25) y
representa el rango de valores que contiene a la mitad central de los datos (el 50%)
Amplitud o rango Es la diferencia entre el valor mximo y mnimo del conjunto de datos
Amplitud semi-
intercuartil
Es la mitad de la diferencia entre el tercer cuartil (o percentil 75) y el primer cuartil (o percentil 25)
y se utiliza para cuantificar la variabilidad de un conjunto de datos medidos con escala ordinal o de
una distribucin de una variable cuantitativa marcadamente asimtrica.
Anlisis de datos El Anlisis de datos en Psicologa es una herramienta metodolgica necesaria, de carcter
fundamentalmente estadstico, para la investigacin en Psicologa.
Anlisis
exploratorio de
datos
(AED) Es tanto una tcnica de anlisis de datos como una manera de pensar que ensea a la
persona que investiga tendencias en los datos que no esperaba encontrar. Entre las tcnicas de AED
destacan las tcnicas grficas (diagrama de tallo y hojas) que permiten una rpida inspeccin de las
propiedades de la distribucin de los datos: posicin central, variabilidad y forma. Tambin
dispone de ndices estadsticos resistentes a los datos extremos de la distribucin, por lo que se les
suele denominar tambin estadsticos robustos.
Apuntamiento ver Curtosis
Asimetra Una distribucin asimtrica es una distribucin no
simtrica por lo que los datos se distribuyen de forma
desigual en los extremos de la distribucin. Cuando hay
muchos datos con valores bajos y pocos datos con
valores altos la distribucin es asimtrica positiva. Por
ejp, el n de horas de sueo diario de 0 a 40 aos. Por el
contrario, cuando hay pocos datos con valores bajos y
muchos datos con valores altos, la distribucin es
asimtrica negativa. Por ejlo, edad de fallecim> en los
pases desarrollados.
Para su clculo se dispone de varios ndices. Si el coeficiente de asimetra es As0 la distribucin
es simtrica positiva.
AZAR Casualidad. Caso fortuito. Fenmeno que no sigue una regla, un orden, una ley conocida. En
Estadstica se contrastan las probabilidades a favor de las hiptesis del investigador en cuanto al
efecto de las variables independientes sobre las dependientes contra la probabilidad de que los
resultados sean debidos al azar, a la pura casualidad.
BAREMO Tabla elaborada como regla para atribuir valor a las puntuaciones individuales o de grupo. Las
puntuaciones del grupo inicial, una muestra que debe ser representativa de la poblacin, sirven de
regla para interpretar las puntuaciones de otros sujetos o grupos que renan las mismas
caractersticas. Es frecuente que a cada puntuacin individual del grupo original se le asigne la
correspondiente trasformacin a puntuaciones como cuantiles (cuartiles, deciles o percentiles),
puntuaciones tpicas, C.I., etc. En adelante, a cualquier puntuacin de un nuevo sujeto se le
atribuye la correspondiente puntuacin (cuantil) del baremo.
-
C
Caja y bigotes La caja representa el 50% de las observaciones centrales, es decir, las observaciones
comprendidas entre el percentil 25 (o primer cuartil) y el percentil 75 (o tercer cuartil). La lnea
en el centro de la caja representa la mediana o percentil 50. Los bigotes son lneas que se
extienden fuera de la caja hasta una distancia de 1,5 veces la longitud de la caja de tal forma
que los datos que quedan fuera de estos bigotes corresponden a las observaciones atpicas,
llamadas tambin "outliers".
Caracterstica Una caracterstica es una propiedad de los individuos de una poblacin. Uno de los objetivos
de la investigacin psicolgica es determinar las propiedades de una determinada poblacin,
propiedades que estarn presentes en todos y cada uno de los individuos que la conforman. Sin
embargo, aunque todos los elementos tengan esa propiedad no todos la tienen en el mismo
grado. Por ejemplo, una propiedad de los mamferos es el sexo, que presenta dos alternativas:
macho y hembra; una propiedad de los seres humanos es el estado civil, con sus diferentes
alternativas: soltero, casado, separado, viudo, etc.; otra puede ser las creencias religiosas:
cristianos, mahometanos, budistas... agnsticos o ateos. En estos ejemplos se ve que las
propiedades de los individuos de una poblacin pueden adoptar diversas variedades. En trminos
estadsticos, a la propiedad de los individuos de una poblacin se le denomina caracterstica,
mientras que a las diferentes variedades de esa caracterstica se le denomina modalidad.
Causalidad El coeficiente de correlacin no permite por tanto una interpretacin en trminos de causa-
efecto. Si se obtiene un valor alto y positivo, indica que cuando una de las variables aumenta
su valor en la escala, la otra, en promedio, tambin lo hace, mientras que cuando el valor es
bajo y negativo indica justamente lo contrario, es decir, que cuando una de las variables
aumenta de valor, la otra, en promedio, disminuye. Por ltimo, los valores prximos a cero
indican ausencia de relacin, o lo que es lo mismo que cuando una de las variables va
aumentando de valor, la otra, en promedio, a veces aumenta y a veces disminuye. En ningn
caso se debe caer en el error de pensar que una variable es causa de la otra. A partir de una simple estudio correlacional, es imprudente establecer ese nexo de causalidad sin acudir a un
enfoque experimental que pudiera determinar sin en verdad existe dicho nexo de causalidad o
no. Incluso en estudios de variables en que se pueda llegar a pensar que una es causa de la otra,
como, por ejemplo, la relacin que pueda darse en los alumnos de secundaria entre la ansiedad
ante una prueba de conocimientos de estadstica y el rendimiento en dicha prueba. Se podra
pensar que un alto grado de ansiedad determina el mal rendimiento en la prueba, y que un bajo
nivel determina un alto rendimiento. Quiere esto decir que la ansiedad es la causa del
rendimiento en esa prueba? Pero tambin podra ser que la prueba de conocimientos de
estadstica provoca una reaccin de ansiedad, de tal modo que los alumnos poco preparados
reaccionan con un aumento de la ansiedad mientras que los mejores preparados se manejan con
cierta tranquilidad en dicha prueba.
Chi-cuadrado
(prueba)
Prueba estadstica para determinar, a partir de los datos recogidos en una muestra, si dos
variables cualitativas estn relacionadas.
Chi-square
(distribucin)
Trmino que se refiere a una distribucin de probabilidad de una variable continua
Coeficiente chi-
cuadrado
Es un ndice para determinar, a partir de los datos recogidos en una muestra, si dos variables
cualitativas estn relacionadas. De este ndice se derivan el coeficiente de contigencia y el
coeficiente fi.
Coeficiente de
contingencia
Es un ndice de la relacin entre dos variables cualitativas y que, al igual que el coeficiente fi,
deriva de Chi cuadrado. Su expresin es la siguiente: Tericamente toma valores
comprendidos entre 0 y 1, aunque no siempre alcanza el valor 1, incluso cuando las variables
estn completamente asociadas. En tablas cuadradas, cuando ambas variables tienen el mismo
nmero de categoras (es decir, I = J), su mximo valor es
-
Coeficiente de
correlacin
Es un ndice numrico que representa la intensidad con que dos variables se relacionan. Si dos
variables son independientes, es decir, si no existe relacin entre ellas, el coeficiente de
correlacin es cero. Dosvariables, X e Y, estn relacionadas cuando cambios en una variable
producecambios en la otra variable. Si se observa que cuando aumentan los valores en una
variable tambin aumentan o disminuyen-, en promedio, los valores en la otra, se puede sospechar que hay correlacin entre ellas. Para cuantificar la intensidad de la relacin entre dos
variables se dispone de distintos ndices de correlacin dependiendo de la naturaleza de las
variables. El siguiente cuadro es un resumen de los ndices que se estudiarn:
Variable Variable Coeficiente
Cualitativa Cualitativa Correlacin Fi
chi-cuadrado
Coeficiente de contingencia
Cualitativa dicotmica Cuantitativa Correlacin Biserial-puntual
Cuantitativa Cuantitativa Correlacin de Pearson
Ordinal Ordinal Correlacin de Spearman.
Coeficiente de
correlacin de
Pearson
Un inconveniente de la covarianza, como medida de variacin conjunta o relacin entre dos
variables es que depende de las unidades de medida en que se expresen las variables de inters
y que no tiene un valor mximo y mnimo, lo que dificulta enormemente su interpretacin. Por
ello, se acude al coeficiente de correlacin de Pearson que es la covarianza entre dos variables,
X e Y,calculada a partir de sus puntuaciones tpicas.Es decir: rxy = cov(zx,zy)
Se representa con la letra r y el subndice xy, (rxy), para representar la relacin lineal entre dos
variables X e Y. Indica la relacin lineal entre dos variables cuantitativas y es un nmero sin
unidad de medida comprendido entre -1 y +1. Un valor de 0 indica que no existe relacin lineal
entre las dos variables. Los valores positivos indican que valores altos de X se asocian con
valores altos de Y, y valores de r negativos indican que valores altos de X se asocian con
valores bajos de Y. Existen diferentes expresiones para obtener la correlacin entre dos
variables cuantitativas segn el tipo de puntuaciones que estemos empleando. (Ver puntuacin
directa, puntuacin diferencial o puntuacin tpica).
Datos con coeficiente de correlacin prxima a +1.
Datos con coeficiente de correlacin prxima a -1. Datos con coeficiente de correlacin prximo a 0.
Coeficiente de
determinacin
Es el coeficiente de correlacin de Pearson al cuadrado y toma cualquier valor positivo
comprendido entre 0 y 1. Se interpreta como proporcin de varianza explicada, es decir, de
toda la variabilidad de la variable Y una determinada proporcin se debe a la variabilidad de la
variable X.Por ejemplo, imagine que entre las variables, X: puntuacin en un test de habilidad
numrica e Y: nota en esta asignatura existe una correlacin de 0,7. Entonces el coeficiente de
determinacin vale 0,49 que significa que el 49% de la variabilidad de las notas obtenidas por
todos los alumnos en la asignatura, es explicada o se debe- a la habilidad numrica. El 51% restante de la variabilidad de las notas se deber a otras variables no incluidas en la regresin
(por ejemplo, la motivacin, el esfuerzo, el tiempo dedicado al estudio, etc.)Con otras palabras,
indica el grado en que una variable es capaz de predecir otra con la que est relacionada.
-
Coeficiente de
variacin
Es un ndice de variabilidad especialmente til para comparar variabilidades de caractersticas
de diferente naturaleza, o de la misma naturaleza en diferentes grupos y es igual al cociente
entre la desviacin tpica y la media. El resultado de este cociente es un nmero abstracto que
indica el nmero de veces que el numerador (la desviacin tpica) contiene al denominador (la
media), con independencia de la unidad en que haya sido medida la variable. A este ndice as
obtenido se le denomina coeficiente de variacin o coeficiente de variabilidad relativa y se
expresa as:
Combinatoria Es una rama de las matemticas que estudia las diferentes formas de agrupamiento y
combinacin de un conjunto de elementos y establece las propiedades y leyes de formacin de
las agrupamientos resultantes. Conocer estas diferentes formas de agrupamiento nos permitir dar respuesta a preguntas como las siguientes: De cuantas formas distintas pueden sentarse tres nios y dos nias en la primera fila
de una clase?.Con un banco de 100 preguntas tipo test cuntas pruebas diferentes de 25 preguntas puedo construir?,
o de cuntas formas diferentes se pueden asignar cinco empleados de un comercio a tres secciones distintas?
Conocimiento cientfico Es el conocimiento adquirido utilizando el mtodo cientfico.
Constante En contraste con la definicin ofrecida de variable, cuando una caracterstica presenta una sola
modalidad, o cuando los objetos presentan la misma magnitud de una determinada
caracterstica, decimos que se trata de una constante, y los objetos o entidades estudiadas
tendrn todos el mismo valor numrico.
CONTRASTE DE
HIPTESIS
Proceso sistemtico que concluye tomando una decisin sobre la hiptesis nula (H0): rechazo o
no rechazo, con la consiguiente aceptacin o no de la hiptesis alternativa (H1) asumiendo un
riesgo de error tipo I = a .
CONTROL
El mtodo cientfico pretende establecer relaciones causales entre las variables relacionadas en
su hiptesis. Lograr una meta tan elevada como este exige del investigador el dominio de la
situacin, de forma que, teniendo bajo su dominio la variable independiente, controle el
conjunto de circunstancias, hechos, personas que, adems de dicha variable, puedan influir en la dependiente. Si no fuera as, quedara la duda de si la relacin encontrada se debe a la
variable independiente, a alguna de esas otras variables convertidas en extraas, esto es, en hiptesis rivales a la suya- o la la interaccin entre unas y otras.
CORRELACIN
Entendemos por correlacin la relacin existente entre dos o ms variables. La correlacin
puede ser perfecta, positiva o negativa (valor de 1), nula (valor de 0), o imperfecta, que
incluye toda la gama de valores que van de 0 a 1, tanto positivos como negativos. La
correlacin es positiva cuando los valores de las variables aumentan o disminuyen en la misma
direccin, y negativa en caso contrario. El ndice de correlacin coeficiente de correlacin- ms conocido es el de Pearson, representado por rxy.
Correlacin biserial-
puntual
Es el coeficiente de correlacin que se aplica cuando se trata de cuantificar la relacin que
existe entre una variable dicotmica por esencia (p.e., sexo), o dicotomizada por conveniencia
con otra variable cuantitativa. Su expresin es la siguiente: donde: es la media de las
puntuaciones de la variable cuantitativa X cuando la variable dicotmica (o dicotomizada) Y
tiene valor 1. es la media de las puntuaciones de la variable cuantitativa X cuando la variable
dicotmica (o dicotomizada) Y tiene valor 0. SX es la desviacin tpica de la variable
cuantitativa X. p es la proporcin de observaciones cuyo valor en Y es 1. q es la proporcin de
observaciones cuyo valor en Y es 0. El rango en valor absoluto que se puede obtener con el
coeficiente de correlacin biserial puntual est entre 0, cuando las medias de la variable
cuantitativa para cada categora de la variable cualitativa son iguales hasta 1. El signo en este
ndice depender de cul de las dos medias se siten en el numerador de la expresin. Si la
media de X cuando Y=1 es mayor que la media de X cuando Y=0, entonces la correlacin
saldr positiva indicando relacin directa entre la variable X y el valor 1 de Y. Por el contrario,
si la media de X cuando Y=1 es menor que la media de X cuando Y=0, entonces la correlacin
saldr negativa indicando relacin directa entre la variable X y el valor 0 de Y.
Correlacin de
Spearman
Cuando queremos analizar la relacin entre variables ordinales, se aplica el coeficiente de
correlacin de rangos de Spearman. Para ello, se asignan rangos u rdenes a cada valor de la
variable y se calcula el cuadrado de las diferencias (di) de rangos entre las dos variables. Se
suman estos cuadrados, , y por ltimo se obtiene el coeficiente con la siguiente expresin: donde
n es el tamao de la muestra o nmero total de observaciones. Los valores del coeficiente de
correlacin de Spearman oscilan entre -1, cuando hay una perfecta relacin inversa entre los
rdenes de las dos variables, 0, cuando no hay relacin entre ambas variables, y +1, cuando hay
una relacin perfecta directa entre las rdenes de ambas variables.
-
Correlacin espuria Cuando se observa un coeficiente de correlacin lineal alto entre dos variables, lo nico que se
puede concluir es que estn relacionados entre s, pero no siempre se puede establecer un nexo
de causalidad de una variable respecto de otra. Hay muchas variables que presentan una alta
correlacin entre s, pero ello se debe a la presencia de una tercera variable que tiene una fuerte
relacin entre ellas. Este tipo de correlaciones se denominan correlaciones espurias. Hay
muchos casos que ilustran este tipo de correlaciones, por ejemplo, la alta correlacin que se da
entre el nmero de matrimonios celebrados y la temperatura media mensual. En ningn caso se
debe caer en el error de pensar que una variable es causa de la otra, el sentido comn nos lleva a pensar que la relacin es meramente fortuita o producida por alguna otra variable que
no hemos contemplado y que pudiera estar relacionada con las dos variables que presentan una
alta correlacin entre s (la mayor parte de las parejas suelen aprovechar los periodos veraniegos para contraer matrimonio, y son precisamente esos perodos en los que la temperatura es mayor).
Correlacin phi El coeficiente de correlacin fi (o phi) es vlido para establecer la asociacin existente entre dos
variables cualitativas con cualquier n de categoras de las variables. Su expresin es: El valor
mnimo de este ndice es 0, que se obtiene cuando el valor de Chi cuadrado es cero. En cuanto al
valor mximo, el ndice phi puede alcanzar valores mayores a 1 cuando el valor de chi cuadrado
sea superior al n de observaciones de la muestra. Hay, sin embargo, un tipo de variables
cualitativas, las denominadas variables dicotmicas, que slo tienen dos categoras posibles
(sexo, x ej). Para este tipo de variables, el coeficiente de correlacin puede ser tambin el siguien:
Con variables dicotmicas el coeficiente phi slo puede obtener valores absolutos entre 0 y 1, y
adems ser positivo o negativo dependiendo de cual de los productos del numerador sea mayor.
Por ello, para su interpretacin hay que considerar la distribucin de las frecuencias en la tabla.
Covarianza ndice que evala el grado con que dos variables cuantitativas
varan conjuntamente. Puede tomar cualquier valor positivo o
negativo. Un valor positivo indica que aumentos en una variable se
corresponden con aumentos en la otra. Un valor negativo indica que aumentos en una variable
se corresponden con decrementos o disminuciones en la otra. Si las dos variables son
independientes, la covarianza es cero. Cuando se dice que una variable aumenta o disminuye
en promedio, se quiere resaltar que lo que va aumentando o disminuyendo son las medias de
una variable condicionada a los valores de la otra, mas que los valores concretos en s. (Ver
Media condicionada). Se obtiene calculando la media de los productos de las desviaciones
respecto a la media de las dos series de puntuaciones.
Cuartil Los cuartiles son las puntuaciones que dividen la distribucin en cuatro partes iguales con el
25% de los datos en cada una de ellas. Hay, por tanto, tres cuartiles: el primer cuartil
corresponde con el percentil 25 y deja por debajo el 25% de los datos. El segundo cuartil
corresponde con el percentil 50 y la mediana y el tercer cuartil corresponde con el percentil 75.
Entre dos cuartiles consecutivos se encuentra el 25% de los datos.
Cuasi-varianza Es un ndice de variabilidad que se obtiene sumando los cuadrados de las
diferencias de todas las puntuaciones respecto a la media y dividiendo entre (n-
1). Su utilidad estriba en que es el mejor estimador de la varianza poblacional,
frente a la varianza de la muestra que estima con error la varianza de la
poblacin. Por esta razn, se la conoce tambien con el nombre de varianza insesgada. Cuando
las muestras son grandes la varianza y la cuasi-varianza prctica> coinciden ya que apenas se
producen diferencias al dividir la suma de los cuadrados de las desviaciones entre n o entre n-1.
Curtosis Se refiere al grado de apuntamiento de la distribucin de
frecuencias. Cuando es muy apuntada, se dice que es
leptocrtica, si es muy aplastada, se dice que es platicrtica.
Un grado intermedio entre estos grados de apuntamiento es
la distribucin mesocrtica, que es la distribucin normal o
de referencia para establecer el grado de apuntamiento.
CURVA NORMAL
(DE
PROBABILIDADES)
Se trata del modelo estadstico al que tienden con ms frecuencia los datos empricos. Cuando
estos se acomodan razonablemente al modelo, podemos aplicarles sus propiedades. Las
caractersticas fundamentales de la curva normal de probabilidades son: a) Tener como valor
mximo el de la ordenada de la media b) Ser simtrica con respecto a la ordenada de la media.
c) Presentar dos puntos de inflexin, uno para el valor de la Media ms una desviacin tpica
(media + s) y otro para la Media menos una desviacin tpica (media s) d) La curva es asinttica con respecto al eje de abscisas: por mucho que se prolongue a derecha e izq nunca
llega a cortarlo. Por ello, nunca encontraremos una probabilidad = 1, que sera un suceso seguro.
-
D
Decil Los deciles son las puntuaciones que dividen la distribucin en diez partes iguales con el
10% de los datos en cada una de ellas.
Desviacin media Es la media de las diferencias en valor absoluto de n puntuaciones
respecto de su media aritmtica. Es decir, dadas las puntuaciones X1,
X2, ..., Xn, su desviacin media, DM, es
El hecho de que en este ndice se tomen las diferencias en valor
absoluto de cada puntuacin respecto de la media aritmtica, se deriva
de la primera propiedad de este ndice de tendencia central.
Desviacin tpica Es la raz cuadrada positiva de la varianza. Es un ndice de variabilidad
o dispersin de un conjunto de datos respecto a la media.
Medida de dispersin o variabilidad. Estadsticamente es la raz
cuadrada de la media de la suma de las desviaciones individuales de un
grupo de sujetos, elevadas al cuadrado, con respecto a la media aritmtica de un grupo. La
varianza es un ndice del grado en que las puntuaciones individuales se agrupan ms o menos
en torno a la media del grupo; si todas las puntuaciones individuales coincidieran con la
media, la varianza sera 0; cuanto ms se aparten de ella, mayor valor alcanzar la varianza.
Esta medida es muy importante en la Estadstica inferencial ya que se utiliza en las pruebas
de contraste de hiptesis.
Diagrama de rbol Representacin grfica que permite dibujar y calcular el nmero de elementos del espacio
muestral de un experimento aleatorio.
DIAGRAMA DE
BARRAS
Representacin grfica especialmente adecuada a variables cualitativas; las barras, situadas
unas a continuacin de otras, tienen como base las diferentes categoras y como altura su
frecuencia.
DIAGRAMA DE
CAJA
Representacin grfica especialmente relevante por la gran cantidad de informacin que
ofrece sobre un conjunto de puntuaciones originales. En concreto nos informa sobre: a) Las
puntuaciones extremas b) La Mediana, igual al Q2 o cuartil 2 c) El recorrido intercuartlico:
Q1 a Q3. d) La informacin contenida sobre este valor en el rectngulo central: en l
podemos apreciar si se da equilibrio o no entre los diferentes cuartile. e) En ocasiones puede
informarnos sobre las puntuaciones fuera de rango.
Diagrama de
dispersin
Es una alternativa a los diagramas tridimensionales para
representar grficamente dos variables cuantitativas medidas
conjunta>. Se llama tambin "nube de puntos" y es la
representacin grfica de dos variables en la que cada punto
representa una determinado dato definido por unas coordenadas
que corresponden a los valores de esa observacin en la variable X
e Y. En el eje horiz se sita los valores de la V independiente y en
el eje vertical los de la V dependiente. Este tipo de grfico es
especialmente til en el anlisis de correlacin y regresin.
Se trata de la representacin grfica de los pares de valores de un grupo de sujetos en dos
variables. El diagrama nos ilustra de la existencia o no de correlacin, de la intensidad y del
tipo (positiva o negativa). Sobre un eje de coordenadas se van marcando los puntos en que se
cruzan los valores de la variable X y de la variable Y.
Diagrama de Tallo y
Hojas
Es un tipo de representacin
grfica muy utilizada dentro
del Anlisis Exploratorio de
datos y muy relacionado con
el histograma con la ventaja
de aportar ms informacin
donde los tallos se
representan en el eje vertical
y corresponden a la amplitud
de los intervalos del
histograma y las hojas a la
frecuencia.
-
Diagrama
tridimensional
Permite representar grficamente la distribucin conjunta de frecuencias absolutas (o de
proporciones) de dos variables y es til cuando el nmero de valores o categoras de cada
variable no es muy elevado. En caso contrario el nmero de barras (o rectngulos, segn el
caso) que puede resultar hara poco informativo el diagrama y las barras quedaran ocultas unas
detrs de otras. Lo mismo sucede con las variables cuantitativas continuas cuando se quiere
representar mediante una histograma tridimensional sin agrupar los datos en intervalos. Una
alternativa a los diagramas tridimensionales para representar grficamente dos variables
cuantitativas medidas conjunta> es el denominado diagrama de dispersin o nube de puntos.
DISEO
EXPERIMENTAL
Sin entrar ahora en el segundo objetivo control de la varianza- el diseo en cuanto plan,
estructura y estrategia nos permite poner a prueba, en condiciones rigurosas, la hiptesis del
investigador sobre el efecto de una variable independiente sobre otra dependi>, contrastando el
resultado con la posibilidad probabilidad- de que tal efecto sea debido al azar.
DISEO
Siguiendo a Kerlinger. Diseo es el plan, estructura y estrategia de una investigacin cuyo objetivo es dar respuesta a ciertas preguntas y controlar la varianza. Como se aprecia, el autor define el trmino e incluye en su concepto los dos objetivos fundamentales del mismo.
Diseo de
investigacin
Es la determinacin de un plan de trabajo o procedimiento para la recogida de datos.
DISPERSIN Caracterstica de un grupo que nos informa del grado en que las puntuaciones de los
integrantes de un grupo se sitan de forma ms o menos cercana la medida de posicin de
que se trate (por ejemplo, de la media aritmtica). Un grupo en que todos su miembros
obtienen una puntuacin igual a la medida de posicin tiene una dispersin de 0; sin
embargo, no existe un valor fijo de dispersin mxima. Las medidas de dispersin o
variabilidad ms importantes y utilizadas son la desviacin tpica o la varianza.
DISTRIBUCIN DE
FRECUENCIAS
En ocasiones, las puntuaciones originales o directas pueden representarse en una tabla en la
que junto a estas Xi- se incluya el nmero de veces que cada puntuacin se repite (frecuencia: fi). Cuando el nmero de puntuaciones diferentes es elevado, las puntuaciones
directas suelen sustituirse por conjunto de ellas, denominados intervalos; junto a ellos, las
veces que ese conjunto de puntuaciones se repite (frecuencia del intervalo). En estos casos, a
la hora de representar al intervalo (por ejemplo, para operar) se utiliza su valor medio,
conocido como marca de clase.
Distribucin binomial Es la distribucin de probabilidad de una variable aleatoria discreta que describe el nmero
de sucesos que se presentarn para un nmero dado de ensayos y conocida la probabilidad de
aparicin del suceso.
Distribucin binomial
negativa
Es la distribucin de probabilidad de una variable aleatoria discreta que describe el nmero
de ensayos que se requieren para conseguir k xitos.
Distribucin chi-
cuadrado
O ji-cuadrado es la distribucin de probabilidad de una variable continua (ver variable chi-
cuadrado)
Distribucin
condicionada
En una distribucin conjunta de frecuencias absolutas (o de frecuencias
relativas), recibe el nombre de distribucin condicionada la distribucin de una
de las variables condicionada a cada valor de la otra variable. As, por ejemplo,
si tenemos dos variables, X: "Hbitos de lectura" e Y: "Horas de consumo de TV" la
distribucin condicionada de frecuencias absolutas se obtiene dividiendo cada frecuencia
absoluta conjunta por su correspondiente frecuencia marginal; es decir:
donde: nij: frecuencia conjunta y n.j: frecuencia marginal. Esta distribucin condicionada nos
informa de la proporcin de observaciones de cada uno de los valores de una variable
asociado a cada uno de los valores de la otra. Por ejemplo, nos permite conocer los "hbitos
de lectura" para los diferentes valores de "horas de consumo de TV" y, viceversa, las "horas
de consumo de TV" para los diferentes "hbitos de lectura".
Distribucin conjunta
de frecuencias
absolutas
Es una tabla de doble entrada, en la que por el lado de las filas se sitan las categoras de la
variable X, y por el lado de las columnas se sitan las categoras de la variable Y. En cada
celdilla de la tabla se presenta la frecuencia absoluta conjunta.
Distribucin conjunta
de frecuencias
relativas
La distribucin conjunta de frecuencias relativas, o proporciones, es una tabla de doble
entrada, en la que por el lado de las filas se sitan las categoras de la variable X, y por el
lado de las columnas se sitan las categoras de la variable Y. En cada celdilla de la tabla se
presenta la frecuencia relativa conjunta o proporcin conjunta.
-
Distribucin de
Bernouilli
Es la funcin de probabilidad de un experimento aleatorio en el que slo pueden ocurrir dos
sucesos mutuamente excluyentes y que se denomina experimento de Bernouilli en honor del
matemtico Jacobo Bernouilli que deriv su funcin de probabilidad
Distribucin de
frecuencias
Es una tabla donde de forma ordenada se presentan los diferentes
valores o modalidades que presenta una variable (o caracterstica) con
el nmero de observaciones (frecuencia) que presentan la misma
modalidad. La suma de las frecuencias de cada modalidad es igual al
tamao de la muestra o nmero total de observaciones. Por ejemplo,
en una muestra de 150 emigrantes su lugar de procedencia ha sido:
Distribucin de
Poisson
Es el lmite al que tiende la distribucin binomial cuando el nmero de ensayos, N, aumenta
y la probabilidad de aparicin de un suceso, p, tiende a cero. Por esta razn se la denomina
tambin como "Ley de los sucesos raros". Por ejemplo, nacimientos de trillizos en una
ciudad. La distribucin de Poisson tiene una funcin de probabilidad conocida que se define
mediante una simple ecuacin matemtica que permite obtener las probabilidades de
aparicin de un determinado suceso.
Distribucin de
porcentajes
Es una tabla donde de forma ordenada se presentan los diferentes
valores o modalidades que presenta una variable (o caracterstica)
con el porcentaje (tanto por ciento) de observaciones que
corresponde a cada modalidad. La suma de los porcentajes de
cada modalidad es igual 100. Por ejemplo, en una muestra de 150
emigrantes el porcentaje de su lugar de procedencia ha sido:
Distribucin de
probabilidad
De una variable aleatoria discreta es una lista de las
probabilidades asociadas con cada posible valor de la
variable. Se la llama tambin Funcin de Probabilidad o, en
otros textos, Funcin de Masa de Probabilidad y ms
formalmente se define como una funcin que asigna
probabilidades a cada valor, xi, de la variable aleatoria discreta, X. Se representa por f(x) =
P(X= xi) y cumple las siguientes condiciones:
que indica que la funcin de probabilidad no puede tomar valores negativos ni mayores de 1
y que la suma de las probabilidades asignadas a todos los posibles valores discretos de la
variable es igual a 1. Algunas variables aleatorias tienen como funcin de probabilidad una
funcin o ecuacin matemtica conocida. Por ejemplo, la funcin de probabilidad de la
distribucin binomial, es:
Distribucin de
proporciones
Es una tabla donde de forma ordenada se presentan los diferentes
valores o modalidades que presenta una variable (o caracterstica)
con proporcin (tanto por uno) de observaciones que corresponde a
cada modalidad. La suma de las proporciones de cada modalidad es
igual 1. Por ejemplo, en una muestra de 150 emigrantes la
proporcin de su lugar de procedencia ha sido:
Distribucin F Es la funcin de densidad de probabilidad de la variable F
Distribucin
heterognea
Es una distribucin con una alta variabilidad con los datos muy dispersos y alejados de su
tendencia central.
Distribucin
homognea
Es una distribucin con poca variabilidad porque sus datos se encuentran muy concentrados
respecto a su tendencia central.
Distribucin marginal En una tabla de distribucin conjunta de frecuencias absolutas (o de frecuencias relativas),
cada una de las dos variables tiene su propia distribucin, la misma que si considerramos
cada variable por separado. Estas dos distribuciones se llaman marginales, ya que se colocan
en los mrgenes de la distribucin conjunta, y se obtienen a partir de la distribucin conjunta
de una manera muy sencilla: sumando las filas, por un lado, y las columnas, por otro. Por
tanto, las distribuciones marginales de una distribucin conjunta de dos variables, X e Y, se
reduce a dos distribuciones (de frecuencias absolutas o de proporciones) de una variable. Una
representa la distribucin de la variable X, sin considerar a la variable Y, y la otra representa
la distribucin de la variable Y sin tener en cuenta la variable X
-
Distribucin muestral Es la distribucin de probabilidad de un estadstico calculado en todas las posibles muestras
del mismo tipo y tamao extradas de una determinada poblacin. Se demuestra que la
distribucin muestral de la media es, o se aproxima, a la distribucin normal. El
conocimiento de la distribucin muestral de los estadsticos es la base de la inferencia
estadstica y el contraste de hiptesis que se estudia en cursos posteriores.
Distribucin
multinomial
Es una generalizacin de la distribucin binomial en la que (a diferencia de sta basada en
variable aleatoria de Bernouilli) cada ensayo puede presentar ms de dos categoras,
exhaustivas y mutuamente excluyentes. Sus caractersticas son: a)consiste en N pruebas
independientes. b)cada prueba o ensayo presenta ms de dos resultados. c) las probabilidades
correspondientes a cada uno de los resultados permanece constante y tales que su suma es
igual a 1.
Distribucin normal Se estudia como distribucin de frecuencias que representa la distribucin de muchas
variables y como distribucin de probabilidad por su especial incidencia en la inferencia
estadstica y contraste de hiptesis que se estudiarn en cursos posteriores. Esta distribucin
se debe a Carl Friedrich Gauss que estudi y describi sus propiedades matemticas.
Distribucin normal
estndar o tipificada
Es una distribucin normal con media cero y desviacin tpica uno.
Distribucin t Distribucin de probabilidad de la variable t de Student
Doble sumatorio Supongamos que un grupo total se
descompone en k grupos con n personas
cada uno, es decir todos los grupos tienen el
mismo nmero de personas:
donde Xij representa la
puntuacin de la persona i que
pertenece al grupo j. La suma de las n
puntuaciones del grupo total vendr dada
por:
Dicho en palabras, el doble sumatorio
significa el sumatorio de los sumatorios de
las puntuaciones de las personas en cada
grupo.
E
Ecuacin de regresin La ecuacin de regresin es una funcin matemtica que representa la relacin entre dos o
mas variables. En este curso se estudia la ecuacin de regresin lineal simple entre dos
variables X e Y que viene definida por la ecuacin de una recta, de expresin: Esta
ecuacin queda perfectamente definida cuando se obtienen los valores de la ordenada, a y
la pendiente, b.
Enfoque confirmatorio Es la forma de abordar muchos anlisis estadsticos cuando se realizan para que los datos
confirmen (o refuten) las hiptesis que se plantean, en vez de plantearse la cuestin de
manera exploratoria de forma tal que sean los propios datos los que nos "digan" las
relaciones o tendencias que hay entre las diferentes caractersticas objeto de estudio.
Enfoque exploratorio El enfoque exploratorio trata de que sean los propios datos los que nos "digan" las relaciones
que hay entre las diferentes caractersticas objeto de estudio. En contraste al modo
confirmatorio, el modo exploratorio est abierto a un amplio abanico de explicaciones
alternativas, lo cual no significa que el modo confirmatorio deba ser desterrado del anlisis
sino, ms bien, que no debe ser el que se emplee de manera exclusiva.
Entidades estadsticas Cada uno de los elementos que componen una poblacin
Equiprobables Dos o mas sucesos son equiprobables si tienen la misma probabilidad de ocurrencia.
-
Error absoluto Es la diferencia , en valor absoluto, entre el valor observado y el
pronosticado mediante la recta de regresin.
Error de agrupamiento Cuando se ordenan los datos en intervalos y asumen todos el valor del punto medio, se
pierde la informacin de cada puntuacin concreta, lo que puede producir un error, que se
conoce como error de agrupamiento. En algunos intervalos, el punto medio puede ser una
sobreestimacin de los valores originales, mientras que en otros intervalos se puede dar una
subestimacin. En distribuciones de frecuencia con un n elevado de datos, los errores por
exceso en unos intervalos tienden a compensarse con los errores por defecto de otros, con lo
cual, a efectos del anlisis estadstico, el empleo del punto medio como valor representativo del
intervalo, produce resultados similares a los producidos si se emplearan los datos originales.
Error de pronstico Es la diferencia entre la puntuacin observada, Y, y la pronosticada, Y',
mediante la ecuacin de regresin. Esto es:
Error tpico Es la desviacin tpica de la distribucin muestral de un determinado estadstico. De esta
forma, el error tpico de la media es la desviacin tpica de la distribucin muestral de la
media. Con otras palabras, la desviacin tpica de todas las medias calculadas en todas las
posibles muestras del mismo tipo y tamao, n, extraidas de una determinada poblacin de
tamao N.
Error tpico de
estimacin
Es la desviacin tpica (raz cuadrada de la varianza) de los errores o residuos de la
regresin.
Escala de intervalo En una escala de intervalo el punto cero es arbitrario y posee unidad de medida, por lo que
los nmeros asignados tienen ya un significado de cantidad, en el sentido ordinario de la
palabra. Un ejemplo sencillo y muy ilustrativo son las escalas Centgrada (C) y Farenheit
(F) de temperatura, donde como se sabe para la escala Centgrada el punto 0 corresponde a
la temperatura de congelacin del agua y el punto 100 a la temperatura de ebullicin. El
cero es arbitrario y no indica carencia del atributo medido, o lo que es lo mismo, no indica
ausencia de calor. En una escala de intervalo el nmero 20 no representa el doble de
cantidad del atributo medido que el 10, de forma que 20C no es el doble de calor que 10,
pero por el contrario, la diferencia entre dos valores de la escala representan distancias
entre cantidades de la propiedad medida, de tal forma que podemos decir que la diferencia
entre 40C y 30C es el doble de la diferencia entre 20 y 15C. Esto es as, como ya se ha
sealado, porque el punto 0 no representa carencia del atributo medido sino que es un
punto cero arbitrario. Respecto a las transformaciones admisibles es cualquier
transformacin lineal tal de los valores iniciales que deja la escala invariante
Escala de medida Es un procedimiento por el cual se relacionan de manera biunvoca (uno a uno) un conjunto
de modalidades (distintas) con un conjunto de nmeros (distintos). Esto es, a cada modalidad
le corresponde un slo nmero, y a cada nmero le corresponde una sola modalidad.
Atendiendo a las relaciones que puedan verificarse empricamente entre las modalidades de
los objetos o caractersticas pueden distinguirse cuatro tipo de escalas de medida, segn el
esquema tradicional propuesto por Stevens (1946) en su primera publicacin sobre teora de
la medida: escala nominal, escala ordinal, escala de intervalo y escala de razn.
Al aplicar la regla de medida y la correspondiente unidad a un determinado objeto llegamos
a un nmero. Pero los nmeros resultantes no tienen todos las mismas propiedades ni, por
tanto, se les pueden aplicar las mismas operaciones matemticas. Con los nmeros ms
perfectos, propios de una escala de medida de cociente o de razn (edad, talla, peso)
podemos utilizar todas las operaciones matemticas. Con los de escalas de intervalo
(temperatura), no, ya que no tienen un 0 absoluto. Hay nmeros propios de una escala de
medida ordinal, que admiten menos operaciones que los anteriores; ahora bien, dado que el
orden tiene en alguna medida un carcter cuantitativo (por ejemplo: clase social) algunos
autores clasifican, en ocasiones, a estas variables como cuasi-cuantitativas. Por ltimo, hay
nmeros propios de escalas de medida nominal; aqu los nmeros no indican cantidad sino
diferencia: lo que es igual recibe el mismo nmero y lo que es diferente, un nmero distinto.
Escala de razn La escala de razn es la ms rica en cuanto a la informacin que proporciona, porque
adems de poseer todas las propiedades de las escalas anteriores: igualdad - desigualdad
(escala nominal), orden (escala ordinal), y distancia (escala de intervalo), tiene la ventaja
de tener un cero absoluto que indica carencia absoluta del atributo medido. Esta es la
escala ms habitual para medir propiedades fsicas, como el peso, la altura, el volumen,
etc., pero es difcil encontrar variables psicolgicas que puedan medirse con esta escala.
-
Por eso, podemos afirmar que el que mide 180 cm, es el "doble" de alto que el que mide
90cm pero nunca que un CI de 180 es el doble de otro CI de 90, a menos que la variable
inteligencia la podamos medir con escala de razn donde el punto cero represente al que
carece "absolutamente" de inteligencia. En consecuencia, la escala de razn incorpora las
caractersticas del sistema numrico de las escalas anteriores: la igualdad, el orden y la
distancia, a la que aade la propia de esta escala que es la igualdad de razones. Al tener un
origen de escala absoluto, la nica transformacin admisible para la escala de razn es del
tipo: g(x)=bx siendo b > 0. Esta transformacin supone simplemente un cambio en la
unidad de medida de la escala, preservando siempre el origen de la misma.
Escala nominal En todas aquellas modalidades o caractersticas en las que la nica comprobacin emprica
que puede hacerse es la de igualdad o desigualdad, su representacin numrica ha de tener
un carcter meramente nominal. A este nivel de relaciones empricas (igualdad-desigualdad)
el hecho de atribuir nmeros hay que entenderlo como simples smbolos o nombres y por
tanto no gozan de propiedades matemticas. No se pueden sumar, restar, multiplicar o
dividir, y tanto dara, pues, cambiarlos por smbolos no numricos. Las tipologas respecto al
carcter, segn la cual los seres humanos pueden encuadrarse en una de las cuatro
categoras: flemtico, melanclico, sanguneo o colrico, son un ejemplo de escala nominal
de caractersticas psicolgicas. Es fcil adivinar el tipo de transformacin admisible que se
puede aplicar en este tipo de escalas: cualquiera que preserve las relaciones de igualdad-
desigualdad de los objetos respecto a una determinada caracterstica.
Escala ordinal Son aquellas caractersticas objeto de estudio cientfico en las que se observan relaciones
de un nivel superior al de la simple igualdad-desigualdad que caracteriza la escala
nominal. Los objetos pueden manifestar determinada caracterstica en mayor grado unos
que otros, de modo que la escala que los represente debe preservar esas relaciones
empricas observadas de orden. En el mbito de las ciencias sociales, muchas son las
caractersticas en las que las relaciones empricas de los objetos que comparten dichas
caractersticas, tienen un carcter ordinal. Por ejemplo, si no se sabe nada de la materia, o
se sabe muy poco, lo ms probable es que el juicio que el profesor haga de su exposicin
sea de "suspenso"; por el contrario, si se sabe bien la materia, y de igual manera se
expresa, lo ms probable es que el juicio sea de "sobresaliente". Si en vez de estos trminos se emplea una escala numrica: 0 para suspenso, 1 para aprobado, 2 para notable, 3 para
sobresaliente y 4 para matrcula de honor, la conclusin que sacar el lector de, pongamos, dos
expedientes acadmicos de 2 alumnos distintos que hayan cursado una misma materia, es que si
uno de los alumnos ha obtenido un 3 y el otro un 1, el primero ha exhibido un mayor conocimiento
de la materia que el segundo, o, lo que es lo mismo, que el segundo tena menos conocimientos que el
primero. Respecto a las transformaciones que admite la escala ordinal de medida, puede
decirse que, en general, cualquier transformacin es vlida siempre que preserve el orden de
magnitud, creciente o decreciente, en que los objetos presentan determinada caracterstica.
Espacio muestral Es el conjunto formado por todos los resultados posibles de un experimento aleatorio. Se
representan con la letra mayscula E y tambin se llama universo o poblacin del experi>.
Esperanza matemtica O valor esperado de una variable aleatoria es el promedio o valor central de la variable. Es
un resumen numrico de la tendencia central de la distribucin de probabilidad (si la
variable es discreta) o de la funcin de densidad de probabilidad (si la variable es
continua). Se conoce tambin con el nombre de "momento respecto al origen de primer
orden" y se representa con la letra E y entre parntesis la variable cuya esperanza se
describe: E(X), E(Y), E(W), etc, o con la letra griega "mu"( ) y como subndice la
variable que se representa , etc.
Estadstica Definida por Amn, (1984; p.37) como " la ciencia que recoge, ordena y analiza los datos
de una muestra, extrada de cierta poblacin, y que, a partir de esa muestra, valindose del
clculo de probabilidades, se encarga de hacer inferencias acerca de la poblacin".
Ciencia que trata de analizar e interpretar los datos recogidos con algn propsito, como la
investigacin cientfica. Algunos autores la definen afirmando que su objeto es el estudio de
los fenmenos aleatorios; recuerde el lector que cuando hablamos de contrastar los efectos
de diversas intervenciones lo que hacemos es asignar proabilidades a que tales efectos se
deban al puro azar (aleatoriedad) o a la intervencin llevada a cabo por el investigador en
condiciones de rigor o control de explicaciones alternativas. Cuando trabajamos con los
valores de las muestras la Estadstica se denomina descriptiva; si de tales valores deseamos
pasar a estimar los correspondientes a la poblacin, la Estadstica se conoce como
-
inferencial; esta es ms compleja pero es la que ofrece ms utilidad u aplicaciones tanto al
cientfico como al profesional. La inferencia estadstica pretende sacar conclusiones sobre
gran nmero de datos a travs de observaciones de parte de esos datos. Se trata de
generalizar los datos de una muestra a la poblacin de la que procede. Mediante la
estadstica inferencial se puede estimar parmetros y realizar contraste de hiptesis.
Estadstico Un estadstico es un valor que se calcula a partir de los datos de una muestra. Se utilizan para
representar una caracterstica de la muestra y para estimar el mismo valor referido a la
poblacin de la cual se ha extrado la muestra. ejp, la media calculada en una muestra proporciona
informacin sobre la correspon> media poblacional. El valor numrico de estos estadsticos dependen
de la composicin de la muestra y variar de una muestra a otra. Se representan por letras del
alfabeto latino. Por ejemplo, rxy, se utiliza para representar la correlacin entre dos variables
X e Y observadas en una muestra. mientras que el mismo concepto, referido a la poblacin,
se denomina parmetro y se representan con letras del alfabeto griego
Valores obtenidos en una muestra. Los ms conocidos son los agrupados bajo las medidas
de posicin o tendencia central (media, mediana, moda), las de dispersin o variabilidad
(desviacin media, desviacin tpica, varianza) o los coeficientes de correlacin. Suelen
representarse con letras latinas ( x , s, r). A partir de ellos, por inferencia estadstica, podemos estimar sus correspondientes parmetros con determinados niveles de
probabilidad, asumiendo un riesgo de error tipo I prefijado por el investigador.
Estadsticos robustos Son ndices estadsticos descriptivos provenientes del anlisis exploratorio de datos que
tienen la peculiaridad de ser resistentes a los datos extremos de la distribucin. Entre ellos
se encuentran: MEDIA RECORTADA, MEDIA WINSORIZADA,MEDIA
CENTRAL,MEDIANA RECORTADA O TRIMEDIA yla MEDA.
Experimento Es el desarrollo de un proceso mediante el cual obtenemos un conjunto de resultados,
observaciones o datos con el fin de realizar una comprobacin o verificar una hiptesis.
ESTIMACIN DE
PARMETROS
Se denomina as el procedimiento por el que se trata de estimar el valor de un estadstico,
obtenido en una muestra, a toda la poblacin de la que aquella forma parte. Toda
estimacin asume un cierto margen de error, medido en trminos de probabilidad; este
error puede hacerse tan pequeo como desee el investigador, pero nunca podr hablar en
trminos seguros, de certeza. Al hablar en el texto del coeficiente de correlacin nos
hemos acercado al concepto y procedimiento de estimacin de parmetros.
EXPERIMENTO Es la modalidad de investigacin emprica ms exigente; como consecuencia, su
aportacin esencial es la posibilidad de establecer, con razonable seguridad, relaciones de
causa a efecto entre una o varias variables independientes (v.i.) y otra denominada
dependiente (v.d.). Para poder lograrlo se deben cumplir determinadas exigencias: el
investigador debe poder planificar la accin y provocar el fenmeno, ha de poder
realizarlo en condiciones de control y debe contar con medidas de calidad, tan vlidas,
fiables y precisas como sea posible.
Experimento aleatorio Es cualquier experimento realizado al azar que se puede repetir indefinidamente en las
mismas condiciones y cuyo resultado no se puede predecir con certeza. cumple las cuatro
condiciones siguientes: a) Se puede repetir indefinidamente en las mismas condiciones. b)
En cada ensayo se obtiene un resultado que pertenece al universo o conjunto de todos los
resultados posibles, E. c) Antes de cada ensayo no se puede predecir con certeza el resultado
que obtendremos. d)A medida que el nmero de ensayos aumenta, la frecuencia relativa - o
proporcin - de aparicin de cada resultado posible tiende a aproximarse a un valor fijo.
F
FIABILIDAD
La fiabilidad es una de las caractersticas tcnicas que deben reunir los instrumentos de
recogida de datos y de medida. Entendemos por fiabilidad el grado de precisin de la
medida; a ms precisin fiabilidad- menos error de medida. La fiabilidad se expresa en muchos casos mediante un coeficiente de correlacin (representado aqu por rXX, dado
que las dos series tienen que ver con el mismo instrumento de recogida de datos). Las dos
series pueden referirse a las puntuaciones en dos mitades de la misma prueba (consistencia
interna), a las puntuaciones de la misma prueba aplica en dos ocasiones separadas por un
cierto tiempo (estabilidad) o a las puntuaciones en dos pruebas equivalentes, esto es, de
caractersticas tan semejantes como sea posible (equivalencia)
-
Frecuencia Es el nmero de veces que un valor de la variable aparece en un conjunto de observaciones.
Frecuencia absoluta Nmero de veces que se repite cada uno de los valores de la variable. Se simboliza por ni.
La suma de todas las frecuencias absolutas representa el total de la muestra n.
Frecuencia absoluta
conjunta
Se representa por nij y corresponde al nmerode datos (la frecuencia) que pertenece a la
categora i-sima de lavariable X y a la categora j-sima de la variable Y. Lapresentacin
de esta informacin en forma de tabla se conoce como distribucinconjunta de frecuencias
absolutas.
Frecuencia acumulada Representa el nmero total de observaciones o datos desde el valor mnimo hasta un cierto
valor. (Ver Acumulada)
Frecuencia relativa Es sinnimo de proporcin.
Frecuencia relativa
conjunta
O proporcin conjunta se representa por pij y corresponde a la proporcin de datos que
pertenece a la clase i-sima de la variable X y a la clase j-sima de la variable Y. La
presentacin de esta informacin en una tabla se conoce como distribucin conjunta de
frecuencias relativas.
Frecuencias esperadas En los problemas de relacin entre variables categricas que se presentan en tablas de
contingencia, las frecuencias esperadas son las frecuencias que se deberan presentar en
cada celda de la tabla en el supuesto de que las variables fuesen independientes.
Frecuencias observadas En los problemas de relacin entre variables categricas que se presentan en tablas de
contingencia, las frecuencias observadas o empricas son las frecuencias que tenemos
realmente en cada celda de la tabla y representan los datos actuales de la tabla. Estas
frecuencias observadas son las que se comparan con las "frecuencias esperadas" para
estudiar la relacin entre las variables de nuestro estudio.
Funcin de densidad de
probabilidad
Es una funcin que describe el comportamiento matemtico de la probabilidad de una
variable aleatoria continua. Conceptualmente es equivalente a la funcin de probabilidad
de una variable aleatoria discreta, pero referido a una variable continua, y en consecuencia,
permite obtener la probabilidad de que la variable aleatoria tome un valor en un intervalo
dado. Ejemplo de funciones de densidad de probabilidad de variables aleatorias continuas
son: la distribucin normal, la F de Fisher, la t de Student y la chi-cuadrado.
Si f(x) es una funcin de densidad de probabilidad de una variable aleatoria, se cumplen
las siguientes condiciones:
La probabilidad total para todos los posibles valores de la variable aleatoria
continua es uno
La funcin de densidad de probabilidad nunca puede ser negativa: f(x)>0
Funcin de distribucin Toda variable aleatoria discreta o continua tiene su funcin de distribucin que representa
la probabilidad de que, para cualquier valor de xi, la variable aleatoria, X, tome valores
menores o iguales que xi.
Se representa por
Para una variable discreta, la funcin de distribucin se obtiene sumando, o acumulando,
las probabilidades de la funcin de probabilidad desde el menor valor de la variable al
mayor.
Por ej, suponiendo que para una variable aleatoria discreta su funcin de probabilidad es
xi 0 1 2 3 4 5
f(xi) = P(X =xi) 0.1 0.2 0.2 0.3 0.1 0.1
Su funcin de distribucin es, acumulando las probabilidades, la siguiente
xi 0 1 2 3 4 5
F(xi) = P(X
-
G
GENERALIZACIN
Entendemos por generalizacin al hecho de extender los resultados de la investigacin
desde los sujetos estudiados a los grupos de los que forma parte, desde las muestras a sus
respectivas poblaciones. Este procedimiento, propio de la Estadstica inferencial, tiene
exigencias que deben cumplirse para que sea legtimo y correcto.
Grados de libertad Hace referencia al nmero de datos de informacin independientes disponibles despus de
realizar un clculo numrico. Por ejemplo, si conocemos la media de n valores, podemos
asignar valores a n-1 y el ltimo quedar determinado automticamente para cumplir la
condicin de que la media sea el valor fijado. En este caso, el clculo de la media se
realiza con n-1 grados de libertad.
H
HIPTESIS
Entendemos por hiptesis las conjeturas sobre la posible relacin entre los elementos -
variablesintegrantes del problema. En los diseos experimentales se formulan hiptesis
sobre la relacin causal entre una o varias variables independientes (V.I.) y la variable
dependiente (V.D.) Una hiptesis se somete a prueba o se contrasta tratando de apreciar si
las probabilidades a su favor son sensiblemente superiores a una explicacin por azar. Esta
segunda hiptesis se denomina nula y se representa por H0 , frente a la del investigador (H1)
Histograma Un tipo de representacin grfica, para variables continuas,
formada por una serie de barras contiguas de altura proporcional a
la frecuencia de la categora de la variable.
Representacin grfica de las puntuaciones obtenidas por un
conjunto de sujetos en una variable cuantitativa. En el eje X se sitan
los lmites de los intervalos; en el Y, la frecuencia del intervalo.
I
Indices de posicin Indican la posicin relativa que ocupa una puntuacin directa dentro de la distribucin de
frecuencias. Por ejemplo, si una puntuacin directa de X=80 supera al 75% de los datos,
esta puntuacin corresponde al percentil 75. Existen tres nombres para los ndices de
posicin; cuartiles, percentiles y deciles. Los cuartiles dividen la distribucin en cuatro
partes, los deciles en diez partes y los percentiles en cien partes iguales.
ndices de posicin. Indican la posicin relativa que ocupa una puntuacin directa dentro de la distribucin de
frecuencias. Por ejemplo, si una puntuacin directa de X=80 supera al 75% de los datos,
esta puntuacin corresponde al percentil 75. Existen tres nombres para los ndices de
posicin; cuartiles, percentiles y deciles. Los cuartiles dividen la distribucin en cuatro
partes, los deciles en diez partes y los percentiles
Intervalo Es sinnimo del concepto de modalidad y corresponde a cada uno de los grupos de valores,
delimitados por dos nmeros, en que se clasifican los datos observados de una variable
(habitual> de tipo cuantitativo) y que ocupan una fila en una distribucin de frecuencias.
Intervalo crtico Es el intervalo que contiene el ndice de posicin (percentil, decil o cuartil) que se desea
obtener con datos agrupados en intervalos. Por ejemplo, para el clculo de la mediana, el
primer paso es determinar en qu intervalo se encontrar. A este intervalo se le denomina
intervalo crtico y para determinarlo se requiere obtener las frecuencias acumuladas o
proporciones acumuladas. Hecho esto, el intervalo crtico es el primer intervalo cuya
frecuencia acumulada sea mayor o igual al 50% de n o cuya proporcin acumulada sea
mayor o igual a 0,50.
Intervalo de confianza Intervalo construido a partir de la informacin proporcionada por la muestra que coger el
valor numrico del parmetro poblacional con una probabilidad determinada.
Intervalo de
probabilidad
Intervalo terico, construido a partir de la distribucin de probabilidad de un determinado
estadstico, que contiene el valor que tomara ese estadstico calculado en cualquier
muestra de un tamao determinado extrado de la poblacin.
-
Investigacin cientfica Esquemticamente, y siempre con el riesgo que esta simplificacin supone, podemos
sealar que una investigacin cientfica conlleva los siguientes pasos: Un primer nivel
terico-conceptual que incluira:
1. Definicin del problema. 2. Deduccin de hiptesis contrastables.
Un segundo nivel tcnico-metodolgico constituido por aspectos propia> metodolgicos:
3. Establecimiento de un procedimiento de recogida de datos.(Diseo de investigacin)
Finalmente, en un nivel estadstico-analtico:
4. Anlisis de los resultados obtenidos. 5. Discusin de dichos resultados y bsqueda de conclusiones 6. Elaboracin de un informe de investigacin.
La interpretacin de los resultados obtenidos nos llevara nuevamente al nivel terico-
conceptual, inicindose nuevamente el proceso y dando lugar a una estructura cclica
caracterstica de toda investigacin cientfica.
Para Selltiz, Investigar es buscar de nuevo, echar otra mirada ms cuidadosa para averiguar ms. Echamos otra mirada porque puede haber algo errneo en lo que ya
sabemos [...] La investigacin cientfica ha de ser sistemtica, organizada, disciplinada y
rigurosa. Investigacin emprica es aquella que acude a la experiencia, a los datos, para
llegar a conclusiones en relacin con las hiptesis de partida.
L
Lmites aparentes Corresponden a los valores observados (ver valor aparente) en una variable con nuestro
instrumento de medida y que definen un intervalo con una frecuencia absouta determinada.
Lmites exactos (de un
intervalo)
Son los valores mximo y mnimo que tendra cada intervalo si el instrumento de medida
tuviera una precisin perfecta. Por ejemplo, cuando se pesa un objeto con una balanza con
precisin de 1 gramo, el peso que se lee es una aproximacin al nmero entero ms
cercano. Si el objeto, segn esa balanza, informa de un peso de 40 gramos hay que
entender que el peso real del objeto se encuentra en el intervalo 40 0,5, es decir el peso
real estar entre 39,5 y 40,5 gramos. El valor que se lee en el instrumento (40 gramos) se
conoce como valor informado o valor aparente, mientras que los valores que acotan el
intervalo (39,5 y 40,5) se conocen como lmites exactos.
M
Meda Es un ndice de dispersin o variabilidad resistente que corresponde a la mediana de las
desviaciones, en valor absoluto, de cada puntuacin a la mediana.
Media La media se utiliza para representar a todos los datos de la
distribucin y es el valor alrrededor del cual tienden
a agruparse todas las observaciones. Se obtiene
sumando todas las puntuaciones de la distribucin y
dividiendo por el nmero de puntuaciones sumadas. Su expresin matemtica
es:
En notacin sumatorio, la media se escribe:
Medida de posicin resultante de sumar todas las puntuaciones de un grupo y dividir el
resultado por el nmero de integrantes del grupo, representado por N. Su ventaja
fundamental radica en que todas y cada una de las puntuaciones de la serie incluyen en su
valor en forma proporcional al mismo. Es especialmente adecuada para niveles de medida
de razn e intervalo.
-
Media central Con los datos ordenados la media central es el promedio de la parte central de la
distribucin una vez que se han sustituido los valores extremos por los valores centrales.
Media condicionada En una distribucin conjunta de frecuencias absolutas de dos variables
X e Y, podemos calcular la media de X condicionada a cada una de los
valores de Y, y de igual forma podemos calcular la media de Y
condicionada a cada uno de los valores de X. Aunque se puede calcular
por diferentes procedimientos, su expresin general es:
siendo: Yj : valores discretos de la variable Y, o puntos medios de los intervalos en el caso
de variables continuas agrupadas en intervalos; j = 1, 2, 3,..., k; nij: frecuencias conjuntas
de Y para el valor i de X, y ni.: frecuencia marginal del valor Xi de la variable X. De forma
similar escribiramos la media de X condicionada a los diferentes valores de Y. Por
ejemplo, supongamos que tenemos una tabla de distribucin conjunta de frecuencias
absolutas que representan las puntuaciones de un test de razonamiento numrico, X, para
las diferentes edades, Y, de escolarizacin de la ESO. La media de X condicionada a los
distintos valores de Y, nos informa de la media del test para las diferentes edades de
escolaridad de la ESO.
Media recortada Es un estadstico de tendencia central resistente a las desviaciones de los datos en uno de
los extremos de la distribucin. Para su clculo, se ordenan los datos y se excluyen un
determinado porcentaje de los valores extremos en los dos lados de la distribucin
calculndose la media aritmtica de los restantes valores.
Media winsorizada Es un ndice de tendencia central resistente a las desviaciones de los datos extremos de la
distribucin. Una vez ordenados los datos, un determinado porcentaje de valores extremos se
sustituyen por el valor inmediata> anterior o posterior y se calcula la de todos los valores.
Mediana Es el valor de la variable que deja por debajo al 50% de las observaciones. Por tanto, es el
valor de la variable que divide a la distribucin en dos parte iguales cada una de las cuales
contiene el 50% de los datos.
Medida de posicin resultante de ordenar las puntuaciones de mayor o menor, o viceversa,
y encontrar la que ocupa el lugar central de la serie. Si la serie tiene un nmero par de
casos, la mediana ser la media de las dos centrales. Su inconveniente fundamental es que
en la mediana no influyen los valores de las puntuaciones sino solo el orden que ocupan.
Dos series muy diferentes pueden tener la misma mediana. Resulta especialmente
adecuada para el nivel de medida ordinal.
Mediana recortada Es un ndice resistente utilizado dentro del Anlisis Exploratorio que se obtiene mediante
una media ponderada de los tres cuartiles. El cuartil segundo (o mediana) tiene doble
ponderacin que los cuartiles primero y tercero.
Medicin Proceso por el cual se asignan nmeros a objetos o caractersticas segn determinadas
reglas. Esta definicin implica poner en correspondencia, por un lado, nmeros, y por otro
objetos o caractersticas con sus correspondientes modalidades. Entre los nmeros se dan
ciertas relaciones que son vlidas dentro del mundo aritmtico, que es un mundo ideal.
Tambin entre las modalidades de las caractersticas se dan determinadas relaciones que
son verificables en el mundo emprico, es decir en el mundo real. Pues bien, medir supone
poner en relacin estos dos mundos, el ideal de los nmeros y el real de los objetos, de
modo que las relaciones que se dan en el mundo numrico preserven exactamente las
relaciones que se observan en el mundo emprico, y slo sern vlidas aquellas relaciones
numricas que puedan ser verificables empricamente.
Medida Es el proceso por el cual se asignan nmeros a objetos o caractersticas segn
determinadas reglas. Esta definicin implica poner en correspondencia, por un lado,
nmeros, y por otro objetos o caractersticas con sus correspondientes modalidades. Entre
los nmeros se dan ciertas relaciones que son vlidas dentro del mundo aritmtico, que es
un mundo ideal. Tambin entre las modalidades de las caractersticas se dan determinadas
relaciones que son verificables en el mundo emprico, es decir en el mundo real. Pues bien,
medir supone poner en relacin estos dos mundos, el ideal de los nmeros y el real de los
objetos, de modo que las relaciones que se dan en el mundo numrico preserven
exactamente las relaciones que se observan en el mundo emprico.
-
ESCALAS DE MEDIDA Una medida, en sentido estricto, es el resultado de comparar una unidad con una cantidad.
La cantidad peso la medimos comparndola con la unidad Kilogramo u otras mayores o menores. El resultado es el nmero. La definicin ms amplia de medida se debe a Stevens: Medir es asignar numerales a los objetos o hechos de acuerdo con ciertas reglas.
Un numeral puede ser un nmero o un smbolo, lo que permite admitir el nivel o escala de
medida nominal. En nuestros mbitos, no siempre es tan fcil proceder a medir variables;
la mayora de las variables son construcciones o constructos elaborados por los cientficos
e investigadores, como en el caso de la inteligencia, el nivel de conocimientos, el
autoconcepto, la tasa de inflacin, el producto interior bruto o similares. En tales casos, la
medida consiste en la asignacin de valores de acuerdo con ciertas reglas, como ocurre en
una prueba objetiva, un cuestionario de actitudes hacia los inmigrantes, la tasa de
mortalidad infantil, etc. Los nmeros que resultan no tienen las mismas propiedades que
en el caso del peso, de la talla o de la edad, nmeros perfectos que permiten todo tipo de
operaciones y que son propios de escalas de medida de razn o cociente. Variables como
la temperatura, perfectamente medibles, se diferencian de las anteriores en que el punto de
partida cero grados- no es fijo, adems de poder presentar valores inferiores. Este tipo de variables forman parte de la escala de intervalos. Las que se limitan a indicar el orden en
una serie (1, 2) se ubican en las escalas ordinales; y en el caso de variables que no indican cantidad sino semejanza o diferencia (sexo, estado civil, clase social, grados
universitarios) la escala se conoce como nominal.
Mtodo cientfico Se caracteriza por ser "sistemtico" y "replicable". El trmino sistemtico hace referencia a
que se trata de un proceso que tiene unos pasos perfectamente establecidos y el trmino
replicable hace referencia a que los datos obtenidos mediante su uso pueden ser replicados
o refutados por cualquier investigador que lo desee.
Moda El valor de la variable que ms se repite, por tanto, es el valor de la variable con mayor
frecuencia.
Tambin denominada Modo, es una medida de posicin que coincide con el valor ms
repetido de la serie de valores. Su inconveniente fundamental es que en aquellos valores
menos repetidos que el de la Moda no cuentan para su obtencin. Resulta especialmente
adecuada para el nivel de medida nominal.
Modalidad Una modalidad es cada uno de las variantes como se manifiesta una caracterstica. El
estado civil, o las creencias religiosas, son caractersticas que presentan pocas
modalidades. Por el contrario, muchas caractersticas objeto de estudio cientfico pueden
presentar un nmero casi infinito de modalidades. Si tomamos por ejemplo la altura o el
peso de la poblacin espaola, estaremos ante caractersticas con un infinito nmero de
modalidades, pues aunque dos modalidades estn muy prximas, siempre son posibles
modalidades intermedias.
Modelo Un modelo permite, haciendo uso de desarrollos matemticos o de otros lenguajes
formales, elaborar una serie de predicciones que pueden ser contrastadas empricamente.
Entendemos por modelo una representacin simplificada de la realidad. Tal representacin puede ser icnica, analgica, matemtica. Los modelos matemticos tienen
una gran utilidad en Estadstica. En la medida en que unos datos empricos sigan
razonablemente un modelo, podemos aplicar las propiedades de este al tratamiento
estadstico de aquellos. En nuestro mbito, modelo es, un tipo de distribucin de datos
terico o ideal al que pueden tender distribuciones empricas o reales de ciertas variables.
Por ejemplo: la variable motivacin por los idiomas, una vez medida en un conjunto
amplio de sujetos (muestra) puede acercarse o apartarse ms o menos de un modelo ideal o
terico como es la denominada curva normal de probabilidades o campana de Gauss. Este
modelo tiene unas propiedades; si nuestros datos medidos se acercan suficientemente al
modelo, podemos aplicarles las propiedades del mismo, lo que nos permitir analizar los
datos y obtener conclusiones. Para decidir si podemos considerar que unos datos empricos
se acercan suficientemente al modelo hasta hacerlos compatibles con l, disponemos de
pruebas de bondad de ajuste, como es el caso de chi o ji cuadrado, cuyo smbolo es X2.
Este tipo de pruebas asignan una probabilidad a los datos empricos sobre su acomodacin
o no al modelo, lo que permite al investigador aceptar o no la hiptesis de nulidad.
-
Muestra Una muestra es una seleccin de datos extrados de una poblacin o universo de posibles
observaciones. La muestra se debe seleccionar de tal forma que sea representativa de la
poblacin de origen. Una de los procedimientos de seleccionar muestras representativas es
el muestreo aleatorio simple donde cada elemento de la poblacin tiene la misma
probabilidad de formar parte de la muestra.
Muestra aleatoria simple La muestra aleatoria simple es una seleccin al azar de un conjunto de observaciones que
formaran la muestra para el anlisis de datos.
Muestreo La estadstica ha desarrollado toda una teora especfica en el que se estudian
procedimientos y tcnicas para la extraccin de muestras representativas de una poblacin
determinada, y que se engloban bajo la denominacin de muestreo.
N
Nube o diagrama de
puntos
Es la representacin grfica de dos variables en la que
cada punto representa una determinado dato definido
por unas coordenadas que corresponden a los valores
de esa observacin en la variable X e Y. En el eje
horizontal se sita los valores de la variable
independiente y en el eje vertical los de la variable
dependiente. Este tipo de grfico es especialmente
til en el anlisis de correlacin y regresin.
O
Ordenada En la ecuacin de regresin, la ordenada es el valor que toma la variable dependiente, Y, cuando
la variable independiente, X, toma el valor 0. Grficamente corresponde al punto donde la recta
corta al eje vertical (o eje de ordenadas). Usualmente, la ordenada se representa por la letra a.
En la recta de la figura cuya ecuacin es
Y=0,933+0,74X. El valor de Y cuando X= 0
corresponde al punto donde la recta corta con el eje
de ordenadas, Y. Este valor es la ordenada de la
recta y, en este ejemplo vale 0,933.
Outlier Un valor extremo o atpico que es muy diferente del resto de observaciones de la muestra
P
Parmetro Entendemos por parmetro el valor de un determinado estadstico no en la muestra en
que se obtiene sino en el total de la poblacin. Si los estadsticos ms comunes, como
las medidas de posicin y variabilidad (media: ; mediana: Md; moda: Mo; desviacin
tpica: s; varianza: s2...) se suelen representar por letras latinas, los parmetros lo hacen
por letras griegas ( = media; s = desviacin tpica; s2 = varianza...)
Nombre dado a cualquier ndice numrico que describe alguna caracterstica de la poblacin: su
tendencia central, variabilidad, asimetra, relacin, covariacin, etc. Se representan por letras
del alfabeto griego, por ejemplo, , se utiliza para representar la correlacin entre dos
variables X e Y de la poblacin. Suele ser un valor desconocido que se estima -o infiere- a
partir de los valores observados en la muestra. De la inferencia de parmetros se ocupa la
Estadstica Inferencial que se estudiar en otros cursos.
-
Pendiente La pendiente de la ecuacin de regresin de Y sobre X se representa por la letra b e indica el
cambio que se produce en la variable Y por cada cambio unitario en la variable X.
Grficamente representa la "inclinacin" de la recta de regresin. Si la relacin entre las variables
es positiva la pendiente tambin es positiva. Si la relacin entre las variables es negativa la
pendiente es negativa. Si no existe relacin lineal entre las variables la pendiente es cero.
En la Figura se ha trazado la recta cuya ecuacin es
Y=0,933+0,74X. El valor de la pendiente, como se ha
sealado, es la variacin que se produce en la variable Y
cuando X aumenta una unidad. Como el lector puede
comprobar el valor de Y para X = 4 es 3,893, y para X =
5 es 4,633; la diferencia entre estos dos valores es
exactamente el valor de la pendiente, es decir, 4,633 -
3,893 = 0,74 = b.
Percentil Es el valor de la variable que deja por debajo un porcentaje determinado de observaciones. Los
percentiles dividen la distribucin en 100 parates, por tanto, existen 99 percentiles que son los
que van desde el percentil 1 al 99 de tal forma que el percentil 73 sera el valor de la variable de
observacin que deja por debajo el 73% de los datos. El percentil 25 es lo mismo que el primer
cuartil. El percentil 50 es lo mismo que la mediana, que el decil 5 y que el segundo cuartil. El
percentil 75 es lo mismo que el tercer cuartil. Por tanto, la escala de percentiles divide a la
distribucin en 100 partes iguales de tal forma que entre dos percentiles consecutivos se
encuentra el 1% de las observaciones.
Poblacin Por poblacin estadstica se entiende el conjunto de todos los elementos que comparten una o
varias caractersticas. A cada uno de los elementos que componen una poblacin se le
denomina de manera genrica entidades estadsticas, y de acuerdo al nmero de las entidades
que la componen, una poblacin puede ser finita o infinita. El conjunto de espaoles que
padecen trastornos epilpticos, los municipios con cinco mil habitantes o menos, los parados
registrados en el Instituto Nacional de Empleo, el conjunto de libros publicados en una ao por
una editorial, el total de accidentes de trfico ocurridos en las carreteras espaolas durante el
ao 1999, son ejemplos claros de poblaciones finitas. Por el contrario, el lanzamiento reiterado
de una moneda, o el conjunto de nmeros naturales (1,2,3...), son ejemplos de poblaciones
infinitas dado que no hay un lmite establecido en ninguno de estos dos conjuntos; siempre se
puede tirar la moneda una vez ms y, respecto al conjunto de nmeros naturales, por muy
grande que sea un nmero siempre habr otros que lo superen
El trmino poblacin se define como el conjunto de todos los casos o elementos que cumplen con las caractersticas que la definen: los varones, las mujeres, los estudiantes de Farmacia, los
polticos, los abogados... En ciencias sociales no suele estar muy claramente definida. El
investigador desea generalizar los datos de la muestra a la poblacin. En los estudios empricos
no suele ser posible ni, en la mayora de los casos, aconsejable- estudiar todos los casos; se acude en su lugar a muestras, que deben ser representativas del conjunto total o poblacin. Por
medio de la Estadstica inferencial se pueden hacer estimaciones de los parmetros a partir de
las muestras (por ejemplo: desde a )
Porcentaje Simbolizado por Pi, es el valor de la frecuencia relativa multiplicado por cien. Expresado
formalmente: Pi = pi 100. Indica el tanto por ciento (%) de observaciones de una determinada
modalidad o valor de la variable de estudio.
Porcentaje acumulado Ver acumulada.
Probabilidad Teora matemtica que estudia la posibilidad de ocurrencia de sucesos o acontecimientos. En
trminos matemticos la probabilidad tiene tres definiciones: la definicin clsica, la definicin
estadstica y la definicin axiomtica.
Frente a los sucesos seguros se encuentran los probables. El tipo de seguros a las que es ms
adecuado aplicar la probabilidad es el de los fenmenos aleatorios. Conociendo las diferentes
manifestaciones de un fenmeno, como el nmero de caras de un dado o de los nmeros de la
lotera, podemos decidir la denominada probabilidad a priori, suponiendo, como debe ocurrir,
que todas las caras del dado y todos los nmeros tienen las mismas oportunidades. En el primer
caso, la probabilidad de una cara cualquiera es de 1/6; en el segundo, suponiendo que tengamos
-
60.000 nmeros, ser de 1/60.000. Para nosotros es importante conocer los modelos de
probabilidad, como el de la curva normal. Gracias a ella, a la regla matemtica que la rige,
podemos asignar probabilidades a los fenmenos que la siguen, que se acomodan a ella. Estas
probabilidades nos permiten aceptar o rechazar hiptesis (pruebas estadsticas) o decidir si un
coeficiente de correlacin rXY es o no estadsticamente significativo. Los valores de
probabilidad oscilan entre 0 suceso imposible- y 1, suceso seguro. Reflexione sobre la correccin o incorreccin de una expresin habitual en los medios de comunicacin como la
siguiente: casi con toda probabilidad. Sera ms correcto afirmar: con elevada probabilidad? o, casi con seguridad?
Probabilidad
acumulada
Representa la suma de probabilidades desde el menor valor posible hasta un cierto valor. En los
modelos de distribucin de variables aleatorias discretas, la probabilidad acumulada
corresponde a la funcin de distribucin de probabilidad.
Promedio La media aritmtica se conoce tambin con el nombre de promedio y
corresponde a la suma de todas las observaciones o datos dividido por el
nmero de datos.
Es un valor de la variable que se encuentra hacia el centro de la distribucin
de frecuencias, se le denomina genricamente como tendencia central y
sintetiza todos los valores de la distribucin.
Proporcin Simbolizada por pi, es el cociente entre la frecuencia absoluta de cada clase, ni y el nmero total
de observaciones, n. Expresado formalmente: pi = ni/n. La frecuencia relativa o proporcin
indica el tanto por uno de observaciones que corresponden a una categora o valor de la variable
de estudio.
Proporcin
acumulada
Ver acumulada.
Proporcin de
varianza explicada
En la ecuacin de regresin, la varianza de la variable
dependiente se puede descomponer en la suma de dos
varianzas: la varianza de las puntuaciones pronosticadas, y la
varianza del error o varianza de los residuos. Los pronsticos son una funcin lineal
de la variable independiente X, funcin que viene especificada por la propia recta de
regresin: , por lo que la varianza de las puntuaciones pronosticadas, Y,
dependen de la varianza de X, tal y como indica la siguiente expresin:
mientras que los residuos no dependen de ninguna variable o lo que es igual, no es funcin de
ninguna variable conocida e incluida en la ecuacin de regresin. Entonces, si la varianza de Y
se puede expresar como la suma de la varianza de los pronsticos y la varianza de los residuos:
y la varianza de las puntuaciones pronosticadas depende de la varianza de X, entonces la
varianza de Y se puede explicar en parte por la varianza de X. Es decir, una parte de la
variabilidad de Y puede ser explicada, una vez construida la recta de regresin por la propia
variabilidad de X. Expresada en trminos de proporciones la proporcin de la variabilidad de Y
que es explicada por la variabilidad de los pronsticos (que a su vez son funcin de la
variabilidad de X) ser:
que corresponde con el coeficiente de determinacin, mientras que la proporcin de la
variabilidad de Y que no se puede explicar por variabilidad de los pronsticos ser:
PRUEBAS
ESTADSTICAS.
BONDAD DE
AJUSTE
Cuando queremos contrastar dos o ms formas de intervencin mtodos, procedimiento de disciplina, sistemas de motivacin, tratamientos fisioteraputicos, frmacos- acudimos a un contraste de hiptesis. El investigador formula la suya H1- y, para darla por buena, debe ser capaz de rechazar la alternativa, conocida como hiptesis nula o de nulidad (H0). Por prudencia,
solo rechazar esta y aceptar aquella cuando las probabilidades a favor de esta sean tan pequeas
como desee y, en consecuencia, las probabilidades a favor de su hiptesis sean tan elevadas como
l decida. Las pruebas estadsticas ms comunes son t y F, aunque hay otras muchas. Un tipo de
pruebas concreto es el de bondad de ajuste; se puede aplicar, por ejemplo, para decidir si una
determinada distribucin de datos se acomoda suficientemente a un modelo como para poder