Glosario_AD1.pdf

26
Glosario A Acumulada (Frecuencia , proporción o porcentaje ) En toda distribución de frecuencia se puede obtener la frecuencia acumulada (o proporción acumulada o porcentaje acumulado ). Para obtener los valores, simplemente hay que ir acumulando (sumando), desde la categoría de menor valor de la variable a la de mayor valor, las frecuencias absolutas (ver frecuencia absoluta), proporciones o porcentajes, de cada categoría de respuesta. Por ejemplo, la frecuencia absoluta acumulada del grado "moderado" de preocupación por la situación política es 108, resultado de sumar las frecuencias de los grados anteriores (18 + 42 = 60) y la suya propia (60 + 48 = 108), indicando que 108 personas presentan una preocupación moderada o menos por las cuestiones políticas. Con el mismo procedimiento se obtendrían las proporciones y porcentajes acumulados. Amplitud del intervalo Es la diferencia entre el límite exacto superior y el límite exacto inferior, o entre el límite aparente superior y el límite aparente inferior más la unidad de medida . Amplitud intercuartil Es la diferencia entre el tercer cuartil (o percentil 75) y el primer cuartil (o percentil 25) y representa el rango de valores que contiene a la mitad central de los datos (el 50%) Amplitud o rango Es la diferencia entre el valor máximo y mínimo del conjunto de datos Amplitud semi- intercuartil Es la mitad de la diferencia entre el tercer cuartil (o percentil 75) y el primer cuartil (o percentil 25) y se utiliza para cuantificar la variabilidad de un conjunto de datos medidos con escala ordinal o de una distribución de una variable cuantitativa marcadamente asimétrica. Análisis de datos El Análisis de datos en Psicología es una herramienta metodológica necesaria, de carácter fundamentalmente estadístico , para la investigación en Psicología. Análisis exploratorio de datos (AED) Es tanto una técnica de análisis de datos como una manera de pensar que enseña a la persona que investiga tendencias en los datos que no esperaba encontrar. Entre las técnicas de AED destacan las técnicas gráficas (diagrama de tallo y hojas) que permiten una rápida inspección de las propiedades de la distribución de los datos: posición central, variabilidad y forma. También dispone de índices estadísticos resistentes a los datos extremos de la distribución, por lo que se les suele denominar también estadísticos robustos. Apuntamiento ver Curtosis Asimetría Una distribución asimétrica es una distribución no simétrica por lo que los datos se distribuyen de forma desigual en los extremos de la distribución. Cuando hay muchos datos con valores bajos y pocos datos con valores altos la distribución es asimétrica positiva. Por ejp, el nº de horas de sueño diario de 0 a 40 años. Por el contrario, cuando hay pocos datos con valores bajos y muchos datos con valores altos, la distribución es asimétrica negativa. Por ejlo, edad de fallecim> en los países desarrollados. Para su cálculo se dispone de varios índices. Si el coeficiente de asimetría es As<0, la distribución es asimétrica negativa. Si As=0 la distribución es simétrica y si As>0 la distribución es simétrica positiva. AZAR Casualidad. Caso fortuito. Fenómeno que no sigue una regla, un orden, una ley conocida. En Estadística se contrastan las probabilidades a favor de las hipótesis del investigador en cuanto al efecto de las variables independientes sobre las dependientes contra la probabilidad de que los resultados sean debidos al azar, a la pura casualidad. BAREMO Tabla elaborada como regla para atribuir valor a las puntuaciones individuales o de grupo. Las puntuaciones del grupo inicial, una muestra que debe ser representativa de la población, sirven de regla para interpretar las puntuaciones de otros sujetos o grupos que reúnan las mismas características. Es frecuente que a cada puntuación individual del grupo original se le asigne la correspondiente trasformación a puntuaciones como cuantiles (cuartiles, deciles o percentiles), puntuaciones típicas, C.I., etc. En adelante, a cualquier puntuación de un nuevo sujeto se le atribuye la correspondiente puntuación (cuantil…) del baremo.

Transcript of Glosario_AD1.pdf

  • Glosario

    A

    Acumulada

    (Frecuencia, proporcin o porcentaje) En toda distribucin de frecuencia se puede obtener la

    frecuencia acumulada (o proporcin acumulada o porcentaje acumulado). Para obtener los

    valores, simplemente hay que ir acumulando (sumando), desde la categora de menor valor de la

    variable a la de mayor valor, las frecuencias absolutas (ver frecuencia absoluta), proporciones o

    porcentajes, de cada categora de respuesta. Por ejemplo,

    la frecuencia absoluta acumulada del grado "moderado" de

    preocupacin por la situacin poltica es 108, resultado de

    sumar las frecuencias de los grados anteriores (18 + 42 =

    60) y la suya propia (60 + 48 = 108), indicando que 108

    personas presentan una preocupacin moderada o menos

    por las cuestiones polticas. Con el mismo procedimiento

    se obtendran las proporciones y porcentajes acumulados.

    Amplitud del

    intervalo

    Es la diferencia entre el lmite exacto superior y el lmite exacto inferior, o entre el lmite

    aparente superior y el lmite aparente inferior ms la unidad de medida.

    Amplitud

    intercuartil

    Es la diferencia entre el tercer cuartil (o percentil 75) y el primer cuartil (o percentil 25) y

    representa el rango de valores que contiene a la mitad central de los datos (el 50%)

    Amplitud o rango Es la diferencia entre el valor mximo y mnimo del conjunto de datos

    Amplitud semi-

    intercuartil

    Es la mitad de la diferencia entre el tercer cuartil (o percentil 75) y el primer cuartil (o percentil 25)

    y se utiliza para cuantificar la variabilidad de un conjunto de datos medidos con escala ordinal o de

    una distribucin de una variable cuantitativa marcadamente asimtrica.

    Anlisis de datos El Anlisis de datos en Psicologa es una herramienta metodolgica necesaria, de carcter

    fundamentalmente estadstico, para la investigacin en Psicologa.

    Anlisis

    exploratorio de

    datos

    (AED) Es tanto una tcnica de anlisis de datos como una manera de pensar que ensea a la

    persona que investiga tendencias en los datos que no esperaba encontrar. Entre las tcnicas de AED

    destacan las tcnicas grficas (diagrama de tallo y hojas) que permiten una rpida inspeccin de las

    propiedades de la distribucin de los datos: posicin central, variabilidad y forma. Tambin

    dispone de ndices estadsticos resistentes a los datos extremos de la distribucin, por lo que se les

    suele denominar tambin estadsticos robustos.

    Apuntamiento ver Curtosis

    Asimetra Una distribucin asimtrica es una distribucin no

    simtrica por lo que los datos se distribuyen de forma

    desigual en los extremos de la distribucin. Cuando hay

    muchos datos con valores bajos y pocos datos con

    valores altos la distribucin es asimtrica positiva. Por

    ejp, el n de horas de sueo diario de 0 a 40 aos. Por el

    contrario, cuando hay pocos datos con valores bajos y

    muchos datos con valores altos, la distribucin es

    asimtrica negativa. Por ejlo, edad de fallecim> en los

    pases desarrollados.

    Para su clculo se dispone de varios ndices. Si el coeficiente de asimetra es As0 la distribucin

    es simtrica positiva.

    AZAR Casualidad. Caso fortuito. Fenmeno que no sigue una regla, un orden, una ley conocida. En

    Estadstica se contrastan las probabilidades a favor de las hiptesis del investigador en cuanto al

    efecto de las variables independientes sobre las dependientes contra la probabilidad de que los

    resultados sean debidos al azar, a la pura casualidad.

    BAREMO Tabla elaborada como regla para atribuir valor a las puntuaciones individuales o de grupo. Las

    puntuaciones del grupo inicial, una muestra que debe ser representativa de la poblacin, sirven de

    regla para interpretar las puntuaciones de otros sujetos o grupos que renan las mismas

    caractersticas. Es frecuente que a cada puntuacin individual del grupo original se le asigne la

    correspondiente trasformacin a puntuaciones como cuantiles (cuartiles, deciles o percentiles),

    puntuaciones tpicas, C.I., etc. En adelante, a cualquier puntuacin de un nuevo sujeto se le

    atribuye la correspondiente puntuacin (cuantil) del baremo.

  • C

    Caja y bigotes La caja representa el 50% de las observaciones centrales, es decir, las observaciones

    comprendidas entre el percentil 25 (o primer cuartil) y el percentil 75 (o tercer cuartil). La lnea

    en el centro de la caja representa la mediana o percentil 50. Los bigotes son lneas que se

    extienden fuera de la caja hasta una distancia de 1,5 veces la longitud de la caja de tal forma

    que los datos que quedan fuera de estos bigotes corresponden a las observaciones atpicas,

    llamadas tambin "outliers".

    Caracterstica Una caracterstica es una propiedad de los individuos de una poblacin. Uno de los objetivos

    de la investigacin psicolgica es determinar las propiedades de una determinada poblacin,

    propiedades que estarn presentes en todos y cada uno de los individuos que la conforman. Sin

    embargo, aunque todos los elementos tengan esa propiedad no todos la tienen en el mismo

    grado. Por ejemplo, una propiedad de los mamferos es el sexo, que presenta dos alternativas:

    macho y hembra; una propiedad de los seres humanos es el estado civil, con sus diferentes

    alternativas: soltero, casado, separado, viudo, etc.; otra puede ser las creencias religiosas:

    cristianos, mahometanos, budistas... agnsticos o ateos. En estos ejemplos se ve que las

    propiedades de los individuos de una poblacin pueden adoptar diversas variedades. En trminos

    estadsticos, a la propiedad de los individuos de una poblacin se le denomina caracterstica,

    mientras que a las diferentes variedades de esa caracterstica se le denomina modalidad.

    Causalidad El coeficiente de correlacin no permite por tanto una interpretacin en trminos de causa-

    efecto. Si se obtiene un valor alto y positivo, indica que cuando una de las variables aumenta

    su valor en la escala, la otra, en promedio, tambin lo hace, mientras que cuando el valor es

    bajo y negativo indica justamente lo contrario, es decir, que cuando una de las variables

    aumenta de valor, la otra, en promedio, disminuye. Por ltimo, los valores prximos a cero

    indican ausencia de relacin, o lo que es lo mismo que cuando una de las variables va

    aumentando de valor, la otra, en promedio, a veces aumenta y a veces disminuye. En ningn

    caso se debe caer en el error de pensar que una variable es causa de la otra. A partir de una simple estudio correlacional, es imprudente establecer ese nexo de causalidad sin acudir a un

    enfoque experimental que pudiera determinar sin en verdad existe dicho nexo de causalidad o

    no. Incluso en estudios de variables en que se pueda llegar a pensar que una es causa de la otra,

    como, por ejemplo, la relacin que pueda darse en los alumnos de secundaria entre la ansiedad

    ante una prueba de conocimientos de estadstica y el rendimiento en dicha prueba. Se podra

    pensar que un alto grado de ansiedad determina el mal rendimiento en la prueba, y que un bajo

    nivel determina un alto rendimiento. Quiere esto decir que la ansiedad es la causa del

    rendimiento en esa prueba? Pero tambin podra ser que la prueba de conocimientos de

    estadstica provoca una reaccin de ansiedad, de tal modo que los alumnos poco preparados

    reaccionan con un aumento de la ansiedad mientras que los mejores preparados se manejan con

    cierta tranquilidad en dicha prueba.

    Chi-cuadrado

    (prueba)

    Prueba estadstica para determinar, a partir de los datos recogidos en una muestra, si dos

    variables cualitativas estn relacionadas.

    Chi-square

    (distribucin)

    Trmino que se refiere a una distribucin de probabilidad de una variable continua

    Coeficiente chi-

    cuadrado

    Es un ndice para determinar, a partir de los datos recogidos en una muestra, si dos variables

    cualitativas estn relacionadas. De este ndice se derivan el coeficiente de contigencia y el

    coeficiente fi.

    Coeficiente de

    contingencia

    Es un ndice de la relacin entre dos variables cualitativas y que, al igual que el coeficiente fi,

    deriva de Chi cuadrado. Su expresin es la siguiente: Tericamente toma valores

    comprendidos entre 0 y 1, aunque no siempre alcanza el valor 1, incluso cuando las variables

    estn completamente asociadas. En tablas cuadradas, cuando ambas variables tienen el mismo

    nmero de categoras (es decir, I = J), su mximo valor es

  • Coeficiente de

    correlacin

    Es un ndice numrico que representa la intensidad con que dos variables se relacionan. Si dos

    variables son independientes, es decir, si no existe relacin entre ellas, el coeficiente de

    correlacin es cero. Dosvariables, X e Y, estn relacionadas cuando cambios en una variable

    producecambios en la otra variable. Si se observa que cuando aumentan los valores en una

    variable tambin aumentan o disminuyen-, en promedio, los valores en la otra, se puede sospechar que hay correlacin entre ellas. Para cuantificar la intensidad de la relacin entre dos

    variables se dispone de distintos ndices de correlacin dependiendo de la naturaleza de las

    variables. El siguiente cuadro es un resumen de los ndices que se estudiarn:

    Variable Variable Coeficiente

    Cualitativa Cualitativa Correlacin Fi

    chi-cuadrado

    Coeficiente de contingencia

    Cualitativa dicotmica Cuantitativa Correlacin Biserial-puntual

    Cuantitativa Cuantitativa Correlacin de Pearson

    Ordinal Ordinal Correlacin de Spearman.

    Coeficiente de

    correlacin de

    Pearson

    Un inconveniente de la covarianza, como medida de variacin conjunta o relacin entre dos

    variables es que depende de las unidades de medida en que se expresen las variables de inters

    y que no tiene un valor mximo y mnimo, lo que dificulta enormemente su interpretacin. Por

    ello, se acude al coeficiente de correlacin de Pearson que es la covarianza entre dos variables,

    X e Y,calculada a partir de sus puntuaciones tpicas.Es decir: rxy = cov(zx,zy)

    Se representa con la letra r y el subndice xy, (rxy), para representar la relacin lineal entre dos

    variables X e Y. Indica la relacin lineal entre dos variables cuantitativas y es un nmero sin

    unidad de medida comprendido entre -1 y +1. Un valor de 0 indica que no existe relacin lineal

    entre las dos variables. Los valores positivos indican que valores altos de X se asocian con

    valores altos de Y, y valores de r negativos indican que valores altos de X se asocian con

    valores bajos de Y. Existen diferentes expresiones para obtener la correlacin entre dos

    variables cuantitativas segn el tipo de puntuaciones que estemos empleando. (Ver puntuacin

    directa, puntuacin diferencial o puntuacin tpica).

    Datos con coeficiente de correlacin prxima a +1.

    Datos con coeficiente de correlacin prxima a -1. Datos con coeficiente de correlacin prximo a 0.

    Coeficiente de

    determinacin

    Es el coeficiente de correlacin de Pearson al cuadrado y toma cualquier valor positivo

    comprendido entre 0 y 1. Se interpreta como proporcin de varianza explicada, es decir, de

    toda la variabilidad de la variable Y una determinada proporcin se debe a la variabilidad de la

    variable X.Por ejemplo, imagine que entre las variables, X: puntuacin en un test de habilidad

    numrica e Y: nota en esta asignatura existe una correlacin de 0,7. Entonces el coeficiente de

    determinacin vale 0,49 que significa que el 49% de la variabilidad de las notas obtenidas por

    todos los alumnos en la asignatura, es explicada o se debe- a la habilidad numrica. El 51% restante de la variabilidad de las notas se deber a otras variables no incluidas en la regresin

    (por ejemplo, la motivacin, el esfuerzo, el tiempo dedicado al estudio, etc.)Con otras palabras,

    indica el grado en que una variable es capaz de predecir otra con la que est relacionada.

  • Coeficiente de

    variacin

    Es un ndice de variabilidad especialmente til para comparar variabilidades de caractersticas

    de diferente naturaleza, o de la misma naturaleza en diferentes grupos y es igual al cociente

    entre la desviacin tpica y la media. El resultado de este cociente es un nmero abstracto que

    indica el nmero de veces que el numerador (la desviacin tpica) contiene al denominador (la

    media), con independencia de la unidad en que haya sido medida la variable. A este ndice as

    obtenido se le denomina coeficiente de variacin o coeficiente de variabilidad relativa y se

    expresa as:

    Combinatoria Es una rama de las matemticas que estudia las diferentes formas de agrupamiento y

    combinacin de un conjunto de elementos y establece las propiedades y leyes de formacin de

    las agrupamientos resultantes. Conocer estas diferentes formas de agrupamiento nos permitir dar respuesta a preguntas como las siguientes: De cuantas formas distintas pueden sentarse tres nios y dos nias en la primera fila

    de una clase?.Con un banco de 100 preguntas tipo test cuntas pruebas diferentes de 25 preguntas puedo construir?,

    o de cuntas formas diferentes se pueden asignar cinco empleados de un comercio a tres secciones distintas?

    Conocimiento cientfico Es el conocimiento adquirido utilizando el mtodo cientfico.

    Constante En contraste con la definicin ofrecida de variable, cuando una caracterstica presenta una sola

    modalidad, o cuando los objetos presentan la misma magnitud de una determinada

    caracterstica, decimos que se trata de una constante, y los objetos o entidades estudiadas

    tendrn todos el mismo valor numrico.

    CONTRASTE DE

    HIPTESIS

    Proceso sistemtico que concluye tomando una decisin sobre la hiptesis nula (H0): rechazo o

    no rechazo, con la consiguiente aceptacin o no de la hiptesis alternativa (H1) asumiendo un

    riesgo de error tipo I = a .

    CONTROL

    El mtodo cientfico pretende establecer relaciones causales entre las variables relacionadas en

    su hiptesis. Lograr una meta tan elevada como este exige del investigador el dominio de la

    situacin, de forma que, teniendo bajo su dominio la variable independiente, controle el

    conjunto de circunstancias, hechos, personas que, adems de dicha variable, puedan influir en la dependiente. Si no fuera as, quedara la duda de si la relacin encontrada se debe a la

    variable independiente, a alguna de esas otras variables convertidas en extraas, esto es, en hiptesis rivales a la suya- o la la interaccin entre unas y otras.

    CORRELACIN

    Entendemos por correlacin la relacin existente entre dos o ms variables. La correlacin

    puede ser perfecta, positiva o negativa (valor de 1), nula (valor de 0), o imperfecta, que

    incluye toda la gama de valores que van de 0 a 1, tanto positivos como negativos. La

    correlacin es positiva cuando los valores de las variables aumentan o disminuyen en la misma

    direccin, y negativa en caso contrario. El ndice de correlacin coeficiente de correlacin- ms conocido es el de Pearson, representado por rxy.

    Correlacin biserial-

    puntual

    Es el coeficiente de correlacin que se aplica cuando se trata de cuantificar la relacin que

    existe entre una variable dicotmica por esencia (p.e., sexo), o dicotomizada por conveniencia

    con otra variable cuantitativa. Su expresin es la siguiente: donde: es la media de las

    puntuaciones de la variable cuantitativa X cuando la variable dicotmica (o dicotomizada) Y

    tiene valor 1. es la media de las puntuaciones de la variable cuantitativa X cuando la variable

    dicotmica (o dicotomizada) Y tiene valor 0. SX es la desviacin tpica de la variable

    cuantitativa X. p es la proporcin de observaciones cuyo valor en Y es 1. q es la proporcin de

    observaciones cuyo valor en Y es 0. El rango en valor absoluto que se puede obtener con el

    coeficiente de correlacin biserial puntual est entre 0, cuando las medias de la variable

    cuantitativa para cada categora de la variable cualitativa son iguales hasta 1. El signo en este

    ndice depender de cul de las dos medias se siten en el numerador de la expresin. Si la

    media de X cuando Y=1 es mayor que la media de X cuando Y=0, entonces la correlacin

    saldr positiva indicando relacin directa entre la variable X y el valor 1 de Y. Por el contrario,

    si la media de X cuando Y=1 es menor que la media de X cuando Y=0, entonces la correlacin

    saldr negativa indicando relacin directa entre la variable X y el valor 0 de Y.

    Correlacin de

    Spearman

    Cuando queremos analizar la relacin entre variables ordinales, se aplica el coeficiente de

    correlacin de rangos de Spearman. Para ello, se asignan rangos u rdenes a cada valor de la

    variable y se calcula el cuadrado de las diferencias (di) de rangos entre las dos variables. Se

    suman estos cuadrados, , y por ltimo se obtiene el coeficiente con la siguiente expresin: donde

    n es el tamao de la muestra o nmero total de observaciones. Los valores del coeficiente de

    correlacin de Spearman oscilan entre -1, cuando hay una perfecta relacin inversa entre los

    rdenes de las dos variables, 0, cuando no hay relacin entre ambas variables, y +1, cuando hay

    una relacin perfecta directa entre las rdenes de ambas variables.

  • Correlacin espuria Cuando se observa un coeficiente de correlacin lineal alto entre dos variables, lo nico que se

    puede concluir es que estn relacionados entre s, pero no siempre se puede establecer un nexo

    de causalidad de una variable respecto de otra. Hay muchas variables que presentan una alta

    correlacin entre s, pero ello se debe a la presencia de una tercera variable que tiene una fuerte

    relacin entre ellas. Este tipo de correlaciones se denominan correlaciones espurias. Hay

    muchos casos que ilustran este tipo de correlaciones, por ejemplo, la alta correlacin que se da

    entre el nmero de matrimonios celebrados y la temperatura media mensual. En ningn caso se

    debe caer en el error de pensar que una variable es causa de la otra, el sentido comn nos lleva a pensar que la relacin es meramente fortuita o producida por alguna otra variable que

    no hemos contemplado y que pudiera estar relacionada con las dos variables que presentan una

    alta correlacin entre s (la mayor parte de las parejas suelen aprovechar los periodos veraniegos para contraer matrimonio, y son precisamente esos perodos en los que la temperatura es mayor).

    Correlacin phi El coeficiente de correlacin fi (o phi) es vlido para establecer la asociacin existente entre dos

    variables cualitativas con cualquier n de categoras de las variables. Su expresin es: El valor

    mnimo de este ndice es 0, que se obtiene cuando el valor de Chi cuadrado es cero. En cuanto al

    valor mximo, el ndice phi puede alcanzar valores mayores a 1 cuando el valor de chi cuadrado

    sea superior al n de observaciones de la muestra. Hay, sin embargo, un tipo de variables

    cualitativas, las denominadas variables dicotmicas, que slo tienen dos categoras posibles

    (sexo, x ej). Para este tipo de variables, el coeficiente de correlacin puede ser tambin el siguien:

    Con variables dicotmicas el coeficiente phi slo puede obtener valores absolutos entre 0 y 1, y

    adems ser positivo o negativo dependiendo de cual de los productos del numerador sea mayor.

    Por ello, para su interpretacin hay que considerar la distribucin de las frecuencias en la tabla.

    Covarianza ndice que evala el grado con que dos variables cuantitativas

    varan conjuntamente. Puede tomar cualquier valor positivo o

    negativo. Un valor positivo indica que aumentos en una variable se

    corresponden con aumentos en la otra. Un valor negativo indica que aumentos en una variable

    se corresponden con decrementos o disminuciones en la otra. Si las dos variables son

    independientes, la covarianza es cero. Cuando se dice que una variable aumenta o disminuye

    en promedio, se quiere resaltar que lo que va aumentando o disminuyendo son las medias de

    una variable condicionada a los valores de la otra, mas que los valores concretos en s. (Ver

    Media condicionada). Se obtiene calculando la media de los productos de las desviaciones

    respecto a la media de las dos series de puntuaciones.

    Cuartil Los cuartiles son las puntuaciones que dividen la distribucin en cuatro partes iguales con el

    25% de los datos en cada una de ellas. Hay, por tanto, tres cuartiles: el primer cuartil

    corresponde con el percentil 25 y deja por debajo el 25% de los datos. El segundo cuartil

    corresponde con el percentil 50 y la mediana y el tercer cuartil corresponde con el percentil 75.

    Entre dos cuartiles consecutivos se encuentra el 25% de los datos.

    Cuasi-varianza Es un ndice de variabilidad que se obtiene sumando los cuadrados de las

    diferencias de todas las puntuaciones respecto a la media y dividiendo entre (n-

    1). Su utilidad estriba en que es el mejor estimador de la varianza poblacional,

    frente a la varianza de la muestra que estima con error la varianza de la

    poblacin. Por esta razn, se la conoce tambien con el nombre de varianza insesgada. Cuando

    las muestras son grandes la varianza y la cuasi-varianza prctica> coinciden ya que apenas se

    producen diferencias al dividir la suma de los cuadrados de las desviaciones entre n o entre n-1.

    Curtosis Se refiere al grado de apuntamiento de la distribucin de

    frecuencias. Cuando es muy apuntada, se dice que es

    leptocrtica, si es muy aplastada, se dice que es platicrtica.

    Un grado intermedio entre estos grados de apuntamiento es

    la distribucin mesocrtica, que es la distribucin normal o

    de referencia para establecer el grado de apuntamiento.

    CURVA NORMAL

    (DE

    PROBABILIDADES)

    Se trata del modelo estadstico al que tienden con ms frecuencia los datos empricos. Cuando

    estos se acomodan razonablemente al modelo, podemos aplicarles sus propiedades. Las

    caractersticas fundamentales de la curva normal de probabilidades son: a) Tener como valor

    mximo el de la ordenada de la media b) Ser simtrica con respecto a la ordenada de la media.

    c) Presentar dos puntos de inflexin, uno para el valor de la Media ms una desviacin tpica

    (media + s) y otro para la Media menos una desviacin tpica (media s) d) La curva es asinttica con respecto al eje de abscisas: por mucho que se prolongue a derecha e izq nunca

    llega a cortarlo. Por ello, nunca encontraremos una probabilidad = 1, que sera un suceso seguro.

  • D

    Decil Los deciles son las puntuaciones que dividen la distribucin en diez partes iguales con el

    10% de los datos en cada una de ellas.

    Desviacin media Es la media de las diferencias en valor absoluto de n puntuaciones

    respecto de su media aritmtica. Es decir, dadas las puntuaciones X1,

    X2, ..., Xn, su desviacin media, DM, es

    El hecho de que en este ndice se tomen las diferencias en valor

    absoluto de cada puntuacin respecto de la media aritmtica, se deriva

    de la primera propiedad de este ndice de tendencia central.

    Desviacin tpica Es la raz cuadrada positiva de la varianza. Es un ndice de variabilidad

    o dispersin de un conjunto de datos respecto a la media.

    Medida de dispersin o variabilidad. Estadsticamente es la raz

    cuadrada de la media de la suma de las desviaciones individuales de un

    grupo de sujetos, elevadas al cuadrado, con respecto a la media aritmtica de un grupo. La

    varianza es un ndice del grado en que las puntuaciones individuales se agrupan ms o menos

    en torno a la media del grupo; si todas las puntuaciones individuales coincidieran con la

    media, la varianza sera 0; cuanto ms se aparten de ella, mayor valor alcanzar la varianza.

    Esta medida es muy importante en la Estadstica inferencial ya que se utiliza en las pruebas

    de contraste de hiptesis.

    Diagrama de rbol Representacin grfica que permite dibujar y calcular el nmero de elementos del espacio

    muestral de un experimento aleatorio.

    DIAGRAMA DE

    BARRAS

    Representacin grfica especialmente adecuada a variables cualitativas; las barras, situadas

    unas a continuacin de otras, tienen como base las diferentes categoras y como altura su

    frecuencia.

    DIAGRAMA DE

    CAJA

    Representacin grfica especialmente relevante por la gran cantidad de informacin que

    ofrece sobre un conjunto de puntuaciones originales. En concreto nos informa sobre: a) Las

    puntuaciones extremas b) La Mediana, igual al Q2 o cuartil 2 c) El recorrido intercuartlico:

    Q1 a Q3. d) La informacin contenida sobre este valor en el rectngulo central: en l

    podemos apreciar si se da equilibrio o no entre los diferentes cuartile. e) En ocasiones puede

    informarnos sobre las puntuaciones fuera de rango.

    Diagrama de

    dispersin

    Es una alternativa a los diagramas tridimensionales para

    representar grficamente dos variables cuantitativas medidas

    conjunta>. Se llama tambin "nube de puntos" y es la

    representacin grfica de dos variables en la que cada punto

    representa una determinado dato definido por unas coordenadas

    que corresponden a los valores de esa observacin en la variable X

    e Y. En el eje horiz se sita los valores de la V independiente y en

    el eje vertical los de la V dependiente. Este tipo de grfico es

    especialmente til en el anlisis de correlacin y regresin.

    Se trata de la representacin grfica de los pares de valores de un grupo de sujetos en dos

    variables. El diagrama nos ilustra de la existencia o no de correlacin, de la intensidad y del

    tipo (positiva o negativa). Sobre un eje de coordenadas se van marcando los puntos en que se

    cruzan los valores de la variable X y de la variable Y.

    Diagrama de Tallo y

    Hojas

    Es un tipo de representacin

    grfica muy utilizada dentro

    del Anlisis Exploratorio de

    datos y muy relacionado con

    el histograma con la ventaja

    de aportar ms informacin

    donde los tallos se

    representan en el eje vertical

    y corresponden a la amplitud

    de los intervalos del

    histograma y las hojas a la

    frecuencia.

  • Diagrama

    tridimensional

    Permite representar grficamente la distribucin conjunta de frecuencias absolutas (o de

    proporciones) de dos variables y es til cuando el nmero de valores o categoras de cada

    variable no es muy elevado. En caso contrario el nmero de barras (o rectngulos, segn el

    caso) que puede resultar hara poco informativo el diagrama y las barras quedaran ocultas unas

    detrs de otras. Lo mismo sucede con las variables cuantitativas continuas cuando se quiere

    representar mediante una histograma tridimensional sin agrupar los datos en intervalos. Una

    alternativa a los diagramas tridimensionales para representar grficamente dos variables

    cuantitativas medidas conjunta> es el denominado diagrama de dispersin o nube de puntos.

    DISEO

    EXPERIMENTAL

    Sin entrar ahora en el segundo objetivo control de la varianza- el diseo en cuanto plan,

    estructura y estrategia nos permite poner a prueba, en condiciones rigurosas, la hiptesis del

    investigador sobre el efecto de una variable independiente sobre otra dependi>, contrastando el

    resultado con la posibilidad probabilidad- de que tal efecto sea debido al azar.

    DISEO

    Siguiendo a Kerlinger. Diseo es el plan, estructura y estrategia de una investigacin cuyo objetivo es dar respuesta a ciertas preguntas y controlar la varianza. Como se aprecia, el autor define el trmino e incluye en su concepto los dos objetivos fundamentales del mismo.

    Diseo de

    investigacin

    Es la determinacin de un plan de trabajo o procedimiento para la recogida de datos.

    DISPERSIN Caracterstica de un grupo que nos informa del grado en que las puntuaciones de los

    integrantes de un grupo se sitan de forma ms o menos cercana la medida de posicin de

    que se trate (por ejemplo, de la media aritmtica). Un grupo en que todos su miembros

    obtienen una puntuacin igual a la medida de posicin tiene una dispersin de 0; sin

    embargo, no existe un valor fijo de dispersin mxima. Las medidas de dispersin o

    variabilidad ms importantes y utilizadas son la desviacin tpica o la varianza.

    DISTRIBUCIN DE

    FRECUENCIAS

    En ocasiones, las puntuaciones originales o directas pueden representarse en una tabla en la

    que junto a estas Xi- se incluya el nmero de veces que cada puntuacin se repite (frecuencia: fi). Cuando el nmero de puntuaciones diferentes es elevado, las puntuaciones

    directas suelen sustituirse por conjunto de ellas, denominados intervalos; junto a ellos, las

    veces que ese conjunto de puntuaciones se repite (frecuencia del intervalo). En estos casos, a

    la hora de representar al intervalo (por ejemplo, para operar) se utiliza su valor medio,

    conocido como marca de clase.

    Distribucin binomial Es la distribucin de probabilidad de una variable aleatoria discreta que describe el nmero

    de sucesos que se presentarn para un nmero dado de ensayos y conocida la probabilidad de

    aparicin del suceso.

    Distribucin binomial

    negativa

    Es la distribucin de probabilidad de una variable aleatoria discreta que describe el nmero

    de ensayos que se requieren para conseguir k xitos.

    Distribucin chi-

    cuadrado

    O ji-cuadrado es la distribucin de probabilidad de una variable continua (ver variable chi-

    cuadrado)

    Distribucin

    condicionada

    En una distribucin conjunta de frecuencias absolutas (o de frecuencias

    relativas), recibe el nombre de distribucin condicionada la distribucin de una

    de las variables condicionada a cada valor de la otra variable. As, por ejemplo,

    si tenemos dos variables, X: "Hbitos de lectura" e Y: "Horas de consumo de TV" la

    distribucin condicionada de frecuencias absolutas se obtiene dividiendo cada frecuencia

    absoluta conjunta por su correspondiente frecuencia marginal; es decir:

    donde: nij: frecuencia conjunta y n.j: frecuencia marginal. Esta distribucin condicionada nos

    informa de la proporcin de observaciones de cada uno de los valores de una variable

    asociado a cada uno de los valores de la otra. Por ejemplo, nos permite conocer los "hbitos

    de lectura" para los diferentes valores de "horas de consumo de TV" y, viceversa, las "horas

    de consumo de TV" para los diferentes "hbitos de lectura".

    Distribucin conjunta

    de frecuencias

    absolutas

    Es una tabla de doble entrada, en la que por el lado de las filas se sitan las categoras de la

    variable X, y por el lado de las columnas se sitan las categoras de la variable Y. En cada

    celdilla de la tabla se presenta la frecuencia absoluta conjunta.

    Distribucin conjunta

    de frecuencias

    relativas

    La distribucin conjunta de frecuencias relativas, o proporciones, es una tabla de doble

    entrada, en la que por el lado de las filas se sitan las categoras de la variable X, y por el

    lado de las columnas se sitan las categoras de la variable Y. En cada celdilla de la tabla se

    presenta la frecuencia relativa conjunta o proporcin conjunta.

  • Distribucin de

    Bernouilli

    Es la funcin de probabilidad de un experimento aleatorio en el que slo pueden ocurrir dos

    sucesos mutuamente excluyentes y que se denomina experimento de Bernouilli en honor del

    matemtico Jacobo Bernouilli que deriv su funcin de probabilidad

    Distribucin de

    frecuencias

    Es una tabla donde de forma ordenada se presentan los diferentes

    valores o modalidades que presenta una variable (o caracterstica) con

    el nmero de observaciones (frecuencia) que presentan la misma

    modalidad. La suma de las frecuencias de cada modalidad es igual al

    tamao de la muestra o nmero total de observaciones. Por ejemplo,

    en una muestra de 150 emigrantes su lugar de procedencia ha sido:

    Distribucin de

    Poisson

    Es el lmite al que tiende la distribucin binomial cuando el nmero de ensayos, N, aumenta

    y la probabilidad de aparicin de un suceso, p, tiende a cero. Por esta razn se la denomina

    tambin como "Ley de los sucesos raros". Por ejemplo, nacimientos de trillizos en una

    ciudad. La distribucin de Poisson tiene una funcin de probabilidad conocida que se define

    mediante una simple ecuacin matemtica que permite obtener las probabilidades de

    aparicin de un determinado suceso.

    Distribucin de

    porcentajes

    Es una tabla donde de forma ordenada se presentan los diferentes

    valores o modalidades que presenta una variable (o caracterstica)

    con el porcentaje (tanto por ciento) de observaciones que

    corresponde a cada modalidad. La suma de los porcentajes de

    cada modalidad es igual 100. Por ejemplo, en una muestra de 150

    emigrantes el porcentaje de su lugar de procedencia ha sido:

    Distribucin de

    probabilidad

    De una variable aleatoria discreta es una lista de las

    probabilidades asociadas con cada posible valor de la

    variable. Se la llama tambin Funcin de Probabilidad o, en

    otros textos, Funcin de Masa de Probabilidad y ms

    formalmente se define como una funcin que asigna

    probabilidades a cada valor, xi, de la variable aleatoria discreta, X. Se representa por f(x) =

    P(X= xi) y cumple las siguientes condiciones:

    que indica que la funcin de probabilidad no puede tomar valores negativos ni mayores de 1

    y que la suma de las probabilidades asignadas a todos los posibles valores discretos de la

    variable es igual a 1. Algunas variables aleatorias tienen como funcin de probabilidad una

    funcin o ecuacin matemtica conocida. Por ejemplo, la funcin de probabilidad de la

    distribucin binomial, es:

    Distribucin de

    proporciones

    Es una tabla donde de forma ordenada se presentan los diferentes

    valores o modalidades que presenta una variable (o caracterstica)

    con proporcin (tanto por uno) de observaciones que corresponde a

    cada modalidad. La suma de las proporciones de cada modalidad es

    igual 1. Por ejemplo, en una muestra de 150 emigrantes la

    proporcin de su lugar de procedencia ha sido:

    Distribucin F Es la funcin de densidad de probabilidad de la variable F

    Distribucin

    heterognea

    Es una distribucin con una alta variabilidad con los datos muy dispersos y alejados de su

    tendencia central.

    Distribucin

    homognea

    Es una distribucin con poca variabilidad porque sus datos se encuentran muy concentrados

    respecto a su tendencia central.

    Distribucin marginal En una tabla de distribucin conjunta de frecuencias absolutas (o de frecuencias relativas),

    cada una de las dos variables tiene su propia distribucin, la misma que si considerramos

    cada variable por separado. Estas dos distribuciones se llaman marginales, ya que se colocan

    en los mrgenes de la distribucin conjunta, y se obtienen a partir de la distribucin conjunta

    de una manera muy sencilla: sumando las filas, por un lado, y las columnas, por otro. Por

    tanto, las distribuciones marginales de una distribucin conjunta de dos variables, X e Y, se

    reduce a dos distribuciones (de frecuencias absolutas o de proporciones) de una variable. Una

    representa la distribucin de la variable X, sin considerar a la variable Y, y la otra representa

    la distribucin de la variable Y sin tener en cuenta la variable X

  • Distribucin muestral Es la distribucin de probabilidad de un estadstico calculado en todas las posibles muestras

    del mismo tipo y tamao extradas de una determinada poblacin. Se demuestra que la

    distribucin muestral de la media es, o se aproxima, a la distribucin normal. El

    conocimiento de la distribucin muestral de los estadsticos es la base de la inferencia

    estadstica y el contraste de hiptesis que se estudia en cursos posteriores.

    Distribucin

    multinomial

    Es una generalizacin de la distribucin binomial en la que (a diferencia de sta basada en

    variable aleatoria de Bernouilli) cada ensayo puede presentar ms de dos categoras,

    exhaustivas y mutuamente excluyentes. Sus caractersticas son: a)consiste en N pruebas

    independientes. b)cada prueba o ensayo presenta ms de dos resultados. c) las probabilidades

    correspondientes a cada uno de los resultados permanece constante y tales que su suma es

    igual a 1.

    Distribucin normal Se estudia como distribucin de frecuencias que representa la distribucin de muchas

    variables y como distribucin de probabilidad por su especial incidencia en la inferencia

    estadstica y contraste de hiptesis que se estudiarn en cursos posteriores. Esta distribucin

    se debe a Carl Friedrich Gauss que estudi y describi sus propiedades matemticas.

    Distribucin normal

    estndar o tipificada

    Es una distribucin normal con media cero y desviacin tpica uno.

    Distribucin t Distribucin de probabilidad de la variable t de Student

    Doble sumatorio Supongamos que un grupo total se

    descompone en k grupos con n personas

    cada uno, es decir todos los grupos tienen el

    mismo nmero de personas:

    donde Xij representa la

    puntuacin de la persona i que

    pertenece al grupo j. La suma de las n

    puntuaciones del grupo total vendr dada

    por:

    Dicho en palabras, el doble sumatorio

    significa el sumatorio de los sumatorios de

    las puntuaciones de las personas en cada

    grupo.

    E

    Ecuacin de regresin La ecuacin de regresin es una funcin matemtica que representa la relacin entre dos o

    mas variables. En este curso se estudia la ecuacin de regresin lineal simple entre dos

    variables X e Y que viene definida por la ecuacin de una recta, de expresin: Esta

    ecuacin queda perfectamente definida cuando se obtienen los valores de la ordenada, a y

    la pendiente, b.

    Enfoque confirmatorio Es la forma de abordar muchos anlisis estadsticos cuando se realizan para que los datos

    confirmen (o refuten) las hiptesis que se plantean, en vez de plantearse la cuestin de

    manera exploratoria de forma tal que sean los propios datos los que nos "digan" las

    relaciones o tendencias que hay entre las diferentes caractersticas objeto de estudio.

    Enfoque exploratorio El enfoque exploratorio trata de que sean los propios datos los que nos "digan" las relaciones

    que hay entre las diferentes caractersticas objeto de estudio. En contraste al modo

    confirmatorio, el modo exploratorio est abierto a un amplio abanico de explicaciones

    alternativas, lo cual no significa que el modo confirmatorio deba ser desterrado del anlisis

    sino, ms bien, que no debe ser el que se emplee de manera exclusiva.

    Entidades estadsticas Cada uno de los elementos que componen una poblacin

    Equiprobables Dos o mas sucesos son equiprobables si tienen la misma probabilidad de ocurrencia.

  • Error absoluto Es la diferencia , en valor absoluto, entre el valor observado y el

    pronosticado mediante la recta de regresin.

    Error de agrupamiento Cuando se ordenan los datos en intervalos y asumen todos el valor del punto medio, se

    pierde la informacin de cada puntuacin concreta, lo que puede producir un error, que se

    conoce como error de agrupamiento. En algunos intervalos, el punto medio puede ser una

    sobreestimacin de los valores originales, mientras que en otros intervalos se puede dar una

    subestimacin. En distribuciones de frecuencia con un n elevado de datos, los errores por

    exceso en unos intervalos tienden a compensarse con los errores por defecto de otros, con lo

    cual, a efectos del anlisis estadstico, el empleo del punto medio como valor representativo del

    intervalo, produce resultados similares a los producidos si se emplearan los datos originales.

    Error de pronstico Es la diferencia entre la puntuacin observada, Y, y la pronosticada, Y',

    mediante la ecuacin de regresin. Esto es:

    Error tpico Es la desviacin tpica de la distribucin muestral de un determinado estadstico. De esta

    forma, el error tpico de la media es la desviacin tpica de la distribucin muestral de la

    media. Con otras palabras, la desviacin tpica de todas las medias calculadas en todas las

    posibles muestras del mismo tipo y tamao, n, extraidas de una determinada poblacin de

    tamao N.

    Error tpico de

    estimacin

    Es la desviacin tpica (raz cuadrada de la varianza) de los errores o residuos de la

    regresin.

    Escala de intervalo En una escala de intervalo el punto cero es arbitrario y posee unidad de medida, por lo que

    los nmeros asignados tienen ya un significado de cantidad, en el sentido ordinario de la

    palabra. Un ejemplo sencillo y muy ilustrativo son las escalas Centgrada (C) y Farenheit

    (F) de temperatura, donde como se sabe para la escala Centgrada el punto 0 corresponde a

    la temperatura de congelacin del agua y el punto 100 a la temperatura de ebullicin. El

    cero es arbitrario y no indica carencia del atributo medido, o lo que es lo mismo, no indica

    ausencia de calor. En una escala de intervalo el nmero 20 no representa el doble de

    cantidad del atributo medido que el 10, de forma que 20C no es el doble de calor que 10,

    pero por el contrario, la diferencia entre dos valores de la escala representan distancias

    entre cantidades de la propiedad medida, de tal forma que podemos decir que la diferencia

    entre 40C y 30C es el doble de la diferencia entre 20 y 15C. Esto es as, como ya se ha

    sealado, porque el punto 0 no representa carencia del atributo medido sino que es un

    punto cero arbitrario. Respecto a las transformaciones admisibles es cualquier

    transformacin lineal tal de los valores iniciales que deja la escala invariante

    Escala de medida Es un procedimiento por el cual se relacionan de manera biunvoca (uno a uno) un conjunto

    de modalidades (distintas) con un conjunto de nmeros (distintos). Esto es, a cada modalidad

    le corresponde un slo nmero, y a cada nmero le corresponde una sola modalidad.

    Atendiendo a las relaciones que puedan verificarse empricamente entre las modalidades de

    los objetos o caractersticas pueden distinguirse cuatro tipo de escalas de medida, segn el

    esquema tradicional propuesto por Stevens (1946) en su primera publicacin sobre teora de

    la medida: escala nominal, escala ordinal, escala de intervalo y escala de razn.

    Al aplicar la regla de medida y la correspondiente unidad a un determinado objeto llegamos

    a un nmero. Pero los nmeros resultantes no tienen todos las mismas propiedades ni, por

    tanto, se les pueden aplicar las mismas operaciones matemticas. Con los nmeros ms

    perfectos, propios de una escala de medida de cociente o de razn (edad, talla, peso)

    podemos utilizar todas las operaciones matemticas. Con los de escalas de intervalo

    (temperatura), no, ya que no tienen un 0 absoluto. Hay nmeros propios de una escala de

    medida ordinal, que admiten menos operaciones que los anteriores; ahora bien, dado que el

    orden tiene en alguna medida un carcter cuantitativo (por ejemplo: clase social) algunos

    autores clasifican, en ocasiones, a estas variables como cuasi-cuantitativas. Por ltimo, hay

    nmeros propios de escalas de medida nominal; aqu los nmeros no indican cantidad sino

    diferencia: lo que es igual recibe el mismo nmero y lo que es diferente, un nmero distinto.

    Escala de razn La escala de razn es la ms rica en cuanto a la informacin que proporciona, porque

    adems de poseer todas las propiedades de las escalas anteriores: igualdad - desigualdad

    (escala nominal), orden (escala ordinal), y distancia (escala de intervalo), tiene la ventaja

    de tener un cero absoluto que indica carencia absoluta del atributo medido. Esta es la

    escala ms habitual para medir propiedades fsicas, como el peso, la altura, el volumen,

    etc., pero es difcil encontrar variables psicolgicas que puedan medirse con esta escala.

  • Por eso, podemos afirmar que el que mide 180 cm, es el "doble" de alto que el que mide

    90cm pero nunca que un CI de 180 es el doble de otro CI de 90, a menos que la variable

    inteligencia la podamos medir con escala de razn donde el punto cero represente al que

    carece "absolutamente" de inteligencia. En consecuencia, la escala de razn incorpora las

    caractersticas del sistema numrico de las escalas anteriores: la igualdad, el orden y la

    distancia, a la que aade la propia de esta escala que es la igualdad de razones. Al tener un

    origen de escala absoluto, la nica transformacin admisible para la escala de razn es del

    tipo: g(x)=bx siendo b > 0. Esta transformacin supone simplemente un cambio en la

    unidad de medida de la escala, preservando siempre el origen de la misma.

    Escala nominal En todas aquellas modalidades o caractersticas en las que la nica comprobacin emprica

    que puede hacerse es la de igualdad o desigualdad, su representacin numrica ha de tener

    un carcter meramente nominal. A este nivel de relaciones empricas (igualdad-desigualdad)

    el hecho de atribuir nmeros hay que entenderlo como simples smbolos o nombres y por

    tanto no gozan de propiedades matemticas. No se pueden sumar, restar, multiplicar o

    dividir, y tanto dara, pues, cambiarlos por smbolos no numricos. Las tipologas respecto al

    carcter, segn la cual los seres humanos pueden encuadrarse en una de las cuatro

    categoras: flemtico, melanclico, sanguneo o colrico, son un ejemplo de escala nominal

    de caractersticas psicolgicas. Es fcil adivinar el tipo de transformacin admisible que se

    puede aplicar en este tipo de escalas: cualquiera que preserve las relaciones de igualdad-

    desigualdad de los objetos respecto a una determinada caracterstica.

    Escala ordinal Son aquellas caractersticas objeto de estudio cientfico en las que se observan relaciones

    de un nivel superior al de la simple igualdad-desigualdad que caracteriza la escala

    nominal. Los objetos pueden manifestar determinada caracterstica en mayor grado unos

    que otros, de modo que la escala que los represente debe preservar esas relaciones

    empricas observadas de orden. En el mbito de las ciencias sociales, muchas son las

    caractersticas en las que las relaciones empricas de los objetos que comparten dichas

    caractersticas, tienen un carcter ordinal. Por ejemplo, si no se sabe nada de la materia, o

    se sabe muy poco, lo ms probable es que el juicio que el profesor haga de su exposicin

    sea de "suspenso"; por el contrario, si se sabe bien la materia, y de igual manera se

    expresa, lo ms probable es que el juicio sea de "sobresaliente". Si en vez de estos trminos se emplea una escala numrica: 0 para suspenso, 1 para aprobado, 2 para notable, 3 para

    sobresaliente y 4 para matrcula de honor, la conclusin que sacar el lector de, pongamos, dos

    expedientes acadmicos de 2 alumnos distintos que hayan cursado una misma materia, es que si

    uno de los alumnos ha obtenido un 3 y el otro un 1, el primero ha exhibido un mayor conocimiento

    de la materia que el segundo, o, lo que es lo mismo, que el segundo tena menos conocimientos que el

    primero. Respecto a las transformaciones que admite la escala ordinal de medida, puede

    decirse que, en general, cualquier transformacin es vlida siempre que preserve el orden de

    magnitud, creciente o decreciente, en que los objetos presentan determinada caracterstica.

    Espacio muestral Es el conjunto formado por todos los resultados posibles de un experimento aleatorio. Se

    representan con la letra mayscula E y tambin se llama universo o poblacin del experi>.

    Esperanza matemtica O valor esperado de una variable aleatoria es el promedio o valor central de la variable. Es

    un resumen numrico de la tendencia central de la distribucin de probabilidad (si la

    variable es discreta) o de la funcin de densidad de probabilidad (si la variable es

    continua). Se conoce tambin con el nombre de "momento respecto al origen de primer

    orden" y se representa con la letra E y entre parntesis la variable cuya esperanza se

    describe: E(X), E(Y), E(W), etc, o con la letra griega "mu"( ) y como subndice la

    variable que se representa , etc.

    Estadstica Definida por Amn, (1984; p.37) como " la ciencia que recoge, ordena y analiza los datos

    de una muestra, extrada de cierta poblacin, y que, a partir de esa muestra, valindose del

    clculo de probabilidades, se encarga de hacer inferencias acerca de la poblacin".

    Ciencia que trata de analizar e interpretar los datos recogidos con algn propsito, como la

    investigacin cientfica. Algunos autores la definen afirmando que su objeto es el estudio de

    los fenmenos aleatorios; recuerde el lector que cuando hablamos de contrastar los efectos

    de diversas intervenciones lo que hacemos es asignar proabilidades a que tales efectos se

    deban al puro azar (aleatoriedad) o a la intervencin llevada a cabo por el investigador en

    condiciones de rigor o control de explicaciones alternativas. Cuando trabajamos con los

    valores de las muestras la Estadstica se denomina descriptiva; si de tales valores deseamos

    pasar a estimar los correspondientes a la poblacin, la Estadstica se conoce como

  • inferencial; esta es ms compleja pero es la que ofrece ms utilidad u aplicaciones tanto al

    cientfico como al profesional. La inferencia estadstica pretende sacar conclusiones sobre

    gran nmero de datos a travs de observaciones de parte de esos datos. Se trata de

    generalizar los datos de una muestra a la poblacin de la que procede. Mediante la

    estadstica inferencial se puede estimar parmetros y realizar contraste de hiptesis.

    Estadstico Un estadstico es un valor que se calcula a partir de los datos de una muestra. Se utilizan para

    representar una caracterstica de la muestra y para estimar el mismo valor referido a la

    poblacin de la cual se ha extrado la muestra. ejp, la media calculada en una muestra proporciona

    informacin sobre la correspon> media poblacional. El valor numrico de estos estadsticos dependen

    de la composicin de la muestra y variar de una muestra a otra. Se representan por letras del

    alfabeto latino. Por ejemplo, rxy, se utiliza para representar la correlacin entre dos variables

    X e Y observadas en una muestra. mientras que el mismo concepto, referido a la poblacin,

    se denomina parmetro y se representan con letras del alfabeto griego

    Valores obtenidos en una muestra. Los ms conocidos son los agrupados bajo las medidas

    de posicin o tendencia central (media, mediana, moda), las de dispersin o variabilidad

    (desviacin media, desviacin tpica, varianza) o los coeficientes de correlacin. Suelen

    representarse con letras latinas ( x , s, r). A partir de ellos, por inferencia estadstica, podemos estimar sus correspondientes parmetros con determinados niveles de

    probabilidad, asumiendo un riesgo de error tipo I prefijado por el investigador.

    Estadsticos robustos Son ndices estadsticos descriptivos provenientes del anlisis exploratorio de datos que

    tienen la peculiaridad de ser resistentes a los datos extremos de la distribucin. Entre ellos

    se encuentran: MEDIA RECORTADA, MEDIA WINSORIZADA,MEDIA

    CENTRAL,MEDIANA RECORTADA O TRIMEDIA yla MEDA.

    Experimento Es el desarrollo de un proceso mediante el cual obtenemos un conjunto de resultados,

    observaciones o datos con el fin de realizar una comprobacin o verificar una hiptesis.

    ESTIMACIN DE

    PARMETROS

    Se denomina as el procedimiento por el que se trata de estimar el valor de un estadstico,

    obtenido en una muestra, a toda la poblacin de la que aquella forma parte. Toda

    estimacin asume un cierto margen de error, medido en trminos de probabilidad; este

    error puede hacerse tan pequeo como desee el investigador, pero nunca podr hablar en

    trminos seguros, de certeza. Al hablar en el texto del coeficiente de correlacin nos

    hemos acercado al concepto y procedimiento de estimacin de parmetros.

    EXPERIMENTO Es la modalidad de investigacin emprica ms exigente; como consecuencia, su

    aportacin esencial es la posibilidad de establecer, con razonable seguridad, relaciones de

    causa a efecto entre una o varias variables independientes (v.i.) y otra denominada

    dependiente (v.d.). Para poder lograrlo se deben cumplir determinadas exigencias: el

    investigador debe poder planificar la accin y provocar el fenmeno, ha de poder

    realizarlo en condiciones de control y debe contar con medidas de calidad, tan vlidas,

    fiables y precisas como sea posible.

    Experimento aleatorio Es cualquier experimento realizado al azar que se puede repetir indefinidamente en las

    mismas condiciones y cuyo resultado no se puede predecir con certeza. cumple las cuatro

    condiciones siguientes: a) Se puede repetir indefinidamente en las mismas condiciones. b)

    En cada ensayo se obtiene un resultado que pertenece al universo o conjunto de todos los

    resultados posibles, E. c) Antes de cada ensayo no se puede predecir con certeza el resultado

    que obtendremos. d)A medida que el nmero de ensayos aumenta, la frecuencia relativa - o

    proporcin - de aparicin de cada resultado posible tiende a aproximarse a un valor fijo.

    F

    FIABILIDAD

    La fiabilidad es una de las caractersticas tcnicas que deben reunir los instrumentos de

    recogida de datos y de medida. Entendemos por fiabilidad el grado de precisin de la

    medida; a ms precisin fiabilidad- menos error de medida. La fiabilidad se expresa en muchos casos mediante un coeficiente de correlacin (representado aqu por rXX, dado

    que las dos series tienen que ver con el mismo instrumento de recogida de datos). Las dos

    series pueden referirse a las puntuaciones en dos mitades de la misma prueba (consistencia

    interna), a las puntuaciones de la misma prueba aplica en dos ocasiones separadas por un

    cierto tiempo (estabilidad) o a las puntuaciones en dos pruebas equivalentes, esto es, de

    caractersticas tan semejantes como sea posible (equivalencia)

  • Frecuencia Es el nmero de veces que un valor de la variable aparece en un conjunto de observaciones.

    Frecuencia absoluta Nmero de veces que se repite cada uno de los valores de la variable. Se simboliza por ni.

    La suma de todas las frecuencias absolutas representa el total de la muestra n.

    Frecuencia absoluta

    conjunta

    Se representa por nij y corresponde al nmerode datos (la frecuencia) que pertenece a la

    categora i-sima de lavariable X y a la categora j-sima de la variable Y. Lapresentacin

    de esta informacin en forma de tabla se conoce como distribucinconjunta de frecuencias

    absolutas.

    Frecuencia acumulada Representa el nmero total de observaciones o datos desde el valor mnimo hasta un cierto

    valor. (Ver Acumulada)

    Frecuencia relativa Es sinnimo de proporcin.

    Frecuencia relativa

    conjunta

    O proporcin conjunta se representa por pij y corresponde a la proporcin de datos que

    pertenece a la clase i-sima de la variable X y a la clase j-sima de la variable Y. La

    presentacin de esta informacin en una tabla se conoce como distribucin conjunta de

    frecuencias relativas.

    Frecuencias esperadas En los problemas de relacin entre variables categricas que se presentan en tablas de

    contingencia, las frecuencias esperadas son las frecuencias que se deberan presentar en

    cada celda de la tabla en el supuesto de que las variables fuesen independientes.

    Frecuencias observadas En los problemas de relacin entre variables categricas que se presentan en tablas de

    contingencia, las frecuencias observadas o empricas son las frecuencias que tenemos

    realmente en cada celda de la tabla y representan los datos actuales de la tabla. Estas

    frecuencias observadas son las que se comparan con las "frecuencias esperadas" para

    estudiar la relacin entre las variables de nuestro estudio.

    Funcin de densidad de

    probabilidad

    Es una funcin que describe el comportamiento matemtico de la probabilidad de una

    variable aleatoria continua. Conceptualmente es equivalente a la funcin de probabilidad

    de una variable aleatoria discreta, pero referido a una variable continua, y en consecuencia,

    permite obtener la probabilidad de que la variable aleatoria tome un valor en un intervalo

    dado. Ejemplo de funciones de densidad de probabilidad de variables aleatorias continuas

    son: la distribucin normal, la F de Fisher, la t de Student y la chi-cuadrado.

    Si f(x) es una funcin de densidad de probabilidad de una variable aleatoria, se cumplen

    las siguientes condiciones:

    La probabilidad total para todos los posibles valores de la variable aleatoria

    continua es uno

    La funcin de densidad de probabilidad nunca puede ser negativa: f(x)>0

    Funcin de distribucin Toda variable aleatoria discreta o continua tiene su funcin de distribucin que representa

    la probabilidad de que, para cualquier valor de xi, la variable aleatoria, X, tome valores

    menores o iguales que xi.

    Se representa por

    Para una variable discreta, la funcin de distribucin se obtiene sumando, o acumulando,

    las probabilidades de la funcin de probabilidad desde el menor valor de la variable al

    mayor.

    Por ej, suponiendo que para una variable aleatoria discreta su funcin de probabilidad es

    xi 0 1 2 3 4 5

    f(xi) = P(X =xi) 0.1 0.2 0.2 0.3 0.1 0.1

    Su funcin de distribucin es, acumulando las probabilidades, la siguiente

    xi 0 1 2 3 4 5

    F(xi) = P(X

  • G

    GENERALIZACIN

    Entendemos por generalizacin al hecho de extender los resultados de la investigacin

    desde los sujetos estudiados a los grupos de los que forma parte, desde las muestras a sus

    respectivas poblaciones. Este procedimiento, propio de la Estadstica inferencial, tiene

    exigencias que deben cumplirse para que sea legtimo y correcto.

    Grados de libertad Hace referencia al nmero de datos de informacin independientes disponibles despus de

    realizar un clculo numrico. Por ejemplo, si conocemos la media de n valores, podemos

    asignar valores a n-1 y el ltimo quedar determinado automticamente para cumplir la

    condicin de que la media sea el valor fijado. En este caso, el clculo de la media se

    realiza con n-1 grados de libertad.

    H

    HIPTESIS

    Entendemos por hiptesis las conjeturas sobre la posible relacin entre los elementos -

    variablesintegrantes del problema. En los diseos experimentales se formulan hiptesis

    sobre la relacin causal entre una o varias variables independientes (V.I.) y la variable

    dependiente (V.D.) Una hiptesis se somete a prueba o se contrasta tratando de apreciar si

    las probabilidades a su favor son sensiblemente superiores a una explicacin por azar. Esta

    segunda hiptesis se denomina nula y se representa por H0 , frente a la del investigador (H1)

    Histograma Un tipo de representacin grfica, para variables continuas,

    formada por una serie de barras contiguas de altura proporcional a

    la frecuencia de la categora de la variable.

    Representacin grfica de las puntuaciones obtenidas por un

    conjunto de sujetos en una variable cuantitativa. En el eje X se sitan

    los lmites de los intervalos; en el Y, la frecuencia del intervalo.

    I

    Indices de posicin Indican la posicin relativa que ocupa una puntuacin directa dentro de la distribucin de

    frecuencias. Por ejemplo, si una puntuacin directa de X=80 supera al 75% de los datos,

    esta puntuacin corresponde al percentil 75. Existen tres nombres para los ndices de

    posicin; cuartiles, percentiles y deciles. Los cuartiles dividen la distribucin en cuatro

    partes, los deciles en diez partes y los percentiles en cien partes iguales.

    ndices de posicin. Indican la posicin relativa que ocupa una puntuacin directa dentro de la distribucin de

    frecuencias. Por ejemplo, si una puntuacin directa de X=80 supera al 75% de los datos,

    esta puntuacin corresponde al percentil 75. Existen tres nombres para los ndices de

    posicin; cuartiles, percentiles y deciles. Los cuartiles dividen la distribucin en cuatro

    partes, los deciles en diez partes y los percentiles

    Intervalo Es sinnimo del concepto de modalidad y corresponde a cada uno de los grupos de valores,

    delimitados por dos nmeros, en que se clasifican los datos observados de una variable

    (habitual> de tipo cuantitativo) y que ocupan una fila en una distribucin de frecuencias.

    Intervalo crtico Es el intervalo que contiene el ndice de posicin (percentil, decil o cuartil) que se desea

    obtener con datos agrupados en intervalos. Por ejemplo, para el clculo de la mediana, el

    primer paso es determinar en qu intervalo se encontrar. A este intervalo se le denomina

    intervalo crtico y para determinarlo se requiere obtener las frecuencias acumuladas o

    proporciones acumuladas. Hecho esto, el intervalo crtico es el primer intervalo cuya

    frecuencia acumulada sea mayor o igual al 50% de n o cuya proporcin acumulada sea

    mayor o igual a 0,50.

    Intervalo de confianza Intervalo construido a partir de la informacin proporcionada por la muestra que coger el

    valor numrico del parmetro poblacional con una probabilidad determinada.

    Intervalo de

    probabilidad

    Intervalo terico, construido a partir de la distribucin de probabilidad de un determinado

    estadstico, que contiene el valor que tomara ese estadstico calculado en cualquier

    muestra de un tamao determinado extrado de la poblacin.

  • Investigacin cientfica Esquemticamente, y siempre con el riesgo que esta simplificacin supone, podemos

    sealar que una investigacin cientfica conlleva los siguientes pasos: Un primer nivel

    terico-conceptual que incluira:

    1. Definicin del problema. 2. Deduccin de hiptesis contrastables.

    Un segundo nivel tcnico-metodolgico constituido por aspectos propia> metodolgicos:

    3. Establecimiento de un procedimiento de recogida de datos.(Diseo de investigacin)

    Finalmente, en un nivel estadstico-analtico:

    4. Anlisis de los resultados obtenidos. 5. Discusin de dichos resultados y bsqueda de conclusiones 6. Elaboracin de un informe de investigacin.

    La interpretacin de los resultados obtenidos nos llevara nuevamente al nivel terico-

    conceptual, inicindose nuevamente el proceso y dando lugar a una estructura cclica

    caracterstica de toda investigacin cientfica.

    Para Selltiz, Investigar es buscar de nuevo, echar otra mirada ms cuidadosa para averiguar ms. Echamos otra mirada porque puede haber algo errneo en lo que ya

    sabemos [...] La investigacin cientfica ha de ser sistemtica, organizada, disciplinada y

    rigurosa. Investigacin emprica es aquella que acude a la experiencia, a los datos, para

    llegar a conclusiones en relacin con las hiptesis de partida.

    L

    Lmites aparentes Corresponden a los valores observados (ver valor aparente) en una variable con nuestro

    instrumento de medida y que definen un intervalo con una frecuencia absouta determinada.

    Lmites exactos (de un

    intervalo)

    Son los valores mximo y mnimo que tendra cada intervalo si el instrumento de medida

    tuviera una precisin perfecta. Por ejemplo, cuando se pesa un objeto con una balanza con

    precisin de 1 gramo, el peso que se lee es una aproximacin al nmero entero ms

    cercano. Si el objeto, segn esa balanza, informa de un peso de 40 gramos hay que

    entender que el peso real del objeto se encuentra en el intervalo 40 0,5, es decir el peso

    real estar entre 39,5 y 40,5 gramos. El valor que se lee en el instrumento (40 gramos) se

    conoce como valor informado o valor aparente, mientras que los valores que acotan el

    intervalo (39,5 y 40,5) se conocen como lmites exactos.

    M

    Meda Es un ndice de dispersin o variabilidad resistente que corresponde a la mediana de las

    desviaciones, en valor absoluto, de cada puntuacin a la mediana.

    Media La media se utiliza para representar a todos los datos de la

    distribucin y es el valor alrrededor del cual tienden

    a agruparse todas las observaciones. Se obtiene

    sumando todas las puntuaciones de la distribucin y

    dividiendo por el nmero de puntuaciones sumadas. Su expresin matemtica

    es:

    En notacin sumatorio, la media se escribe:

    Medida de posicin resultante de sumar todas las puntuaciones de un grupo y dividir el

    resultado por el nmero de integrantes del grupo, representado por N. Su ventaja

    fundamental radica en que todas y cada una de las puntuaciones de la serie incluyen en su

    valor en forma proporcional al mismo. Es especialmente adecuada para niveles de medida

    de razn e intervalo.

  • Media central Con los datos ordenados la media central es el promedio de la parte central de la

    distribucin una vez que se han sustituido los valores extremos por los valores centrales.

    Media condicionada En una distribucin conjunta de frecuencias absolutas de dos variables

    X e Y, podemos calcular la media de X condicionada a cada una de los

    valores de Y, y de igual forma podemos calcular la media de Y

    condicionada a cada uno de los valores de X. Aunque se puede calcular

    por diferentes procedimientos, su expresin general es:

    siendo: Yj : valores discretos de la variable Y, o puntos medios de los intervalos en el caso

    de variables continuas agrupadas en intervalos; j = 1, 2, 3,..., k; nij: frecuencias conjuntas

    de Y para el valor i de X, y ni.: frecuencia marginal del valor Xi de la variable X. De forma

    similar escribiramos la media de X condicionada a los diferentes valores de Y. Por

    ejemplo, supongamos que tenemos una tabla de distribucin conjunta de frecuencias

    absolutas que representan las puntuaciones de un test de razonamiento numrico, X, para

    las diferentes edades, Y, de escolarizacin de la ESO. La media de X condicionada a los

    distintos valores de Y, nos informa de la media del test para las diferentes edades de

    escolaridad de la ESO.

    Media recortada Es un estadstico de tendencia central resistente a las desviaciones de los datos en uno de

    los extremos de la distribucin. Para su clculo, se ordenan los datos y se excluyen un

    determinado porcentaje de los valores extremos en los dos lados de la distribucin

    calculndose la media aritmtica de los restantes valores.

    Media winsorizada Es un ndice de tendencia central resistente a las desviaciones de los datos extremos de la

    distribucin. Una vez ordenados los datos, un determinado porcentaje de valores extremos se

    sustituyen por el valor inmediata> anterior o posterior y se calcula la de todos los valores.

    Mediana Es el valor de la variable que deja por debajo al 50% de las observaciones. Por tanto, es el

    valor de la variable que divide a la distribucin en dos parte iguales cada una de las cuales

    contiene el 50% de los datos.

    Medida de posicin resultante de ordenar las puntuaciones de mayor o menor, o viceversa,

    y encontrar la que ocupa el lugar central de la serie. Si la serie tiene un nmero par de

    casos, la mediana ser la media de las dos centrales. Su inconveniente fundamental es que

    en la mediana no influyen los valores de las puntuaciones sino solo el orden que ocupan.

    Dos series muy diferentes pueden tener la misma mediana. Resulta especialmente

    adecuada para el nivel de medida ordinal.

    Mediana recortada Es un ndice resistente utilizado dentro del Anlisis Exploratorio que se obtiene mediante

    una media ponderada de los tres cuartiles. El cuartil segundo (o mediana) tiene doble

    ponderacin que los cuartiles primero y tercero.

    Medicin Proceso por el cual se asignan nmeros a objetos o caractersticas segn determinadas

    reglas. Esta definicin implica poner en correspondencia, por un lado, nmeros, y por otro

    objetos o caractersticas con sus correspondientes modalidades. Entre los nmeros se dan

    ciertas relaciones que son vlidas dentro del mundo aritmtico, que es un mundo ideal.

    Tambin entre las modalidades de las caractersticas se dan determinadas relaciones que

    son verificables en el mundo emprico, es decir en el mundo real. Pues bien, medir supone

    poner en relacin estos dos mundos, el ideal de los nmeros y el real de los objetos, de

    modo que las relaciones que se dan en el mundo numrico preserven exactamente las

    relaciones que se observan en el mundo emprico, y slo sern vlidas aquellas relaciones

    numricas que puedan ser verificables empricamente.

    Medida Es el proceso por el cual se asignan nmeros a objetos o caractersticas segn

    determinadas reglas. Esta definicin implica poner en correspondencia, por un lado,

    nmeros, y por otro objetos o caractersticas con sus correspondientes modalidades. Entre

    los nmeros se dan ciertas relaciones que son vlidas dentro del mundo aritmtico, que es

    un mundo ideal. Tambin entre las modalidades de las caractersticas se dan determinadas

    relaciones que son verificables en el mundo emprico, es decir en el mundo real. Pues bien,

    medir supone poner en relacin estos dos mundos, el ideal de los nmeros y el real de los

    objetos, de modo que las relaciones que se dan en el mundo numrico preserven

    exactamente las relaciones que se observan en el mundo emprico.

  • ESCALAS DE MEDIDA Una medida, en sentido estricto, es el resultado de comparar una unidad con una cantidad.

    La cantidad peso la medimos comparndola con la unidad Kilogramo u otras mayores o menores. El resultado es el nmero. La definicin ms amplia de medida se debe a Stevens: Medir es asignar numerales a los objetos o hechos de acuerdo con ciertas reglas.

    Un numeral puede ser un nmero o un smbolo, lo que permite admitir el nivel o escala de

    medida nominal. En nuestros mbitos, no siempre es tan fcil proceder a medir variables;

    la mayora de las variables son construcciones o constructos elaborados por los cientficos

    e investigadores, como en el caso de la inteligencia, el nivel de conocimientos, el

    autoconcepto, la tasa de inflacin, el producto interior bruto o similares. En tales casos, la

    medida consiste en la asignacin de valores de acuerdo con ciertas reglas, como ocurre en

    una prueba objetiva, un cuestionario de actitudes hacia los inmigrantes, la tasa de

    mortalidad infantil, etc. Los nmeros que resultan no tienen las mismas propiedades que

    en el caso del peso, de la talla o de la edad, nmeros perfectos que permiten todo tipo de

    operaciones y que son propios de escalas de medida de razn o cociente. Variables como

    la temperatura, perfectamente medibles, se diferencian de las anteriores en que el punto de

    partida cero grados- no es fijo, adems de poder presentar valores inferiores. Este tipo de variables forman parte de la escala de intervalos. Las que se limitan a indicar el orden en

    una serie (1, 2) se ubican en las escalas ordinales; y en el caso de variables que no indican cantidad sino semejanza o diferencia (sexo, estado civil, clase social, grados

    universitarios) la escala se conoce como nominal.

    Mtodo cientfico Se caracteriza por ser "sistemtico" y "replicable". El trmino sistemtico hace referencia a

    que se trata de un proceso que tiene unos pasos perfectamente establecidos y el trmino

    replicable hace referencia a que los datos obtenidos mediante su uso pueden ser replicados

    o refutados por cualquier investigador que lo desee.

    Moda El valor de la variable que ms se repite, por tanto, es el valor de la variable con mayor

    frecuencia.

    Tambin denominada Modo, es una medida de posicin que coincide con el valor ms

    repetido de la serie de valores. Su inconveniente fundamental es que en aquellos valores

    menos repetidos que el de la Moda no cuentan para su obtencin. Resulta especialmente

    adecuada para el nivel de medida nominal.

    Modalidad Una modalidad es cada uno de las variantes como se manifiesta una caracterstica. El

    estado civil, o las creencias religiosas, son caractersticas que presentan pocas

    modalidades. Por el contrario, muchas caractersticas objeto de estudio cientfico pueden

    presentar un nmero casi infinito de modalidades. Si tomamos por ejemplo la altura o el

    peso de la poblacin espaola, estaremos ante caractersticas con un infinito nmero de

    modalidades, pues aunque dos modalidades estn muy prximas, siempre son posibles

    modalidades intermedias.

    Modelo Un modelo permite, haciendo uso de desarrollos matemticos o de otros lenguajes

    formales, elaborar una serie de predicciones que pueden ser contrastadas empricamente.

    Entendemos por modelo una representacin simplificada de la realidad. Tal representacin puede ser icnica, analgica, matemtica. Los modelos matemticos tienen

    una gran utilidad en Estadstica. En la medida en que unos datos empricos sigan

    razonablemente un modelo, podemos aplicar las propiedades de este al tratamiento

    estadstico de aquellos. En nuestro mbito, modelo es, un tipo de distribucin de datos

    terico o ideal al que pueden tender distribuciones empricas o reales de ciertas variables.

    Por ejemplo: la variable motivacin por los idiomas, una vez medida en un conjunto

    amplio de sujetos (muestra) puede acercarse o apartarse ms o menos de un modelo ideal o

    terico como es la denominada curva normal de probabilidades o campana de Gauss. Este

    modelo tiene unas propiedades; si nuestros datos medidos se acercan suficientemente al

    modelo, podemos aplicarles las propiedades del mismo, lo que nos permitir analizar los

    datos y obtener conclusiones. Para decidir si podemos considerar que unos datos empricos

    se acercan suficientemente al modelo hasta hacerlos compatibles con l, disponemos de

    pruebas de bondad de ajuste, como es el caso de chi o ji cuadrado, cuyo smbolo es X2.

    Este tipo de pruebas asignan una probabilidad a los datos empricos sobre su acomodacin

    o no al modelo, lo que permite al investigador aceptar o no la hiptesis de nulidad.

  • Muestra Una muestra es una seleccin de datos extrados de una poblacin o universo de posibles

    observaciones. La muestra se debe seleccionar de tal forma que sea representativa de la

    poblacin de origen. Una de los procedimientos de seleccionar muestras representativas es

    el muestreo aleatorio simple donde cada elemento de la poblacin tiene la misma

    probabilidad de formar parte de la muestra.

    Muestra aleatoria simple La muestra aleatoria simple es una seleccin al azar de un conjunto de observaciones que

    formaran la muestra para el anlisis de datos.

    Muestreo La estadstica ha desarrollado toda una teora especfica en el que se estudian

    procedimientos y tcnicas para la extraccin de muestras representativas de una poblacin

    determinada, y que se engloban bajo la denominacin de muestreo.

    N

    Nube o diagrama de

    puntos

    Es la representacin grfica de dos variables en la que

    cada punto representa una determinado dato definido

    por unas coordenadas que corresponden a los valores

    de esa observacin en la variable X e Y. En el eje

    horizontal se sita los valores de la variable

    independiente y en el eje vertical los de la variable

    dependiente. Este tipo de grfico es especialmente

    til en el anlisis de correlacin y regresin.

    O

    Ordenada En la ecuacin de regresin, la ordenada es el valor que toma la variable dependiente, Y, cuando

    la variable independiente, X, toma el valor 0. Grficamente corresponde al punto donde la recta

    corta al eje vertical (o eje de ordenadas). Usualmente, la ordenada se representa por la letra a.

    En la recta de la figura cuya ecuacin es

    Y=0,933+0,74X. El valor de Y cuando X= 0

    corresponde al punto donde la recta corta con el eje

    de ordenadas, Y. Este valor es la ordenada de la

    recta y, en este ejemplo vale 0,933.

    Outlier Un valor extremo o atpico que es muy diferente del resto de observaciones de la muestra

    P

    Parmetro Entendemos por parmetro el valor de un determinado estadstico no en la muestra en

    que se obtiene sino en el total de la poblacin. Si los estadsticos ms comunes, como

    las medidas de posicin y variabilidad (media: ; mediana: Md; moda: Mo; desviacin

    tpica: s; varianza: s2...) se suelen representar por letras latinas, los parmetros lo hacen

    por letras griegas ( = media; s = desviacin tpica; s2 = varianza...)

    Nombre dado a cualquier ndice numrico que describe alguna caracterstica de la poblacin: su

    tendencia central, variabilidad, asimetra, relacin, covariacin, etc. Se representan por letras

    del alfabeto griego, por ejemplo, , se utiliza para representar la correlacin entre dos

    variables X e Y de la poblacin. Suele ser un valor desconocido que se estima -o infiere- a

    partir de los valores observados en la muestra. De la inferencia de parmetros se ocupa la

    Estadstica Inferencial que se estudiar en otros cursos.

  • Pendiente La pendiente de la ecuacin de regresin de Y sobre X se representa por la letra b e indica el

    cambio que se produce en la variable Y por cada cambio unitario en la variable X.

    Grficamente representa la "inclinacin" de la recta de regresin. Si la relacin entre las variables

    es positiva la pendiente tambin es positiva. Si la relacin entre las variables es negativa la

    pendiente es negativa. Si no existe relacin lineal entre las variables la pendiente es cero.

    En la Figura se ha trazado la recta cuya ecuacin es

    Y=0,933+0,74X. El valor de la pendiente, como se ha

    sealado, es la variacin que se produce en la variable Y

    cuando X aumenta una unidad. Como el lector puede

    comprobar el valor de Y para X = 4 es 3,893, y para X =

    5 es 4,633; la diferencia entre estos dos valores es

    exactamente el valor de la pendiente, es decir, 4,633 -

    3,893 = 0,74 = b.

    Percentil Es el valor de la variable que deja por debajo un porcentaje determinado de observaciones. Los

    percentiles dividen la distribucin en 100 parates, por tanto, existen 99 percentiles que son los

    que van desde el percentil 1 al 99 de tal forma que el percentil 73 sera el valor de la variable de

    observacin que deja por debajo el 73% de los datos. El percentil 25 es lo mismo que el primer

    cuartil. El percentil 50 es lo mismo que la mediana, que el decil 5 y que el segundo cuartil. El

    percentil 75 es lo mismo que el tercer cuartil. Por tanto, la escala de percentiles divide a la

    distribucin en 100 partes iguales de tal forma que entre dos percentiles consecutivos se

    encuentra el 1% de las observaciones.

    Poblacin Por poblacin estadstica se entiende el conjunto de todos los elementos que comparten una o

    varias caractersticas. A cada uno de los elementos que componen una poblacin se le

    denomina de manera genrica entidades estadsticas, y de acuerdo al nmero de las entidades

    que la componen, una poblacin puede ser finita o infinita. El conjunto de espaoles que

    padecen trastornos epilpticos, los municipios con cinco mil habitantes o menos, los parados

    registrados en el Instituto Nacional de Empleo, el conjunto de libros publicados en una ao por

    una editorial, el total de accidentes de trfico ocurridos en las carreteras espaolas durante el

    ao 1999, son ejemplos claros de poblaciones finitas. Por el contrario, el lanzamiento reiterado

    de una moneda, o el conjunto de nmeros naturales (1,2,3...), son ejemplos de poblaciones

    infinitas dado que no hay un lmite establecido en ninguno de estos dos conjuntos; siempre se

    puede tirar la moneda una vez ms y, respecto al conjunto de nmeros naturales, por muy

    grande que sea un nmero siempre habr otros que lo superen

    El trmino poblacin se define como el conjunto de todos los casos o elementos que cumplen con las caractersticas que la definen: los varones, las mujeres, los estudiantes de Farmacia, los

    polticos, los abogados... En ciencias sociales no suele estar muy claramente definida. El

    investigador desea generalizar los datos de la muestra a la poblacin. En los estudios empricos

    no suele ser posible ni, en la mayora de los casos, aconsejable- estudiar todos los casos; se acude en su lugar a muestras, que deben ser representativas del conjunto total o poblacin. Por

    medio de la Estadstica inferencial se pueden hacer estimaciones de los parmetros a partir de

    las muestras (por ejemplo: desde a )

    Porcentaje Simbolizado por Pi, es el valor de la frecuencia relativa multiplicado por cien. Expresado

    formalmente: Pi = pi 100. Indica el tanto por ciento (%) de observaciones de una determinada

    modalidad o valor de la variable de estudio.

    Porcentaje acumulado Ver acumulada.

    Probabilidad Teora matemtica que estudia la posibilidad de ocurrencia de sucesos o acontecimientos. En

    trminos matemticos la probabilidad tiene tres definiciones: la definicin clsica, la definicin

    estadstica y la definicin axiomtica.

    Frente a los sucesos seguros se encuentran los probables. El tipo de seguros a las que es ms

    adecuado aplicar la probabilidad es el de los fenmenos aleatorios. Conociendo las diferentes

    manifestaciones de un fenmeno, como el nmero de caras de un dado o de los nmeros de la

    lotera, podemos decidir la denominada probabilidad a priori, suponiendo, como debe ocurrir,

    que todas las caras del dado y todos los nmeros tienen las mismas oportunidades. En el primer

    caso, la probabilidad de una cara cualquiera es de 1/6; en el segundo, suponiendo que tengamos

  • 60.000 nmeros, ser de 1/60.000. Para nosotros es importante conocer los modelos de

    probabilidad, como el de la curva normal. Gracias a ella, a la regla matemtica que la rige,

    podemos asignar probabilidades a los fenmenos que la siguen, que se acomodan a ella. Estas

    probabilidades nos permiten aceptar o rechazar hiptesis (pruebas estadsticas) o decidir si un

    coeficiente de correlacin rXY es o no estadsticamente significativo. Los valores de

    probabilidad oscilan entre 0 suceso imposible- y 1, suceso seguro. Reflexione sobre la correccin o incorreccin de una expresin habitual en los medios de comunicacin como la

    siguiente: casi con toda probabilidad. Sera ms correcto afirmar: con elevada probabilidad? o, casi con seguridad?

    Probabilidad

    acumulada

    Representa la suma de probabilidades desde el menor valor posible hasta un cierto valor. En los

    modelos de distribucin de variables aleatorias discretas, la probabilidad acumulada

    corresponde a la funcin de distribucin de probabilidad.

    Promedio La media aritmtica se conoce tambin con el nombre de promedio y

    corresponde a la suma de todas las observaciones o datos dividido por el

    nmero de datos.

    Es un valor de la variable que se encuentra hacia el centro de la distribucin

    de frecuencias, se le denomina genricamente como tendencia central y

    sintetiza todos los valores de la distribucin.

    Proporcin Simbolizada por pi, es el cociente entre la frecuencia absoluta de cada clase, ni y el nmero total

    de observaciones, n. Expresado formalmente: pi = ni/n. La frecuencia relativa o proporcin

    indica el tanto por uno de observaciones que corresponden a una categora o valor de la variable

    de estudio.

    Proporcin

    acumulada

    Ver acumulada.

    Proporcin de

    varianza explicada

    En la ecuacin de regresin, la varianza de la variable

    dependiente se puede descomponer en la suma de dos

    varianzas: la varianza de las puntuaciones pronosticadas, y la

    varianza del error o varianza de los residuos. Los pronsticos son una funcin lineal

    de la variable independiente X, funcin que viene especificada por la propia recta de

    regresin: , por lo que la varianza de las puntuaciones pronosticadas, Y,

    dependen de la varianza de X, tal y como indica la siguiente expresin:

    mientras que los residuos no dependen de ninguna variable o lo que es igual, no es funcin de

    ninguna variable conocida e incluida en la ecuacin de regresin. Entonces, si la varianza de Y

    se puede expresar como la suma de la varianza de los pronsticos y la varianza de los residuos:

    y la varianza de las puntuaciones pronosticadas depende de la varianza de X, entonces la

    varianza de Y se puede explicar en parte por la varianza de X. Es decir, una parte de la

    variabilidad de Y puede ser explicada, una vez construida la recta de regresin por la propia

    variabilidad de X. Expresada en trminos de proporciones la proporcin de la variabilidad de Y

    que es explicada por la variabilidad de los pronsticos (que a su vez son funcin de la

    variabilidad de X) ser:

    que corresponde con el coeficiente de determinacin, mientras que la proporcin de la

    variabilidad de Y que no se puede explicar por variabilidad de los pronsticos ser:

    PRUEBAS

    ESTADSTICAS.

    BONDAD DE

    AJUSTE

    Cuando queremos contrastar dos o ms formas de intervencin mtodos, procedimiento de disciplina, sistemas de motivacin, tratamientos fisioteraputicos, frmacos- acudimos a un contraste de hiptesis. El investigador formula la suya H1- y, para darla por buena, debe ser capaz de rechazar la alternativa, conocida como hiptesis nula o de nulidad (H0). Por prudencia,

    solo rechazar esta y aceptar aquella cuando las probabilidades a favor de esta sean tan pequeas

    como desee y, en consecuencia, las probabilidades a favor de su hiptesis sean tan elevadas como

    l decida. Las pruebas estadsticas ms comunes son t y F, aunque hay otras muchas. Un tipo de

    pruebas concreto es el de bondad de ajuste; se puede aplicar, por ejemplo, para decidir si una

    determinada distribucin de datos se acomoda suficientemente a un modelo como para poder