Variables qualitatives
description
Transcript of Variables qualitatives
1
Variables qualitativesTaules de freqüències: freq. absolutes, percentatges i freq.relatives Gràfiques: barres, sectors, de Pareto, i altres
Descriptius: la moda, per a totes les qualitatives la mediana i els percentils, per a les qualitatives ordinals
Un exemple de variable nominal: estudi complert
Un exemple de variable ordinal: estudi complert
2
Taules de freqüències per a variables qualitatives• Consisteixen en un resum dels valors o modalitats diferents que pren la
variable qualitativa, amb el recompte del nombre d’aparicions per a cada valor.
Exemple: Variable religió majoritària. Casos: països. Pag. 18
Valors o modalitats Sense valors perduts
(27/109)x100 (27/108)
x100
3
Exemple: Variable regió econòmica. Casos: països. Pag. 19
Sense ponderar:
tots els països el mateix pes
Ponderant segons la població: cada
país té un pes proporcional a la
seva població
4
Taula de freqüències tipus Pag. 20
knnn ...21
5
Taules de freq. per a variables qualitatives: resum
• S’utilitzen per resumir la informació dels k valors o modalitats d’una
variable qualitativa, en un total de n casos: k ≤ n• Les freq. absolutes o recomptes indiquen, per a cada valor, xi , el
nombre de vegades que es repeteix: ni
• Les freq. relatives o tants per ú indiquen, per a cada valor, xi , la
proporció de vegades que es repeteix: fi
• Els percentatges o tants per cent indiquen, per a cada valor, xi , el %
• de vegades que es repeteix: pi =
n
ni
100fi
6
Gràfiques per a variables qualitatives: barres• Per a cada valor o modalitat, s’aixeca una barra d’altura igual (o
proporcional) a la seva freqüència o percentatge. Pag. 26
Exemple: Variable religió majoritària. Casos: països. Pag. 27
7
Exemple: Variable religió majoritària: tipologies. Casos: països. Pag. 27
Aparentment, les religions cristianes semblen molt més majoritàries, del
que en realitat són
L’eix no comença al 0
8
Gràfiques per a variables qualitatives: sectors• Per a cada valor o modalitat, es considera un sector d’angle proporcional a
la seva freqüència o percentatge. Pag. 27
Exemple: Variable religió majoritària: tipologies. Pag. 28
Els països no estan ponderats: per a cada modalitat, es veu el %
de països
Els països estan ponderats per població: per a cada modalitat, es
veu el % de població
9
Gràfiques per a variables qualitatives: barres de Pareto• Diagrama de barres per als valors o modalitats ordenats de més a menys
freqüent. Doble eix vertical: a l’eix principal de l’esquerra freqüències (o %), corresponents a les barres; a l’eix secundari de la dreta, % acumulats, corresponents a la línia poligonal creixent. Pag. 29
Exemple: Variable religió majoritària: països sense ponderar
Entre catòlica, musulmana i protestant hi ha gairebé el
80% dels països
10
Gràfiques per a variables qualitatives: pictogrames
11
Descriptius per a variables qualitatives: la moda
• La moda (Mo) és el valor o modalitat més freqüent de la variable. Li corresponen màxima freqüència absoluta, relativa i percentatge. Pag. 42
Exemple:La moda de la taula 1.1, és la religió catòlica, atès que té el % més elevat de
països: 38%
• Equivalentment, li corresponen la barra més alta i el sector d’angle més gran.
Exemples:La moda de les modalitats de religió dels països sense ponderar, és la
modalitat de religions cristianes, atès que té el sector més gran: 60.19% de països.
La moda de les modalitats de religió dels països ponderats per població, és la modalitat d’altres religions, atès que té el sector més gran: 48.47% de població.
12
Remarques i propietats importants de la moda• És fàcil de calcular. És una característica de posició central.
• La moda és més significativa, si té una freqüència sensiblement superior a les dels altres valors.
• Pot no ser única, si la màxima freqüència correspon a dos o més valors. Es parla de distribucions unimodals, bimodals, etc.
Exemple:
La distribució de països (sense ponderar per població) segons regions econò-miques, té dues modes: OCDE i Amèrica Llatina, amb un 19.3% de països.
13
Per contra:
La distribució de regions econòmiques, per països ponderats per població, és unimodal: Moda=Àsia/Pacífic, amb un 58.5% de la població.
14
Descriptius per a variables qualitatives ordinals: la moda, mediana, els quartils i els percentils
• La mediana (Md) és el valor que ocupa la posició central quan tenim totes les observacions ordenades: la meitat d’observacions (50%) són menors o iguals que la mediana i l’altra meitat són majors o iguals. Pags. 39,..
Exemples, amb poques dades: n senarLa mediana de 3, 27, 30, 51 i 100 és 30, és la que està al mig: Md = 30La mediana de 3, 3, 3, 5 i 7 és 3, és la que està al mig: Md = 3
Exemples, amb poques dades: n parellLa mediana de 3, 27, 51 i 100 és la mitjana de les dues que estan al mig:
Md = (27+51)/2 = 39La mediana de 3, 3, 3 i 5 és 3, és la mitjana de les dues que estan al mig:
Md = (3+3)/2 = 3
15
Càlcul de la mediana per a les dades resumides en una taula de freqüències
• Els valors han d’estar ordenats• Localitzarem el primer percentatge acumulat que supera el 50%, el valor
corresponent és la mediana.• Cas que hi hagi un percentatge acumulat igual al 50%, farem la mitjana
entre el valor corresponent i el següent (només pot ocórrer si n és parell)
Exemple, a partir d’una taula de freqüencies: n senar
Md = 4
16
Exemples, a partir d’una taula de freqüencies: n parell
a) Cap percentatge acumulat coincideix amb el 50%
Md = 5
b) Un percentatge acumulat coincideix amb el 50%
Md =(5+7)/2 = 6
17
Distribució d’una variable de tipus numèric, mesurada en escala ordinal: l’últim interval és obert!
ingper91 Ingresos del encuestado 1991
26 1,7 2,6 2,6
36 2,4 3,6 6,2
30 2,0 3,0 9,3
24 1,6 2,4 11,7
23 1,5 2,3 14,0
23 1,5 2,3 16,3
15 1,0 1,5 17,8
31 2,1 3,1 20,9
55 3,7 5,5 26,5
54 3,6 5,4 31,9
64 4,3 6,4 38,3
58 3,9 5,8 44,2
55 3,7 5,5 49,7
61 4,1 6,1 55,8
84 5,6 8,5 64,3
83 5,5 8,4 72,6
54 3,6 5,4 78,1
66 4,4 6,6 84,7
38 2,5 3,8 88,5
23 1,5 2,3 90,8
44 2,9 4,4 95,3
47 3,1 4,7 100,0
994 66,3 100,0
493 32,9
9 ,6
4 ,3
506 33,7
1500 100,0
1 Menos de $1000
2 $1000-2999
3 $3000-3999
4 $4000-4999
5 $5000-5999
6 $6000-6999
7 $7000-7999
8 $8000-9999
9 $10000-12499
10 $12500-14999
11 $15000-17499
12 $17500-19999
13 $20000-22499
14 $22500-24999
15 $25000-29999
16 $30000-34999
17 $35000-39999
18 $40000-49999
19 $50000-59999
20 $60000-74999
21 $75000+
22 Rehusa
Total
Válidos
0 No procede
98 No sabe
99 No contesta
Total
Perdidos
Total
Frecuencia PorcentajePorcentaje
válidoPorcentajeacumulado
18
Els percentils: quartils i decils (casos particulars): Pgs. 44,...
• El percentil o centil d’ordre r(Cr) és el valor tal que un (r x 100 %) de les observacions són menors o iguals que Cr i el (100-r) x 100 % són majors o iguals. Es localitzen a partir dels percentatges acumulats.
Per exemple, C60 és tal que el 60% d’observacions són menors o iguals i el 40% són majors o iguals, etc. Es localitza a partir del primer percentatge acumulat que supera el 60%, el valor corresponent és el centil 60.
A la taula pag. anterior, veiem que:
C60 correspon a l’interval 25000$ a 29999$, que podem representar pel seu punt mitjà: 27500$
C90 correspon a l’interval 60000$ a 74999$, que podem representar pel seu punt mitjà: 67500$
[25000, 30000)
19
La mediana és el centil 50: parteix la distribució en dues parts, cadascuna amb un 50% d’observacions
20
Hi ha tres quartils
Q1= C25 , Q2= C50 = Md , Q3= C75
que parteixen la distribució en quatre parts, cadascuna amb un 25% d’observacions (una quarta part de l’àrea)