estatistica 4 bussab

23
Bussab&Morettin Estatística Básica Capítulo 4 Problema 01. (a) Grau de Instrução Procedênci a 1º grau 2º grau Superior Total Interior 3 (0,083) 7 (0,194) 2 (0,056) 12 (0,33) Capital 4 (0,111) 5 (0,139) 2 (0,056) 11 (0,31) Outra 5 (0,139) 6 (0,167) 2 (0,056) 13 (0,36) Total 12 (0,33) 18 (0,50) 6 (0,17) 36 (1,00) (b) Dos funcionários dessa empresa, 50% têm o segundo grau. (c) Dos funcionários dessa empresa, 19,4% têm o segundo grau e são oriundos do interior. (d) Dentre os funcionários do interior, 7/12 (58,3%) têm o segundo grau. Problema 02. (a) No sorteio de um indivíduo dentre os 36, é maior a probabilidade de o mesmo ter o segundo grau. (b) Quanto à região de procedência, a maior probabilidade está associada com a região identificada por “Outra”. (c) A probabilidade de um indivíduo sorteado aleatoriamente ter grau superior de instrução é 0,17. (d) A probabilidade pedida é . (e) Nesse caso, temos Problema 03. (a) Temos que e . Assim, Y X Baixo Alto Total Baixo 1 (0,025) 7 (0,175) 8 (0,20) cap04 - 1 -

description

ffdsaddad

Transcript of estatistica 4 bussab

Captulo 4

Bussab&Morettin

Estatstica Bsica

Captulo 4

Problema 01.

Grau de Instruo

Procedncia1 grau2 grauSuperiorTotal

Interior3 (0,083)7 (0,194)2 (0,056)12 (0,33)

Capital4 (0,111)5 (0,139)2 (0,056)11 (0,31)

Outra5 (0,139)6 (0,167)2 (0,056)13 (0,36)

Total12 (0,33)18 (0,50)6 (0,17)36 (1,00)

(a) Dos funcionrios dessa empresa, 50% tm o segundo grau.

(b) Dos funcionrios dessa empresa, 19,4% tm o segundo grau e so oriundos do interior.

(c) Dentre os funcionrios do interior, 7/12 (58,3%) tm o segundo grau.

Problema 02.

(d) No sorteio de um indivduo dentre os 36, maior a probabilidade de o mesmo ter o segundo grau.

(e) Quanto regio de procedncia, a maior probabilidade est associada com a regio identificada por Outra.

(f) A probabilidade de um indivduo sorteado aleatoriamente ter grau superior de instruo 0,17.

(g) A probabilidade pedida .

(h) Nesse caso, temos

Problema 03.

(i) Temos que e . Assim,

Y

XBaixoAltoTotal

Baixo1 (0,025)7 (0,175)8 (0,20)

Alto19 (0,475)13 (0,325)32 (0,80)

Total20 (0,50)20 (0,50)40 (1,00)

(j) Da tabela, tem-se que 2,5% dos indivduos encontram-se nessas condies.

(k) 50%.

(l) Dentre as pessoas com baixa rotatividade, 12,5% ganham pouco.

(m) A probabilidade em (c) foi bastante modificada. Isto indica que a maioria das pessoas que ganham pouco tm rotatividade.

Problema 04.

Regio de ProcednciaGrau de Instruo

1 grau2 grauSuperior

Interior0,2500,5830,167

Capital0,3640,4550,182

Outra0,3850,4620,154

(n) Em caso de independncia entre a regio de procedncia e grau de escolaridade, em cada tabela deveria existir 33% com 1 grau, 50% com 2 grau e 17% com grau Superior.

Problema 05.

Tabela do total de linhas

Y

XBaixoAltoTotal

Baixo1 (12,5%)7 (87,5%)8 (100,0%)

Alto19 (59,4%)13 (40,6%)32 (100,0%)

Total20 (50,0%)20 (50,0%)40 (100,0%)

Tabela do total de colunas.

Y

XBaixoAltoTotal

Baixo1 (5,0%)7 (35,0%)8 (20,0%)

Alto19 (95,0%)13 (65,0%)32 (80,0%)

Total20 (100,0%)20 (100,0%)40 (100,0%)

As tabelas acima indicam existncia de relao entre as variveis rotatividade e salrio, pois as propores marginais no se repetem no interior da tabela.

Problema 06.

(o) A proporo de homens entre os indivduos que usaram o hospital :

(p) A proporo de homens entre os indivduos que no usaramo hospital :

(q) Tabela do total de colunas.

Usaram o hospital100 (0,10)150 (0,15)0,25

No usaram o hospital900 (0,90)850 (0,85)0,75

1,001,001,00

Independentemente do sexo, 25% das pessoas usam e 75% no usam o hospital. Essas porcentagens deveriam ser iguais nas duas colunas e no so. Portanto, o uso do hospital depende do sexo do segurado.

Problema 07.

Veja a tabela a seguir. Entre parnteses, encontram-se os valores esperados em caso de independncia das variveis.

Grau de Instruo

Procedncia1 grau2 grauSuperiorTotal

Interior3 (4,00)7 (6,00)2 (2,00)12

Capital4 (3,67)5 (5,50)2 (1,83)11

Outra5 (4,33)6 (6,50)2 (2,17)13

Total1218636

Com isso, os clculos ficam assim:

Problema 08.

Para os dados do problema 3, tem-se:

Y

XBaixoAltoTotal

Baixo1 (4)7 (4)8

Alto19 (16)13 (16)32

Total202040

De modo que,

Para os dados do problema 6, tem-se:

HomensMulheresTotal

Usaram o hospital100 (125)150 (125)250

No usaram o hospital900 (875)850 (875)1750

Total100010002000

De modo que,

Problema 09.

Os dados podem ser assim representados:

CompanhiaDurao de efeito de dedetizao

Menos de 4 mesesDe 4 a 8 mesesMais de 8 meses

X0,320,600,08

Y0,350,580,07

Z0,340,600,06

Essas propores indicam que no h diferenas da durao de efeito de dedetizao entre as trs empresas.

Problema 10.

(a)(b)

(c)(d)

(e)(f)

(g)

Problema 11.

(r) Diagrama de disperso

(s) O grfico do item (a) indica dependncia linear entre as variveis.

(t)

(u) As regies de Porto Alegre e Fortaleza apresentam comportamento diferente das demais. Retirando-se esses elementos do clculo resulta .

Problema 12.

Y

X123456Total

11001428

232143215

327200011

43201006

Total911367440

(v) Como existem pontos que coincidiriam no caso de um diagrama de disperso, pode-se representar os pontos coincidentes no grfico com nmero de repeties. Outra alternativa, vlida do ponto de vista descritivo adicionar uma perturbao aos pontos. Soma-se uma quantidade pequena s coordenadas, de modo a no haver mais coincidncias. A seguir, o grfico com a perturbao:

(w) O coeficiente de correlao entre X e Y 0,59, indicando uma dependncia linear moderada entre as variveis.

Problema 13.

(x) Grfico de disperso

(y) O coeficiente de correlao entre as variveis 0,74.

Problema 14.

X: idade

Estado Civiln

dp(X)var(X)x(1)q1q2q3xn

solteiro1634,337,6959,1120,8327,5035,7540,6846,58

casado2035,635,9535,3626,0831,3734,9139,8148,92

Total3634,586,7445,3920,0030,0034,5040,0048,92

Problema 15.

X: Nota em Estatstica.

SeoN

dp(X)var(X)x(1)q1q2q3xn

P78,710,750,57889910

T78,291,111,2477,58910

V117,911,642,69478910

Total258,241,301,69488910

Logo, Seo no serve para explicar nota.

Problema 16.

Problema 17.

Pode-se perceber que os pontos esto razoavelmente dispersos abaixo em relao a reta (x=y). Logo, parece que os salrios dos professores secundrios menor que o dos administradores.

Problema 18.

Salrio

Estado CivilMenos de 10 SMEntre 10 e 20 SMMais de 20 SMTotal

Solteiro0,120,190,090,40

Casado0,080,310,210,60

Total0,200,500,301,00

(z) Considere-se a tabela do total de colunas:

Salrio

Estado CivilMenos de 10 SMEntre 10 e 20 SMMais de 20 SMTotal

Solteiro0,600,380,300,40

Casado0,400,620,700,60

Total1,001,001,001,00

Pelas diferenas entre as propores marginais e as do interior da tabela, parece haver relao entre as variveis.

Problema 19.

OpinioLocal de residncia

UrbanoSuburbanoRuralTotal

A favor0,330,580,700,50

Contra0,670,420,300,50

(aa) A opinio parece depender do local de residncia do indivduo.

OpinioLocal de residncia

UrbanoSuburbanoRuralTotal

A favor30 (45)35 (30)35 (25)100

Contra60 (45)25 (30)15 (25)100

Problema 20.

Considere a tabela com os valores observados e os esperados:

PropriedadeAtividade

CosteiraFluvialInternacionalTotal

Estatal5 (33,64)141 (129,02)51 (34,34)197

Particular92 (63,64)231 (242,98)48 (64,66)371

Parece existir associao entre o tipo de atividade e propriedade das embarcaes.

Problema 21.

Considere a tabela com os valores observados e esperados :

ParticiparamCidade

So PauloCampinasRib. PretoSantos

Sim50 (64,76)65 (80,95)105 (97,14)120 (97,14)

No150 (135,24)185 (169,05)195 (202,86)180 (202,86)

Os dados da tabela indicam que a participao em atividades esportivas depende da cidade.

Problema 22.

(ab) Tabela dos totais de colunas.

Pretende continuar?Classe social

AltaMdiaBaixaTotal

Sim0,500,440,380,40

No0,500,560,720,60

H evidncias de que a distribuio das respostas afirmativas e negativas no coincidem.

(ac) Tabela dos valores observados e esperados:

Pretende continuar?Classe social

AltaMdiaBaixaTotal

Sim200 (160)220 (200)380 (440)800

No200 (240)280 (300)720 (660)1200

Existe dependncia entre as variveis.

(ad) Se houvesse tal modificao, a dependncia entre as variveis seria apenas menor ().

Problema 23.

e

e

e

Problema 24.

Problema 25.

O coeficiente de correlao linear entre X e Y -0,92, indicando forte correlao linear entre as variveis.

Problema 26.

Pode-se calcular, com os dados fornecidos, e . Como o valor mais alto encontrado 0,95, a varivel Y a mais indicada para explicar a variao de X.

Problema 27.

Salrio

Idade[0,15)[15,30)Total

[0,30)448

[30,40)61218

[40,50)3710

Total132336

(ae) O clculo do coeficiente de correlao neste caso, poderia ser feito utilizando-se os pontos mdios de cada categoria.

(af) Com a idia que foi descrita no item anterior, o clculo do coeficiente de correlao agrupados poderia ser feito com a frmula usual, onde haveria 4 pares (15;7,5) repetidos, 6 pares (35;7,5) repetidos, etc. Assim a frmula seria:

onde xi, yi so os pontos mdios, , , , ,

Problema 28.

(ag) Tabela dos valores observados e dos observados:

CaraCoroaTotal

Cara24 (23,92)22 (22,08)46

Coroa28 (28,08)26 (25,92)54

Total5248100

Logo, no h associao entre os resultados das moedas de um real e de um quarto de dlar.

(ah) O coeficiente de correlao linear entre as variveis X1 e X2 0, pois X1 e X2 so independentes. Esse resultado est de acordo com o resultado do item anterior.

Problema 29.

(ai) O salrio anual mdio dos homens 15 e o desvio-padro 3,87.

(aj) O salrio anual mdio das mulheres 10 e o desvio-padro 3,16.

(ak)

(al) O salrio mdio familiar 25. A varincia do salrio familiar 35.

(am) Descontando 8% dos salrios de todos os homens da amostra e 6% do salrio de todas as mulheres, o salrio mdio familiar cai para 23,2 e a varincia vai a 30,18.

Problema 30.

(an) Histograma

(ao) A mdia da varivel V 30,2 e a varincia 130,6. Como dp(V)=11,43, o limite para se considerar um vendedor excepcional. Acima desse valor, h apenas 1 dentre os 15 indivduos analisados.

(ap) O primeiro quartil da distribuio de V 23,5.

(aq) Os box-plots a seguirindicam que existe alguma diferena entre a distribuio das vendas nas trs diferentes zonas. Assim, no justo aplicar um mesmo critrio para todas as zonas.

(ar) , , logo a varivel teste parece ser a mais importante na contratao de um empregado.

Conceito do gerenteZonaTotal

NorteSulLeste

Bom4 (2,7)3 (2,7)1 (2,7)8

Mau1 (2,3)2 (2,3)4 (2,3)7

Total55515

Logo, existe uma baixa associao entre o Conceito do gerente e a Zona.

(as) Considere X: resultado do teste.

Conceito do gerentenmdiadpvar

Bom86,002,144,57

Mau76,141,682,81

Total156,071,873,50

Considere agora X: vendas:

Zonanmdiadpvar

Norte529,814,4207,7

Sul534,613,56183,8

Oeste526,24,621,2

Total1530,211,43130,6

Problema 31.

(at) ; ;

(au) (A,A),..., (A,E), (B,A),..., (B,E), (C,A),..., (C,E), (D,A),..., (D,E), (E,A),...,(E,E)

1234567

Freq.0,040,080,200,240,240,160,04

(av) ; ;

Vemos que e

0149

Freq.

(aw) ; .

X2

X11357Total

10,040,040,080,040,20

30,040,040,080,040,20

50,080,080,160,080,40

70,040,040,080,040,20

Total0,200,200,400,201,00

(ax) As variveis so independentes, pois

(ay) So iguais entre si e distribuio de X.

(az) No tem esse item.

(ba) Teremos 53=125 triplas.

(bb) Histograma mais prximo de uma normal; ,

(bc) Histograma com assimetria direita.

(bd) Distribuies marginais iguais distribuio de X.

Problema 32.

(be) No tem.

(bf) No tem.

(bg) (A,B),..., (A,E), (B,A),..., (B,E), (C,A),..., (C,E), (D,A),..., (D,E), (E,A),...,(E,D)

23456

Freq.0,100,200,300,200,20

(bh) ; ;

Vemos que

0149

Freq.

(bi) ; .

X2

X11357Total

10,040,040,080,040,20

30,040,040,080,040,20

50,080,080,160,080,40

70,040,040,080,040,20

Total0,200,200,400,201,00

(bj) As variveis so independentes, pois

(bk) So iguais entre si e distribuio de X.

(bl) No tem esse item.

(bm) Teremos 60 triplas.

(bn) Histograma mais prximo de uma normal; ,

(bo) Histograma com assimetria direita.

(bp) Distribuies marginais iguais distribuio de X.

Problema 34.

Problema 35.

Dotplot para as regies de procedncia:

BoxPlot - CapitalBoxPlot Interior

BoxPlot - Outra

Pode-se observar que os salrios da Capital tm variabilidade maior e distribuio mais assimtrica. As mdias e medianas so similares.

Problema 36.

SolteirosCasados

Os grficos de disperso no mostram tendncias particulares.

Problema 37.

Os boxplots acima mostram que todas as distribuies so assimtricas, sendo que a regio Sul se destaca pelo seu aspecto peculiar. A regio Sudeste tem variabilidade maior, pela incluso do estado de So Paulo, que bastante populoso.

Problema 38.

TelebrsIbovespaTotal

BaixaAlta

Baixa14 (5,4)0 (8,6)14

Alta1 (9,6)24 (15,4)25

Total152439

Logo, percebe-se grande associao entre os preos das aes da Telebrs e Ibovespa.

Problema 39.

0

1

2

3

4

5

6

7

8

9

10

Nmero de peas produzidas

Nota

cap04 - 1 -

_1055005361.unknown

_1055014761.unknown

_1055018595.unknown

_1055019969.unknown

_1055020872.unknown

_1055021764.unknown

_1055259121.unknown

_1055259358.unknown

_1055259384.unknown

_1055259442.unknown

_1055259449.unknown

_1055259395.unknown

_1055259377.unknown

_1055055572.unknown

_1055055637.unknown

_1055021492.unknown

_1055021750.unknown

_1055020897.unknown

_1055019999.unknown

_1055020005.unknown

_1055019993.unknown

_1055019608.unknown

_1055019867.unknown

_1055019903.unknown

_1055019660.unknown

_1055019579.unknown

_1055019591.unknown

_1055018874.unknown

_1055017634.unknown

_1055018506.unknown

_1055018564.unknown

_1055017740.unknown

_1055016754.unknown

_1055016835.unknown

_1055015294.unknown

_1055010020.unknown

_1055010500.unknown

_1055013179.unknown

_1055014728.unknown

_1055011375.unknown

_1055010075.unknown

_1055010095.unknown

_1055010047.unknown

_1055009021.unknown

_1055009782.unknown

_1055009974.unknown

_1055009041.unknown

_1055008412.unknown

_1055008807.unknown

_1055008396.unknown

_1054929445.unknown

_1055003821.unknown

_1055005170.unknown

_1055005272.unknown

_1055005319.unknown

_1055005213.unknown

_1055004683.unknown

_1055005073.unknown

_1055004553.unknown

_1054998325.unknown

_1055002954.unknown

_1055003304.unknown

_1055002871.unknown

_1054997334.unknown

_1054997546.unknown

_1054933498.unknown

_1054921990.unknown

_1054923173.unknown

_1054923570.unknown

_1054929207.unknown

_1054923468.unknown

_1054922414.unknown

_1054923135.unknown

_1054922356.unknown

_1054919056.unknown

_1054921112.unknown

_1054921876.unknown

_1054921003.unknown

_1054918929.unknown

_1054919029.unknown

_1054918880.unknown