Nicholas Day Norman Breslow .

Post on 07-Apr-2016

215 views 1 download

Transcript of Nicholas Day Norman Breslow .

Prof. José Leopoldo Ferreira Antunes

leopoldo@usp.br

Curso de VerãoAnálise Multinível em

Estudos Epidemiológicos

2

Regressão de Poisson

Regressão Logística

RegressãoLogística

Nicholas Day

Norman Breslow

http://www.iarc.fr/en/publications/pdfs-online/stat/sp32/SP32_vol1-0.pdf

RegressãoLogística

Regressão Logística

Fator Desfecho = 1 Desfecho = 0 Total= 1 A B A+B= 0 C D C+D

Total A+C B+D A+B+C+D

odds1 (quando o fator = 1) = = A/C

odds2 (quando o fator = 0) = = B/D

Odds Ratio = = AD/BC

RR = RiscoM/RiscoD = (1/2)/(1/6) = 3

OR = OddsM/OddsD = (1/1)/(1/5) = 5

Sorteio Moeda DadoGanha 1 1Perde 1 5Total 2 6

Regressão LogísticaO desfecho é necessariamente categórico.Y = b0 + b1*X , usando transformação algébrica: oddsodds de Y = (prob. Y = 1)/(prob. Y = 0)odds = p/(1-p); p = Probabilidade de Y ser = 1log (odds) = b0 + b1*Xlog(odds1) = b0 + b1*X1log(odds2) = b0 + b1*X2log(odds2) – log(odds1) = b0 + b1*X2 – b0 – b1*X1log(odds2/odds1) = b1*(X2-X1)Se o fator é categórico, então: X2 = 1 e X1 = 0log(odds ratio) = b1odds ratio = 10b1

Regressãode Poisson

Aluisio JD Barros Vânia N Hirakata

Fator Desfecho = 1 Desfecho = 0 Total= 1 A B A+B= 0 C D C+D

Total A+C B+D A+B+C+D

Incidência 1 (quando o fator = 1) = A/(A+B)Incidência 2 (quando o fator = 0) = C/(C+D)

Razão de incidências =

Regressão de PoissonY = b0 + b1*X, usando transformação algébrica: loglog(Y) = b0 + b1*Xlog(Y1) = b0 + b1*X1log(Y2) = b0 + b1*X2log(Y2) – ln(Y1) = b0 + b1*X2 – b0 – b1*X1log(Y2/Y1) = b1*(X2-X1)Se o fator é categórico, então: X2 = 1 e X1 = 0log(Y2/Y1) = b1Y2/Y1 = 10b1

Para desfechos categóricos: razão de incid. ou preval.Para desfechos paramétricos: razão de escores

Análise multivariadaRegressão Linear:Y = b0 + b1*X1 + b2*X2 + b3*X3 + ... + bN*XN

Regressão de Poisson:log(Y) = b0 + b1*X1 + b2*X2 + b3*X3 + ... + bN*XN

Regressão Logística:log (odds) = b0 + b1*X1 + b2*X2 + b3*X3 + ... + bN*X

Stepwise

Análise hierárquica

Como selecionar as variáveisque serão incluídas nomodelo multivariado?

Forward selectionBackward eliminationQualidade do ajuste

Inclusão obedece estrutura conceitual estipulada

“Os pressupostos para explicar um fenômeno não devem se multiplicar além do necessário.” Frei Guilherme de Occam (1285-1349).

“Karl Pearson reconheceu este como o mais importante Canon de todo o campo do pensamento lógico. Mas a primazia do princípio de parcimônia na análise estatística tem sido

desafiada pelos modernos desenvolvi- mentos técnicos da informática.”

Porta M. A Dictionary of Epidemiology, 5th

Ed. Oxford: Oxford University Press, 2008.

Miquel Porta

Análise hierárquica

Nível distal

Nível mesial

Nível proximal

Organizaçãodos

fatores

G.F. Vaccarezza

Plausibilidade?

M.G.H. Biazevic

Condição socioeconômica: renda

Características demográficas:idade e sexo

Características comportamentaisConsumo de tabaco e álcool

Características comportamentais proximais: hábitos nutricionais

Consumo cumulativo de café

Casos e controles pareados

Distal

Mesial

Proximal

Fatorprincipal

Plausibilidade?

Leon Gordis

Gordis L. Epidemiology. 3rd ed. Philadelphia, Pennsylvania: Elsevier Saunders: 2004.

http://whqlibdoc.who.int/publications/2010/9788572888394_por.pdf

R. Bonita; R. Beaglehole; T. Kjellström.

Epidemiologia Básica. São Paulo: Ed. Santos, 2010. 2ª edição. ISBN: 9788572888394Ruth Bonita

Robert Beaglehole

Consumo de café e câncer bucal não associaram significantemente na análise não-ajustada (bivariada), mas a associação inversa (indicativa de proteção) foi significante após o ajuste por consumo de tabaco...

Por que não se incluiu uma variável de interação entre café e tabaco?

Victora CG, Huttly SR, Fuchs SC, Olinto MT. The role of conceptual frameworks in epidemiological analysis: a hierarchical approach. Int J Epidemiol 1997;26:224-7.

César G. Victora

Análise hierárquica

Nível distal

Nível mesial

Nível proximal

Organizaçãodos

fatores

Diez-Roux AV. A glossary for multilevel analysis. J Epidemiol Community Health 2002; 56:588-94.

Ana Diez-Roux

“See MULTILEVEL ANALYSIS.”

Porta M. A Dictionary of Epidemiology, 5th Ed. Oxford: Oxford University Press, 2008.

Miquel Porta

No exemplo de Victora et al. (1997), renda familiar seria determinante distal (X1) e desnutrição seria determinante proximal (X2) de óbito infantil por diarréia (Y).

Se a análise é multivariada com esses dois fatores:

Y = b0 + b1*X1 + b2*X2 + ESendo E = resíduo de regressão = Yobservado – Yestimado

Mas esse modelo multivariado não obedece à estrutura conceitual delineada, pois renda familiar exerce efeito sobre o risco de desnutrição infantil e sobre o risco de óbito infantil por diarréia, mas não se pretende avaliar um hipotético efeito de desnutrição infantil sobre a renda familiar.

Organiza-se, então, a análise em dois níveis:

1º O nível distalY = b0 + b1*X1 + Eapenas renda (X1) entrou no modelo explicativo de YY’ = b0 + EY = Y’ + b1*X1

2º O nível proximalY’ = b0’ + b2’*X2 + Eapenas desnutrição (X2) entrou no modelo de Y’

Substituindo... Y = Y’ + b1*X1 = b0’ + b2’*X2 + E + b1*X1Reordenando... Y = b0’ + b1*X1 + b2’*X2 + E

Organiza-se, então, a análise em dois níveis:

1º O nível distalY = b0 + b1*X1 + Eapenas renda (X1) entrou no modelo explicativo de YY’ = b0 + EY = Y’ + b1*X1

2º O nível proximalY’ = b0’ + b2’*X2 + Eapenas desnutrição (X2) entrou no modelo de Y’

Substituindo... Y = Y’ + b1*X1 = b0’ + b2’*X2 + E + b1*X1Reordenando... Y = b0’ + b1*X1 + b2’*X2 + E

Organiza-se, então, a análise em dois níveis:

1º O nível distal (fator distal = renda)xi: reg desfecho rendaxi: logit desfecho renda, or ou usando i.rendaxi: poisson desfecho renda, irr r ou usando i.renda

2º O nível proximal (fator proximal = desnutrição)xi: reg desfecho renda desnutriçãoxi: logit desfecho renda desnutrição, orxi: poisson desfecho renda desnutrição, irr r

Organiza-se, então, a análise em dois níveis:

1º O nível distal (fator distal = renda)xi: reg desfecho rendaxi: logit desfecho renda, or ou usando i.rendaxi: poisson desfecho renda, irr r ou usando i.rendaRegistra-se o coeficiente da variável distal: renda, sem ajuste por desnutrição2º O nível proximal (fator proximal = desnutrição)xi: reg desfecho renda desnutriçãoxi: logit desfecho renda desnutrição, orxi: poisson desfecho renda desnutrição, irr rRegistra-se o coeficiente da variável proximal: desnutrição, já ajustada por renda

A. F. Boing

Proporção explicada = (ORh – ORf)/(ORh – 1)ORh = odds ratio hierarchically adjusted

ORf = odds ratio fully adjusted

Análise bivariada:xi: logit caso fator, or --- ou --- xi: logit caso i.fator, or Análise multivariada:1º nível... distalxi: logit caso manual, or--- ou ---xi: logit caso i.educ, or2º nível... proximalxi: logit caso manual i.tabaco i.alcool, or--- ou ---xi: logit caso i.educ i.tabaco i.alcool, or

Análise bivariada:xi: logit caso fator, or --- ou --- xi: logit caso i.fator, or Análise multivariada:1º nível... distalxi: logit caso manual, or O que é a opção “or”?--- ou --- O que é o sufixo “i.”?xi: logit caso i.educ, or O que é o comando “xi”?2º nível... proximalxi: logit caso manual i.tabaco i.alcool, or--- ou ---xi: logit caso i.educ i.tabaco i.alcool, or