Interpretação de dados - embrapa.br

61
Interpreta¸ ao de dados Ivani de Oliveira Negr˜ ao Lopes Maria Cristina Neves de Oliveira Londrina-PR Mar¸ co, 2018

Transcript of Interpretação de dados - embrapa.br

Page 1: Interpretação de dados - embrapa.br

Interpretacao de dados

Ivani de Oliveira Negrao LopesMaria Cristina Neves de Oliveira

Londrina-PRMarco, 2018

Page 2: Interpretação de dados - embrapa.br

Topicos abordados

1 Introducao

2 Fundamentos da Estatıstica Experimental

3 Interpretacao de dados

4 Consideracoes finais

Page 3: Interpretação de dados - embrapa.br

1 Introducao

2 Fundamentos da Estatıstica Experimental

3 Interpretacao de dados

4 Consideracoes finais

Page 4: Interpretação de dados - embrapa.br

Most scientists “can’t replicate studies bytheir peers”

http://www.bbc.com/news/science-environment-39054778

Science Needs a Solution for theTemptation of Positive Results

Na ciencia, resultados positivos sao ‘tentacao’ e

reprodutibilidade e desafioAaron E. Carroll, NYT

Traducao: http://www1.folha.uol.com.br/ciencia

Page 5: Interpretação de dados - embrapa.br

A crise da reprodutibilidade

Bayer pharmaceuticals(2011): conduziu experimentos tentando reproduzir dados de 67

trabalhos da literatura (47 envolvendo cancer), obtendo resultados coincidentes com os

reportados originalmente em apenas 25% dos casos;

https://www.nature.com/articles/nrd3439-c1

Empresa de biotecnologia Amgen (2012): tentou reproduzir os resultados de 53

estudos, referencias na proposicao de novas estrategias para o tratamento de cancer,

mas conseguiram chegar as mesmas conclusoes dos autores em apenas 11% dos casos;

https://www.nature.com/articles/483531a

Trabalho colaborativo mundialmente (2015): reportou que apenas 30-50% de 100

experimentos publicados em 2008 em tres das maiores revistas de psicologia tiveram

seus resultados replicados em concordancia com as conclusoes originais, a depender do

criterio usado para definir “similar”.

http://science.sciencemag.org/content/349/6251/aac4716.full...

Page 6: Interpretação de dados - embrapa.br

Por que?

Acredita-se que fraudes sao raras. Mas:

Frequentemente, o que se ve na literatura e a “melhor” versao do que ocorreu;

Prevalece a cultura da valorizacao do impacto da descoberta em detrimento de suarelevancia e ou sua confirmacao;

O interesse por resultados nulos, ou resultados diferentes dos esperados, e quaseinexistente;

Falta de transparencia - dados precisam ser disponibilizados para facilitar a inspecao poroutros pesquisadores;

A mıdia divulga novas descobertas, frequentemente exagerando sua importancia eseus benefıcios, ao inves de promover uma analise crıtica do resultado no contexto dedescobertas anteriores;

Ignora-se, ao menos inconsientemente, a relacao entre conflitos de interesse financeiro evies na pesquisa;

...

Page 7: Interpretação de dados - embrapa.br

“Sem saber se a literatura cientıfica foi construıda sob

base solida ou areia, estamos desperdicando

simultaneamente tempo e dinheiro”

Prof Malcolm Macleod, Neurocientista, Edinburgh, Escocia

https://www.nature.com/news/no-publication-without-confirmation-1.21509

Page 8: Interpretação de dados - embrapa.br

A producao agrıcola e uma atividade empırica comcaracterısticas unicas:

Incertezas na producao, principalmente devido a:▸ condicoes climaticas;▸ pragas e doencas;▸ historico de diversificacao de culturas;▸ historico do manejo dos solos;

Alta variabilidade entre:▸ zonas climaticas;▸ regioes;▸ fazendas;▸ produtores;▸ adocao de tecnologias de producao;

Foto: ION Lopes

ION Lopes & MCN Oliveira Interpretacao de dados 8 / 61

Page 9: Interpretação de dados - embrapa.br

A ciencia agrıcola e uma parceirado produtor na busca contınua derespostas a questoes importantes

que interferem na sustentabilidadeda producao agrıcola.

Foto: ION Lopes

ION Lopes & MCN Oliveira Interpretacao de dados 9 / 61

Page 10: Interpretação de dados - embrapa.br

1 Introducao

2 Fundamentos da Estatıstica Experimental

3 Interpretacao de dados

4 Consideracoes finais

Page 11: Interpretação de dados - embrapa.br

Experimentacao agrıcola

Experimentacao: Investigacao planejada a fim de se obter fatosnovos ou de se confirmar/negar resultados de experimentos previos[6].

SE: conhecimento novo e resultado de cuidadosa analise einterpretacao de dados,

ENTAO: e fundamental que se invista tempo no planejamentoexperimental de modo a maximizar o volume de informacao obtida ereduzir o dispendio de recursos.

A qualidade dos dados e um pre-requisito para que as analisesestatısticas produzam resultados uteis.

ION Lopes & MCN Oliveira Interpretacao de dados 11 / 61

Page 12: Interpretação de dados - embrapa.br

Tipos de experimentos quanto ao proposito [6]

1 Preliminar: grandes quantidades de tratamentos sao testadasem busca de direcoes para futuros trabalhos; geralmente amaioria dos tratamentos aparecem apenas uma vez;Inspecao individual - sem finalidade de comparacoes.

2 Avaliacao/Inspecao/Confirmacao: as respostas mensu-radas/observadas de diferentes tratamentos sao comparadasusando um numero de observacoes que de uma segurancaaceitavel de que diferencas significativas serao detectadas;Todos vs Todos.

3 Demonstrativo: compara um tratamento novo com trata-mento padrao.Novo vs Padrao.

ION Lopes & MCN Oliveira Interpretacao de dados 12 / 61

Page 13: Interpretação de dados - embrapa.br

Princıpios da experimentacao

1 Repeticao: torna possıvel a estimacao do erro experimental;

2 Casualizacao: garante que as estimativas sao estatıstica-mente validas;

3 Controle local: reduz o erro experimental, quando as unidadesexperimentais sao heterogeneas.

ION Lopes & MCN Oliveira Interpretacao de dados 13 / 61

Page 14: Interpretação de dados - embrapa.br

Sobre o erro experimental

Inerente a variacao no material experimental ou a qualquerfalta de uniformidade nas condicoes de conducao do experi-mento;

Nao pode ser eliminado, mas deve ser reduzido:▸ identificando fontes de heterogeneidade no material experimental;▸ acomodando fontes de desuniformidade por meio de blocos;▸ adotando um numero de repeticoes adequado;▸ uniformizando criterios adotados em cada etapa com a equipe.

Requisito a aplicacao de testes de significancia e a estimacaode intervalos de confiancas;

A precisao e a sensibilidade sao inversamente proporcionais avariancia da media: σx

2= σ2/n. A medida que n cresce, σ2

x

diminui;

Erro Padrao da Media (EPM) σx =

σ2x .

ION Lopes & MCN Oliveira Interpretacao de dados 14 / 61

Page 15: Interpretação de dados - embrapa.br

Tratamentos

O processo/material cujo efeito se deseja medir. Pode conter:

apenas uma fonte de variacao: genotipo, doses de um defen-sivo/adubo, sistema de plantio, etc.;

Sorteio considera apenas a homogeneidade das parcelas.

duas ou mais fontes de variacao: genotipo x espacamento;genotipo x espacamento x densidade, etc..Exemplos: experimentos fatoriais, experimentos em parcelassubdivididas (split-plot) e experimentos faixas (strip-plot).

Sorteio considera a homogeneidade das parcelas, a facilidade de

aleatorizacao das combinacoes das fontes de variacao e a precisao

desejada nas estimativas dos efeitos.

ION Lopes & MCN Oliveira Interpretacao de dados 15 / 61

Page 16: Interpretação de dados - embrapa.br

Delineamentos experimentais

Delineamento Inteiramente Casualizado (DIC)

Modelo estatıstico:

yij = µ + τi + eij , em que:

yij = dado observado naparcela ij ;

µ = media do experimento;

τi = efeito do tratamento i ;

eij = erro experimental naparcela ij , eij ∼ N(0, σ2

).

Tab. 1: Analise de variancia (Anava)

FV GLTratamentos 3Erro 12Total 15

Fig. 1: Sorteio DIC

ION Lopes & MCN Oliveira Interpretacao de dados 16 / 61

Page 17: Interpretação de dados - embrapa.br

Delineamentos experimentais

Delineamento em Blocos Casualizados (DBC)

Modelo estatıstico:

yij = µ + τi + βj + eij , em que:

yij = dado observado na parcela ij ;

µ = media do experimento;

τi = efeito do tratamento i ;

βj = efeito do bloco j ;

eij = erro experimental na parcela ij ,eij ∼ N(0, σ2

).

Tab. 2: Anava

FV GLTratamentos 3Blocos 3Erro 9Total 15

Fig. 2: Sorteio DBC

ION Lopes & MCN Oliveira Interpretacao de dados 17 / 61

Page 18: Interpretação de dados - embrapa.br

Experimento fatorial

Tab. 3: Anava fatorial

FV GLBloco 3Genotipo (G) 1Espacamento (E) 1G x E 1Erro 9Total 15

Fig. 3: Sorteio fatorial DBC.

Erro padrao para comparar quaisquer duas medias:√

2σ2/n

No exemplo:

● Comparacoes no fatorial G × E, n=r =4

● Comparacoes de nıveis de G, n=r×nE = 8

● Comparacoes de nıveis de E, n=r×nG = 8

ION Lopes & MCN Oliveira Interpretacao de dados 18 / 61

Page 19: Interpretação de dados - embrapa.br

Experimento parcelas subdivididas

Tab. 4: Anava parcelas subdivididas

FV GLBloco 4 − 1 = 3Espacamento (E) 2 − 1 = 1Erro (a) 3 × 1 = 3Parcela 4 × 2 − 1 = 7Genotipo (G) 2 − 1 = 1G x E 1 × 1 = 1Erro (b) 2 × 3 × 1 = 6Subparcela 2 × 4 × 1 = 8Total 2 × 2 × 4 − 1 = 15

Fig. 4: Sorteio parcelas subdivi-didas DBC.Erros padroes para comparar:

dois nıveis de E:√

2Ea/rnG , n=rnG

dois nıveis de G:√

2Eb/rnE , n=rnE

dois nıveis de G dentro de um nıvel de E:√

2Eb/r , n=r

dois nıveis de E dentro de um nıvel de G:√

2[(nG − 1)Eb + Ea]/rnG , n=rnG

ION Lopes & MCN Oliveira Interpretacao de dados 19 / 61

Page 20: Interpretação de dados - embrapa.br

Experimento em faixas

Cada fator e casualizado em uma direcao do bloco, sim-bolicamente denominadas faixas horizontais e verticais.

Tab. 5: Anava

FV GLBloco 4 − 1 = 3Densidade (D) 2 − 1 = 1Erro (a) 3 × 1 = 3Espacamento (E) 2 − 1 = 1Erro (b) 3 × 1 = 3D x E 1 × 1 = 1Erro (c) 3 × 1 × 1 = 3Total 3 × 2 × 2 × 4 − 1 = 15

Erros padroes para comparar:

nıveis de D:√

2Ea/rnD

nıveis de E:√

2Eb/rnE

nıveis de D dentro de E:√

2[(nE − 1)Ec + Ea]/rnD

nıveis de E dentro de D:√

2[(nD − 1)Ec + Eb]/rnE Fig. 5: Sorteio faixas

ION Lopes & MCN Oliveira Interpretacao de dados 20 / 61

Page 21: Interpretação de dados - embrapa.br

LEMBRE-SE!

O erro padrao da media, utilizado na com-paracao de medias, pode variar para diferentescomparacoes dentro de um experimento, adepender do delineamento. Portanto, essavariacao pode, por exemplo, levar a conclusaode que uma diferenca de 180 kg ha−1 (e naouma diferenca de 200 kg ha−1) entre as mediasdois tratamentos e significativa.

Page 22: Interpretação de dados - embrapa.br

1 Introducao

2 Fundamentos da Estatıstica Experimental

3 Interpretacao de dados

4 Consideracoes finais

Page 23: Interpretação de dados - embrapa.br

Regras gerais ao interpretar dados

Interpretar dados de pesquisa e contar uma historia com inıcio, meio e

fim. Por isso, lembre-se de informar:▸ a motivacao do trabalho;▸ as principais hipoteses agronomicas investigadas;▸ o delineamento experimental, inclusive a caracterizacao da parcela;▸ tratos agronomicos;▸ variaveis observadas/aferidas para fins de teste de significancia de hipoteses

estatısticas;▸ metodologias envolvidas nas analises estatısticas dos dados, inclusive analises

de adequacao dos modelos adotados;▸ estatısticas uteis a compreensao dos dados - escolha um formato de apre-

sentacao que esteja de acordo com o foco da discussao (tabelas, graficos ouinforme diretamente no texto).

Discussoes de resultados estatısticos devem se limitada ao que o(s)modelo(s), estatısticas ou testes adotado(s) permitem concluir;

Inferencias agronomicas, mesmo fundamentadas nas analises estatısticas,devem levar em consideracao o escopo do estudo.

ION Lopes & MCN Oliveira Interpretacao de dados 23 / 61

Page 24: Interpretação de dados - embrapa.br

Analise descritiva

Estatısticas descritivas e graficos sao particularmente uteis para se construir umavisao geral experimento - nao ha preocupacao com comparacoes ou significanciade efeitos.

Fig. 6: Medidas de tendencia central (MTC). Adaptadode wikipedia/lognormal

Observe que:

a moda depende de frequencias;

a mediana depende de posicao- 50% da massa de dados einferior a mediana e os demais50% sao superiores a ela;a media depende de todosos dados e, por isso, ela eum valor tıpico apenas dedistribuicoes simetricas;MTCs sao iguais apenas emdistribuicoes simetricas;a media da distribuicao as-simetrica e um valor atıpico dadistribuicao simetrica;quanto maior a variancia, maisdispersa sera a massa de dadosno eixo-x .

ION Lopes & MCN Oliveira Interpretacao de dados 24 / 61

Page 25: Interpretação de dados - embrapa.br

Analise para fins de inferencias

Envolve testes de significancia de hipoteses estatısticas formuladasnos parametros dos modelos adotados. Testes devem ser escolhidosparalelamente a construcao das hipoteses, na fase de planejamentodo experimento.

Hipoteses estatısticas

H0: afirmacao a respeito de estatısticas que descrevemuma variavel resposta.

H1: negacao de H0, o que pode ser assumido quando H0

e rejeitada.

ION Lopes & MCN Oliveira Interpretacao de dados 25 / 61

Page 26: Interpretação de dados - embrapa.br

Erros de decisao

Decisao baseada nos dadosVerdade desconhecida

H0 e verdadeira H0 e falsaErro tipo II

Aceitar H0 OK β e probabilidade de

se cometer esse erro

Erro tipo IRejeitar H0 α (significancia, p) OK1

e probabilidade de

se cometer esse erro

Exemplos de possıveis consequencias desses erros:

Erro tipo I - recomendar um tratamento ineficaz, ou de eficacia inferior.

Erro tipo II - deixar de recomender um tratamento com eficacia diferenciada.

1A probabilidade de se rejeitar H0 falsa e chamada de poder do teste.ION Lopes & MCN Oliveira Interpretacao de dados 26 / 61

Page 27: Interpretação de dados - embrapa.br

Sobre testes estatısticos de significancia

Testes estatısticos fornecem evidencias quantitativas para averificacao da incompatibilidade entre um conjunto de dados e ummodelo proposto.

Fig. 7: Exemplo distribuicao nor-mal.

A area abaixo da curva indica probali-dades e seu total e igual a 1;

Valores extremos sao menosprovaveis. Na figura ao lado, porexemplo, a probabilidade da variavelX assumir um valor abaixo -1,96 ouacima de 1,96 e 0,05 ou 5%;

Regioes de significancia e de con-fianca sao estabelecidos pelopesquisador, em geral em observanciaa valores adotados por seus pares;

Testes estatısticos sao construıdosa partir de um conjunto de pressu-posicoes e da hipotese H0.

Page 28: Interpretação de dados - embrapa.br

Analise de adequacao de modelos

Sao pre-requitos a validade de resultados obtivos por meio demodelos anava, e de testes de comparacoes multiplas:

Aditividade do modelo;Os blocos influenciaram os tratamentos uniformemente?

Homogeneidade de variancia ou homocedasticidade;A variancia dos resıduos pode ser assumida constante para os diferentestratamentos?

Independencia de resıduos;Ha efeito que nao foi explicado pelo modelo?

Normalidade de resıduos;As estimativas sao viciadas/tendenciosas?

O nao atendimento dessas pressuposicoes pode indicar a presenca deoutliers ou inadequacao do modelo ajustado.

ION Lopes & MCN Oliveira Interpretacao de dados 28 / 61

Page 29: Interpretação de dados - embrapa.br

Tab. 6: Dados-exemplos de produtividade de soja cultivada sob quatrotratamentos, em cinco blocos. Valores observados (Prod), estimados(Pred) e resıduo (Erro).

Tratamento Bloco Prod (y) Pred (y) Erro=y − y1 1 5272 4578 6941 2 4330 4277 531 3 4446 4728 -2821 4 4590 4609 -191 5 3639 4085 -4462 1 3477 3400 772 2 3324 3099 2252 3 3605 3550 542 4 3270 3431 -1612 5 2713 2907 -1953 1 4765 5397 -6323 2 5699 5097 6023 3 5305 5547 -2423 4 5395 5429 -343 5 5211 4905 3064 1 4173 4312 -1394 2 3132 4011 -8804 3 4931 4462 4694 4 4558 4343 2144 5 4154 3819 334

Media - 4299 4299 0

ION Lopes & MCN Oliveira Interpretacao de dados 29 / 61

Page 30: Interpretação de dados - embrapa.br

Interpretacao anavaAnava tem como resultado a particao da variacao total dos dados entre osfatores fixos e aleatorios considerados no modelo.

Tab. 7: Exemplo anava

FV GL SQ QM F Pr > FBloco 4 1.127.254 281.813 1,14 0,3852Tratamento 3 10.157.997 3.385.999 13,66 0,0004Resıduo 12 2.974.120 247.843 - -Total 19 14259371 - - -

CV= 11,6% R2=79,1% Media Geral=4299,4

1 H0: µ1 = µ2 = ... = µ4 e H1: µi ≠ µi ′ , i , i′ = 1, ...,4 para algum i e i ′ tal que i ≠ i ′;

2 R2 = SQmodSQTotal

= SQTratamento+SQBlocoSQTotal

= 79,1% indica a proporcao da variancia total que e

devida ao efeito de bloco e de tratamento;

3 A significancia exata (Pr > F) associada ao efeito de tratamento e igual a 0,0004.Ou seja, o risco de se rejeitar incorretamente a hipotese H0(Tratamento) e proximo azero.

4 H0 deve ser rejeitada, mas H1 nao permite a identificacao de quantas medias diferementre si e nem quais sao essas medias.

ION Lopes & MCN Oliveira Interpretacao de dados 30 / 61

Page 31: Interpretação de dados - embrapa.br

Interpretacao anava. Continuacao...

Para o exemplo:

σ2= 247.843 e uma estimativa da variancia residual

σx =

√247.843

5= 222,64 e uma estimativa do EPM de um tratamento

σd =

2 × 247.8435

= 315 e uma estimativa do EP da diferenca entre duas medias

Diferenca Mınima Significativa (DMS)

A DMS = tασd , em que tα e o α-percentil da distribuicao t com GL igual ao

GL do resıduo, so deve ser usada para testar diferencas estabelecidas na fase de

planejamento do experimento, isto e, antes de se conhecer os dados. Caso todas

as comparacoes entre duas medias sejam igualmente importantes, um teste de

comparacoes multiplas deve ser escolhido, tambem na fase de planejamento.

ION Lopes & MCN Oliveira Interpretacao de dados 31 / 61

Page 32: Interpretação de dados - embrapa.br

Testes de Comparacoes Multiplas (TCM)

TCM sao aplicados quando ha evidencias pelo teste F de que ha diferencas sig-nificativas entre pares de medias e quando todas as comparacoes sao igualmenteimportantes. Uma classificacao devida a Hsu (1996) [4] categoriza os TCMs deacordo com:

Tipo de comparacao aplicada;

▸ Comparacoes entre todos os pares de medias;▸ Comparacoes entre a media de um controle e todas as demais

medias.

Forca da inferencia

▸ Relacionada a maneira como o TCM controla a taxa de erro dedecisao. A maior parte dos TCMs controlam o erro tipo I. Leia:Madden (1982) [5], Furtado (1999) [3] e Borges (2003) [2].

ION Lopes & MCN Oliveira Interpretacao de dados 32 / 61

Page 33: Interpretação de dados - embrapa.br

TCM. Continuacao...

No exemplo, ha quatro medias a serem comparadas. Assumindo que todas ascomparacoes sao igualmente importantes, ha m=4(4 − 1)/2=6 pares de mediasdistintos a serem comparadas. Isto e, ha seis hipoteses a serem testadas.

2 3 41 H0(1): µ1 = µ2 H0(2): µ1 = µ3 H0(3): µ1 = µ4

2 - H0(4): µ2 = µ3 H0(5): µ2 = µ4

3 - - H0(6): µ3 = µ4

1 O controle da taxa de erro tipo I pode ser feito por comparacao/hipotese(TEC) ou por famılia de hipoteses (TEE);

2 A real quantidade de H0s que sao verdadeiras (ou falsas) e desconhecida;

3 TCMs se divergem principalmente pelo modo como controlam a taxa deerro tipo I;

ION Lopes & MCN Oliveira Interpretacao de dados 33 / 61

Page 34: Interpretação de dados - embrapa.br

Orientacoes gerais quanto a TCM

1 TCMs que controlam apenas a TEC, devem ser evitados quando ha maisde tres medias e todas as comparacoes sao igualmente importantes;

2 Alguns TCMs controlam bem a TEE apenas quando H0 e verdadeirapara todas as comparacoes, como por exemplo no caso em que o teste Fe nao significativo;

3 Alguns TCMs controlam bem a TEE mesmo quando H0 e verdadeiraapenas parcialmente. Isto e, H0 nao e verdadeira para todas as com-paracoes. Esses TCMs visam assegurar que a Maxima Taxa de Erropor Experimento (MTEE) e menor que α/m, em que m e o numero dehipoteses/comparacoes.

ION Lopes & MCN Oliveira Interpretacao de dados 34 / 61

Page 35: Interpretação de dados - embrapa.br

Caracterısticas de alguns TCM

Tab. 8: Tab. Alguns TCM para comparacoes par-a-par

Teste Controle de errot-student TECDuncan TECStudent-Newman-Keuls (SNK) TEETukey2 MTEEBonferroni MTEESidak MTEEScheffe MTEE

1 Se uma diferenca e nao significativa, ambas medias recebem um identifi-cador comum, em geral letras.

2 A escolha de um TCM deve ser orientada pelas hipoteses estabelecidasno planejamento e pelos custos atribuıveis aos erros tipo I e tipo II;

3 Estudos com dados simulados mostraram que os testes de Tukey, Scheffee SNK apresentaram excelentes protecoes contra o erro tipo I por experi-mento [7, 8].

2Mais poderoso que Bonferroni, Sidak e Scheffe [5]2Mais poderoso que Bonferroni, Sidak e Scheffe [5]ION Lopes & MCN Oliveira Interpretacao de dados 35 / 61

Page 36: Interpretação de dados - embrapa.br

Caracterısticas de alguns TCM ...

Tab. 9: Algumas opcoes de testes de significancia para contrastes

Teste Controle de errot-student TECDunnett TECBonferroni TEESidak MTEEScheffe MTEE

1 Essa classe de TCMs e preferıvel quando apenas algumas comparacoespossuem interpretacao de interesse;

2 Todos os contrastes de interesse devem ser estabelecidos na fase doplanejamento experimental.

ION Lopes & MCN Oliveira Interpretacao de dados 36 / 61

Page 37: Interpretação de dados - embrapa.br

Interpretacao de resultados de TCM

Tab. 10: Resultado do teste de Tukeypara o exemplo

Tratamento Media3 5275 A1 4455 A B4 4190 B C2 3278 C

DMS = 934,76 qtab=4,20

Medias seguidas de mesma letra nao diferem entresi, de acordo com o teste de Tukey (p ≤ 0, 05)

Evidencia de diferencas entreos tratamentos:

3 e 4;

3 e 2;

1 e 2;

A DMS apresentada na tabela e dada por:

DMS =4,20×σx =4,20×222,64=934,76.

Portanto, para que uma diferenca d =300 nesse experimento fosse significativapelo teste de Tukey (p ≤ 0,05), o erro padrao deveria ser inferior a 71,4.

ION Lopes & MCN Oliveira Interpretacao de dados 37 / 61

Page 38: Interpretação de dados - embrapa.br

Interpretacao de resultados de TCM

Tab. 11: Resultado do teste de Duncanpara o exemplo

Tratamento Media3 5275 A1 4455 B4 4190 B2 3278 C

Medias seguidas de mesma letra nao diferem entresi, de acordo com o teste de Ducan (p ≤ 0, 05)

As regioes crıticas sao variaveis.Para t tratamentos, sao calcu-ladas t − 1 DMS.

Nº de Medias DMS2 686,03 718,14 737,5

Mesmo considerando um teste menos conservador, as DMS sao bastanteelevadas. Um exame cauteloso nos dados pode indicar possıveis causas da altavariabilidade.

ION Lopes & MCN Oliveira Interpretacao de dados 38 / 61

Page 39: Interpretação de dados - embrapa.br

Interpretacao de resultados de TCM

Tab. 12: Um exemplo de interpretacao de TCMs em umexperimento com 18 tratamentos e quatro repeticoes

Tratamento Media Duncan TukeyTrat17 3250 A ATrat18 3167 A B ATrat16 3015 A BC A BTrat11 3006 A BC A BTrat8 2961 BC A B CTrat10 2853 BC D A B C DTrat13 2782 C D E A B C D ETrat14 2738 C D E F A B C D ETrat15 2723 C D E F A B C D ETrat7 2620 D E F B C D ETrat9 2609 D E F B C D ETrat12 2558 D E F G B C D ETrat6 2502 E F G B C D E FTrat5 2441 F G C D E FTrat3 2433 F G D E FTrat2 2281 G H E FTrat4 2258 G H E FTrat1 2024 H F

√DMS Tukey=527,8;

√DMS Duncan=variavel;

√O teste de Duncan detectou

mais diferencas significativas doque o teste de Tukey;

√Seriam todas essas difer-

encas significativas legıtimas?

ION Lopes & MCN Oliveira Interpretacao de dados 39 / 61

Page 40: Interpretação de dados - embrapa.br

Interpretacao de resultados de TCM

Tab. 13: DMS variavel para o teste deDuncan com 18 medias.

Nº Medias DMS γ2 289 0,0503 304 0,0984 313 0,1435 321 0,1856 326 0,2267 330 0,2658 334 0,3029 337 0,337

10 339 0,37011 342 0,40112 344 0,43113 345 0,46014 347 0,48715 348 0,51216 349 0,53717 350 0,56018 351 0,582

Observe que:

√γ e a TEE do teste de Duncan, dada por:

γ = 1 − (1 − α)k−1, em que α = 0,05 ea probabilidade do erro tipo I por hipotesee k (k = 2, ...,18) e o numero de mediasconsideradas em cada hipotese;

√A significancia (γ ) com que a hipotese de

igualdade entre k medias (k = 2, ...,18) foitestada, variou entre 5,0% e 58,2%.

√A forca da inferencia fornecida pelo teste de

Duncan reduz a medida que a quantidades demedias aumenta;

ION Lopes & MCN Oliveira Interpretacao de dados 40 / 61

Page 41: Interpretação de dados - embrapa.br

Alternativas aos TCMs

Em experimentos com grande numero de tratamentos, a interpretacao deresultados de TCMs pode se tornar confusa, visto que podem surgir dezenas degrupos. Nesses casos, uma alternativa e o criterio de agrupamento de Scott &Knott (1974) [9] ou uma modificacao proposta por Bhering (2008) [1].Importante lembrar que:

SK e um algoritmo de agrupamento particional para a analise de variancia e nao umTCM;

Em cada etapa, o algoritmo encontra a particao que maximiza a variancia entre osgrupos. Essa variancia e entao comparada a variancia residual (estimador de maximaverosimilhanca da variancia residual) e testada pelo teste de Chi-quadrado com nıvelα de significancia e v graus de liberdade, em que v e grau de liberdade do resıduo;

Nao ha controle de taxa de erro por experimento. No entanto, estudos com dadossimulados indicam que a taxa de erro tipo I real obtida pelo teste de SK e muitoproxima aos valores obtidos pelo teste de Tukey, quando ha grande quantidade detratamentos.

ION Lopes & MCN Oliveira Interpretacao de dados 41 / 61

Page 42: Interpretação de dados - embrapa.br

Interpretacao de interacoes

Fig. 8: Possıveis resultados de interacoes entre dois fatores A e B. Adaptado de [6]

ION Lopes & MCN Oliveira Interpretacao de dados 42 / 61

Page 43: Interpretação de dados - embrapa.br

Interpretacao de interacoes

Tab. 14: Anova experimento fatorial 9×4

FV GL F Pr > FBloco 4 2,9 0,0233Genotipo (G) 8 4,4 <0,0001Percevejo (P) 3 89,4 <0,0001GP 24 0,92 0,5743Erro 140 - -

Dados: CB Hoffman-Campo

Nao houve interacao significativa entre osfatores genotipo e percevejo;

Os fatores simples podem ser interpretadosdiretamente;

σ2=125,02; nG=5×4=20; nP=5×9=45

σxG=2,5; qtab=4,46; DMSG=11,1

σxP=1,7; qtab=3,68; DMSP=6,1

Tab. 15: Porcentagem de sementesboas, por genotipo

Genotipo Mediaa

1 75,0 AB2 74,0 AB3 71,5 B4 69,7 B5 73,6 B6 66,3 B7 84,8 A8 68,6 B9 73,5 B

Tab. 16: Porcentagem de sementesboas, por populacao de percevejos

Pop. percevejos Mediaa

0 95,7 A4 80,8 B8 70,0 C16 58,7 D

aMedias seguidas de letras iguais nao diferem entre si (Tukey, p<0,05)

ION Lopes & MCN Oliveira Interpretacao de dados 43 / 61

Page 44: Interpretação de dados - embrapa.br

Interpretacao de interacoesTab. 17: Anova GP/P

Pop. percevejo F Pr > F0 1,80 0,08142 1,40 0,20093 1,78 0,08634 2,21 0,0304

Tab. 18: Porcentagem de sementes boas denove genotipos dentro de diferentes pop.percevejos

GenotipoNº de percevejos

0 4 8 167 98,3 A 87,3 A 80,1 A 73,4 A2 97,7 A 81,6 A 69,9 AB 58,4 AB9 96,9 A 80,7 A 68,9 AB 56,5 AB5 95,6 A 79,3 A 68,3 AB 54,9 AB1 94,3 A 79,0 A 67,0 AB 53,6 AB3 94,3 A 78,2 A 66,8 AB 51,3 AB4 91,7 A 72,2 A 61,5 AB 51,0 B6 83,7 A 70,9 A 61,4 AB 50,4 B8 78,8 A 68,5 A 56,5 B 48,9 B

Embora a interacao tenha sido naosignificativa, considerando-se todosos nıveis de GP, o desdobramento dainteracao pode revelar interacao emnıveis especıficos. O desdobramentoGP/P mostrou que ha diferencassignificativas entre as medias de aomenos dois genotipos quando expostosa 16 percevejos/parcela.

n=5

σxG/P=5

qtab=4,46

DMSG/P=22,3

ION Lopes & MCN Oliveira Interpretacao de dados 44 / 61

Page 45: Interpretação de dados - embrapa.br

Interpretacao de interacoes

Fig. 9: Porcentagem de sementes boas de nove genoti-pos expostos a diferentes pop. percevejos

A resposta dos genotipos a popu-lacaoes crescentes de percevejo emais informativa se for exploradaa natureza quantitativa do fatorpercevejo.

Para o exemplo, a relacao SB×Pop.percevejos foi melhor descrita pelomodelo de regressao assintotico[10]. Tal modelo permitiu compararas respostas dos genotipos por meiodas taxas de variacao das curvas.Observe que a curva do genotipo7 apresentou a menor taxa, o quepode estar indicando uma maiortolerancia desse genotipo a maioresinfestacoes de percevejos.

ION Lopes & MCN Oliveira Interpretacao de dados 45 / 61

Page 46: Interpretação de dados - embrapa.br

Interpretacao de interacoes

Tab. 19: Anova experimentofatorial 21×2×3

FV GL F Pr > FA 20 164,8 <0,0001B 1 1,4 0,2452C 2 5,0 0,0073AB 20 3,6 <0,0001AC 40 7,4 <0,0001BC 2 0,9 0,4288ABC 40 3,2 <0,0001

Dados: CV Godoy

Visto que as interacoes AB, AC e ABCsao significativas, a interpretacao direta deum efeito simples pode nao ser valida napresenca dessas interacoes;

A falta de significancia da interacao BC,pode estar indicando que a significanciada interacao ABC pode ser explicada pelasignificancia das interacoes AB e AC;

Duas alternativas sao igualmente aceitaveis:▸ Desdobrar a interacao ABC - mais detalhada;▸ Desdobrar a interacao AB e AC;

ION Lopes & MCN Oliveira Interpretacao de dados 46 / 61

Page 47: Interpretação de dados - embrapa.br

Tab. 20: Comparacao de medias resultante da interacao AB.

A B1 2

16 a 123,9 A b 60,6 A14 a 96,9 A a 66,7 A7 a 67,1 AB b 35,7 ABC5 a 50,5 BC a 45,3 AB1 a 34,5 BCD a 22,7 BCDE3 a 26,8 BCD a 21,1 BCDE9 a 21,8 CDE a 16,3 CDEF17 b 19,1 DEF a 37,4 ABC10 a 17,7 DEFG a 30,0 ABCD21 b 16,2 DEFGH a 40,6 ABC11 a 14,1 DEFGH a 11,3 EFG4 a 9,6 EFGH a 11,7 DEFG15 a 7,3 FGHI a 7,7 FG2 a 6,9 GHI a 5,2 G12 a 6,6 HI a 4,9 G6 a 3,5 I b 1,5 H19 b 2,9 I a 6,7 FG20 a 0,6 J a 0,3 I8 a 0,3 JK a 0,2 I13 a 0,2 K a 0,3 I18 a 0,1 K a 0,2 I

Medias seguidas de mesma letra maiuscula na vertical ou por letra minuscula

na horizontal nao diferem entre si (Tukey, p ≤ 0, 05).

▷ σ2 foi estimado comdiferentes valores de n.Para:

● nıveis de Bdentro de um nıvel deA, n=2×4=8;

● nıveis de Adentro de um nıvel deB, n=21×4=84;

▷ Observe que dentrode B1:

● x16 − x7 = 56,8,nao e significante;

● x20 − x18 = 0,5, esignificante;

Por que?

ION Lopes & MCN Oliveira Interpretacao de dados 47 / 61

Page 48: Interpretação de dados - embrapa.br

Interpretacao de interacoes

Tab. 21: Anova conjunta de um experimento em parcelas subdivididas

Fatore de variacao σx GLFator GLDen Pr > FLocal (L) 60 1 18,3 <0,0001Bloco(L) - 6 18,3 0,9935Densidade (D) 84 3 18,3 0,2897LD 120 3 18,3 0,0392Genotipo (G) 106 7 165,8 <0,0001LG 151 7 165,8 <0,0001GD 219 21 165,7 0,0611LGD 320 21 165,7 <0,0001

Dados: GF Vilela & JSS Foloni

1 Graus de liberdade ajustados pela formula de Satterthwaite;

2 A parcela foi definida pela densidade e a subparcela pelogenotipo;

3 Os efeitos de todas as interacoes foram significativos.

ION Lopes & MCN Oliveira Interpretacao de dados 48 / 61

Page 49: Interpretação de dados - embrapa.br

Principal hipotese agronomica

A produtividade da cultura da soja depende da densidade de plantio, do genotipo escolhido edas caracterısticas do local de plantio.

Hipoteses estatısticas testadas para verificacao da hipotese agronomica

H0(1) ∶ µL1 = µL2 (Interpretada por meio das interacoes!)

H0(2) ∶ µD1 = µD2 = µD3 = µD4 (Interpretada por meio das interacoes!)

H0(3) ∶ µG1 = µG2 = ... = µG8 (Interpretada por meio das interacoes!)

H0(4) ∶ µLD11 = µLD12 = ... = µLD24 (Rejeitada!)Portanto: ao menos uma densidade de plantio alterou significativamente produtivi-dade media entre locais.H0(5) ∶ µLG11 = µLG12 = ... = µLG28 (Rejeitada!)Portanto: a produtividade de ao menos um genotipo foi significativamente diferentesentre locais.H0(6) ∶ µGD11 = µGD12 = ... = µGD84 (Rejeitada!)Portanto: a densidade de plantio alterou significativamente a produtividade media deao menos um genotipo.H0(7) ∶ µLGD111 = µLGD112 = ... = µLGD284; (Rejeitada!)Portanto: a produtividade de ao menos um genotipo, em ao menos uma densidade deplantio, foi significativamente diferentes entre locais.

Em quais nıveis desses fatores ocorreram as diferencas significativas?

ION Lopes & MCN Oliveira Interpretacao de dados 49 / 61

Page 50: Interpretação de dados - embrapa.br

A interpretacao de experimentos envolvendo mais de um fator e sempre mais simples quando seinicia o exame dos resultados a partir de um painel grafico.

Fig. 10: Produtividade media de oito genotipos de soja em diferentes densidades de semeadura,em dois locais. Letras indicam os resultados das comparacoes entre medias de densidades paracada genotipo, em cada local (Tukey, p ≤ 0,05)).

ION Lopes & MCN Oliveira Interpretacao de dados 50 / 61

Page 51: Interpretação de dados - embrapa.br

Principais padroes observados no painel

A caracterıstica de cada local foi o fator que mais influenciou a produtividade da sojano experimento;

A produtividade media no local L1 foi tipicamente superior ao local L2;

A resposta dos genotipos a densidade depende fortemente das caracterısticas do local;

Dentro de cada local, o fator que mais influenciou a produtividade foi o genotipo;

A densidade de semeadura foi um fator crıtico na produtividade de diferentes genoti-pos em cada local;

Se a densidade cresce de D1 a D4, pode-se dizer que as maiores densidades favore-ceram o aumento de produtividade dos genotipos G2 e G7 no local L1, no qual seobteve produtividades tipicamente maiores. Contrariamente, as maiores densidadesreduziram significativamente a produtividade desses genotipos no local L2, no qual seobteve produtividades tipicamente menores que em L1;

Nao e possıvel inferir que a densidade do plantio sempre aumentara ou reduzira aprodutividade. Essa estrategia pode ser eficiente para aumentar significativamentea produtividade da soja, porem em observancia as caracterısticas de cada local e decada genotipo.

ION Lopes & MCN Oliveira Interpretacao de dados 51 / 61

Page 52: Interpretação de dados - embrapa.br

Tab. 22: Produtividade media de oito genotipos de soja em quatro densidades de semeaduraem dois locais.

Local GenotipoDensidade Media

D1 D2 D3 D4 (D/G)

L1

1 AB 4558 ab B *4190 b AB 4979 abc A 5421 ab 4787 b2 B 2837 d AB *3573 bc A 4165 bcd A 4559 bc 3784 c3 A *3417 bcd A *3386 bc A *3846 bcd A 4329 bc 3744 c4 A *3680 abcd A *4158 b A 4304 bcd A 3598 cd 3935 c5 A *4212 abc A 4075 bc AB 3698 d B *2821 d *3701 c6 A *3218 cd A *2864 c A *3751 cd A *3529 cd *3341 c7 B 4591 ab A 6255 a A 6008 a A 5884 a 5684 a8 A 4845 a A 4324 b A 5094 ab A 4694 abc 4740 bMedia B 3920 b AB 4103 ab A 4481 a A 4354 a A 4214

L2

1 A 2881 b A *3587 a A 3713 a A 3228 ab 3352 ab2 A 4286 a B *2915 a B 2983 a B 2831 ab 3254 ab3 A *2663 b A *3162 a A *3147 a A 2737 b 2927 b4 A *3280 ab A *3434 a A 3038 a A *3545 ab 3324 ab5 AB *3602 ab AB 3106 a B 2633 a A 4093 a *3358 ab6 A *2975 ab A *2925 a A *3069 a A *3008 ab *2994 b7 A 3758 ab A 4064 a A 3674 a A 3367 ab 3716 a8 A 3233 ab A 3257 a A 3225 a A 3445 ab 3290 abMedia A 3335 a A 3306 a A 3185 a A 3282 a B 32771 A 3720 ab A 3889 b A 4346 ab A 4324 ab 4070 b2 A 3559 ab A 3244 bc A 3574 bcd A 3695 bc 3518 cd3 A 3041 b A 3274 bc A 3497 bcd A 3533 bc 3336 cd4 A 3480 ab A 3796 b A 3671 bcd A 3572 bc 3630 bc

Media 5 A 3907 ab A 3591 bc A 3165 d A 3457 bc 3530 cd(G/D) 6 A 3096 b A 2895 c A 3410 cd A 3269 c 3167 d

7 B 4174 a A 5159 a AB 4841 a AB 4630 a 4701 a8 A 4039 a A 3791 b A 4159 abc A 4070 abc 4015 bMedia A 3627 A 3705 A 3833 A 3819 3746

*Genotipos que diferiram significativamente entre locais. Letras maiusculas na horizontal indicam os resultados decomparacoes entre densidades para cada cultivar em cada local; letras minusculas na vertical indicam os resultados dascomparacoes entre cultivares em cada densidade, em cada local. Interpretacao semelhante se aplica as medias marginais.Letras iguais indicam medias que nao diferiram entre si (Tukey, p ≤ 0, 05).

ION Lopes & MCN Oliveira Interpretacao de dados 52 / 61

Page 53: Interpretação de dados - embrapa.br

Por ultimo, disculta os detalhes - do mais geral para o mais especıfico

Devido a forte interacao dos fatores densidade de plantio e genotipo com o local nesse

estudo, as discussoes de interacoes duplas podem ser de pouco valor pratico. No

entanto, pode-se dizer:▸ A produtividade media do genotipo G7 foi significativamente maior, na media

dos dois locais, em todas as densidade de plantio e na media das quatrodensidades;

▸ O manejo na densidade de plantio afetou significativamente a produtividadeapenas do genotipo G7, na medias dos dois locais;

▸ No local L1, considerando a media das densidades, os cultivares foram separa-dos em tres grupos de produtividade: G7 (a), G1 e G8 (b) e demais (c);

▸ No local L2, considerando a media das densidades, os genotipos G2 a G6 eG8, obtiveram as produtividades mais altas (a) embora tenham sido os menosprodutivos no local L1;

▸ ...

Em media, os genotipos G5 e G6 foram os mais sensıveis a variacao de local;

...

Nao basta relatar os resultados, uma vez que eles estao expostos na figura e na tabela, procure

interpretar agronomicamente os resultados obtidos; considere as caracterısticas dos solos, as

condicoes edafoclimaticas e todos os demais aspectos relevantes e possivelmente contrastantes

entre os dois locais.

ION Lopes & MCN Oliveira Interpretacao de dados 53 / 61

Page 54: Interpretação de dados - embrapa.br

1 Introducao

2 Fundamentos da Estatıstica Experimental

3 Interpretacao de dados

4 Consideracoes finais

Page 55: Interpretação de dados - embrapa.br

Consideracoes finais

A interpretacao agronomica deve ser fundamentada na interpretacaoestatıstica. No entanto, a relevancia agronomica de um estudo dependedas evidencias de reproducibilidade dos resultados obtidos, e das perspec-tivas que o conhecimento gerado oferece;

Um estudo nao visa apresentar uma conclusao definitiva para a hipotesecientıfica e sim acrescentar conhecimento ao problema sob investigacao;

Portanto, se o teste estatıstico indicou que nao ha evidencia quantitativade que os tratamentos possuem efeitos diferentes, dedique um tempopara entender se houve uma razao biologica para tal conclusao ou seocorreu a interferencia de outros fatores nao controlados no experimento;

Um planejamento experimental adequado, junto a um estatıstico, podereduzir problemas adversos, normalmente inerentes a caracterısticasespecıficas do problema agronomico em estudo.

ION Lopes & MCN Oliveira Interpretacao de dados 55 / 61

Page 56: Interpretação de dados - embrapa.br

“A ciencia avanca por corroboracao - quando pesquisadores verificam osresultados uns dos outros. A ciencia avanca mais rapido quando as pessoas

desperdicam menos tempo seguindo falsas direcoes”.

Challenges in irreproducible researchDesafios da pesquisa irreprodutıvel

https://www.nature.com/collections/prbfkwmwvz

ION Lopes & MCN Oliveira Interpretacao de dados 56 / 61

Page 57: Interpretação de dados - embrapa.br

Referencias I

[1] L. L. Bhering, C. D. Cruz, E. S. De Vasconcelos, A. Ferreira, and M. F. R. De Resende.Alternative methodology for Scott-Knott test.Crop Breeding and Applied Biotechnology, 8(1):9–16, 2008.

[2] L. C. Borges and D. F. Ferreira.Poder e taxas de erro tipo I dos testes scott-knott, tukey e student-newman-keuls sobdistribuicoes normal e nao normais dos resıduos.Revista de Matematica e Estatıstica (Online), 21(1):67–83, 2003.

[3] D. F. Ferreira., J. A. Muniz, and L. H. de Aquino.Comparacoes multiplas em experimentos com grande numero de tratamentos - utilizacaodo teste de scott-knott.Ciencia e Agrotecnologia, 23(3):745–752, 1999.

[4] J. C. Hsu.Multiple Comparisons: Theory and Methods.Chapman & Hall, London, UK, 1st edition, 1996.

[5] L. V. Madden, Knoke J. K., and R. Louie.Considerations for the use of multiple comparison procedures in phytopathological investi-gations.The american Phytopathological Society, 72(8):1015–1017, 1982.

ION Lopes & MCN Oliveira Interpretacao de dados 57 / 61

Page 58: Interpretação de dados - embrapa.br

Referencias II

[6] J. H. T. Robert G. D. Steel.Principles and Procedures of Statistics.McGraw-Hill Book Company, New York, Toronto, London, 1st edition, 1960.

[7] C. S. G. and S. M. R.A monte carlo study of five pairwise multiple comparison procedures.Agronomy Journal, 63:940–945, 1971.

[8] C. S. G. and S. M. R.An evaluation of ten pairwise multiple comparison procedures by monte carlo methods.American Statistical Association, 68:66–74, 1973.

[9] A. J. Scott and M. Knott.A cluster analysis method for grouping means in the analysis of variance.Biometrics, 30(3):507–512, 1974.

[10] W. . L. . Stevens.Asymptotic regression.7(3):247–267, 1951.

ION Lopes & MCN Oliveira Interpretacao de dados 58 / 61

Page 59: Interpretação de dados - embrapa.br

Obrigada!

[email protected]

Page 60: Interpretação de dados - embrapa.br
Page 61: Interpretação de dados - embrapa.br

Anexo: Precisao, sensibilidade e poder de um teste

Considerando que:

Aceitar H0: Positivo

Rejeitar H0: Negativo

VP: Verdadeiro Positivo

FP: Falso Positivo

FN: Falso Negativo

VN: Verdadeiro Negativo

voltar

ION Lopes & MCN Oliveira Interpretacao de dados 61 / 61