apostila_-_superfcie_de_resposta
-
Upload
jorge-alberto-cardoso -
Category
Documents
-
view
216 -
download
0
Transcript of apostila_-_superfcie_de_resposta
-
8/16/2019 apostila_-_superfcie_de_resposta
1/38
Univ
Discip
Introdução à M
rsidade Federal de Viçosa
Departamento de Estatística
ina: EST 631 – Métodos Estatísticos II
Apostila
etodologia de Superfícies de
Paulo
Anderson
Viçosa, MG
2011
Resposta
Roberto Cecon
odrigo da Silva
-
8/16/2019 apostila_-_superfcie_de_resposta
2/38
ii
Introdução à Metodologia de Superfícies de Resposta
-
8/16/2019 apostila_-_superfcie_de_resposta
3/38
iii
Sumário
1.
Introdução.................................................................................................................. 1
2.
Modelo de Primeira Ordem ....................................................................................... 4
3. Delineamentos Experimentais para Ajuste de Modelos de Primeira Ordem ............ 9
3.1. Fatorial Completo .............................................................................................. 9
3.2.
Delineamento Composto Central (DCC) ........................................................... 9
3.3. Delineamento Composto Central Rotacionado (DCCR) ................................. 10
3.4. Delineamento de Box-Behnken (DBB) ........................................................... 10
4. Teste de Significância do Modelo ........................................................................... 12
5. Medidas e Adequação de Modelos.......................................................................... 13
6.
Teste para Falta de Ajuste ....................................................................................... 14
7. Método da Inclinação Ascendente .......................................................................... 15
8. Exemplo de Aplicação para o Modelo de Primeira Ordem .................................... 15
9. Modelo de Segunda Ordem ..................................................................................... 21
10.
Localização do Ponto Estacionário ......................................................................... 28
11. Caracterizando a Superfície de Resposta ................................................................ 29
Referências ..................................................................................................................... 35
-
8/16/2019 apostila_-_superfcie_de_resposta
4/38
1
1. Introdução
No contexto da estatística experimental há constante interesse em caracterizar a
possível relação entre uma ou mais variáveis resposta e um conjunto de fatores de
interesse. Isso pode ser executado através da construção de um modelo que descreva a
variável resposta em função dos níveis aplicáveis desses fatores.
Certos tipos de problemas científicos envolvem a expressão de uma variável
resposta, tal como o rendimento de um produto, como uma função empírica de um ou
mais fatores quantitativos, tais como a temperatura de reação e a pressão. Isso pode ser
efetuado utilizando-se uma metodologia que permita modelar a relação: Rendimento em
função de temperatura de reação e pressão. O conhecimento da forma funcional de f,
frequentemente obtida com a modelagem de dados provenientes de experimentos
planejados, permite tanto sumarizar os resultados do experimento quanto predizer a
resposta para níveis dos fatores quantitativos. Assim, a função f define a superfície de
resposta, que em sua essência, consiste em estimar coeficientes da regressão polinomial
para a geração de um modelo empírico, por meio do qual é possível aproximar uma
relação (inicialmente desconhecida ou conhecida) entre os fatores e as respostas do
processo.
Podemos então definir a Superfície de Resposta como sendo a representação
geométrica obtida quando uma variável resposta é plotada como uma função de dois ou
mais fatores quantitativos. A função pode ser assim definida:
1 2 k
Y f (X ,X ,..., X )= + ε
Em que: Y é a resposta (variável dependente); 1 2 kX , X ,..., X são os fatores (variáveis
independentes); e ε é o erro aleatório.
Denota-se a resposta esperada por:
1 2 kE(Y) f (X , X , ,X )= = η…
então,
1 2 kf (X ,X , ,X )η = …
-
8/16/2019 apostila_-_superfcie_de_resposta
5/38
2
é chamada de superfície de resposta.
A metodologia de superfície de resposta, ou MSR, é uma coleção de técnicas
matemáticas e estatísticas que são úteis para modelagem e análise nas aplicações em
que a resposta de interesse seja influenciada por várias variáveis e o objetivo seja
otimizar essa resposta. Por exemplo, suponha que um engenheiro químico deseje
encontrar os níveis de temperatura (X1) e concentração da alimentação (X2) que
maximizem o rendimento (Y) de um processo. O rendimento de um processo é uma
função dos níveis de temperatura e concentração de alimentação, como
1 2Y f (x ,x )= + ε , em que ε representa o erro observado na resposta esperada
1 2
E(Y) f (x ,x )= = η , então a superfície representada por1 2
f (x ,x )η = é chamada de
superfície de resposta (Montgomery e Runger, 2008).
Segundo Montgomery (2001), as equações definidas de superfície de resposta
podem ser representadas graficamente e utilizadas de três formas:
• Descrever como as variáveis em teste afetam as respostas;
• Determinar as inter-relações entre as variáveis em teste; e
•
Para descrever efeitos combinados de todas as variáveis em teste sobre aresposta.
Algumas considerações devem ser feitas quando utilizamos superfície de
resposta, a saber:
a)
O uso efetivo da superfície de resposta deve considerar cinco pressupostos:
i. Os fatores que são críticos ao processo são conhecidos;
ii. A região em que os fatores influem o processo é conhecida;
iii. Os fatores variam continuamente ao longo da faixa experimental escolhida;
iv. Existe uma função matemática que relaciona os fatores à resposta medida;
v. A resposta que é definida por essa função é uma superfície lisa.
-
8/16/2019 apostila_-_superfcie_de_resposta
6/38
3
b) A técnica também apresenta algumas limitações que devem ser consideradas:
i. Grandes variações dos fatores podem resultar em conclusões falsas;
ii.
Os fatores críticos não foram especificados corretamente;
iii. A região de ótimo pode não ser determinada devido ao uso de uma faixa muito
estreita ou ampla;
iv. Como em qualquer experimento, resultados destorcidos podem ser obtidos se os
princípios clássicos da experimentação não forem seguidos (casualização,
repetição e controle local); e
v. Superestimar a computação: o pesquisador dever utilizar de bom senso e seu
conhecimento sobre o processo para chegar a conclusões apropriadas a seusdados.
A aplicação dessa metodologia foi realizada inicialmente na indústria química,
tendo sido seus fundamentos formalizados por Box e Draper (1987). No campo
agronômico, o uso concentrou-se no estudo do rendimento de cultivares, como efeito de
níveis de nutrientes aplicados ao solo, incluindo-se outros fatores, como: densidade de
plantio e lâminas de irrigação.A superfície de resposta é útil quando o pesquisador não conhece a relação exata
entre os fatores. Mas, geralmente quando a expressão analítica da função é conhecida, a
metodologia pode ser útil em alguns casos: freqüentemente podem-se encontrar funções
descontínuas, e em muitos casos se trabalha com valores discretos das variáveis de
projeto ou fatores, sendo assim o uso da metodologia de superfície de resposta apresenta
uma ampla aplicação na pesquisa, porque ela considera vários fatores em níveis
diferentes e as interações correspondentes entre esses fatores e níveis.Dentre as vantagens da metodologia de superfície de resposta, a principal é que
seus resultados são resistentes aos impactos de condições não ideais, como erros
aleatórios e pontos influentes, porque a metodologia é robusta. Outra vantagem é a
simplicidade analítica da superfície de resposta obtida, pois a metodologia gera
polinômios. Em geral, polinômios de duas ou mais variáveis, são funções contínuas.
-
8/16/2019 apostila_-_superfcie_de_resposta
7/38
4
Após o ajuste do modelo aos dados, é possível estimar a sensibilidade da
resposta aos fatores, além de determinar os níveis dos fatores nos quais a resposta é
ótima (por exemplo, máxima ou mínima).
2. Modelo de Primeira Ordem
Na maioria dos problemas em superfície de resposta, a forma do relacionamento
entre as variáveis dependentes e independentes é desconhecida. Assim, o primeiro passo
é encontrar uma aproximação para o verdadeiro relacionamento entre a variável
resposta (y) e as variáveis independentes (fatores). Geralmente utiliza-se de uma
regressão polinomial de baixo grau em alguma região das variáveis independentes. A
forma geral para o modelo de primeira ordem (ou modelo de grau um) em k variáveis de
entrada (independentes) pode ser representado por:
k
0 i ii 1
Y X=
= β + β + ε∑
Onde Y é uma variável resposta observada, 0 1 k, , ...,β β β são parâmetros desconhecidos,
e ε é o termo do erro aleatório. Se ε tem média zero, então a porção não aleatória do
modelo geral de primeira ordem representa a verdadeira resposta média, η , que é,
k
0 i ii 1
E(Y) X=
η = = β + β∑
e ε é tido como erro experimental. Se, entretanto, o modelo descrito é inadequado para
representar a verdadeira resposta média, então ε contém, adicionalmente ao erro
experimental, um erro não aleatório (sistemático). Este último erro é atribuído a omissão
de termos em 1 2 kX , X ,..., X de grau superior a um que podem ser entendidas como
outras variáveis as quais tem alguma influência sobre a variável resposta. Este erro
adicional (excluindo o erro experimental) é chamado falta de ajuste.
Escrevendo o modelo em notação matricial, considerando N observações, temos:
= +Y Xβ ε
-
8/16/2019 apostila_-_superfcie_de_resposta
8/38
5
Em que Y é um vetor de N (N ≥ k+1) observações, [ ]0 1 k` ...= β β ββ é um vetor (k+1)
x 1 de parâmetros desconhecidos, [ ]1 2 N` ...= ε ε εε é um vetor N x 1 de erros, e X é
uma matriz N x (k+1) de coeficientes dos parâmetros que compreende os níveis dasvariáveis independentes. Assume-se que os erros aleatórios são 2NID(0, )σ , isto é,
independentemente distribuídos com distribuição Normal de média zero e variância
comum. Quando a matriz X é de posto coluna completo, então o estimador de mínimos
quadrados ordinários de β pode ser obtido por:
1ˆ ( )−=β X`X X`Y
E a matriz de variâncias e covariâncias de β̂ é dada por:
1 2ˆV( ) ( )−= σβ X`X
Na maioria dos casos, os cálculos para estimação dos parâmetros podem ser
simplificados codificando os níveis das k variáveis independentes iX por meio de:
iu iiu
i
2(X X )x i 1,2,...,k e u 1,2,...,N
R−
= = =
Em queN
i iuu 1X X / N== ∑ eiR é a diferença entre o maior e o menor valor dos níveis.
A codificação apresenta a característica:
N
iuu 1
x 0 i 1,2,...,k=
= =∑
Exemplo: Os dados a seguir referem-se ao peso de alimentos ingeridos em experimento
com alimentação de ratos em relação a duração do tempo entre inoculação de dosagens
de uma droga e a alimentação (horas).
-
8/16/2019 apostila_-_superfcie_de_resposta
9/38
6
Droga (X1)Dosagem (mg kg-1)
Tempo (X2) Peso observado
0,3 1 5,630,3 1 6,420,7 1 1,380,7 1 1,940,3 5 11,570,3 5 12,160,7 5 5,720,7 5 4,690,3 9 12,680,3 9 13,310,7 9 8,28
0,7 9 7,73
Utilizando variáveis codificadas, tem-se:
( ) ( )1u 1 1u 1u1u
1
2 X X 2 X 0,5 X 0,5x
R 0,7 0,3 0,2
− − −= = =
−
( ) ( )2u 2 2u 2u2u
2
2 X X 2 X 5 X 5x
R 9 1 4
− − −= = =
−
Então, o modelo de primeira ordem para u 0 1 1u 2 2u uY X X= β + β + β + ε , em notação
matricial = +Y Xβ ε , utilizando as variáveis codificadas é
0
1
23 1
12 1 12 3
5,63 1 1 1
6,42 1 1 1
1,38 1 1 1
1,94 1 1 111,57 1 1 0
12,16 1 1 0
5,72 1 1 0
4,64 1 1 0
12,68 1 1 1
13,31 1 1 1
8,28 1 1 1
7,73 1 1 1
− − − − −
− −
β − = β +
β − −
11
12
21
22
31
32
41
42
51
52
61
6212 1
ε ε ε
ε ε
ε ε ε
ε ε
ε
ε
-
8/16/2019 apostila_-_superfcie_de_resposta
10/38
-
8/16/2019 apostila_-_superfcie_de_resposta
11/38
8
Quadro da análise de variância:
FV GL SQ QM F
Regressão 2 174,1380 87,0690 84,28**
Resíduo 9 9,2980 1,0331
Total 11 183,4360
9493,04360,183
1380,174R 2 ==
Teste para cada um dos parâmetros:
0β:H
0β:H
11
10
≠
=
**10,9
)0331,1(12
1
0-2,67333-t −==
0β:H
0β:H
21
20
≠
=
**26,9
)331(1,08
1
032875,3t =
−=
**significativo pelo teste t a 5% de probabilidade.
-
8/16/2019 apostila_-_superfcie_de_resposta
12/38
3.
DelineamenModelos de
3.1.
Fatorial Comple
Caracteriza-se pel
escolhidos pelo pesquisad
de ensaios. Deste modo, u
combinações distintas, se p
Exemplo 1: Em um ensaio
5, 7) e pH (5, 6, 7) tent
fatorial 33, onde k=3 fator
representação gráfica:
3.2.
Delineamento Co
Caracteriza-se pela
central. Sua vantagem é
restringe-se ao ajuste de m
Tomando-se como
ficaria: 23+1 = 9, uma redu
9
tos Experimentais paraPrimeira Ordem
o
Combinação de todos os níveis de t
r apresentando como desvantagem um núm
m fatorial completo com p(níveis) e k(fato
= k.
onde se deseja contrastar temperatura (30, 3
ndo otimizar uma determinada reação quí
s e p=3 níveis. Ao todo serão 27 tratame
mposto Central (DCC)
Combinação de um fatorial 2K (k fatore
a de reduzir o número de ensaios, todavi
delos de primeira ordem.
ilustração o exemplo da seção 3.1, o númer
ão de 18 ensaios em relação ao fatorial com
juste de
dos os fatores
ro muito grande
es) apresenta pk
5, 40), tempo (3,
ica, temos um
tos, conforme a
) mais o ponto
a sua utilização
de tratamentos
pleto.
-
8/16/2019 apostila_-_superfcie_de_resposta
13/38
10
3.3.
Delineamento Composto Central Rotacionado (DCCR)
É utilizado para experimentos onde k(fatores) 2≥ . Este delineamento contém
pontos da parte cúbica codificados para ( ± 1), pontos axiais codificados para ( ± α ,
onde α = (2k)1/4) para testar o modelo de segunda ordem e o ponto central codificado
para (0) que geralmente possui repetições. Assim, número de tratamentos passaria a ser:
fatorial 2k + ponto central + 2k pontos axiais. Para o exemplo da seção 3.1., 23+1+2*3=
15 tratamentos.
3.4. Delineamento de Box-Behnken (DBB)
É utilizado para experimentos com k ≥ 3. Tendo como principal vantagem a
redução do número de ensaios para estudar um maior número de fatores. De modo geral
os níveis dos fatores são escolhidos à partir das informações de seus limites inferiores e
superiores.
O número de tratamentos dá-se pela combinação dos níveis da parte cúbica +
ponto central.
A título de ilustração, seguem abaixo outros exemplos:
Exemplo 2. Um experimento com dois fatores de interesse (A e B), possuindo p = 4
níveis para ambos os fatores.
-
8/16/2019 apostila_-_superfcie_de_resposta
14/38
Exemplo 3.
Exemplo 4. Um planejame
11
nto experimental com 3 fatores e 4 níveis ca a.
-
8/16/2019 apostila_-_superfcie_de_resposta
15/38
12
4.
Teste de Significância do Modelo
Este teste é realizado como um procedimento de ANOVA. Calculando-se a
razão entre a média quadrática dos termos de regressão e a média quadrática do erro,
encontra-se a estatística F, que comparada com o valor crítico de F para um dado nível
de significância, permite avaliar a significância do modelo. Se F for maior que F crítico
então o modelo é adequado (Montgomery, 2001).
Considerando o sistema de equações normais (SEN), dado por:
ˆ =X`Xβ X`Y
pode-se obter as somas de quadrados relativas a cada fonte de variação da ANOVA:
N2
Total j j 1
SQ C Y C=
= − = −∑Y`Y
ResíduoˆSQ = −Y`Y β`X`Y
Re gˆSQ C= −β`X`Y
em que C é o termo de correção, dado por:
2N
j j 1
Y
CN
=
=∑
O teste para a significância da regressão determina se existe uma relação linear
entre a variável de resposta y um subconjunto de regressores. As hipóteses apropriadas
neste caso são:
0 1 2 k
1
H : ...H : pelo menos um dos difere de zero
β = β = = ββ
O teste individual de significância de cada coeficiente pode conduzir a
otimização do modelo através da eliminação ou adição de termos. As hipóteses
utilizadas para testar qualquer um dos coeficientes de regressão são:
0 i
1 i
H : 0
H : 0
β =
β ≠
-
8/16/2019 apostila_-_superfcie_de_resposta
16/38
13
O teste utilizado para realizar esse teste é:
ï ï
2iii
ˆ ˆt
ˆˆ ˆcV( )
β β= =
σβ
Em que cii é o elemento da diagonal da matriz (X’X)-1 correspondente ao coeficiente em
teste. A estatística segue distribuição t com o número de graus de liberdade do resíduo.
Se o valor p do teste individual para os termos for inferior ao nível de
significância, então o termo é adequado ao modelo e deve, portanto, ser mantido. Ao
contrário, o termo deve ser excluído se tal procedimento conduzir a um aumento do
coeficiente de determinação R² conjuntamente com a diminuição do efeito residual e o
valor p referente à falta de ajuste do modelo for superior ao nível de significância. Além
disso, a retirada de qualquer termo deve obedecer ao princípio da hierarquia. Este
princípio, segundo Montgomery (2001), postula que quando um termo de ordem alta for
mantido no modelo, o de ordem baixa que o compõe também deve ser mantido.
5.
Medidas e Adequação de Modelos
A medida de adequação mais comumente usada é o coeficiente de determinação
R², definido por:
2 2SQRegressão SQResíduoR 1 [0 R 1]SQTotal SQTotal
= = − ≤ ≤
e representa a proporção da variação total que é devida (explicada) pelo modelo
regressão.
Associado ao R² está o coeficiente de determinação ajustado 2R , que considera
o fato de que R² tende a superestimar a quantidade atual de variação contabilizada para
a população. Também é fato que a inclusão de muitos parâmetros no modelo de
regressão aumenta substancialmente o valor de R². Se o modelo recebeu parâmetros
desnecessários haverá um incremento em R² sem haver, necessariamente, melhoria de
precisão da resposta. Por isso o R² ajustado é mais indicado para comparar modelos com
números diferentes de parâmetros e, ainda, ajustados com número de observações
diferentes. O coeficiente de determinação ajustado para graus de liberdade e número de
parâmetros (p) é definido por:
-
8/16/2019 apostila_-_superfcie_de_resposta
17/38
14
22 R (n 1) pR
n p 1− −
=− −
Nota: O R2 ajustado é sempre menor que o R2 e só será igual quando R2 = 1.
6. Teste para Falta de Ajuste
A adição de pontos centrais aos arranjos experimentais proporciona a obtenção
de uma estimativa do erro experimental. De acordo com Montgomery (2001), esteartifício permite que a soma de quadrados residual (SQRes) seja discriminada em dois
componentes: (i) a soma de quadrados devida ao erro puro (SQEP) e; (ii) a soma de
quadrados devido à falta de ajuste do modelo adotado (SQF.Aj). Assim, pode-se escrever:
Re s EP F.Aj.SQ SQ SQ= +
Admitindo-se que existam ni observações de uma dada resposta Y de interesse
no i-ésimo nível dos regressores ix (i 1,2,..., k)= . Considere que ijY denote a j-ésima
observação da resposta no nível ix , com i j 1,2,...,n= ek
ii 1
n N=
=∑ , o total de
observações. Então, o ij-ésimo resíduo será:
ij ij ij i i ïˆ ˆY Y (Y Y ) (Y Y )− = − + −
Onde iY é a média da resposta para o nível ix . Elevando-se ao quadrado ambos os
lados e somando em relação a i e j, obtém-se:
i i
F.Aj.Res EP
n nk k k2 2 2
ij i ij i i i ii 1 j 1 i 1 j 1 i 1
SQSQ SQ
ˆ ˆ(Y Y ) (Y Y ) n (Y Y )= = = = =
− = − + −∑∑ ∑∑ ∑
-
8/16/2019 apostila_-_superfcie_de_resposta
18/38
15
7.
Método da Inclinação Ascendente
O objetivo é auxiliar o pesquisador, de forma rápida e eficiente, a encontrar a
região de ótimo, isto é, determinar a melhor região de estudo. Encontrada a região de
ótimo, um modelo mais elaborado, por exemplo, um modelo de segunda ordem, pode
ser empregado, e uma análise pode ser feita para localizar o ponto de máximo ou de
mínimo (ponto ótimo).
Utiliza-se um conjunto de tratamentos em torno do ponto inicial e estimam-se
por Mínimos Quadrados as inclinações iβ . A partir das magnitudes e sinais destas
inclinações, calcula-se a direção do método da inclinação ascendente (MIA). Assim:
• Experimentos são conduzidos ao longo do caminho da MIA até que nenhum
incremento na resposta seja observado.
• Eventualmente, chega-se a vizinhança do valor ótimo e isto será indicado pela
falta de ajuste do modelo de 1ª ordem.
• A aproximação por um plano se torna insatisfatória pelo fato dos efeitos de
ordens mais elevadas, particularmente os de 2ª ordem (quadrático e de interação
linear), se tornarem relativamente mais importantes. Nesse caso usa-se o Modelo
Quadrático.
8.
Exemplo de Aplicação para o Modelo de
Primeira OrdemConsideremos o seguinte exemplo: um experimento em esquema fatorial 2x2,
tempo e temperatura, com dois níveis cada, ou seja, um fatorial 22 para que os níveis
desses fatores maximizem a produção de um determinado processo. A região
experimental será (30, 40) min para o tempo de reação e (150, 160)°F para temperatura.
Normalmente, opera-se com um tempo de 35 minutos e temperatura de 155 ºF, que
resulta numa produção de 40% aproximadamente.
-
8/16/2019 apostila_-_superfcie_de_resposta
19/38
16
Como esta região provavelmente não contém o ótimo, um modelo de primeira
ordem será ajustado e aplicado o Método da Máxima Inclinação Ascendente. As
variáveis independentes serão codificadas para (-1, 1) para simplificar os cálculos.
Serão incluídos também cinco pontos centrais entre os valores máximos e mínimos do
tempo e temperatura. As repetições no ponto central são utilizadas para estimar o erro
experimental e para checar o ajuste do modelo de primeira ordem. Os pontos centrais do
delineamento são os correspondentes às condições de operação atual (35 min e 155 ºF).
Codificação:
Tabela 1. Variáveis originais e codificadas de um experimento fatorial 2x2 (tempo e
temperatura).
Variáveis originais Variáveis codificadas Resposta
1X 2X 1x 2x Y
30 150 -1 -1 39,330 160 -1 1 40,0
40 150 1 -1 40,940 160 1 1 41,535 155 0 0 40,335 155 0 0 40,535 155 0 0 40,735 155 0 0 40,235 155 0 0 40,6
Para realização do diagnóstico correto em relação ao modelo de primeira ordem
deveremos obter uma estimativa do erro experimental, verificar se a interação deve ser
incluída no modelo e finalmente verificar se os termos quadráticos devem ser
adicionados no modelo.
1 2
1 2
X 35 X 155x x
5 5
− −= =
-
8/16/2019 apostila_-_superfcie_de_resposta
20/38
17
Tabela 2. Análise de variância do modelo de primeira ordem.
FV GL SQ QM F Valor pRegressão 2 2,8250 1,4125 47,8010 0,0002
Desvios 6 0,1773 0,0295Total 8 3,0023R² = 0,9409 R² Ajustado = 0,9212
Tabela 3. Estimativas dos parâmetros do modelo de regressão de primeira ordem.
Efeitos Estimativas Desvio t Valor pConstante 40,4444
Tempo ( 1x ) 0,7750 0,0859 9,0169 0,0002Temperatura ( 2x ) 0,3249 0,0859 3,7811 0,0093
Equação ajustada:
39.0
39.5
40.0
40.5
41.0
41.5
42.0
-1.0
-0.50.0
0.51.0
-1.0-0.5
0.00.5
Y
x 1
x 2
Figura 1. Superfície de Resposta do modelo de 1º Ordem.
Cálculo do erro experimental
A soma de quadrado do erro é obtida de forma tradicional, com 4 graus de
liberdade.
1 2ŷ 40,440 0,775x 0,325x= + +
-
8/16/2019 apostila_-_superfcie_de_resposta
21/38
18
2 (40,3² 40,5² 40,7² 40, 2² 40,6²) (202,3)² 5ˆ 0,04305 1
+ + + + −σ = =
−
A interação entre os fatores pode ser obtida adicionando o termo x1x2 e é medidapelo coeficiente β12. A estimativa é obtida (considerando as variáveis codificadas) por:
12 1 1 1 2 2 3 2 4o
1ˆ (x y x y x y x y )n trat
β = + + +
Extremos MeioInt o
Y YSQ
n trat
−= ∑ ∑
Para o exemplo em questão, temos:
Outra verificação da adequabilidade do modelo é obtida pela comparação da
resposta média dos quatro pontos do fatorial (40,425), com a resposta média do centro
do delineamento (40,46).
Se β11 e β22 são os coeficientes dos termos quadráticos
2
1χ e
2
2χ , então a diferençadas médias é uma estimativa de β11 + β22.
Assim, não existe nenhuma razão para questionar o modelo de primeira ordem.
Os próximos passos da (MIA) devem seguir.
Para andar (mover-se) do centro do delineamento (x1=0 e x2=0) no caminho da
inclinação ascendente, deveríamos mover 0,775 unidades na direção x1 para cada 0,325
( )121ˆ 1*39,3 ( 1* 40) ( 1* 40,9) 1* 41,55 0,0254
β = + − + − + = −
2
Int
[(39,3 41,5) (40 40,5)]SQ 0,0025
4+ − +
= =
Int
Erro
SQ 0,0025F 0,058
QM 0,043= = =
11 12 1 2ˆ ˆ y y 40,425 40,46 0,035β + β = − = − = −
-
8/16/2019 apostila_-_superfcie_de_resposta
22/38
19
unidades na direção de x2. Assim, a direção da inclinação ascendente passa pelo ponto
central (x1=0 e x2=0) e tem inclinação 0,325/0,775=0,42.
O engenheiro decide usar um tempo de reação de 5 minutos como tamanho do
passo inicial. Usando a relação entre 1X e x1, vimos que 5 minutos no tempo de reação
corresponde a um intervalo (passo), na variável codificada x1, de ∆x1=1. Os passos no
caminho da inclinação ascendente são:
∆x1=1
∆x2=(0,325/0,775) ∆x1=0,42
Os pontos experimentais são obtidos e a produção para estes pontos observados
até que se perceba um decréscimo na produção. Os resultados são mostrados na tabela a
seguir:
Tabela 4. Método da Inclinação Ascendente para o exemplo da tabela 1.
PassosVariáveis codificadas Variáveis originais
Resposta Yx1 x2 1X 2X
Origem 0 0 35 155
∆ 1,00 0,42 5 2 Não faz
Origem + ∆ 1,00 0,42 40 157 41,0Origem + 2∆ 2,00 0,84 45 159 42,9
Origem +3∆ 3,00 1,26 50 161 47,1
Origem +4∆ 4,00 1,68 55 163 49,7
Origem +5∆ 5,00 2,10 60 165 53,8
Origem +6∆ 6,00 2,52 65 167 59,9
Origem + 7∆ 7,00 2,94 70 169 65,0
Origem + 8∆ 8,00 3,36 75 171 70,4
Origem + 9∆ 9,00 3,78 80 173 77,6
Origem + 10∆ 10,00 4,20 85 175 80,3Origem + 11∆ 11,00 4,62 90 179 76,2
Origem + 12∆ 12,00 5,04 95 181 75,1
Incrementos na resposta são observados até o 10° passo; depois há um
decréscimo na produção.
Portanto, outro modelo de primeira ordem pode ser ajustado em torno do ponto
(85,175). A região de exploração para tempo seria (80,90) e de temperatura (170,180).
-
8/16/2019 apostila_-_superfcie_de_resposta
23/38
20
Assim repete-se todo o processo e os resultados são analisados a seguir:
A região de 1X é [80, 90] e para 2X é [170, 180]. O delineamento experimental
e os resultados são apresentados na tabela a seguir. Novamente usou-se um fatorial 2 2
completo com cinco pontos centrais.
Tabela 5. Dados para o segundo ajuste do modelo de primeira ordem.
Variáveis codificadas Variáveis originaisResposta Y
x1 x2 1X 2X
-1 -1 80 170 76,5
-1 1 80 180 77,01 -1 90 170 78,01 1 90 180 79,50 0 85 175 79,90 0 85 175 80,30 0 85 175 80,00 0 85 175 79,70 0 85 175 79,8
1 21 2X 85 X 175x e x5 5
− −= =
Modelo de 1ª ordem ajustado aos dados codificados é dado por:
1 2Ŷ 78,97 1,00X 0,50X= + +
Tabela 6. Analise da variância para o segundo modelo de primeira ordem.FV GL SQ QM F
Regressão 2 5,0000 2,5000 47,17*Resíduo 6 11,1200Interação 1 0,2500 0,2500 4,72
Quad. Puro 1 10,6580 10,62580 201,09*Erro puro 4 0,2120 0,0530
Total 8 16,1200
-
8/16/2019 apostila_-_superfcie_de_resposta
24/38
21
Pela tabela de ANOVA, o componente do termo quadrático puro foi
significativo, isso implica que o modelo de 1ª Ordem não é uma aproximação adequada.
A curvatura na real superfície pode indicar que se está próximo do ótimo; assim,
análises adicionais devem ser feitas para localizar o ótimo com mais precisão. Nesse
ponto, uma análise adicional deve ser feita para localizar o ótimo com mais precisão.
9.
Modelo de Segunda Ordem
Na falta de conhecimento suficiente acerca da forma da verdadeira superfície de
resposta, geralmente o experimentador tenta a aproximação pelo modelo de primeira
ordem. Quando, entretanto, o modelo de primeira ordem apresenta falta de ajuste para a
superfície, incorpora-se termos de ordem superior.
Quando o experimentador está relativamente próximo do “ótimo”, um modelo
que incorpora a curvatura é usualmente requerido para aproximar a resposta. Na maioria
dos casos o modelo de segunda ordem
k k k 1 k2
0 i i ii i ij i ji 1 i 1 i 1 j 2
i j
Y X X X X−
= = = =<
= β + β + β + β + ε∑ ∑ ∑∑
Em que 1 2 kX ,X ,...,X são as variáveis independentes que tem influência na resposta Y;
0 i ij, (i 1,2,..., k), ( j 1, 2,..., k)β β = β = são parâmetros desconhecidos, e ε é um erro
aleatório.
Utilizando variáveis codificadas, ix ,obtidas por:
i
iu iiu
X
u 1,2,....,NX Xx
i 1, 2,..., ks
=−=
=
Em que iuX é o u-ésimo nível da i-ésima variável independente,N
i iuu 1X X / N
== ∑ é a
média dos valores iuX , i1/ 2N 2
X iu iu 1s (X X ) / N
= = − ∑ é o desvio padrão, e N é o
número de observações. Sem perda de generalidade podemos considerar os valores de
iX sendo substituídos pelos correspondentes valores de ix (i 1,2,...,k)= . Os valores da
-
8/16/2019 apostila_-_superfcie_de_resposta
25/38
22
variável resposta obtidos com as variáveis codificadas podem, então, ser representados
como
k k k 1 k2
u 0 i iu ii iu ij iu ju ui 1 i 1 i 1 j 2
i j
Y x x x x
−
= = = =<
= β + β + β + β + ε∑ ∑ ∑∑
Em que uε é o erro experimental em uY . Assume-se que os valores de uε sejam
independentemente distribuídos como variáveis aleatórias com média zero e variância
2σ .
O modelo pode ser escrito na forma de matriz da seguinte forma:
= +Y Xβ ε
Em que [ ]1 2 NY Y Y=Y` … , X é uma matriz N x p de coeficientes dos parâmetros que
compreende os níveis das variáveis independentes; p (k 1)(k 2) / 2= + + ; β é um vetor
p x 1 de parâmetros desconhecidos e [ ]1 2 N` ...= ε ε εε . O estimador de mínimos
quadrados para β no modelo é dado por:
1ˆ ( )−=β X`X X`Y
A matriz de variâncias e covariâncias de β̂ é
1 2ˆV( ) ( )−= σβ X`X
10.
Exemplo de Aplicação para o Modelo deSegunda Ordem
Considere um esquema fatorial 3 x 3, com 3 níveis de N (0, 50 e 100) e 3 níveis
de P (20, 40 e 60), de acordo com o modelo de segunda ordem:
i2i1i522i4
21i32i21i10i eXXβXβXβXβXββY ++++++=
O experimento dói instalado no delineamento em blocos casualizados com 3 repetições
e os dados obtidos encontram-se na tabela a seguir:
-
8/16/2019 apostila_-_superfcie_de_resposta
26/38
23
Trat. N P Bloco i1x i2x 12i1 xx − 2
2i2 xx − i2i1 xx Y
1 0 20 1 -1 -1 1/3 1/3 1 471 0 20 2 -1 -1 1/3 1/3 1 40
1 0 20 3 -1 -1 1/3 1/3 1 442 0 40 1 -1 0 1/3 -2/3 0 602 0 40 2 -1 0 1/3 -2/3 0 622 0 40 3 -1 0 1/3 -2/3 0 663 0 60 1 -1 1 1/3 1/3 -1 383 0 60 2 -1 1 1/3 1/3 -1 403 0 60 3 -1 1 1/3 1/3 -1 364 50 20 1 0 -1 -2/3 1/3 0 424 50 20 2 0 -1 -2/3 1/3 0 44
4 50 20 3 0 -1 -2/3 1/3 0 465 50 40 1 0 0 -2/3 -2/3 0 705 50 40 2 0 0 -2/3 -2/3 0 695 50 40 3 0 0 -2/3 -2/3 0 646 50 60 1 0 1 -2/3 1/3 0 456 50 60 2 0 1 -2/3 1/3 0 446 50 60 3 0 1 -2/3 1/3 0 467 100 20 1 1 -1 1/3 1/3 -1 457 100 20 2 1 -1 1/3 1/3 -1 46
7 100 20 3 1 -1 1/3 1/3 -1 448 100 40 1 1 0 1/3 -2/3 0 808 100 40 2 1 0 1/3 -2/3 0 708 100 40 3 1 0 1/3 -2/3 0 659 100 60 1 1 1 1/3 1/3 1 359 100 60 2 1 1 1/3 1/3 1 369 100 60 3 1 1 1/3 1/3 1 39
( 0 100 )1i 2 1i
1i 1i(100 0 )2
X X 50
x x { 1,0,1}50
+
−
− −
= = ∴ −
( 20 60)2i 2 1i
2i 2i( 60 20 )2
X X 40x x { 1,0,1}
20
+
−
− −= = ∴ −
2i
2 i2i i
2 2 22 2i i
xP x
n( 1) (0) (1) 2
x X3 3
= −
− + += − = −
∑
-
8/16/2019 apostila_-_superfcie_de_resposta
27/38
24
1
2x
3=
6 6
27 0 0 0 0 0
0 18 0 0 0 00 0 18 0 0 0
0 0 0 6 0 0
0 0 0 0 6 0
0 0 0 0 0 12
=
X`X
6 1
1363
2739
`4 7 / 3
455/3
8
−
= −
−
−
X Y
6 1
1363 / 27
27/1839/18ˆ47/18
455/18
8/12
−
= −
−
−
β
2 22 2i 0 1 1i 2 2i 3 1i 3 4 2i 3 5 1i 2i iY β β x β x β (x ) β (x ) β x x e= + + + − + − + +
2
1i 2i 1ii
2
2i 1i 2i
X 50 X 40 X 501363 27 39 47 2Ŷ27 18 50 18 20 18 50 3
X 40 X 50 X 40455 2 818 20 3 12 50 20
− − − = + − − −
− − − − − −
21i 2i 1i 1i
i
22i 2i 1i 2i 2i 2i
27X 39X X 2X1363 27 78 47 2Ŷ 1
27 18 18 900 360 18 2500 50 3
X 4X X X 2X X455 2 8
4 218 400 20 3 12 1000 50 20
= − + + − − − + +
− − + − − − − +
1ii
2 21i 1i 2i 2i 2i 1i 2i 1i 2i
27X1363 27 78 47 94 1820 910 36Ŷ
27 18 18 18 54 18 54 12 90094X 16X 39X 1820X 8X 47X 455X 8X X
900 600 360 360 240 45000 7200 12000
= − + − + − + − + +
+ − + + − − −
2i 1i 2i 1i
22i 1i 2i
Ŷ 34,8148 0,161111X 4,98055X 0,0010444X
0,0631944X 0,0006666X X
= − + + −
− −
-
8/16/2019 apostila_-_superfcie_de_resposta
28/38
25
2
ˆSQ Reg C
1363
27
391363 27 39 47 455 8 (1363)4 7 / 327 18 18 18 18 12 27
455/3
8
72811,2963 68806,2593
4005,0370
= −
−
= − − − − − − −
−
= −
=
βX`Y
SQTotal 73179 68806,2593 4372,7407= − =
Quadro da ANOVA
FV GL SQ QM F
Blocos 2 9,8518 --
(Tratamentos) (8) (4163,407) --
Regressão 5 4005,037 801,0074 64,24**
Falta de ajuste 3 158,370 52,7900 4,23*
Resíduo puro 16 199,4815 12,4675
Total 26 4372,7403
5% 1%F (3,16) 3, 24 F (3,16) 5, 29= =
2
2
SQ Re g 4005, 037R 0,9159
SQTotal 4372,7403
SQ Reg 4005,037R 0,9619
SQTrat. 4163,407
= = =
= = =
Teste para as hipóteses:
0 1
1 1
H : 0
H : 0
β =
β ≠
1% 5% 10%t (16) 2,92 t (16) 2,12 t (16) 1,75= = =
2718
118
0t 1,8023
(12,4675)
−= =
-
8/16/2019 apostila_-_superfcie_de_resposta
29/38
26
Utilizando :QMRes 18,8342
GL Res 19
=
=
2718
118
0t 1,4664(18,8342)
−= =
1% 5% 10%t (19) 2,86 t (19) 2,09 t (16) 1,73= = =
0− λ =B I
1 2
1
2 1
2
Y0,161111 0,0020888X 0,0006666X 0
XY
4, 98055 0,126388X 0, 0006666X 0X
∂= − − =
∂∂
= − − =∂
1 2
21
22
2 2
2
2
0,0020888X 0,0006666X 0,161111
0,161111 0,0006666XX
0,0020888
0,161111 0,0006666X4,98055 0,126388X 0,0006666 0
0,0020888
4,98055 0,126388X 0,0514154 0,000212732X 0
0,126175X 4,9291346
X 3
− = −
−=
− − − =
− − + =
− = −
= 9,06
1
0,161111 0,0006666(39,06)X 64,66
0,0020888−
= =
Ponto crítico ( 1 2X 64,66;X 39,06= = ).Matriz da segunda derivada:
2 2
2 21 2
2
1 2
Y Y0,0020888 0,126388
X X
Y0,0006666
X X
∂ ∂= − = −
∂ ∂
∂= −
∂ ∂
-
8/16/2019 apostila_-_superfcie_de_resposta
30/38
27
Estudo da natureza da superfície de resposta: este pode ser realizado considerando oponto estacionário e os sinais e magnitudes dos iλ .
0− λ =B I 22 1
221 1 2
2 212
21 2 2
YYX X X 1 0
0 1Y YX X X
∂∂ ∂ ∂ ∂ = = ∂ ∂
∂ ∂ ∂
B I
Suponha que o ponto estacionário esteja dentro da região de estudo na qual foi ajustadoo modelo de segunda ordem.
Conclusão:
i) Se todos os valores de iλ são positivos, então sX é um ponto de respostamínima.
ii) Se todos os valores de iλ são negativos, então sX é um ponto de respostamáxima.
iii) Se os valores de iλ tem sinais positivos e negativos, então sX é um pontode sela.
0,0020888 0,0003333
0,0003333 0,126388
− = −
B , então:
0,0020888 0,0003333 00
0,0003333 0,126388 0
− λ − λ = − = − λ
B I
0, 0020888 0, 0003333
00,0003333 0,126388
− − λ
=− − λ
2
2
1 2
( 0,0020888 )( 0,126388 ) (0,0003333) 0
0,126388 0,1284768 0, 000263787 0
0,1284768 0,016506288 0,000133358
2(0,126388)
1,0144 0,00205
− − λ − − λ − =
λ + λ + =
− ± −λ =
λ = − λ = −
-
8/16/2019 apostila_-_superfcie_de_resposta
31/38
28
11.
Localização do Ponto Estacionário
Suponha que nosso interesse é encontrar os níveis 1 2 kx ,x ,..., x , que otimize a
resposta predita. Este ponto, se existir, será dado pelo conjunto 1 2 kx ,x ,..., x para o qual
as derivadas parciais são iguais são iguais à zero, isto é
1 2 k
ˆ ˆ ˆY Y Y... 0
x x x∂ ∂ ∂
= = = =∂ ∂ ∂
Este ponto é chamado de ponto estacionário e pode representar um ponto de
máximo, de mínimo ou um ponto de sela.Para obtenção de uma solução matemática geral para localização do ponto
estacionário, escrevemos o modelo de segunda ordem na seguinte notação matricial
ˆˆ = + +0Y β x`b x`Bx
onde
1 11 12 1k1
2 2 22 2k
kk kk
ˆ ˆ ˆ ˆ / 2 / 2xˆ ˆ ˆx / 2
x ˆ ˆsim.
β β β β β β β = = =
β β
x b B
…
…
⋮ ⋮ ⋱ ⋮
Em que b é um vetor (k x 1) dos coeficientes de regressão de primeira ordem e B é uma
matriz simétrica (k x k) onde na diagonal têm-se os coeficientes de regressão de
segunda ordem e fora da diagonal os coeficientes da interação.
As derivadas parciais dos valores preditos da resposta Ŷ em relação aos
elementos do vetor x igualadas a zero são dadas por:
Ŷ2 0
∂= + =
∂b Bx
x
O ponto estacionário é a solução das equações, ou seja,
1s
1
2−= −x B b
O valor predito da variável resposta no ponto estacionário é:
-
8/16/2019 apostila_-_superfcie_de_resposta
32/38
-
8/16/2019 apostila_-_superfcie_de_resposta
33/38
30
onde iw são as variáveis independentes transformadas e os iλ são constantes. A
equação acima é chamada de forma canônica do modelo. Os iλ são os autovalores ou
raízes características da matriz B. Assim, tem-se que:
i. Se todos os valores de ( iλ ) são positivos, então, sx é um ponto de resposta
mínima;
ii. Se os ( iλ ) são todos negativos, então, sx é um ponto de resposta máxima;
iii. Se os valores de ( iλ ) tem sinais positivos e negativos, então, sx é um ponto de
sela.
Além disso, a superfície tem inclinação na direção de iw para o qual o valor de
iλ é maior.
Consideremos novamente o exemplo: segunda fase do estudo. Para ajustar um
modelo de segunda ordem é necessário aumentar o delineamento com pontos adicionais.
Para ser possível estimar os parâmetros do modelo o engenheiro obteve mais 4
observações, mais ou menos no mesmo tempo em que executou os 9 tratamentos
anteriores. Os 4 tratamentos adicionais foram:(x1=0; x2=± 1,414) e (x1=± 1,414; x2=0).
Este é o Delineamento Composto Central.
Tabela 7. Delineamento composto central para avaliação do exemplo.
Variáveis originais Variáveis codificadas Resposta
1X 2X x1 x2 Y (produção)
80 170 -1 -1 76.580 180 -1 1 7790 170 1 -1 78
90 180 1 1 79.585 175 0 0 79.985 175 0 0 80.385 175 0 0 8085 175 0 0 79.785 175 0 0 79.8
92.07 175 1.414 0 78.477.93 175 -1.414 0 75.6
85 182.07 0 1.414 78.5
85 167.93 0 -1.414 77
-
8/16/2019 apostila_-_superfcie_de_resposta
34/38
31
Tabela 8. Análise da variância de dados referentes à produção no delineamento
composto central.
FV GL SQ QM F Valor p
Intercepto 1 31951.98 31951.98 450595.9 0.000000*
Tempo 1 7.92 7.92 111.7 0.000015
Tempo² 1 13.17 13.17 185.8 0.000003
Temperatura 1 2.12 2.12 29.9 0.000934
Temperatura² 1 6.97 6.97 98.3 0.000023
Tempo x Temperatura 1 0.25 0.25 3.5 0.102519
Resíduo 7 0.50 0.07
Os efeitos do modelo de segunda ordem ajustado aos dados codificados bem
como sua significância estatística são apresentados na Tabela 9.
Tabela 9. Estimativa dos parâmetros do modelo de segunda ordem.
Efeitos Estimativas Valor pIntercepto 79.93995 0.000000
Tempo 0.99505 0.000015
Tempo² -1.37645 0.000003
Temperatura 0.51520 0.000934
Temperatura² -1.00134 0.000023
Tempo x Temperatura 0.25000 0.102519
Tem-se a não significância do efeito da interação Tempo x Temperatura, assim o
modelos ajustado pode ser expresso por:
2 21 1 2 2Ŷ 79,93995 0,99505x 1,37645x 0,5152x 1,00134x= + − − −
-
8/16/2019 apostila_-_superfcie_de_resposta
35/38
-
8/16/2019 apostila_-_superfcie_de_resposta
36/38
33
x1
-1.0 -0.5 0.0 0.5 1.0
x 2
-1.0
-0.5
0.0
0.5
1.0
75
76
77
78
79
80
Figura 5. Gráfico de contorno do modelo de 2º Ordem.
Sabendo que o modelo é apropriado para descrever os dados, podemos então
encontrar a localização do ponto estacionário usando a solução geral apresentada.
O ponto estacionário é a solução das equações, ou seja,
1s
1
20,73972 0,09234 0,99505 0,7836410,09234 1,01018 0,51520 0,612332
−= −
− − − = − = − − −
x B b
Em termos das variáveis originais, o ponto estacionário é dado por:
11
22
X 850,78364 X 81,0818
5X 175
0,61233 X 171,93835
−− = ∴ =
−− = ∴ =
O valor da resposta estimada no ponto estacionário é:
0,99505 1,37645 0,12500
0,51520 0,12500 1,00134
− = = −
b B
-
8/16/2019 apostila_-_superfcie_de_resposta
37/38
34
[ ]
's 0
s
1ˆŶ2
0,995051Ŷ 79,94 0,78364 0,61233 79,390,515202
= β +
= + − − ≅
sx b
Análise canônica
Vamos expressar o modelo ajustado na forma canônica. Primeiramente
precisamos encontrar os autovalores, 1 2eλ λ , que são as raízes do determinante da
equação:0
1,37645 0,125000
0,12500 1,00134
− λ =
− − λ=
− − λ
B I
Resolvendo a equação:
2 2,3777 1,3626 0λ + λ + =
Temos:
1 0,9635λ = − e 2 1,4143λ = −
A forma canônica do modelo ajustado fica:
2 21 2Ŷ 80,21 0,9635w 1,4143w= − −
Visto que as raízes iλ são todas negativas, conclui-se então que sx é um ponto de
resposta máxima.
-
8/16/2019 apostila_-_superfcie_de_resposta
38/38
Referências
BOX, G. E. P.; DRAPER, N. R. Empirical model buiding and response surfaces.
New York: John Wiley & Sons, 1987.
KHURI, A. I.; CORNELL, J. A. Response Surfaces: designs and analysis. New York:
Marcel Dekker Inc., 1987.
MONTGOMERY, D. C. Design and analysis of experiments. John Wiley & Sons,
New York, 2001.
MONTGOMERY, D. C.; RUNGER, G. C. Estatística aplicada e probabilidade para
engenheiros; tradução Verônica Calado. 2 ed. Rio de Janeiro: LTC, 2008.