Aprendizaje adaptativo basado en Simuladores de Realidad ...
ALGORITMO EVOLUCIONARIO´ ADAPTATIVO EM PROBLEMAS ...
Transcript of ALGORITMO EVOLUCIONARIO´ ADAPTATIVO EM PROBLEMAS ...
Universidade Federal de Pernambuco
Centro de Informatica
Pos-graduacao em Ciencia da Computacao
ALGORITMO EVOLUCIONARIO
ADAPTATIVO EM PROBLEMAS
MULTIMODAIS DINAMICOS
Maury Meirelles Gouvea Junior
TESE DE DOUTORADO
Recife
12 de Marco de 2009
Universidade Federal de Pernambuco
Centro de Informatica
Maury Meirelles Gouvea Junior
ALGORITMO EVOLUCIONARIO ADAPTATIVO EM PROBLEMAS
MULTIMODAIS DINAMICOS
Trabalho apresentado ao Programa de Pos-graduacao em
Ciencia da Computacao do Centro de Informatica da Uni-
versidade Federal de Pernambuco como requisito parcial
para obtencao do grau de Doutor em Ciencia da Com-
putacao.
Orientador: Prof. Dr. Aluizio Fausto Ribeiro Araujo
Recife
12 de Marco de 2009
iii
Para Laura, meu amor, minha companheira inseparavel.
AGRADECIMENTOS
Aos meus pais, Maury e Alda, pelo amor que sempre me deram, pelo exemplo de uniao,
perseveranca e cuidado que sempre foram e serao.
Ao meu orientador, Prof. Dr. Aluizio Fausto Ribeiro Araujo, pela oportunidade e
pelos direcionamentos tecnicos e metodologicos.
A Pontifıcia Universidade Catolica de Minas Gerais (PUC Minas), em especial, ao Pro-
Reitor Prof. Dr. Joao Francisco de Abreu e a Magda Soares Nunes, assessora executiva,
pelo apoio e concessao do Plano Permanente de Capacitacao Docente.
Ao Conselho Nacional de Desenvolvimento Cientıfico e Tecnologico (CNPq), pelo
suporte financeiro atraves de bolsa de estudos.
Aos professores e funcionarios do Centro de Informatica da Universidade Federal de
Pernambuco, pela atencao e apoio recebidos.
Ao Industrial Control Centre da Universidade de Strathclyde, Glasgow, Escocia, em
especial, aos Prof. Dr. Michael Grimble, Prof. Dr. Leonardo Giovanini e Prof. Dr.
Reza Katebi, pela oportunidade, hospitalidade e importantes contribuicoes ao trabalho
durante meu estagio neste centro de pesquisa.
Ao Prof. Dr. Jose Wilson Costa e ao Prof. MSc. Lucio Mauro Pereira, coordenado-
res do curso de Sistemas de Informacao da PUC Minas, campus Contagem, pelo apoio
irrestrito, amizade e por proporcionar-me um bom ambiente de trabalho.
A toda a minha famılia, sempre unida, em especial, as minhas queridas irmas, Magali
e Meirinha, pelos momentos de muita alegria. Ao meu grande amigo, e tio, Emmo Sanna,
por ter sido um dos primeiros a mostrar-me o caminho cientıfico.
Um agradecimento muito especial ao meu amigo James McKinstry, pela amizade tao
consolidada e pelo grande apoio durante minha permanencia em Glasgow, Escocia.
Um agradecimento muito especial ao meu amigo Cıcero Garrozi, pela amizade e com-
panheirismo sempre demonstrados. Aos demais amigos do Recife, em especial, Pedro
Cecconello, Adriana Freitas, Ricardo Ramos, Paula, Joel Silva e Sergio Murilo, por esta-
rem sempre perto, proporcionando momentos muito agradaveis.
v
Na sobrevivencia dos indivıduos e racas favorecidas, durante a luta
constante e recorrente pela existencia, vemos uma forma poderosa e
incessante de selecao.
—CHARLES DARWIN (1809 – 1882)
RESUMO
Os algoritmos evolucionarios sao metodos de otimizacao e busca global baseados em po-
pulacoes. Como nas populacoes biologicas, um algoritmo evolucionario perde diversidade,
ao longo de geracoes, restringindo a busca em uma regiao restrita do espaco de solucoes e
prejudicando a busca global. Em ambientes complexos, multimodais e dinamicos, a perda
de diversidade torna-se um problema ainda mais crıtico, pois a busca deve ser abrangente
e o algoritmo se adaptar o mais rapido possıvel.
Um algoritmo evolucionario possui parametros cujos valores influenciam tanto o re-
sultado do processo quanto a diversidade da populacao. Esta tese apresenta dois novos
metodos de controle de parametros de algoritmos evolucionarios, o controle adaptativo e
o controle da funcao de distribuicao de probabilidade. O objetivo desses metodos e con-
trolar a diversidade da populacao de acordo com funcoes pre-determinadas. O processo
evolucionario e, portanto, tratado como um problema de controle, cujos parametros do
algoritmo evolucionario sao as entradas de controle e a diversidade da populacao e a saıda
do processo.
No metodo de controle adaptativo, a estrategia de controle e baseada no sistema adap-
tativo por modelo de referencia, onde uma diversidade de referencia e utilizada como mo-
delo de comportamento para a diversidade do processo evolucionario. O segundo metodo
tem como objetivo manter a funcao de distribuicao de probabilidade da diversidade da
populacao proxima de uma distribuicao determinada. Assim, a distribuicao da populacao
no espaco de solucoes e tambem indiretamente controlada. Para esse metodo manter um
controle de baixo custo computacional, utiliza-se uma rede neural B-spline para modelar
o processo evolucionario.
Em problemas de controle, e necessario conhecer o modelo do processo para se ela-
borar uma estrategia de controle. Assim, foi proposto um novo modelo de dinamica
de populacoes que descreve o comportamento da frequencia genica e da diversidade de
populacoes. Baseado nesse modelo, o processo evolucionario e formalizado matemati-
camente. Portanto, o metodo de controle adaptativo proposto utiliza esse modelo de
vii
RESUMO viii
dinamica de populacoes na estrategia de controle.
Os dois metodos de controle de diversidade propostos foram validados em estudos de
casos. Todos os problemas utilizados tiveram caracterısticas multimodais e dinamicas,
com comportamentos que variaram de uniforme, pequenas e grandes variacoes, a caotica.
Os desempenhos dos metodos propostos foram comparadas com um algoritmo genetico
padrao e outros seis algoritmos evolucionarios adaptativos.
Palavras-chave: Algoritmos evolucionarios; Controle adaptativo; Dinamica de po-
pulacoes; Sistemas estocasticos; Controle estocastico; Controle de parametros; Redes
neurais B-spline; Diversidade.
ABSTRACT
Evolutionary algorithms are global optimization and search methods based on popu-
lations. As in biological populations, an evolutionary algorithm loses diversity, along
generations, constraining the search to a specific region of the solutions space and impai-
ring the global search. In complex, multimodal and dynamic, environments the diversity
loss becomes a more serious problem, because the search must be comprehensive and
algorithm should evolve as quickly as possible.
An evolutionary algorithm has parameters in which their values influence both the
outcome of the process and the diversity of the population. This thesis presents two
new parameter control methods for evolutionary algorithms, the adaptive control and
the probability density function control. These methods aim to control the population
diversity according to predefined functions. Therefore, the evolutionary process is treated
as a control problem, which the evolutionary algorithm parameters are the control inputs
and the population diversity is the process output.
In the adaptive control method, the control strategy is based on the model-reference
adaptive control, where a reference diversity is used as a behavior model for the diversity
of the evolutionary process. The second method aims to make the probability density
function (PDF) of the population diversity to be close to a determined PDF. Thus, the
population distribution on the solutions space is also indirectly controlled. In order to
keep low the computational effort, this second method uses a B-spline neural network to
model the evolutionary process.
In control problems, it is necessary to know the process model to create a control
strategy. Thus, a population dynamics model was proposed to describe the gene frequency
and diversity behaviors of populations. Based on this model, the evolutionary process is
mathematically formalized. Therefore, the proposed adaptive control method uses this
population dynamics model into the control strategy.
The two proposed diversity control methods were validated in several case studies
using benchmark problems. All of them had multimodal and dynamic features, with
ix
ABSTRACT x
behaviors that varied from linear, small- and large-sized, to chaotic. The performances
of the proposed methods were compared with a standard genetic algorithm and other six
adaptive evolutionary algorithms.
Keywords: Evolutionary algorithms; Adaptive control; Population dynamics; Stochas-
tic systems; Stochastic control; Parameter control; B-spline neural networks; Diversity.
SUMARIO
Capıtulo 1—Introducao 1
1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.1 Objetivos Especıficos . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Escopo do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Capıtulo 2—Algoritmos Evolucionarios Adaptativos 8
2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Controle de Parametros Determinıstico . . . . . . . . . . . . . . . . . . . 10
2.3 Controle de Parametros Adaptativo . . . . . . . . . . . . . . . . . . . . . 12
2.4 Controle de Parametros Auto-Adaptativo . . . . . . . . . . . . . . . . . . 18
2.5 Adaptacao para Manutencao ou Controle da Diversidade . . . . . . . . . 21
2.5.1 Manutencao da Diversidade . . . . . . . . . . . . . . . . . . . . . 21
2.5.2 Controle da Diversidade . . . . . . . . . . . . . . . . . . . . . . . 29
2.6 Discussoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Capıtulo 3—Genetica de Populacoes e Biodiversidade 35
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2 Genetica de Populacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Metricas de Diversidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 Equilıbrio de Hardy-Weinberg . . . . . . . . . . . . . . . . . . . . . . . . 40
3.5 Fatores que Afetam o Equilıbrio de Hardy-Weinberg . . . . . . . . . . . . 43
3.5.1 Mutacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.5.2 Cruzamentos Nao-Aleatorios . . . . . . . . . . . . . . . . . . . . . 44
3.5.3 Deriva Genetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.5.4 Selecao Natural . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.5 Efeito Gargalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
xi
SUMARIO xii
3.5.6 Tamanho da Populacao . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6 Tamanho Efetivo da Populacao . . . . . . . . . . . . . . . . . . . . . . . 46
3.6.1 Modelo de Wright-Fisher . . . . . . . . . . . . . . . . . . . . . . . 47
3.6.2 Tipos de Tamanho Efetivo . . . . . . . . . . . . . . . . . . . . . . 48
3.6.3 Tamanho Efetivo por Perda de Heterozigosidade . . . . . . . . . . 49
3.6.4 Tamanho Efetivo por Variancia . . . . . . . . . . . . . . . . . . . 50
3.6.5 Tamanho Efetivo com N Variavel . . . . . . . . . . . . . . . . . . 50
3.6.6 Tamanho Efetivo com Selecao . . . . . . . . . . . . . . . . . . . . 51
3.6.7 Desvio do Equilıbrio de Hardy-Weinberg . . . . . . . . . . . . . . 52
3.7 Outros Tamanhos Efetivos da Populacao . . . . . . . . . . . . . . . . . . 53
3.8 Discussoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Capıtulo 4—Controle Adaptativo e de PDF 55
4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2 Sistema Dinamico Nao-Linear . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3 Problemas de Controle Nao-Linear . . . . . . . . . . . . . . . . . . . . . 58
4.4 Sistemas Adaptativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.4.1 Sistema Adaptativo por Modelo de Referencia . . . . . . . . . . . 60
4.4.1.1 Metodo MIT . . . . . . . . . . . . . . . . . . . . . . . . 61
4.4.1.2 Teoria de Lyapunov . . . . . . . . . . . . . . . . . . . . 62
4.4.1.2.1 Teorema da Estabilidade de Lyapunov . . . . . 63
4.5 Controle de PDF da Saıda de Sistemas Estocasticos . . . . . . . . . . . . 64
4.5.1 Modelo Dinamico . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.5.2 Modelagem de Sistemas Dinamicos Lineares . . . . . . . . . . . . 67
4.5.3 Estrategia de Controle de PDF . . . . . . . . . . . . . . . . . . . 69
4.6 Discussoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Capıtulo 5—Modelo de Dinamica de Populacoes 73
5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.2 Calculando a Diversidade da Populacao . . . . . . . . . . . . . . . . . . . 74
5.3 Modelo de Dinamica de Populacoes . . . . . . . . . . . . . . . . . . . . . 78
5.4 Gradiente Estocastico e Analise de Sensibilidade . . . . . . . . . . . . . . 84
5.5 Testes para Validacao do Modelo . . . . . . . . . . . . . . . . . . . . . . 86
SUMARIO xiii
5.6 Discussoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Capıtulo 6—Modelos de Controle de Parametros 93
6.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
6.2 Modelo de Referencia de Diversidade . . . . . . . . . . . . . . . . . . . . 94
6.3 Modelo do Processo Evolucionario . . . . . . . . . . . . . . . . . . . . . . 96
6.4 Controle Adaptativo do Processo Evolucionario . . . . . . . . . . . . . . 97
6.5 Estrategia de Controle Adaptativo . . . . . . . . . . . . . . . . . . . . . 97
6.5.1 Estrategia Baseada no Sinal de Comando . . . . . . . . . . . . . . 98
6.5.2 Estrategia Baseada no Sinal de Comando e na Saıda do Processo 99
6.5.3 Mecanismo de Selecao . . . . . . . . . . . . . . . . . . . . . . . . 100
6.6 Controle de PDF Aplicado aos AEs . . . . . . . . . . . . . . . . . . . . . 101
6.6.1 Calculo da PDF da Diversidade . . . . . . . . . . . . . . . . . . . 103
6.6.2 Geracao de Amostras e Identificacao do Modelo do Processo Evo-
lucionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.6.3 Estrategia de Controle de PDF . . . . . . . . . . . . . . . . . . . 106
6.7 Discussoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Capıtulo 7—Estudo de Casos 111
7.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.2 Planejamento dos Experimentos . . . . . . . . . . . . . . . . . . . . . . . 112
7.3 Dinamica dos Ambientes . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
7.4 Analise de Rastreamento . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
7.4.1 Analise de Rastreamento em Ambientes Estaticos . . . . . . . . . 116
7.4.2 Analise de Rastreamento em Ambientes Dinamicos Cıclicos: 200
Geracoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.4.3 Analise de Rastreamento em Ambientes Dinamicos Cıclicos: 40
Geracoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.4.4 Discussoes Finais Sobre o Rastreamento . . . . . . . . . . . . . . 126
7.5 Experimentos com Modelos de Referencia . . . . . . . . . . . . . . . . . . 127
7.5.1 Discussoes Finais Sobre os Modelos de Referencia . . . . . . . . . 129
7.6 Experimentos com Funcoes Contınuas . . . . . . . . . . . . . . . . . . . . 130
7.6.1 Experimentos com a Funcao de Ackley . . . . . . . . . . . . . . . 130
SUMARIO xiv
7.6.2 Experimentos com a Funcao de Schwefel . . . . . . . . . . . . . . 131
7.7 Experimentos com o Gerador Moving Peaks . . . . . . . . . . . . . . . . 132
7.8 Experimentos com o Problema da Mochila . . . . . . . . . . . . . . . . . 142
7.9 Experimentos com o Projeto de Rede de Radio-Transmissores . . . . . . 152
7.10 Experimentos com o Roteamento de Redes . . . . . . . . . . . . . . . . . 153
7.11 Analise de Desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
7.12 Discussoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
Capıtulo 8—Conclusoes e Trabalhos Futuros 168
8.1 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
Apendice A—Funcoes Padronizadas para Teste 173
A.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
A.2 Funcoes Contınuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
A.3 Gerador Moving Peaks . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
A.3.1 Morfologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
A.3.2 Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
A.4 Problema Combinatorio da Mochila . . . . . . . . . . . . . . . . . . . . . 177
A.5 Projeto de Rede de Radio-Transmissores . . . . . . . . . . . . . . . . . . 177
A.6 Roteamento de Redes de Transportes . . . . . . . . . . . . . . . . . . . . 178
LISTA DE FIGURAS
1.1 Analise de desempenho de metodos de otimizacao realizada por Goldberg
(1989). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1 Diversidade da populacao vista por fmax − f (SRINIVAS; PATNAIK, 1994). 16
2.2 Pseudo-codigo do laco interno do TRAM. . . . . . . . . . . . . . . . . . . 25
2.3 Pseudo-codigo do laco externo do TRAM. . . . . . . . . . . . . . . . . . 26
2.4 Pseudo-codigo do RIGA . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5 Pseudo-codigo do ERIGA . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.1 Diagrama de blocos de um sistema de controle adaptativo. . . . . . . . . 56
4.2 Diagrama de blocos do sistema adaptativo por modelo de referencia. . . . 61
5.1 Distribuicoes genicas iniciais e finais dos genes 1, 4 e 9. . . . . . . . . . . 76
5.2 Probabilidade de selecao do i-esimo indivıduo em funcao da pressao de
selecao, β. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.3 Barras de erros de previsao de diversidade para as populacao de 10, 100 e
400 indivıduos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.4 Variacao do erro nas populacoes com 10 e 400 indivıduos com na = 10. . 90
5.5 Variacao do erro nas populacoes com 10 e 400 indivıduos com na = 100. . 90
5.6 Erro medio para 10 e 100 alelos. . . . . . . . . . . . . . . . . . . . . . . . 91
6.1 Controle de parametros pelo SAMR. . . . . . . . . . . . . . . . . . . . . 97
6.2 Pseudo-codigo do metodo de controle de diversidade proposto — DRAC . 101
6.3 PDFs de duas populacoes com mesma diversidade media. . . . . . . . . . 102
6.4 PDF de uma populacao da geracao inicial ate a geracao 500. . . . . . . . 104
6.5 PDF desejada: (a) concentrada no melhor indivıduo ou gene e (b) dis-
tribuıda em tres nichos no espaco de solucoes. . . . . . . . . . . . . . . . 106
6.6 Diagrama de blocos do metodo de controle de PDF de diversidade. . . . 108
xv
LISTA DE FIGURAS xvi
7.1 Sequencias geradas pela funcao logıstica para diferentes valores de A. . . 115
7.2 Analise de rastreamento no moving peaks em ambiente estatico. . . . . . 117
7.3 Analise de rastreamento no problema da mochila em ambiente estatico. . 119
7.4 Analise de rastreamento no moving peaks em ambiente dinamico com va-
riacoes cıclicas de 200 geracoes. . . . . . . . . . . . . . . . . . . . . . . . 121
7.5 Analise de rastreamento no problema da mochila em ambiente dinamico
com variacoes cıclicas de 200 geracoes. . . . . . . . . . . . . . . . . . . . 122
7.6 Analise de rastreamento no moving peaks em ambiente dinamico com va-
riacoes cıclicas de 40 geracoes. . . . . . . . . . . . . . . . . . . . . . . . . 124
7.7 Analise de rastreamento no problema da mochila em ambiente dinamico
com variacoes cıclicas de 40 geracoes. . . . . . . . . . . . . . . . . . . . . 125
7.8 Melhores aptidoes no Experimento 7.6.2.a: funcao de Schwefel, variacoes
pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.9 Melhores aptidoes no Experimento 7.6.2.b: funcao de Schwefel, variacoes
grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7.10 Melhores aptidoes no Experimento 7.6.2.c: funcao de Schwefel, variacoes
caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.11 Melhor aptidao no Experimento 7.7.a.: moving peaks com dinamica com
variacoes pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
7.12 Melhor aptidao no Experimento 7.7.b: moving peaks com dinamica com
variacoes grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.13 Melhor aptidao no Experimento 7.7.c: moving peaks com dinamica caotica. 140
7.14 Melhor aptidao dos metodos propostos no moving peaks. . . . . . . . . . 141
7.15 Melhor aptidao no Experimento 7.8.a: problema da mochila com variacoes
pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
7.16 Melhor aptidao no Experimento 7.8.b: problema da mochila com variacoes
grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
7.17 Melhor aptidao no Experimento 7.8.c: problema da mochila com variacoes
caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
7.18 Melhor aptidao nos metodos propostos: problema da mochila. . . . . . . 148
7.19 Diversidades no Experimento 7.8.a: problema da mochila com variacoes
pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.20 Diversidades no Experimento 7.8.c: problema da mochila com variacoes
caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
LISTA DE FIGURAS xvii
7.21 Melhor aptidao no Experimento 7.9.b: problema RND com variacoes grandes.154
7.22 Melhor aptidao no Experimento 7.9.c: problema RND com variacoes caoticas.155
7.23 Melhor aptidao no Experimento 7.10.b: roteamento de redes com variacoes
grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
7.24 Melhor aptidao no Experimento 7.10.c: roteamento de redes com variacoes
caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
A.1 Superfıcies produzidas pelo gerador moving peaks . . . . . . . . . . . . . 176
A.2 Grafo nao-orientado de um problema de roteamento de redes. . . . . . . 178
LISTA DE TABELAS
3.1 Probabilidades de cruzamento ao acaso. . . . . . . . . . . . . . . . . . . . 43
3.2 Distribuicoes genotıpicas em uma geracao de descendentes. . . . . . . . . 43
5.1 Parametros do problema de otimizacao de uma funcao quadratica f (Equacao5.3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2 Diversidades inicial e final nos experimentos da funcao quadratica f , Equacao5.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3 Estatıstica para os metodos baseados na heterozigosidade, He. . . . . . . 77
5.4 Parametros utilizados nos experimentos. . . . . . . . . . . . . . . . . . . 87
5.5 Erros de previsao de diversidade com na = 10. . . . . . . . . . . . . . . . 89
7.1 Parametros fixos comuns utilizados nos experimentos. . . . . . . . . . . . 114
7.2 Resultados da analise de rastreamento em ambientes estaticos: Experi-
mentos 7.4.1.a e 7.4.1.b. . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.3 Resultados da analise de rastreamento em ambientes dinamicos com va-
riacoes cıclicas de 200 geracoes: Experimentos 7.4.2.a e 7.4.2.b. . . . . . . 123
7.4 Resultados da analise de rastreamento em ambientes dinamicos com va-
riacoes cıclicas de geracoes: Experimentos 7.4.3.a e 7.4.3.b. . . . . . . . . 126
7.5 Experimento 7.5.a: moving peaks, ciclos de 40 geracoes e dinamica com
variacoes pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
7.6 Experimento 7.5.b: moving peaks, ciclos de 200 geracoes e dinamica com
variacoes grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
7.7 Experimento 7.5.c: Problema da Mochila, ciclos de 40 geracoes e dinamica
com variacoes pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7.8 Experimento 7.5.d: Problema da Mochila, ciclos de 200 geracoes e dinamica
com variacoes grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7.9 Resultados do Experimento 7.6.1.a: funcao de Ackley, variacoes pequenas. 131
7.10 Resultados do Experimento 7.6.1.b: funcao de Ackley, variacoes grandes. 132
xviii
LISTA DE TABELAS xix
7.11 Resultados do Experimento 7.6.1.c: funcao de Ackley, variacoes caoticas. 136
7.12 Resultados do Experimento 7.6.2.a: funcao de Schwefel com variacoes pe-
quenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7.13 Resultados do Experimento 7.6.2.b: funcao de Schwefel com variacoes
grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
7.14 Resultados do Experimento 7.6.2.c: funcao de Schwefel com variacoes
caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7.15 Resultados do Experimento 7.7.a: moving peaks com variacoes pequenas. 145
7.16 Resultados do Experimento 7.7.b: moving peaks com variacoes grandes. . 149
7.17 Resultados do Experimento 7.7.c: moving peaks com variacoes caoticas. . 152
7.18 Resultados do Experimento 7.8.a: problema da mochila com variacoes
pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
7.19 Resultados do Experimento 7.8.b: problema da mochila com variacoes
grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
7.20 Resultados do Experimento 7.8.c: problema da mochila com variacoes
caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
7.21 Resultados do Experimento 7.9.b: problema RND com variacoes grandes. 160
7.22 Resultados do Experimento 7.9.c: problema RND com variacoes caoticas. 161
7.23 Resultados do Experimento 7.10.b: roteamento de redes com variacoes
grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
7.24 Resultados do Experimento 7.10.c: roteamento de redes com variacoes
caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
7.25 Analise geral de desempenho. . . . . . . . . . . . . . . . . . . . . . . . . 164
7.26 Tempos medios de execucao dos AEs. . . . . . . . . . . . . . . . . . . . . 164
CAPITULO 1
INTRODUCAO
Os algoritmos evolucionarios (AEs) sao metodos de busca global, baseados na teoria
da evolucao de Darwin (2004), aplicaveis em problema de otimizacao, modelagem e
simulacao (GOLDBERG, 1989; EIBEN; SMITH, 2003; BRANKE, 2002). Goldberg (1989)
mostrou que metodos classicos de otimizacao ou busca, como, por exemplo, gradiente
descendente e conjugado (PIERRE, 1986), tem desempenho superior a algoritmos evo-
lucionarios e a metodos de busca aleatoria quando aplicados em classes especıficas de
problemas, Figura 1.1. Contudo, em problemas dinamicos e multimodais, com funcoes
objetivo nao-diferenciaveis, muitos metodos classicos nao sao aplicaveis.
Os algoritmos evolucionarios, assim como outros metodos de otimizacao ou busca,
possuem parametros cujos valores tem influencia direta no desempenho do processo de
busca. Determinar os valores desses parametros, que a priori nao tem nenhum relaciona-
mento com o ambiente, e uma tarefa nao trivial e muitos esforcos tem sido despendidos
para encontrar algoritmos e heurısticas que possam faze-lo (EIBEN et al., 1999; ANGELINE,
1995).
Figura 1.1 Analise de desempenho de metodos de otimizacao realizada por Goldberg (1989).
Basicamente, existem duas formas de determinar os valores dos parametros de um
1
algoritmo evolucionario, por ajuste previo ou controle de parametros. No ajuste previo,
os valores dos parametros sao determinados antes do inıcio do processo evolucionario.
No controle de parametros, os parametros sao ajustados durante o processo evolucionario
de acordo com uma estrategia pre-definida ou em conformidade com o desempenho do
algoritmo. Estrategias que ajustem esses parametros durante o processo evolucionario e
uma das areas de pesquisa mais promissora da computacao evolucionaria.
Os algoritmos evolucionarios com parametros ajustaveis aplicados a problemas de oti-
mizacao ou busca em ambientes estaticos, isto e, em espacos cujos otimos nao mudam
suas localizacoes ou as restricoes do problema sao fixas, tem sua importancia consolidada
na literatura atraves de testes empıricos e demonstracoes teoricas (EIBEN et al., 1999).
Entretanto, em ambientes dinamicos, o problema torna-se mais complexo, aumentando a
relevancia dos metodos de controle de parametros. Um algoritmo de otimizacao ou busca
em ambientes dinamicos deve adaptar-se rapidamente as novas condicoes e explorar o
maior numero de regioes possıvel. O algoritmo evolucionario padrao (GOLDBERG, 1989)
nao se mostra apto a resolver problemas de otimizacao ou busca em ambientes dinamicos
porque tende a convergir prematuramente, dificultando a adaptacao as variacoes do am-
biente (BRANKE, 2001; JIN; BRANKE, 2005).
Em muitos trabalhos, a dinamica do ambiente e tratada introduzindo memoria (BENDT-
SEN; KRINK, 2002; GOLDBERG; SMITH, 1987), controlando a diversidade (BUI et al., 2005;
COBB, 1990; GREFENSTETTE, 1992; MONSIEURS; FLERACKERS, 2003; SIMOES; COSTA,
2001, 2002a) ou, ainda, mesclando os dois primeiros metodos (SIMOES; COSTA, 2003).
Ao adicionar memoria aos AEs e possıvel armazenar boas solucoes e utiliza-las quando
ocorrerem variacoes no ambiente (BRANKE, 1999, 2001; JIN; BRANKE, 2005). A memoria
pode ser introduzida ao AE de duas formas: implıcita, que utiliza representacao redun-
dante (i.e., o indivıduo possui um genotipo com mais informacoes para definir o fenotipo);
ou explıcita, que armazena as melhores solucoes, utilizando-as quando ocorrem variacoes
no ambiente. Goldberg e Smith sugeriram uma extensao para o algoritmo evolucionario
padrao que agrega memoria com representacao redundante (GOLDBERG; SMITH, 1987).
Bendtsen e Krink (2002) utilizaram memoria explıcita movendo gradualmente os in-
divıduos armazenados para perto do melhor indivıduo da geracao atual.
O controle da diversidade permite que o numero de regioes exploradas durante o
processo evolucionario seja mantido ou variado. Assim, a adaptacao as mudancas do
ambiente pode ser mais rapida. No algoritmo evolucionario padrao, e difıcil manter a
diversidade porque os indivıduos tendem a convergir prematuramente para regioes es-
2
pecıficas do espaco de busca (GOLDBERG, 1989). Em ambientes dinamicos, a tendencia
de convergencia da populacao e uma restricao importante, pois dificulta a resposta rapida
as variacoes do ambiente. Varios pesquisadores elaboraram metodos diretos e indiretos de
controle da diversidade. Por exemplo, Cobb (1990) introduziu a hipermutacao gatilhada,
Grefenstette (1992) apresentou a imigracao aleatoria, Simoes e Costa (2001, 2002a) uti-
lizaram o princıpio da transmutacao genetica, Bui et al. (2005) utilizaram a abordagem
multiobjetivo para tratar ambientes dinamicos.
Esta tese propoe dois metodos de controle da diversidade de AEs, o primeiro baseado
no controle adaptativo e o segundo no controle estocastico. O uso do controle adapta-
tivo para ajustes dos parametros do algoritmo evolucionario se justifica pela presenca de
incertezas inerentes a processos evolucionarios. O metodo de controle adaptativo utili-
zado, denominado controle adaptativo por modelo de referencia (ASTROM; WITTENMARK,
1995; NARENDRA; ANNASWAMY, 2005), se aplica ao problema do controle de parametros
por existir na literatura algumas hipoteses que sugerem determinados comportamentos
para um algoritmo evolucionario (BEYER; RUDOLPH, 1997; BUI et al., 2005; COBB, 1990;
GREFENSTETTE, 1992; SIMOES; COSTA, 2001). O controle adaptativo por modelo de re-
ferencia e utilizado para controlar a diversidade, contribuindo para reduzir o problema
da convergencia prematura, aumentar o numero de regioes exploradas pela populacao e
responder de maneira mais rapida e eficiente as mudancas do ambiente.
O segundo metodo proposto utiliza os princıpios do controle de funcao de distribuicao
de probabilidade (PDF, do ingles, probability density function) (WANG, 2000a). Esse
metodo foi idealizado e inicialmente desenvolvido no Industrial Control Centre da Uni-
versidade de Strathclyde, em Glasgow, Escocia, com a supervisao do Prof. Dr. Michael
Grimble e do Prof. Dr. Leonardo Giovanini. Esse metodo de controle estocastico tem
como objetivo desenvolver uma estrategia de controle que aproxime a PDF da saıda do
processo de uma PDF desejada. Embora modelos matematicos possam ser utilizados para
obter a PDF da saıda, estes modelos sao, normalmente, complicados e demandam um ele-
vado esforco computacional. Com o objetivo de elaborar um controle de PDF adequado
e de baixo custo computacional, redes neurais, em especial a B-spline, tem sido utilizadas
para aproximar estatıstica e dinamicamente a PDF da saıda de processos estocasticos
(WANG, 2000a, 1999, 2000b). Uma B-spline pode ser aplicada apenas se um conjunto de
dados da entrada de controle e da PDF da saıda do processo estiver disponıvel.
Para elaborar um sistema de controle e necessario conhecer o modelo do processo.
Normalmente, os metodos de controle de diversidade nao tem informacoes precisas do
3
processo evolucionario. Apenas o desvio entre as diversidades atual e de referencia e
conhecido (WONG et al., 2003; URSEM et al., 2002; DIVERSITY-BASED. . . , 2007). Alguns
modelos de algoritmos evolucionarios ja foram propostos (GOLDBERG, 1989; RADCLIFFE,
1991); no entanto, esses modelos nao tratam a dinamica do algoritmo evolucionario em
relacao a diversidade da populacao. Alternativamente, existem algumas formulacoes que
tratam a dinamica dos AEs, como Bethke (1981), Vose e Liepins (1991), P.-Bennett et
al. (1994), Stark e Spall (2003), mas estes modelos nao podem ser utilizados na analise
da dinamica dos AEs porque necessitam de um conhecimento previo da probabilidade de
transicao de estados ou geracoes.
Pelas razoes supracitadas, foi elaborado um novo modelo de dinamica de populacoes
que descreve o comportamento da frequencia genica e da diversidade de populacoes.
Esse modelo considera os principais parametros de fatores evolutivos de uma populacao,
a saber, pressao de selecao, taxa de mutacao, numero de alelos e tamanho efetivo da
populacao. Portanto, foi possıvel, por analise de sensibilidade, identificar o impacto que
tais fatores podem causar na diversidade de populacoes.
A partir do modelo de dinamica de populacoes, formalizou-se um modelo de pro-
cesso evolucionario. Dois modelos de controle foram estabelecidos, o primeiro baseado
no controle adaptativo por modelo de referencia, denominado Controle Adaptativo por
Diversidade de Referencia (DRAC, do ingles, Diversity-Reference Adaptive Control); e o
segundo modelo baseado no controle de funcao de distribuicao de probabilidade, denomi-
nado AE Adaptativo Baseado na Funcao de Distribuicao de Probabilidade de Diversidade
(PDFEA, do ingles, Probability Density Function Based Evolutionary Algorithm).
A validacao dos metodos de controle de parametros propostos foi realizada atraves
de estudos de casos utilizando benchmarks e problemas reais multimodais e dinamicos.
Os metodos propostos, DRAC e PDFEA, foram comparados com o algoritmo genetico
padrao e seis algoritmos evolucionarios adaptativos.
1.1 OBJETIVOS
Esta tese tem como objetivo elaborar dois metodos de controle de parametros de AEs para
problemas de otimizacao ou busca em ambientes complexos, multimodais e dinamicos,
onde sugere-se a utilizacao de parametros ajustaveis. A solucao proposta utiliza metodos
de controle adaptativo e estocastico para ajuste dos parametros de fatores evolutivos,
como selecao e mutacao. A partir de um novo modelo de dinamica de populacoes pro-
4
posto, o processo evolucionario e formalizado analiticamente. O modelo de dinamica de
populacoes e, tambem, utilizado no sistema de controle do metodo DRAC.
1.1.1 Objetivos Especıficos
Esta tese de doutorado tem os seguintes objetivos especıficos:� Pesquisar e analisar criticamente os principais trabalhos sobre controle de parametros
de algoritmos evolucionarios nas ultimas decadas.� Investigar metodos de controle adaptativo apropriados para aplicacao no controle
de parametros de algoritmos evolucionarios.� Estudar o problema da diversidade das especies e de populacoes, levantando poten-
ciais metricas de diversidade que possam ser aplicadas na computacao evolucionaria.
Este estudo tem, tambem, o objetivo de analisar a dinamica da diversidade de po-
pulacoes, conhecendo os principais fatores e consequencias da sua variacao. Dentre
esses fatores destaca-se o impacto da variacao da diversidade sobre a evolucao da
populacao.� Propor e formalizar modelos de referencia baseados em perfis de diversidade de
populacoes estudadas no item anterior.� Desenvolver um modelo de dinamica de populacoes que descreva o comportamento
da diversidade em relacao aos parametros de fatores evolutivos, como mutacao e
selecao.� Elaborar dois novos metodos de controle de parametros de algoritmos evolucionarios
que empregam os fundamentos da teoria de controle. O principal objetivo do
metodo proposto e controlar a diversidade atraves de ajustes dos parametros de
algoritmos evolucionarios. O novo metodo e recomendado, principalmente, para
problemas multimodais com ambientes variaveis em morfologia e dinamica.� Formalizar o controle da diversidade de algoritmos evolucionarios como um pro-
blema de controle. Elaborar uma estrategia de controle que conduza o sistema ao
estado de equilıbrio.� Pesquisar problemas de referencia na literatura da computacao evolucionaria para
validar os metodos propostos.
5
� Realizar estudos de casos em ambientes multimodais e dinamicos, comparando os
metodos propostos com o algoritmo evolucionario padrao e outros algoritmos evo-
lucionarios adaptativos.� Propor melhorias nos metodos de controle de parametros propostos, apos analise
de resultados, para aplicacao em trabalhos futuros.
1.2 ESCOPO DO TRABALHO
O Capıtulo 2 apresenta uma pesquisa bibliografica com analise crıtica dos trabalhos
recentes sobre controle de parametros de algoritmos evolucionarios. Sao apresentadas
as classificacoes dos metodos de controle de parametros por tipo de adaptacao, a saber,
determinıstico, adaptativo e auto-adaptativo. O capıtulo apresenta, tambem, metodos
que promovem e controlam a diversidade das populacoes de algoritmos evolucionarios.
O Capıtulo 3 aborda a diversidade genetica de populacoes, suas caracterısticas e fato-
res que contribuem para sua variacao ao longo de geracoes. Sao apresentados os principais
conceitos de genetica de populacoes e as principais metricas de diversidade de especies e
populacoes presentes na literatura. O equilıbrio de Hardy-Weinberg, uma lei que deter-
mina a constancia genica de uma populacao ideal, e descrito em detalhes. Sao expostos
os principais fatores que afetam o equilıbrio da frequencia genica de uma populacao. Este
capıtulo tambem apresenta um dos parametros mais utilizados na avaliacao da diversi-
dade de populacoes, o tamanho efetivo da populacao. Essa grandeza, baseada em uma
populacao ideal criada pelos cientistas Sewall Wright (1931) e Ronald Fisher (1930), pos-
sui algumas variantes e muitas formas de se calcular. Os conceitos apresentados neste
capıtulo sao empregados na elaboracao de modelos de referencia de diversidade utilizados
no controle de parametros de algoritmos evolucionarios.
O Capıtulo 4 descreve sucintamente quatro metodos de controle adaptativo, a saber,
agendamento de ganho, modelo de referencia, regulador auto-ajustavel e controle dual.
Este capıtulo apresenta, em detalhes, o controle adaptativo por modelo de referencia e
o controle de funcao de distribuicao de probabilidade. No controle adaptativo, duas das
principais estrategias de controle sao apresentados, os metodos MIT e de Lyapunov. No
controle de PDF, a identificacao do processo e realizada por uma rede neural B-spline.
O Capıtulo 5 apresenta um novo modelo de dinamica de populacoes que descreve o
comportamento da frequencia genica e da diversidade de populacoes em relacao a um gene.
Esse modelo leva em consideracao os principais fatores evolutivos, a saber, cruzamento,
6
mutacao e selecao. Com o modelo de dinamica de populacoes proposto e possıvel realizar
previsoes e analisar o impacto que fatores evolutivos causam na diversidade da populacao.
O Capıtulo 6 apresenta duas propostas de controle da diversidade de algoritmos evo-
lucionarios, a primeira utilizando o controle adaptativo por modelo de referencia e a
segunda utilizando o controle da PDF da diversidade. As propostas incluem tres mo-
delos de referencia, um modelo de processo evolucionario e duas estrategias de controle.
No metodo baseado no controle adaptativo, a pressao de selecao e a taxa de mutacao
sao utilizadas como sinal de controle. A estrategia de controle visa ajustar a entrada
do processo e os parametros do controlador para aproximar a diversidade da populacao
da saıda do modelo de referencia. No controle de PDF, a taxa de mutacao e o sinal de
controle e a estrategia de controle ajusta esse sinal com o objetivo de aproximar a PDF
da diversidade da populacao de uma PDF de referencia.
O Capıtulo 7 apresenta 26 experimentos onde os metodos propostos, DRAC e PDFEA,
foram testados e analisados. Investigou-se o comportamento do modelo de referencia,
a capacidade de rastreamento pelo sistema de controle e o desempenho dos metodos
propostos em relacao a um algoritmo genetico padrao e seis algoritmos evolucionarios
adaptativos.
O Capıtulo 8 apresenta as contribuicoes desta tese, conclusoes e sugestoes para tra-
balhos futuros.
7
CAPITULO 2
ALGORITMOS EVOLUCIONARIOS ADAPTATIVOS
2.1 INTRODUCAO
Os algoritmos evolucionarios (AEs) possuem quatro paradigmas principais, a saber, al-
goritmos geneticos (GOLDBERG, 1989), estrategias evolutivas (SCHWEFEL, 1995), pro-
gramacao evolucionaria (FOGEL, 1995) e programacao genetica (KOZA, 1992). Em todos
esses paradigmas, a resolucao do problema e baseada na teoria da evolucao de Darwin
(2004). Inicialmente, um conjunto de solucoes e gerado aleatoriamente, onde cada solucao
e um indivıduo, a qualidade da solucao e a aptidao do indivıduo, o conjunto de solucoes e
uma populacao e o espaco de solucoes e o meio ambiente. Iterativamente, novas solucoes
sao criadas a partir das existentes, via operadores evolucionarios. As piores solucoes,
menos “adaptadas” ao ambiente, tendem a ser eliminadas ao longo do processo evolu-
cionario. Assim, as solucoes melhores tendem a prevalecer, como no processo de evolucao
natural das especies. Nos AEs, o que torna uma solucao melhor ou pior e o valor de sua
aptidao segundo uma ou mais metricas. A probabilidade de um indivıduo transmitir suas
caracterısticas para as proximas geracoes e tambem influenciada pela sua aptidao.
Um algoritmo evolucionario, assim como qualquer metodo de busca, possui parametros
cujos valores tem influencia direta no desempenho do processo de busca. Alguns exemplos
desses parametros sao as probabilidades de cruzamento e mutacao, o tipo de operador de
cruzamento, o tamanho da populacao. Escolher valores para tais parametros, que a priori
nao tem nenhuma ligacao com o ambiente, e uma tarefa nao trivial e muitos esforcos tem
sido despendidos para encontrar algoritmos e heurısticas que possam faze-lo.
Basicamente, existem duas formas de determinar os valores dos parametros de um
algoritmo evolucionario, por ajuste previo ou controle de parametros. No ajuste previo,
os valores dos parametros sao determinados antes do inıcio do processo evolucionario. O
problema dessa abordagem e o fato de, na maioria das vezes, nao se conhecer as carac-
terısticas e o comportamento do ambiente no qual tenta-se chegar a uma solucao. Por
melhor que sejam as tecnicas utilizadas, os ajustes previos dos parametros nao estao rela-
cionados com os caminhos percorridos durante o processo de busca. Em outras palavras,
8
ao longo do processo de busca as condicoes do ambiente podem nao ser as mesmas das
iniciais. Assim, pode ser necessario alterar os valores dos parametros por estes nao esta-
rem adequados as condicoes atuais do processo. Por exemplo, em regioes de otimos locais
ou em estados de baixa diversidade pode ser prominente aumentar a taxa de mutacao.
No controle de parametros, os valores sao ajustados durante o processo evolucionario.
Assim, os parametros podem ser ajustados em funcao de uma estrategia pre-definida ou
em conformidade com os caminhos percorridos pelo algoritmo de busca, de acordo com os
resultados que estes proporcionaram. Encontrar uma estrategia que ajuste os parametros
durante o processo de busca e uma das areas de pesquisa mais atrativa da computacao
evolucionaria.
Muitos autores ja abordaram o problema do controle de parametros na computacao
evolucionaria (EIBEN et al., 1999; ANGELINE, 1995; HINTERDING et al., 1997; SMITH;
FOGARTY, 1997). Eiben et al. (1999) elaboraram uma discussao sobre o controle de
parametros, mostrando sua superioridade em relacao ao ajuste previo. Nesta tese de
doutorado, foram apresentados argumentos que mostram ser inapropriado, em muitas
situacoes, o uso de parametros fixos. As formas de controle de parametros foram classi-
ficadas em funcao do tipo de mecanismo de ajuste, a saber, determinısticos, adaptativos
ou auto-adaptativos.
Os metodos determinısticos modificam os parametros deterministicamente sem uti-
lizar nenhuma informacao do ambiente durante o processo evolucionario. Os metodos
adaptativos utilizam informacoes do ambiente para determinar a direcao ou a magnitude
das mudancas dos parametros. Nos metodos auto-adaptativos, os parametros sao co-
dificados no genotipo do indivıduo e submetidos ao processo evolucionario. A favor da
adaptacao existe a importancia de se interagir com o meio, que pode fornecer informacoes
importantes sobre a qualidade do caminho da busca, direcionando-a para regioes mais
promissoras. As informacoes colhidas do ambiente tambem podem ajudar a compreender
melhor o problema.
Outros autores promovem formas diferentes de classificar os metodos de controle de
parametros. Angeline (1995) classificou as formas de controle de parametros baseado
em nıveis de ajuste, a saber, da populacao, do indivıduo e do componente. Ao nıvel da
populacao, os parametros sao ajustados de forma a produzirem efeitos globais na po-
pulacao. Ao nıvel do indivıduo, as modificacoes sao feitas em cada indivıduo, porem,
aplicadas uniformemente aos seus componentes ou genes. Ao nıvel do componente, os
metodos determinam como cada componente ou gene do indivıduo deve sofrer as al-
9
teracoes. Hinterding et al. (1997) considerou mais um nıvel de adaptacao: do ambiente,
onde a resposta do ambiente para o indivıduo varia. Por exemplo, quando a funcao de ap-
tidao e uma soma ponderada e seus pesos variam, assim como a aptidao de um indivıduo
varia, em resposta a determinadas consideracoes.
Uma outra importante justificativa para o ajuste de parametros de fatores evolu-
cionarios e a manutencao ou controle da diversidade da populacao. Varios autores ja
trataram esse tema com ajustes de parametros (SHIMODAIRA, 2001; URSEM et al., 2002;
YANG; TINOS, 2007; SIMOES; COSTA, 2002b; COBB, 1990; GREFENSTETTE, 1992; WONG
et al., 2003). A perda da diversidade em populacoes finitas, sem migracao e com baixa
taxa de mutacao e iminente apos sucessivas geracoes. Mesmo com selecao aleatoria, sem
pressao de selecao, ha perda de diversidade em populacoes finitas em decorrencia da de-
riva genetica. Em um algoritmo evolucionario, essa perda reduz as regioes exploradas,
contrapondo uma de suas principais vantagens, a busca simultanea em varias regioes do
espaco de solucoes. O algoritmo genetico padrao (AGP), sem ajuste previo de parametros
ou durante o processo evolucionario, tem uma perda de diversidade natural que resulta
em convergencia prematura, isto e, toda a populacao se concentra em uma regiao do
espaco de solucoes. Essa caracterıstica praticamente inviabiliza a utilizacao de AGPs
em problemas complexos, e.g., multimodais e dinamicos, cujo ajuste de parametros de
fatores evolucionarios e quase imprescindıvel.
Este capıtulo descreve e analisa criticamente varios metodos de controle de parametros,
mostrando que na maioria das vezes os mesmos levam significativa vantagem sobre os
metodos de ajuste previo. Os metodos de controle de parametros sao apresentados con-
forme o mecanismo de ajuste. As proximas secoes apresentam tres metodos de controle
de parametros, a saber, o determinıstico, na Secao 2.2, o adaptativo, na Secao 2.3, e o
auto-adaptativo, na Secao 2.4. Na sequencia, a Secao 2.5 apresenta alguns trabalhos que
tratam o problema da manutencao da diversidade, na Subsecao 2.5.1, e o controle da
diversidade, na Subsecao 2.5.2, utilizando metodos de controle de parametros. A Secao
2.6 apresenta as discussoes finais.
2.2 CONTROLE DE PARAMETROS DETERMINISTICO
Os metodos de controle de parametros determinısticos modificam os parametros, normal-
mente, em funcao das geracoes, sem utilizar nenhum retorno do processo evolucionario.
Em um exemplo tıpico de controle de parametros determinıstico, Hinterding et al. (1997)
10
definiu a taxa de mutacao como
pm(k) = 0.5− 0.3k
K, (2.1)
sendo pm a probabilidade ou taxa de mutacao, k a geracao atual e K o numero maximo
de geracoes. Neste caso, a taxa de mutacao decresce de 0.5 ate 0.2, na ultima geracao. O
ajuste de pm e determinıstico, pois nao ha nenhuma informacao do processo evolucionario,
como, por exemplo, o numero de geracoes que a aptidao media da populacao nao melhora.
A Equacao 2.1 e monotonica, o que pode nao ser desejavel quando, por exemplo, a
diversidade da populacao diminui muito. A desvantagem dessa forma de ajuste e que a
taxa de mutacao da Equacao 2.1 nao se relaciona com o problema ou com atributos da
populacao, como sua aptidao media.
Em outro exemplo de controle determinıstico, Back e Schutz (1996) apresentaram
um metodo de ajuste da taxa de mutacao na forma hiperbolica, tambem em funcao das
geracoes, como segue
pm(k) =
(2 +
L− 2
K − 1× k
)−1
, (2.2)sendo L o numero de genes do indivıduo. Esse metodo determinıstico obteve melhor
desempenho em relacao a um modelo auto-adaptativo, proposto no mesmo trabalho, e a
um AGP com taxa de mutacao fixa igual a 1/L.
Droste et al. (2001) criaram um metodo, com representacao binaria1, que ajusta a
taxa de mutacao de acordo com a regra
pm(k) =
{1/L, se pm(k) > 0.5
2 pm(k − 1), caso contrario.(2.3)
Esse algoritmo produz uma taxa de mutacao ciclicamente crescente no intervalo [1/L, 0.5].
Os autores mostraram que o controle dinamico da taxa de mutacao aumenta a velocidade
de convergencia do AE em relacao ao valor mais recomendado para uma taxa de mutacao,
i.e., pm = 1/L.
Thierens (2002) propos um metodo determinıstico inspirado no algoritmo de aprendi-
zagem de Manhattan (KUSHNER; CLARK, 1978), de origem estocastica2, utilizando uma
1Na representacao binaria, as variaveis de decisao do problema sao codificadas no genotipo do in-
divıduo por numeros binarios2Os algoritmos de aprendizagem estocasticos estimam parametros otimos para seus respectivos mo-
delos.
11
taxa de mutacao pm(k) e tres novos indivıduos gerados a partir das taxas de mutacao
pm(k), ωpm(k) e pm(k)/ω, sendo ω uma constante denominada fator de exploracao3.
Thierens utilizou a seguinte regra para executar a aprendizagem de Manhattan:
1. Mutar o indivıduo x das seguintes tres formas:
M(x, pm/ω)→ {x1, pm/λ}
M(x, pm)→ {x2, pm}
M(x, ω pm)→ {x3, λ pm}
2. Selecionar o indivıduo com melhor aptidao dentre
{x, pm}, {x1, pm/λ}, {x2, pm} e {x3, λ pm}
sendo xi, i = 1, 2, 3, o indivıduo mutado a partir de x, λ uma constante denominada
fator de aprendizagem e M(·, ·) uma regra de mutacao, que gera tres novos indivıduos
utilizando uma dentre as taxas de mutacao pm/ω, pm e ω pm. Selecionando sucessivamente
pares { x, pm }, pretende-se alcancar uma taxa de mutacao que tende a gerar indivıduos
melhores. A proporcao que a taxa de mutacao se modifica e determinada pelo fator de
aprendizagem, λ.
A maior vantagem do controle de parametros determinıstico e a sua simplicidade de
implementacao e seu baixo custo computacional. No entanto, em problemas complexos
uma estrategia de ajuste pre-definida, sem interacao com o ambiente, pode nao alcancar
os melhores resultados. Por exemplo, em um problema dinamico, apos a mudanca do
ambiente, pode ser recomendado que a taxa de mutacao aumente por um determinado
perıodo, o que nao e possıvel no controle de parametros determinıstico.
2.3 CONTROLE DE PARAMETROS ADAPTATIVO
Os metodos adaptativos tem um retorno do processo evolucionario para determinar a
direcao ou a magnitude das mudancas dos parametros. A regra de 1/5 de sucesso (RE-
CHENBERG, 1973) para ajuste da taxa de mutacao e um dos principais exemplos de
metodo adaptativo. O mecanismo de ajuste funciona da seguinte forma: se nas n ultimas
geracoes houve sucesso4 em mais de 1/5 das mutacoes, entao a taxa de mutacao sera
3O coeficiente ω determina o grau de variacao do indivıduo, modulando a sua exploracao na superfıcie
de busca. Por essa razao o nome fator de exploracao.4Entende-se como sucesso quando a mutacao melhora a aptidao media da populacao.
12
aumentada; caso contrario, sera diminuıda. Portanto, a regra de 1/5 de sucesso interage
com o ambiente, modificando a taxa de mutacao, a cada n geracoes.
Em outro exemplo de controle adaptativo, Davis (1989) criou um metodo baseado
no desempenho dos operadores do processo evolucionario. O metodo promove alteracoes
nas probabilidades dos operadores baseado nas aptidoes dos descendentes. Assim, os
operadores que geram filhos melhores tem maior probabilidade de atuarem no futuro.
Back (1993) apresentou um estudo sobre taxas de mutacao fixa e adaptavel, com
AGs binarios, utilizando ambientes distintos. Em ambientes unimodais, os resultados
mostraram que uma taxa de mutacao fixa igual a 1/L pode alcancar resultados satis-
fatorios e que taxas de mutacao que decaem a partir deste valor nao aceleram a busca
significativamente. No entanto, para ambientes multimodais, o estudo mostrou que uma
taxa de mutacao adaptavel pode contribuir para que os indivıduos escapem de otimos
locais. Na versao adaptativa, a taxa de mutacao e inversamente proporcional a aptidao
do indivıduo. A ideia e produzir grandes alteracoes em indivıduos com baixa aptidao
e pequenas alteracoes em indivıduos com alta aptidao — beneficiando a explotacao. A
suposicao de produzir pequenas alteracoes em indivıduos com alta aptidao pode ser uma
desvantagem em um problema onde nao se conheca o valor do otimo global ou que pos-
sua otimos locais cujos valores da funcao de aptidao sao elevados. Nesse ultimo caso,
os indivıduos terao dificuldades de escapar de otimos locais cujos valores da funcao de
aptidao sejam elevados, pois suas taxas de mutacao serao baixas.
Lee e Takagi (1993) utilizaram a logica nebulosa para ajustar tres parametros dos al-
goritmos geneticos, a saber, o tamanho da populacao e as taxas de cruzamento e mutacao.
As mudancas dos parametros sao baseadas no desempenho da populacao a cada geracao,
considerando as piores e melhores aptidoes, a aptidao media e sua variacao desde a ultima
acao de controle. Lee e Takagi tiveram como objetivos, alem da aplicacao da logica nebu-
losa nos algoritmos evolucionarios, entender melhor a relacao do controle de parametros
e melhorar o seu desempenho.
O sistema nebuloso, baseado em regras, possui uma base de conhecimento que ne-
cessita de informacoes previas do ambiente. As dificuldades nesse tipo de sistema sao
a necessidade de haver um especialista para modelagem da base de conhecimento e a
aquisicao de informacoes do ambiente quando estas sao imprecisas ou mesmo inexisten-
tes. O ponto chave na abordagem de Lee e Takagi e a elaboracao de um metodo que
projeta, automaticamente, o sistema nebuloso. Outra desvantagem e o onus computaci-
onal causado pela decisao baseada em regras para ajustes dos parametros. Entretanto,
13
segundo os autores, em problemas onde a funcao de aptidao tem alta complexidade, o
tempo de inferencia em comparacao ao tempo total de processamento nao e significativo.
Corne et al. (1994) consideraram as estatısticas de desempenho dos descendentes ge-
rados por varios operadores no problema da construcao de grade horaria semanal. Perio-
dicamente, os operadores que geraram indivıduos mais aptos sao tem suas probabilidades
de aplicacao aumentadas, enquanto que os operadores que geraram indivıduos menos
aptos tem suas probabilidades diminuıdas.
Sebag e Schoenauer (1994) construıram um banco de dados de operadores de cru-
zamento usados no inıcio do processo evolucionario. Esses operadores sao classificados
como ruins ou bons de acordo com as aptidoes dos descendentes (i.e., operadores que
geram descendentes com baixas aptidoes sao rotulados como ruins, e vice-versa). Atraves
de um controle adaptativo, a ideia e prevenir que operadores de cruzamento inadequados
quebrem sequencias de genes promissoras. Primeiramente, decorre-se um processo darwi-
niano convencional, que tem como objetivo armazenar informacao em uma base de dados.
Em seguida, os cruzamentos sao observados e um conjunto de regras para classificacao
dos cruzamentos e construıdo por aprendizagem indutiva — com atualizacoes periodicas.
Na fase seguinte, ja utilizando o controle adaptativo, os cruzamentos classificados como
ruins sao recusados. A existencia de um direcionamento na operacao de cruzamento pode
acelerar o processo evolucionario com uma maior explotacao. No entanto, para montagem
das regras pela aprendizagem indutiva e necessario conhecimento previo do problema.
S.-Voosen e Muhlenbein (1994) dividiram a populacao em sub-populacoes para ajuste
da taxa de mutacao. Na abordagem proposta, o numero de indivıduos da populacao
se mantem fixo, variando o tamanho das sub-populacoes conforme a aptidao do me-
lhor indivıduo da sub-populacao. As sub-populacoes competem pelos mesmos recursos,
de forma que as mais aptas crescem (recebem indivıduos de outras sub-populacoes), e
vice-versa. As competicoes entre sub-populacoes se mostram eficientes e robustas, pois
podem utilizar diferentes estrategias, favorecendo aquelas com parametros e estrategias
mais adequados. Em outro trabalho, S.-Voosen e Muhlenbein (1996) elaboraram uma
metodologia mais abrangente, variando tambem o tamanho da populacao.
A divisao da populacao, alem de favorecer o uso de diferentes estrategias ao mesmo
tempo, sugere a utilizacao de computacao paralela — por exemplo, cada sub-populacao
pode ser conduzida por um processador ou nodo de um cluster. A implementacao pa-
ralela pode aumentar a velocidade de convergencia, pois permite buscas simultaneas em
espacos de solucoes diferentes. Lis (1996) propos uma taxa de mutacao dinamica, uti-
14
lizando o paradigma da programacao paralela. Nesta abordagem, o processador mestre
gera a populacao inicial e a distribui entre os processadores escravos, formando as sub-
populacoes. Cada processador escravo executa sua propria estrategia durante um tempo
denominado epoca ou perıodo de migracao. A cada final de epoca, o processador mestre
avalia os melhores indivıduos, recalcula a taxa de mutacao, monta uma nova populacao e
a distribui novamente aos processadores escravos. Lis determinou um conjunto de nıveis
escalonados de taxa de mutacao, quanto maior o nıvel, maior a taxa de mutacao. Durante
uma epoca, os processadores escravos executam o algoritmo genetico sequencial com suas
respectivas taxas de mutacao. Os ajustes das taxas de mutacao sao feitas como segue:� Se a maior aptidao for de um indivıduo da sub-populacao com a maior taxa de
mutacao, entao as taxas de mutacao de todas as sub-populacoes dos processadores
escravos serao aumentadas em um nıvel.� Senao, se a maior aptidao for de um indivıduo da sub-populacao com a menor taxa
de mutacao, entao as taxas de mutacao de todas as sub-populacoes serao diminuıdas
em um nıvel.� Senao, se a maior aptidao for de um indivıduo de uma sub-populacao com taxa de
mutacao intermediaria, entao nao serao alteradas as taxas de mutacao.
O princıpio do metodo de Lis induzir um aumento ou diminuicao da taxa de mutacao
em funcao do desempenho da sub-populacao com o indivıduo mais apto. Assim, supoe-se
que o nıvel da taxa de mutacao dessa sub-populacao e o mais apropriado para a epoca
atual.
Spears (1995) criou uma forma de adaptacao em que se os dois ultimos bits dos pais
forem iguais a 1, o cruzamento sera uniforme; se os dois ultimos bits forem iguais a 0,
o cruzamento sera de 2-pontos; se os bits forem diferentes, o cruzamento sera escolhido
aleatoriamente. No decorrer das geracoes, a predominancia de um determinado bit pode
significar que seu tipo de cruzamento correspondente esta gerando indivıduos mais aptos.
Um dos principais recursos dos algoritmos evolucionarios e a capacidade de escapar de
otimos locais, pois a taxa da mutacao elevada pode dispersar parte da populacao “presa”
em otimos locais. A Figura 2.1 (SRINIVAS; PATNAIK, 1994) mostra a tendencia de toda
a populacao convergir para uma regiao especıfica do espaco de solucoes. A concentracao
nessa regiao pode ser refletida na diferenca entre a maior aptidao e a aptidao media da
populacao, fmax − f . A medida que os indivıduos convergem para uma regiao de otimo
15
local ou global, a aptidao media tende a crescer e a diferenca fmax− f diminuir. A Figura
2.1 mostra uma regiao de maximo local, com maior aptidao igual a 0.5 (no maximo global,
a funcao de aptidao e igual a 1.0).
Figura 2.1 Diversidade da populacao vista por fmax − f (SRINIVAS; PATNAIK, 1994).
Srinivas e Patnaik apresentaram uma forma adaptativa para evitar a convergencia
em otimos locais. No metodo, as taxas de cruzamento e mutacao variam em funcao da
diferenca fmax − f . Essas formas de adaptacao foram definidas como segue
pc =k1
fmax − f(2.4)
e
pm =k2
fmax − f(2.5)
para as taxas de cruzamento e mutacao, respectivamente, sendo k1 e k2 constantes pre-
viamente definidas. Uma desvantagem desse modo de adaptacao e que ao convergir para
o otimo global, a populacao tem o mesmo espalhamento caso nao se conheca a aptidao
maxima.
Srinivas e Patnaik tambem sugerem um outro controle adaptativo para ajustes das
taxas de cruzamento e mutacao, que variam em funcao da aptidao do proprio indivıduo,
definidas como
pc = k1fmax − f
′
fmax − f(2.6)
16
e
pm = k2fmax − f
fmax − f, (2.7)
sendo f ′ a maior aptidao entre os indivıduos selecionados para o cruzamento e f a ap-
tidao do indivıduo a ser mutado. Dessa forma, aptidoes baixas, tanto para cruzamento
quanto para mutacao, elevam as taxas das Equacoes 2.6 e 2.7, possibilitando que os no-
vos indivıduos sofram grandes alteracoes e, assim, pesquisem novas regioes do espaco de
busca. Quando f ou f ′ atinge valores proximos de fmax, as taxas cruzamento e mutacao
decrescem. A desvantagem do metodo de Srinivas e Patnaik e que nas primeiras geracoes
os indivıduos com melhores aptidoes tem taxas de cruzamento e mutacao baixas — o que
pode ser desejavel, pois nessas primeiras geracoes esses indivıduos podem estar distantes
do otimo global.
Existem diferencas basicas entre as abordagens (i) da Figura 2.1, sem nenhuma
adaptacao, (ii) das Equacoes 2.4 e 2.5 e (iii) das Equacoes 2.6 e 2.7. Na abordagem
(i), ha uma tendencia a rapida convergencia para otimos locais, sem nenhuma acao para
reverter esta situacao. Na abordagem (ii), o disturbio causado pelas taxas das Equacoes2.4 e 2.5 pode impedir que a populacao convirja para o otimo global. Na abordagem (iii),
as Equacoes 2.6 e 2.7 produzem poucas perturbacoes nos indivıduos proximos as regioes
otimas, mas tende a modificar significativamente indivıduos com aptidao baixa. Essa e
a razao principal de nao ocorrer a convergencia prematura da abordagem (iii), enquanto
que na abordagem (i), os indivıduos com baixa aptidao sao eliminados ou convergem
prematuramente para regioes de otimos locais proximas.
Arabas et al. (1994) discutiram dois fatores importantes no processo evolucionario,
o tamanho da populacao e o mecanismo de selecao. O tamanho da populacao tem im-
portancia decisiva no processo evolucionario. Uma populacao pequena, geralmente, con-
duz o processo a uma convergencia prematura. Por outro lado, uma populacao grande
causa muito esforco computacional. O mecanismo de selecao tambem tem influencia di-
reta na convergencia. Se a pressao de selecao for muito grande, a diversidade da populacao
tende a diminuir. Por outro lado, uma pressao pequena torna a busca ineficaz. Tanto a
diversidade quanto a pressao da selecao sao influenciadas pelo tamanho da populacao.
No trabalho de Arabas et al., o tamanho da populacao e variavel e nao ha selecao
direta. O objetivo de variar o tamanho da populacao e tentar encontrar seu valor otimo
nos diferentes estagios do processo evolucionario. Em substituicao a selecao, os autores
17
criaram o parametro tempo de vida, proporcional a aptidao, que determina o numero
de geracoes que um indivıduo permanece na populacao. Assim, os indivıduos com me-
lhores aptidoes permanecem mais tempo no processo, e vice-versa, como no processo
evolucionario biologico.
O metodo de Arabas et al. promove uma pressao de selecao mais suave, pois tambem
pune os indivıduos com aptidoes menores. Os indivıduos menos aptos tem um tempo de-
terminado para melhorarem suas aptidoes. Em um processo evolucionario com pressao de
selecao convencional, os indivıduos menos aptos tendem a serem eliminados em geracoes
sucessivas. Nas primeiras geracoes do metodo de Arabas et al., a populacao cresce ate
que os primeiros indivıduos, com menor tempo de vida, comecem a ser eliminados. O
parametro tempo de vida tende a adequar o tamanho da populacao a regiao onde ela se
encontra. Por exemplo, em uma regiao nao promissora a maioria dos indivıduos tem ap-
tidoes baixas; consequentemente, muitos indivıduos tendem a serem excluıdos mais cedo
— diminuindo a populacao. Em uma regiao promissora, os indivıduos sobrevivem por
mais tempo — aumentando a populacao. Assim, em regioes mais promissoras um numero
maior de indivıduos busca as melhores solucoes. Os resultados obtidos pelo metodo de
Arabas et al. mostraram-se promissores; no entanto, a escolha de uma estrategia otima
para o calculo do parametro tempo de vida e, ainda, um problema em aberto.
O controle de parametros adaptativo tem a vantagem de interagir com o ambiente,
o que pode representar uma vantagem sobre o controle determinıstico. Entretanto, o
controle adaptativo possui um custo computacional maior em relacao ao determinıstico.
Esse custo pode ser minimizado se os ajustes ocorrerem ao nıvel da populacao, como,
por exemplo, os metodos de Rechenberg (1973), Ochoa et al. (2000), Eldridge (2002) e
Srinivas e Patnaik (1994).
2.4 CONTROLE DE PARAMETROS AUTO-ADAPTATIVO
Os metodos auto-adaptativos utilizam o princıpio da evolucao nos proprios parametros,
que sao codificados nos indivıduos e passam por todos os processos evolucionarios —
selecao, cruzamento e mutacao. Por exemplo, um indivıduo com L genes no AGP, re-
presentativos de sua caracterıstica, passa a ter L+ 1 genes no controle auto-adaptativo,
sendo o gene adicional um parametro de fatores evolutivos, como a taxa de mutacao
ou cruzamento, o tipo de operador de cruzamento, dentre outros. Assim, o parametro
adicionado ao indivıduo sofrera todos os efeitos da evolucao.
18
Spears (1995) utilizou uma forma auto-adaptativa para controlar o cruzamento. A
decisao de qual tipo de operador utilizar e tomada adicionando um gene do cruzamento
no indivıduo, onde 1 representa o cruzamento uniforme e 0 o cruzamento de 2-pontos.
Duas formas auto-adaptativas sao possıveis para a tomada de decisao. Na primeira,
denominada local, a decisao depende dos dois indivıduos escolhidos para o cruzamento, se
ambos tem o gene do cruzamento iguais, realiza-se o cruzamento correspondente ao valor
do gene; se os genes forem diferentes, determina-se o tipo de cruzamento aleatoriamente.
Na segunda forma, denominada global, o operador de cruzamento e escolhido conforme a
populacao como um todo. Por exemplo, se em 75% da populacao o gene do cruzamento
for 1, entao o cruzamento uniforme sera usado em 75% dos cruzamentos e o cruzamento de
2-pontos em 25% deles. A ideia geral do metodo de Spears e a decisao de qual operador
de cruzamento utilizar esta relacionada com a maioria, local ou global, supondo que
determinado tipo de cruzamento gerou indivıduos mais bem adaptados.
Outros metodos auto-adaptativos podem ser vistos nos trabalhos de Back (1996),
Fogel et al. (1991), Fogel (1995) e Schwefel (1995). Por exemplo, a mutacao do j-esimo
gene do i-esimo indivıduo de uma populacao pode ser processada como segue
g′ij = gij + σj N(0, 1), (2.8)sendo σj o parametro de adaptacao ou tamanho do passo sobre o espaco de solucoes e
N(0, 1) uma variavel aleatoria gerada a partir de uma funcao de distribuicao normal com
media 0 e desvio padrao 1. No metodo de Schwefel (1995), o parametro de adaptacao e
modificado pela funcao da distribuicao log-normal
σ′
j = σj exp(τ ′N(0, 1) + τ Nj(0, 1)), (2.9)sendo τ e τ ′ as taxas de aprendizagem. No trabalho de Fogel (1995), o parametro de
adaptacao e modificado pela funcao de distribuicao normal
σ′
j = σj + ζ σj N(0, 1), (2.10)sendo ζ uma constante. As Equacoes 2.9 e 2.10 introduzem ruıdo no parametro de
adaptacao, criando solucoes na direcao onde houveram melhorias de indivıduos anteces-
sores (ANGELINE, 1995).
No trabalho de Back (1992), os indivıduos possuem L taxas de mutacao codificadas em
seus genotipos. Assim, cada variavel de decisao possui sua propria taxa de mutacao. Para
19
os problemas unimodais estudados, o metodo com uma taxa de mutacao por indivıduo
(nıvel do indivıduo) com selecao preservativa teve sempre o melhor desempenho. Ja
nos problemas multimodais, o metodo com N taxas de mutacao por indivıduo (nıvel
do componente) com selecao preservativa teve o melhor desempenho. Esses resultados
sugerem que problemas mais complexos necessitam de ajustes mais refinados de suas
variaveis de decisao.
Maley (1997) acrescentou um gene ao genotipo do indivıduo correspondente a taxa
de mutacao, pm ∈ [0, 100], do seu descendente. No metodo de Maley, nao ha reproducao
sexuada, os genes dos pais sao copiados para seus descendentes e entao sofrem dois tipos
de mutacao, uma para o gene taxa de mutacao e outra para os genes-atributo5. O gene
que representa a taxa de mutacao do descendente difere aleatoriamente do gene do pai
em funcao de uma distribuicao de Poisson, com λ = 5, centrada no gene do pai, como
segue
(λx+λ−p) e−λ
(x+ λ− p)!, (2.11)
sendo p o gene do pai transmitido ao descendente e x e o valor em potencial do gene do
descendente. A mutacao dos genes-atributo depende do gene do pai, p, que representa a
taxa de mutacao, resultando
λ = (p
50)3, (2.12)
com λ ∈ [0, 8] usado na distribuicao de Poisson. A variavel λ e o numero medio de bits
que sao mutados nos descendentes durante a reproducao.
Os metodos auto-adaptativos, na maioria dos casos, nao necessitam de uma estrategia
explıcita de ajuste. A ideia principal e que os parametros evoluam com os indivıduos.
Se um indivıduo possuir um parametro com valor inadequado, este tendera a ter uma
baixa aptidao, e vice-versa. O custo computacional, geralmente, nao e muito elevado,
pois apenas acrescenta-se alguns genes nos indivıduos. A principal vantagem do controle
auto-adaptativo, a independencia de uma estrategia de ajuste, pode tambem ser uma des-
vantagem, pois na falta de uma interacao com o ambiente a evolucao da populacao pode
ser mais lenta em relacao aos metodos apresentados nas secoes anteriores, principalmente
o adaptativo.
5Genes que representam apenas as caracterısticas do indivıduo.
20
2.5 ADAPTACAO PARA MANUTENCAO OU CONTROLE DA DIVERSIDADE
Nos algoritmos evolucionarios, conservar a diversidade da populacao ou minimizar a sua
perda pode beneficiar o processo evolucionario de diversas formas, como, por exemplo,
prevenindo a convergencia prematura da populacao, alocando a populacao em solucoes
otimas distintas de Pareto em problemas multiobjetivo ou permitindo que a populacao se
adapte rapidamente as mudancas do ambiente em problemas dinamicos. A convergencia
prematura, na maioria das vezes, pode levar o AE a um resultado sub-otimo, isto e,
convergir a populacao em otimos locais. Encontrar varias solucoes na fronteira de Pareto
significa ter mais opcoes quando a solucao otima de Pareto nao for encontrada. Em
problemas dinamicos, uma populacao bem distribuıda no espaco de solucoes pode evitar
a reinicializacao dos indivıduos depois de uma mudanca do ambiente.
Os metodos de controle de parametros que objetivam a preservacao da diversidade
podem ser divididos em dois paradigmas: manutencao e controle da diversidade. Os
metodos de manutencao da diversidade utilizam estrategias que atenuam sua perda (BUI
et al., 2005; HERRERA et al., 1997; HERRERA; LOZANO, 2000; SIMOES; COSTA, 2002a;
WONG et al., 2003). Os metodos de controle de diversidade tem um valor ou faixa de
diversidade determinada (MEIYI et al., 2004; NGUYEN; WONG, 2003; URSEM et al., 2002).
Assim, as estrategias de controle da diversidade tem como objetivo minimizar a diferenca
entre as diversidades da populacao e a determinada. A diferenca de filosofia entre os
metodos de manutencao e controle da diversidade e a existencia de um valor ou faixa
de diversidade determinada nos ultimos. As duas proximas subsecoes apresentam alguns
desses metodos.
2.5.1 Manutencao da Diversidade
A maioria dos metodos que tratam a diversidade da populacao procuram evitar sua
perda sem estabelecer um valor mınimo desejado. Simoes e Costa (2002b) utilizaram um
ambiente dinamico para fazer um estudo comparativo entre quatro diferentes metodos
de manutencao da diversidade. Os ajustes dos parametros impedem o rapido decaimento
da diversidade, resultado da convergencia prematura. Os metodos utilizados foram o
algoritmo genetico baseado na transmutacao (AGT) (SIMOES; COSTA, 2001), o AGT
melhorado (AGTM) (SIMOES; COSTA, 2002a), o algoritmo genetico com hiper-mutacao
gatilhada (THM) (COBB, 1990) e o algoritmo genetico com imigracao aleatoria (AGIA)
(GREFENSTETTE, 1992).
21
Os dois primeiros metodos, AGT (SIMOES; COSTA, 2001) e AGTM (SIMOES; COSTA,
2002a), baseiam-se no princıpio biologico da transmutacao genetica, que modifica uma
bacteria ao capturar o DNA (do ingles, desoxyribonucleic acid) de celulas inimigas, ad-
quirindo parte de seu codigo genetico. Basicamente, os metodos AGT e AGTM possuem
um reservatorio de segmentos de genes de tamanhos variados, que podem chegar ao ta-
manho de um indivıduo. A cada geracao, os indivıduos selecionados para a transmutacao
sao modificados pelos seguimentos de genes do reservatorio. A diferenca entre os metodos
AGT e AGTM e que o segundo ajusta adequadamente alguns parametros do algoritmo
de modo a melhorar o seu desempenho. Simoes e Costa realizaram estudos parametricos
para obter valores adequados para os quatro parametros: tamanho do seguimento de
genes, taxas de reposicao, mutacao e transmutacao (SIMOES; COSTA, 2002a).
O metodo THM ajusta a taxa de mutacao utilizando um valor base baixo quando o
algoritmo estiver estavel; elevando-o quando o algoritmo tiver seu desempenho degradado
(COBB, 1990). No trabalho de Simoes e Costa (2002b), o valor base para a taxa de
mutacao foi de 0.1, os aumentos da taxa de hiper-mutacao, quando o desempenho do
algoritmo degradava, foram de 10%, 20% e 30%. Os melhores resultados foram alcancados
com a taxa de hipermutacao igual a 10%.
Simoes e Costa testaram os quatro metodos em ambientes dinamicos que variaram
a ciclos de 15, 50, 100 e 200 geracoes. Os resultados mostraram que nas mudancas do
ambiente em ciclos maiores que 30, o metodo AGTM teve o melhor desempenho. Nas
mudancas em ciclos pequenos, o metodo THM teve o melhor desempenho. Observando
a diversidade em ciclos de 300 geracoes, o THM proporcionava baixa diversidade na
populacao nos finais de cada ciclo. Os autores concluıram, portanto, que o metodo AGTM
tem melhor desempenho quando o ambiente e dinamico, principalmente nas mudancas
do ambiente a ciclos maiores que 30 geracoes.
Wong et al. (2003) elaboraram um metodo para ajuste das taxas de cruzamento, pc,
e mutacao, pm, com o intuito de balancear exploracao e explotacao. O processo evolu-
cionario e dividido em dois perıodos: o primeiro utiliza pc e pm com valores aleatorios;
o segundo ajusta pc e pm de acordo com a melhoria das aptidoes obtidas no primeiro
perıodo. A diversidade da populacao e mantida adicionando uma “aptidao de diversi-
dade” a aptidao original do indivıduo. Assim, a diversidade da populacao influencia a
selecao dos sobreviventes de uma forma ponderada, isto e, existe um peso que balanceia
as aptidoes original e de diversidade na nova funcao de aptidao.
Shimodaira (2001) elaborou um metodo, com representacao binaria, para manutencao
22
da diversidade, denominado diversity control-oriented genetic algorithm (DCGA). Em
primeiro lugar, a populacao e agrupada em pares. Cada par e recombinado entre si e seus
descendentes mutados segundo uma probabilidade. Na sequencia, os filhos gerados se
juntam a populacao. A populacao emergente, de pais e filhos, e ordenada de acordo com
as aptidoes. Finalmente, a selecao de sobreviventes e feita de acordo com as seguintes
regras:
1. Os indivıduos duplicados, segundo a paridade de genes, sao eliminados;
2. Os indivıduos sao selecionados de acordo com a probabilidade
ps =
((1− c)
Hi
L+ c
)α, (2.13)
sendo Hi a distancia de Hamming do i-esimo indivıduo ate o indivıduo com melhor
aptidao, c e α, ambos ∈ [0.0, 1.0], sao parametros da taxa de selecao, ps;
3. Se o numero de indivıduos selecionados for menor que o tamanho da populacao
(que e fixo), entao o numero de indivıduos correspondente a esta diferenca e gerado
aleatoriamente.
O metodo de Shimodaira tem justificativas empıricas e teoricas para nao convergir
prematuramente. Os descendentes duplicados reduzem a diversidade, provocando con-
vergencia prematura. Assim, o cruzamento — sempre executado — e a taxa de mutacao
elevada tendem a produzir descendentes geneticamente mais distintos dos seus pais, ex-
plorando diferentes regioes do espaco de solucoes. A pressao de selecao e a diversidade
devem ser externamente controladas, pois o algoritmo evolucionario, por si so, nao pode
discernir um otimo local de um global. Se a pressao de selecao for alta, indivıduos com
melhor aptidao, geneticamente similares ao melhor indivıduo, tenderao a surgir em maior
quantidade causando convergencia prematura.
Shimodaira procurou resolver o problema da convergencia prematura reduzindo apro-
priadamente a pressao de selecao na vizinhanca do melhor indivıduo. A probabilidade
de selecao de sobreviventes, Equacao 2.13, estabelece um limiar entre a tendencia de
eliminar indivıduos proximos ao melhor indivıduo e a selecao de indivıduos distantes do
mesmo. Quanto maior esse limiar, maior a diversidade da populacao. Shimodaira ajusta
o limiar pelos valores de c e α, Equacao 2.13, baseado em tentativa e erro.
A pressao da selecao pode ser ajustada em funcao do problema. Por exemplo, para
ambientes com poucos otimos locais, a pressao de selecao, controlada por c e α, pode ser
23
maior do que em ambientes com muitos otimos locais. Essa relacao com o ambiente pode
alterar a velocidade de convergencia.
(HERRERA; LOZANO, 2000) elaboraram um metodo adaptativo para ajuste do in-
tervalo de mutacao em AE com genotipos com codificacao real, denominado two-loop
real-coded genetic algorithm (TRAM), que tende a aumentar a diversidade da populacao
depois de um intervalo sem progresso da aptidao media da populacao. Herrera e Lozano
basearam no princıpio em que o intervalo de mutacao, δ, pode ser:
1. muito grande, diminuindo as chances de convergencia para o otimo global, ou
2. muito pequeno, induzindo a convergencia prematura em um otimo local.
Herrera e Lozano criaram dois lacos: um interno para adaptar o passo de um operador
de mutacao; e um externo para adaptar o passo de um operador de mutacao usado para
re-iniciar um operador.
O laco interno executa o processo evolucionario usual (selecao, cruzamento e mutacao)
em um determinado numero de geracoes, Go, chamado tempo entre observacoes. Assim,
dependendo do progresso da aptidao media da populacao nessas Go geracoes, ajusta-
se o passo do operador de mutacao e calcula-se o novo valor de Go. O operador de
mutacao, denominado Mutacao(δ), executa a heurıstica: se x ∈ [a, b] for um gene a ser
mutado, entao o gene resultante da mutacao, x′, sera um numero aleatorio do intervalo
[x−δ(x−a), x+δ(b−x)]. Assim, quanto maior δ, maior podera ser a variacao produzida
em x.
Depois de Go geracoes, o parametro δ e adaptado pela seguinte heurıstica: “aumente
δ se houver progresso de f (aptidao media da populacao); ou diminua, caso contrario”.
O intervalo δ ∈ [δmin,∆], sendo δ calculado pelo laco externo. O laco interno termina
quando δ alcanca δmin, supondo que um otimo local ou o global foi alcancado (MAZA;
YURET, 1994). Para a adaptacao de δ, sao utilizadas duas variaveis, yes and no. Se
houver um progresso ou estabilidade no processo evolucionario (fold ≥ f , sendofold a
aptidao media da populacao na geracao anterior), entao for δ e multiplicada por 2yes; caso
contrario, δ e dividido por 2no. Assim, quando o processo de busca estiver estacionado
em um otimo local e evolucoes nao forem esperadas pela reducao do δ, a duracao do laco
interno nao sera longa. A Figura 2.2 mostra o pseudo-codigo do laco interno do algoritmo
TRAM.
O laco externo executa um operador de inicializacao, chamado Reinicializar(∆), que
executa o operador Mutacao(∆) em todos os genes dos indivıduos da populacao. O
24
Figura 2.2 Pseudo-codigo do laco interno do TRAM.
25
objetivo e manter um nıvel contınuo de exploracao no espaco de solucoes. Essa acao
tenta assegurar que um material genetico novo e promissor esteja disponıvel na populacao
para ser tratado pelo laco interno. O laco externo adapta o parametro ∆, utilizando
informacoes obtidas depois da execucao do laco interno, pela heurıstica: “diminuir ∆
dividindo-o por 2 se for observado um progresso em f+ (melhor aptidao da populacao);
ou aumentar ∆ multiplicando-o por 2; caso contrario”. O novo valor de ∆ sera o primeiro
valor de δ no proximo laco interno. A Figura 2.3 mostra o pseudo-codigo do laco externo
do algoritmo TRAM.
Figura 2.3 Pseudo-codigo do laco externo do TRAM.
Ajustando constantemente o intervalo de mutacao, o algoritmo TRAM procura au-
mentar o nıvel da diversidade quando um estado estacionario de evolucao e atingido.
Assim, a diversidade da populacao tende a diminuir ate um nıvel mınimo, aumentando
depois de um intervalo sem evolucao do ponto de vista da aptidao media da populacao.
Grefenstette (1992) propos uma abordagem inspirada no fluxo de imigrantes de uma
populacao em geracoes sucessivas, denominada random immigrants genetic algorithm
(RIGA). Essa abordagem mantem um determinado nıvel de diversidade da populacao
substituindo uma porcao de indivıduos da populacao atual por indivıduos gerados ale-
atoriamente, chamados imigrantes aleatorios, a cada geracao. Existem duas estrategias
que definem como os indivıduos sao substituıdos: substituir indivıduos aleatoriamente
26
ou substituir os piores (VAVAK; FOGARTY, 1996). Para que os imigrantes aleatorios nao
prejudiquem a busca, especialmente durante o perıodo em que o ambiente nao varia, o
numero de imigrantes aleatorios, ni, e usualmente ajustado para um valor pequeno. A
Figura 2.4 mostra o pseudo-codigo do algoritmo RIGA.
Figura 2.4 Pseudo-codigo do RIGA
O RIGA insere indivıduos aleatorios na populacao, uma estrategia que pode aumentar
a diversidade da populacao e beneficiar o desempenho de AGs em ambientes dinamicos.
Todavia, em ambientes com pequenas variacoes, a introducao de imigrantes aleatorios
pode desviar a busca do AG no ambiente antes das mudancas, degradando o desempenho
do AG. Por outro lado, se o ambiente nao varia severamente, os imigrantes aleatorios po-
dem nao ter efeito positivo mesmo quando ocorre uma mudanca, pois os piores indivıduos
anteriores as mudancas podem ainda ser melhores do que os imigrantes aleatorios apos
as mudancas. Considerando essas colocacoes, uma abordagem baseada em imigrantes
elitistas, denominada elitism-based immigrants genetic algorithm (EIGA), foi proposta
para AGs em ambientes dinamicos (YANG, 2007).
No EIGA, antes das operacoes geneticas, uma sub-populacao, Sei(k), de nei indivıduos
elitistas e usada para criar imigrantes a cada geracao. Em seguida, Sei(k) e mutada com
probabilidade pim. Finalmente, a sub-populacao Sei(k) substitui os piores indivıduos da
populacao atual, P (k). A abordagem baseada nos imigrantes elitistas combina a ideia do
27
elitismo com a abordagem tradicional dos imigrantes aleatorios. A abordagem baseada
nos imigrantes elitistas tem apresentado resultados importantes em ambientes dinamicos,
especialmente quando este apresenta baixo grau de variacao (YANG, 2007).
Figura 2.5 Pseudo-codigo do ERIGA
Com o objetivo de alcancar um grau de variacao de diversidade adequado, as abor-
dagens baseadas em imigrantes elitistas e aleatorios podem ser combinadas. O pseudo-
codigo dessa nova abordagem, denominada elitism-based and random immigrants genetic
algorithm (ERIGA), e apresentado na Figura 2.5.
No ERIGA, os nei(k) imigrantes elitistas, da sub-populacao Sei(k), sao adicionados
aos nri(k) imigrantes aleatorios, da sub-populacao Sri(k), formando uma unica populacao
de imigrantes. Essas duas sub-populacoes de imigrantes substituem os piores indivıduos
da populacao atual, P (k), a cada geracao k. No ERIGA, para proporcionar um melhor
desempenho, os tamanhos das duas sub-populacoes de imigrantes sao ajustadas adap-
tativamente de acordo com seus respectivos desempenhos, no intervalo [nmin, ni − nmin],
sendo nmin o numero mınimo de imigrantes e ni o numero total fixo de imigrantes por
28
geracao, i.e., ni = nei(k) + nri(k). Se uma sub-populacao de imigrantes tem desempenho
pior que outra, seu numero de imigrantes nxi(k) (i.e., nei(k) ou nri(k)) sera reduzido,
como nxi(k) − max{nmin, nxi(k) − α}, sendo α uma constante; enquanto o numero de
imigrantes da abordagem com melhor desempenho aumenta na proporcao inversa. Se os
desempenhos forem iguais, nao havera mudancas nos tamanhos das sub-populacoes.
A ideia basica da abordagem baseada em imigrantes hıbrida e inserir diferentes graus
de diversidade ao ambiente dinamico. O EIGA tem como objetivo inserir suaves mudancas
entre as variacoes do ambiente. O RIGA insere medio grau de mudanca. Justas, essas
duas abordagens podem melhorar o desempenho de AGs em ambientes com diferentes
dinamicas.
2.5.2 Controle da Diversidade
Os metodos de controle da diversidade precisam ter, alem de um valor de referencia, uma
forma de medir a diversidade da populacao. Assim, e possıvel definir uma estrategia de
controle explıcita, baseada em um valor ou faixa de diversidade desejada. A diversidade
da populacao pode mostrar as semelhancas entre os indivıduos e suas distribuicoes no
espaco de solucoes. Na computacao evolucionaria, os metodos que mensuram a diversi-
dade da populacao utilizam dois modelos distintos, o primeiro em funcao das distancias
entre os indivıduos (WINEBERG; OPPACHER, 2003) e o segundo em funcao das distancias
dos indivıduos a um ponto de referencia (URSEM et al., 2002; MEIYI et al., 2004) — nor-
malmente o ponto medio da populacao.
A diversidade em funcao das distancias entre todos os indivıduos pode ser medida
pela expressao
Γ =
N∑
i=1
√√√√i−1∑
j=1
d(gi, gj), (2.14)sendo d(gi, gj) a distancia (e.g., Euclidiana ou de Hamming) entre os indivıduos gi e gj. A
diversidade da Equacao 2.14, com complexidade O(LN2), tem um custo computacional
elevado, o que representa uma desvantagem significante.
Wineberg e Oppacher (2003) propuseram uma medida de menor custo computacional
do que a Equacao 2.14, com complexidade O(LN), baseada na frequencia de ocorrencia
dos alelos, expressa por
29
Γ =N2
2L
L∑
i=1
∑
∀α∈A
fi(α)(1− fi(α)), (2.15)sendo A o conjunto de alelos,
fi(α) =ci(α)
N(2.16)
a frequencia que o alelo α ocorre no i-esimo gene dos indivıduos da populacao,
ci(α) =N∑
j=1
δji(α) (2.17)o numero de ocorrencias de α e δji(α) o delta de Kronecker, que torna-se 1 se o gene no
locus i no cromossomo j for igual a α; ou 0, caso contrario. A diversidade de Wineberg
e Oppacher fica praticamente limitada as implementacoes binarias. Na representacao
inteira6, pode-se ter muitos valores de α, tornando o calculo praticamente inviavel. Na
representacao real7, a diversidade expressa pela Equacao 2.15 nao e viavel porque existem
infinitos α, a nao ser que se considere subintervalos, resultando o mesmo problema da
representacao inteira.
A segunda forma de calcular a diversidade, em funcao de um ponto de referencia no
espaco de solucoes, tem um custo computacional menor, complexidade O(LN), mas nao
mede com tanta precisao a similaridade entre os indivıduos. A diversidade e, normal-
mente, calculada em funcao das distancias dos indivıduos ao ponto medio da populacao.
Este modelo de diversidade fornece uma ideia da dispersao da populacao em torno do seu
ponto medio. Ursem et al. (2002) calcula a diversidade como segue
Γ =1
DN
N∑
i=1
√√√√L∑
j=1
(gij − gj)2, (2.18)sendo D a diagonal do espaco de solucoes, D ⊂ ℜL, gij o j-esimo gene do i-esimo
indivıduo, gj o j-esimo elemento do ponto medio da populacao, g, onde
gj =1
N
N∑
i=1
gij. (2.19)6Na representacao inteira, as variaveis de decisao do problema sao codificadas no genotipo do indivıduo
por numeros inteiros7Na representacao real, as variaveis de decisao do problema sao codificadas no genotipo do indivıduo
por numeros reais
30
Meiyi et al. (2004) calcularam a diversidade pela expressao
Γ = 1 +1
L
L∑
j=1
p(j) ln p(j), (2.20)sendo
p(j) =1
DN
√√√√N∑
i=1
(gij − gj)2. (2.21)As diversidades de Ursem et al. (2002) e Meiyi et al. (2004), Equacoes 2.18 e 2.20,
sao analiticamente distintas, mas ambas sao baseadas em desvios quadraticos em relacao
ao ponto medio. A diferenca fundamental entre essas diversidades e a nao linearidade
presente na Equacao 2.20, que penaliza as medias quadraticas p(j) mais acentuadamente
a medida que se aproximam do ponto medio do eixo cartesiano j.
A preservacao da diversidade da populacao se torna mais importante em problemas
complexos — multiobjetivos e dinamicos. Em problemas dinamicos, um valor adequado
de diversidade aumenta a chance de alcancar o otimo global depois da mudanca do ambi-
ente, pois a populacao estara melhor distribuıda na superfıcie de solucoes. Os algoritmos
para otimizacao multiobjetivo buscam balancear objetivos conflitantes. Assim, uma di-
versidade adequada permite que o AE pesquise uma regiao maior da fronteira de Pareto
e encontre balancos entre os objetivos.
Ursem et al. (2002) criaram um metodo, denominado diversity-guided evolutionary
algorithm (DGEA), com dois modos de evolucao: explotativo e explorativo. No primeiro,
a populacao passa pelos processos de selecao e recombinacao — sem mutacao –, tendendo
a diminuir a diversidade. No modo explorativo, a populacao atual sofre apenas mutacao,
tendendo a aumentar a diversidade. Os modos de evolucao se alternam em funcao de uma
faixa estabelecida de diversidade desejada. O processo evolucionario se inicia pelo modo
explotativo ate que a diversidade atinja um valor mınimo, previamente estabelecido; em
seguida, muda-se o modo de evolucao para o explorativo ate que a diversidade atinja um
valor maximo, previamente estabelecido. Esse processo se repete durante todo o processo
evolucionario. Assim, a diversidade da populacao oscila dentro de uma faixa previamente
estabelecida.
Ursem et al. determinaram valores mınimos e maximos para a diversidade da po-
pulacao iguais a 5 × 10−6 e 0.25, respectivamente, e valores das taxas de cruzamento e
mutacao iguais a 0.9 e 0.75, respectivamente. A desvantagem do metodo de Ursem et
31
al. e nao utilizar conjuntamente selecao, cruzamento e mutacao, que juntos sao a base
dos AEs. O modo explotativo nao possui mutacao e o modo explorativo simplesmente
espalha a populacao na superfıcie do espaco de solucoes por meio de grandes variacoes
no genotipo dos indivıduos — o que pode retira-los de regioes promissoras.
Nguyen e Wong (2003), a partir do trabalho de Beyer e Rudolph (1997)8, utilizaram
a teoria de controle para ajustar a taxa de mutacao em espacos unimodais. Entretanto,
o metodo de Nguyen e Wong pode ser aplicado em espacos multimodais utilizando sub-
populacoes. Os resultados do trabalho de Beyer e Rudolph (1997) estabelecem analiti-
camente que os algoritmos evolucionarios podem ser induzidos a uma convergencia de
ordem linear em espacos unimodais se a diversidade da populacao tiver um decaimento
exponencial em funcao do tempo. No trabalho de Beyer e Rudolph (1997), a diversidade
desejada na geracao k e expressa por
Γd(k) = Γ(k0) exp(−k/τ), (2.22)sendo Γ(k0) a diversidade inicial e τ > 0 uma constante. Essa heurıstica e motivada
pela observacao que, em espacos unimodais, a convergencia implica em uma correspon-
dente reducao na diversidade e que uma taxa de convergencia exponencial necessitara ser
acompanhada por uma reducao exponencial da diversidade.
O metodo de Nguyen e Wong (2003) compara a diversidade atual com a desejada Γd;
quando a diferenca for maior que a tolerancia, a taxa de mutacao e corrigida por um
metodo de controle (OGATA, 1998). O ajuste da taxa de mutacao procede-se como segue
pm(k + 1) = pm(k) exp
(e(k)
e(k)
), (2.23)
sendo e o desvio ou erro entre a diversidade atual e a desejada e e(k) o erro quadratico
medio expresso por
e(k) =√
[e(1)]2 + [e(2)]2 + · · ·+ [e(k)]2, (2.24)O desempenho do metodo de Nguyen e Wong (2003) e comparado com um metodo auto-
adaptativo em varios experimentos, onde obteve resultados melhores.
8O trabalho de Beyer e Rudolph (1997) estabelece analiticamente que os algoritmos evolucionarios
podem ter uma convergencia de ordem linear em espacos unimodais se os parametros geneticos forem
otimizados.
32
2.6 DISCUSSOES FINAIS
Este capıtulo apresentou os principais metodos de controle de parametros da computacao
evolucionaria divididos de acordo com seus mecanismos de adaptacao. O controle de
parametros e um problema complexo, em aberto, que depende nao so do problema em
questao mas tambem do estado atual da busca. Dentre os principais metodos de con-
trole de parametros, foram apresentados metodos determinısticos, adaptativos e auto-
adaptativos.
Um problema tıpico com relacao aos metodos de adaptacao e a dificuldade em en-
contrar problemas gerais que possam avaliar corretamente o desempenho de diferentes
metodos de adaptacao. Alguns trabalhos mostram que valores otimos para as taxas de
operadores de variacao dependem da natureza do espaco da funcao de aptidao e do estado
atual da busca (SMITH; FOGARTY, 1996).
Richter e Paxton (2005) apresentaram um estudo de casos onde foram testados dois
metodos determinısticos e quatro adaptativos. Os resultados mostraram grandes dife-
rencas nos resultados nas varias funcoes de aptidao utilizadas. Alguns metodos que
obtiveram os melhores resultados com uma determinada funcao de aptidao nem sequer
convergiram em outra. Os resultados do trabalho de Richter e Paxton (2005) podem ser
usados como um guia de uso de metodos adaptativos para situacoes especıficas.
A grande maioria dos metodos de controle de parametros mostra resultados melhores
do que processos com parametros fixos. Alguns metodos obtem bons resultados obser-
vando o desempenho de diferentes estrategias (SMITH; FOGARTY, 1997). No entanto, e
importante ressaltar que em alguns problemas, como nos trabalhos de Back (1992), Ri-
chter e Paxton (2005), os metodos que utilizaram parametros fixos obtiveram resultados
melhores do que aqueles com controle de parametros. Smith e Fogarty (1997) levantaram
mais tres questoes importantes, a saber, (i) a necessidade de se manter um nıvel adequado
de diversidade, (ii) a adaptacao a um nıvel apropriado e (iii) a natureza da adaptacao
como uma busca em um espaco de possıveis configuracoes.
Os metodos de auto-adaptacao sinalizam como os mais promissores segundo alguns
pesquisadores (SMITH; FOGARTY, 1997). Tais metodos estao aptos a modificar implici-
tamente os parametros dos operadores. No entanto, essas adaptacoes sao aleatorias, nao
analisam explicitamente direcoes e/ou sensibilidades, mas apenas algumas tendencias. E
possıvel que modificacoes baseadas em direcoes promissoras ou sensibilidade da aptidao
do indivıduo em relacao aos seus componentes possam ser mais adaptaveis ao processo
33
evolucionario e menos parametrizadas.
Dentre os modelos que tratam a diversidade da populacao, os metodos de manutencao
da diversidade tem a desvantagem de nao ajustar os parametros em funcao de um valor
especıfico de diversidade. Por outro lado, esse paradigma pode causar ajustes super ou
subdimensionados, prejudicando a evolucao da populacao. Os modelos de controle da di-
versidade ajustam os parametros em funcao de um valor ou faixa de diversidade desejada.
Entretanto, esses modelos nao formalizaram estudos sobre a diversidade desejada, que
poderiam garantir um melhor desempenho do AE. O modelo de Nguyen e Wong (2003),
dentre os apresentados neste capıtulo, e o que mais se aproxima da proposta deste tra-
balho. No entanto, esse modelo nao pode garantir a convergencia de ordem linear em
espacos multimodais, limitando-o a problemas unimodais, contınuos e estaticos. A pro-
posta de controle de parametros fundamentada por um estudo de modelos e metricas de
diversidade, Capıtulo 3, pode indicar perfis de diversidade adequados as caracterısticas
dos problemas, alem de melhorar a compreensao da dinamica do processo evolucionario.
Esta tese adota a abordagem adaptativa, ao nıvel da populacao, para o controle de
parametros de AEs. Essa escolha se deve a possibilidade da interacao com o processo
evolucionario e a um custo computacional aceitavel. Essa interacao com o processo de
busca pode ser realizada em relacao ao desvio entre as diversidades da populacao e a
determinada e, tambem, em relacao ao desempenho do AE. O emprego do controle adap-
tativo pode contribuir significativamente, possibilitando que os parametros do AE sejam
ajustados durante o processo evolucionario em funcao de objetivos especıficos, Capıtulo
6, possibilitando adequa-los as condicoes do ambiente de busca.
34
CAPITULO 3
GENETICA DE POPULACOES E BIODIVERSIDADE
3.1 INTRODUCAO
A diversidade e uma grandeza que determina o grau de semelhanca entre objetos ou
indivıduos de um conjunto ou populacao de qualquer natureza. Normalmente, busca-
se conservar ou maximizar a diversidade — qualquer que seja a area. Na natureza,
a perda da diversidade, causada pela extincao de algumas especies, pode causar serios
desequilıbrios ecologicos com consequencias irreversıveis ao ecossistema. A preservacao
da diversidade — diversidade biologica ou biodiversidade — e um problema que vem
sendo tratado ha algumas decadas (RAO, 1982; WEITZMAN, 1992; SOLOW et al., 1993;
ONAL, 2003).
Elevados nıveis de diversidade conferem habilidades para que indivıduos, populacoes
ou especies respondam a adversidades, como doencas, parasitas e predadores e se adaptem
ao meio. Por outro lado, baixos nıveis de diversidade tendem a limitar essas habilidades
a curto e longo prazo (AMOS; HARWOOD, 1998; AMOS; BALMFORD, 2001). A diversidade
biologica ou biodiversidade engloba todas as especies de plantas, animais e microorganis-
mos, assim como os ecossistemas e os processos ecologicos dos quais estas especies fazem
parte. A biodiversidade e considerada em tres nıveis (GOEDERT, 2002):
1. Diversidade genetica, que representa a soma total da informacao genetica contida
nos genes de indivıduos de plantas, animais e de microrganismos que habitam a
Terra;
2. Diversidade das especies, que se refere a variedade de organismos vivos na Terra,
que estima-se estar entre 5 e 30 milhoes ou mais; e
3. Diversidade de ecossistemas, que se refere a variedade de habitats, comunidades
biologicas e processos ecologicos na biosfera.
Este capıtulo aborda a diversidade genetica de populacoes, suas caracterısticas e fa-
tores que contribuem para sua variacao ao longo das geracoes. O restante deste capıtulo
35
esta organizado como segue. A Secao 3.2 introduz o conceito de genetica de populacoes.
A Secao 3.3 apresenta as principais metricas de diversidade de especies apresentadas na
literatura. A Secao 3.4 descreve o equilıbrio de Hardy-Weinberg (EHW), a lei que deter-
mina a constancia da distribuicao alelica de uma populacao ideal. A Secao 3.5 expoe os
principais fatores que afetam o equilıbrio da distribuicao alelica de uma populacao real.
A Secao 3.6 apresenta um dos parametros mais utilizados na avaliacao da diversidade de
populacoes, o tamanho efetivo da populacao. A Secao 3.6.1 descreve a populacao ideal
idealizada pelos cientistas Sewall Wright (1931) e Ronald Fisher (1930). A Secao 3.7
apresenta variantes do tamanho efetivo da populacao encontrados na literatura. A Secao
3.8 apresenta as discussoes finais.
3.2 GENETICA DE POPULACOES
O processo evolucionario e sua diversidade genetica podem ser estudados em relacao a
genetica de populacoes (BEIGUELMAN, 2005; CROW; KIMURA, 1970). A populacao e a
unidade evolucionaria, considerando que exista evolucao sempre que a frequencia genica
na populacao se altere significativamente. A frequencia genica e o numero de alelos de
um determinado tipo dividido pelo numero total de alelos.
No entanto, do ponto de vista ecologico, uma populacao corresponde apenas a um
conjunto de indivıduos que ocupa uma dada area geografica em um dado momento. Esse
tipo de definicao nao e adequado como unidade evolucionaria pois nao implica que os
seres se reproduzam, condicao fundamental para a mudanca genetica.
Os genes que constituem o fundo genetico — conjunto de todos os genes presentes
numa populacao num dado momento — sao transmitidos de geracao em geracao, ale-
atoriamente, em novas combinacoes de alelos. Quanto maior o numero de genes que
constituem o fundo genetico da populacao, maior a probabilidade de existir variacao na
geracao seguinte. A determinacao das frequencias genicas de uma populacao em geracoes
sucessivas indica se existe ou nao manutencao do fundo genetico, e se atuam fatores de
evolucao.
3.3 METRICAS DE DIVERSIDADE
A medida de diversidade deve refletir o grau de semelhanca de objetos de um conjunto
particular. A base para a medida de diversidade pode ser atribuıda a diferenca entre pares
36
de objetos. Essa diferenca ou distancia entre pares de objetos, indivıduos ou especies,
(si, sj), e representada por d(si, sj). O metodo que define a distancia entre os pares de
objetos depende do problema em questao. Por exemplo, no trabalho de Champely e
Chessel (2002), a distancia e baseada na pilhagem de substratos. A distancia entre pares
de especies deve satisfazer as seguintes propriedades:
d(si, sj) ≥ 0, (3.1)d(si, si) = 0 (3.2)
e
d(si, sj) = d(sj, si). (3.3)Neste momento, nao e definido o modo de calcular d(·, ·), pois o procedimento esta
ligado a natureza do problema em questao (WEITZMAN, 1992). Por exemplo, pode-se
considerar d(·, ·) como diferencas entre as polıticas de taxas, educacao, ambiental, de
defesa, na diversidade polıtica; diferencas geneticas baseadas em propriedades molecula-
res, na biodiversidade; distancia Euclidiana dos vetores de solucoes, em um problema de
otimizacao ou tomada de decisao.
Outra metrica importante no calculo da diversidade e a distancia entre um objeto si
e um conjunto S, para si /∈ S, definida por
d(si, S) = minsj∈S
d(si, sj), (3.4)sendo d(si, S) a distancia entre o objeto de S mais proximo de si (WEITZMAN, 1992).
Quando d(si, S) e pequeno, uma pequena diversidade e adicionada quando si e introduzido
em S, e vice-versa.
A distancia d(si, S) pode ser aproximada como a derivada da funcao diversidade Γ(·)
em relacao ao objeto si (WEITZMAN, 1992). Essa aproximacao pode ser formalizada pela
analogia da equacao da derivada ou primeira-diferenca, como segue
d(si, S) = Γ(S ∪ si)− Γ(S). (3.5)E desejavel, portanto, que a funcao diversidade Γ(·) satisfaca as seguintes propriedades
matematicas (SOLOW et al., 1993; WEITZMAN, 1992):
37
1. Monotonicidade em relacao a um objeto: se um objeto si e adicionado ao conjunto
S, entao Γ(S + si) ≥ Γ(S) + d(si, S). Esta propriedade expressa a ideia que adicio-
nando um novo objeto ao conjunto S, a diversidade desse conjunto aumentara em,
no mınimo, a distancia entre o objeto de S mais proximo de si.
2. Equivalencia: para um conjunto S, N ≥ 2, existe no mınimo um objeto si que
satisfaz a condicao Γ(S) = d(si, S − si) + Γ(S − si).
3. Igualdade: supondo existir si ∈ S e sj /∈ S, tal que d(si, sj) = 0 e d(si, sk) =
d(sj, sk), ∀sk ∈ S. Assim, se sj for adicionado a S, entao Γ(S + sj) = Γ(S) (i.e.,
d(sj, S) = 0).
4. Continuidade em relacao a distancia: dados dois conjuntos S e Q, de tamanhos
iguais, e φ uma funcao um-para-um que mapeia S para Q. Entao, ∀κ > 0, ∃δ > 0
tal que
∑
si∈S
∑
sj∈S
|d(si, sj)− d(φ(si), φ(sj))| < δ,
si 6= sj , implica que
|Γ(S)− Γ(Q)| < κ.
5. Monotonicidade em relacao a distancia: dado dois conjuntos S e Q, de tamanhos
iguais, e φ uma funcao um-para-um que mapeia S para Q. Supondo que
d(φ(si), φ(sj)) > d(si, sj),
∀si, sj ∈ S, si 6= sj. Entao,
Γ(Q) > Γ(S).
6. Maxima diversidade que pode ser adicionada por uma especie: se uma especie si
for adicionada a S, entao
Γ(S + si) ≤ Γ(S) +D(si, S),
∀si /∈ S, sendo D(si, S) a maxima distancia de si ao conjunto S,
38
D(si, S) = maxsj∈S
d(si, sj).
A medida de diversidade de um conjunto de objetos ou especies pode ser calculada de
varias formas (WEITZMAN, 1992; SOLOW et al., 1993; CHAMPELY; CHESSEL, 2002; ONAL,
2003; WEIKARD et al., 2006). Essas formas sao baseadas nas distancias entre objetos
(Equacao 3.4).Rao (1982) criou uma funcao de diversidade baseada em uma distribuicao de proba-
bilidade de um conjunto finito de especies. A diversidade de Rao emprega a distancia
d(s1, s2) entre duas especies X = s1 e X = s2, sendo X uma variavel aleatoria com
distribuicao de probabilidade conhecida, definida sobre um conjunto finito de especies. A
funcao de diversidade de Rao e definida como a distancia media entre pares de especies,
isto e,
Γ =ns∑
i=1
ns∑
j=1
pi pj d(si, sj), (3.6)sendo ns o numero de especies e pi = P (X = si).
Weitzman (1992) elaborou um metodo de conservacao da diversidade, cujo valor e
calculado recursivamente pela expressao
Γ(S) = maxsi∈S
Γ(S − si) + d(si, S), ∀si ∈ S (3.7)que tem uma solucao unica se a condicao Γ(si) = d0, e definida, sendo d0 ≥ 0 uma
constante.
Solow et al. (1993) elaboraram uma funcao, denominada medida de preservacao, que
representa a perda da diversidade quando uma especie si e extinta, isto e, mostra o
impacto causado na diversidade pela extincao de si. A funcao perda de diversidade e
expressa por
∆Γ = −∑
si /∈S
d(si, S). (3.8)A partir do trabalho de Rao (1982), Champely e Chessel (2002) criaram uma funcao
de diversidade utilizando a distancia Euclidiana entre as especies, definida como
Γ =1
2
ns∑
i=1
ns∑
j=1
pi pj [d(si, sj)]2. (3.9)
39
Shannon (1948) derivou uma funcao de diversidade da teoria da informacao, descrita
como
SH = −
ns∑
i=1
pi log2 pi, (3.10)sendo pi a taxa de ocorrencia do i-esimo alelo, indivıduo ou especie no conjunto S.
A funcao de diversidade de Simpson (MAGURRAN, 2004) e expressa de quatro formas:1S =
∑ns
i=1 pi log2 pi,2S = 1− 1S, 3S = 1/1S e 4S = (3S − 1)/2. O ındice 2S e a chance
da escolha aleatoria de duas entidades diferentes, tambem chamado de heterozigosidade
(He), tal que
He = 1−ns∑
i=1
p2i , (3.11)
A diversidade entre especies tem caracterısticas diferentes da diversidade de uma
populacao. No primeiro caso, as especies sao sempre diferentes umas das outras. Em uma
populacao, ainda que improvavel, dois indivıduos podem ser geneticamente identicos. Na
diversidade de especies, a entrada de uma especie ao conjunto S causa, obrigatoriamente,
aumento da diversidade, e vice-versa. Em populacoes, a entrada de um indivıduo ao
conjunto S pode causar aumento ou diminuicao da diversidade.
Portanto, as funcoes de diversidade 3.6, 3.7, 3.8 e 3.9 devem ser utilizadas, preferenci-
almente, em problemas de diversidade de especies. Ademais, essas funcoes satisfazem as
propriedades definidas por Weitzman (1992). As funcoes de diversidade 3.10 e 3.11 sao
mais flexıveis por tratarem proporcoes de objetos ao inves de distancias entre os mesmos.
Assim, e possıvel quantificar a diversidade tanto de especies quanto de populacoes.
3.4 EQUILIBRIO DE HARDY-WEINBERG
O ramo da genetica destinado ao estudo da dinamica dos genes nas populacoes naturais
e denominado genetica das populacoes, cuja base se estabelece no equilıbrio de Hardy-
Weinberg (LI, 1988; BEIGUELMAN, 2005; STARK, 2005). Este princıpio, descoberto in-
dependentemente pelo matematico ingles Godfrey Hardy (1908) e pelo medico alemao
Wilhelm Weinberg (1908), determina que se nao existem fatores evolutivos atuando so-
bre uma populacao, as frequencias genicas permanecerao inalteradas e as proporcoes
genotıpicas atingiriam um estado de equilıbrio.
40
A importancia do teorema de Hardy-Weinberg esta no fato de se estabelecer um
modelo para a dinamica dos genes. Assim, e possıvel estimar as frequencias genicas e
genotıpicas em geracoes sucessivas e compara-las com valores obtidos na pratica. Se
houver um desvio entre os valores do modelo de Hardy-Weinberg e os reais, conclui-se
que fatores evolutivos estao atuando sobre essa populacao e que ela esta evoluindo. Caso
contrario, a populacao esta em equilıbrio.
O equilıbrio de Hardy-Weinberg foi provado, de forma irrefutavel, em uma populacao
teorica, que nao esteja sujeita aos fatores evolutivos, que obedeca as seguintes premissas:
1. A populacao e infinita, eliminando, portanto, a deriva genetica.
2. Existe o mesmo numero de generos masculinos e femininos.
3. Os cruzamentos ocorrem aleatoriamente, permitindo os consanguıneos desde que
ocorram aleatoriamente.
4. Todos os pares tem o mesmo grau de fertilidade e geram o mesmo numero de filhos.
5. Nao existe mutacao.
6. Nao existe pressao de selecao natural, nao existindo fatores que aumentem ou di-
minuam a sobrevivencia de indivıduos com determinado genotipo.
7. Nao existe migracao.
A partir das premissas supracitadas, considerando uma populacao panmıtica1 com N
indivıduos diploides, N →∞, que se reproduz por fecundacao cruzada, apenas um locus
genico e dois alelos tipo A e a, as frequencias genotıpicas dos indivıduos com genotipos
AA, Aa e aa sao, respectivamente, definidas como
f(AA) =nAAN
= r, (3.12)f(Aa) =
nAaN
= s, (3.13)e
f(aa) =naaN
= t, (3.14)1Em uma populacao panmıtica os cruzamentos sao realizados ao acaso.
41
sendo nAA, nAa e naa o numero de indivıduos com genotipos do tipo AA, Aa e aa,
respectivamente. Os valores nAA, nAa e naa sao chamados frequencias absolutas. As
frequencias genicas ou alelicas sao definidas como segue
p =nA2N
=2nAA + nAa
2N= r +
1
2s (3.15)
e
q =na2N
=2naa + nAa
2N= t+
1
2s, (3.16)
sendo nA e na o numero de alelos A e a, respectivamente. Os valores nA e na sao
frequencias absolutas e as frequencias genotıpicas e genicas sao relativas. As frequencias
genotıpicas, em populacoes muito grandes, podem ser consideradas probabilidades, isto
e, r e a probabilidade de se tomar, ao acaso, um indivıduo AA dessa populacao. Consi-
derando que r + s+ t = 1 e p+ q = 1, isto e
nAA + nAa + naaN
= 1 (3.17)e
nA + na2N
= 1. (3.18)Assim, o binomio (p+ q)2 = 1 proporciona a seguinte distribuicao genica
p2 + 2pq + q2 = (r +1
2s)2 + 2(r +
1
2s)(t+
1
2s) + (t+
1
2s)2 = 1. (3.19)
O equilıbrio de Hardy-Weinberg, definido pela Equacao 3.19, estabelece que as frequencias
genicas se mantem constantes ao longo das geracoes.
Considerando as frequencias genotıpicas, a probabilidade de dois indivıduos AA, com
frequencias genotıpicas r, cruzarem e r × r = r2. Assim, e possıvel montar um quadro
de probabilidades de ocorrencias de cruzamentos ao acaso entre os tipos de genotipos,
Tabela 3.1.
Para provar o equilıbrio de Hardy-Weinberg, a Tabela 3.2 mostra as possıveis com-
binacoes de casais (pares de genotipos), suas respectivas probabilidades de ocorrencias e
as frequencias genotıpicas na geracao dos descendentes. Para verificar a descendencia dei-
xada por cada casal, supoe-se que este numero nao depende dos genotipos dos indivıduos
que formam o casal e que o numero de descendentes por casal e o mesmo. Assim, e
42
Tabela 3.1 Probabilidades de cruzamento ao acaso.
possıvel calcular a frequencia de descendentes de cada classe de casal pelas suas respecti-
vas frequencias de cruzamentos. A partir da frequencia genotıpica da populacao inicial, e
possıvel observar que esta distribuicao se mantem na primeira geracao de filhos — como
preve o equilıbrio de Hardy-Weinberg.
Tabela 3.2 Distribuicoes genotıpicas em uma geracao de descendentes.
Nas frequencias genotıpicas resultantes da primeira geracao de descendentes, ultima
linha da Tabela 3.2, considerando as relacoes estabelecidas pelas Equacoes 3.15 e 3.16,observa-se a mesma distribuicao inicial estabelecida pela lei do equilıbrio de Hardy-
Weinberg, Equacao 3.19.3.5 FATORES QUE AFETAM O EQUILIBRIO DE HARDY-WEINBERG
Quando os fatores estabilizadores, citados na secao anterior, nao ocorrem na populacao, as
frequencias genicas tendem a variar, prevalecendo um ou um numero limitado de alelos.
A seguir sao apresentados os fatores que acabam com o equilıbrio de Hardy-Weinberg
43
(EHW) em uma populacao (CROW; KIMURA, 1970; LEBERG, 1992; AMOS; HARWOOD,
1998; FRANKHAM et al., 2002; DARWIN, 2004; BEIGUELMAN, 2005).
3.5.1 Mutacao
O efeito da mutacao na frequencia genica depende da adaptabilidade que os indivıduos
mutados apresentem, tanto para reproducao como para sobrevivencia. Pode-se considerar
que a diversidade genica e consequencia de mutacoes sucessivas, pois estas sao a unica
fonte de variabilidade conhecida no conjunto de todos genes de um determinado tipo —
fundo genico. Contudo, a mutacao nao consegue alterar o sentido da evolucao pois ocorre,
espontaneamente, com taxas da ordem de 10−6. A mutacao apenas cria diversidade
(RIDLEY, 2004).
3.5.2 Cruzamentos Nao-Aleatorios
Nas populacoes naturais, os cruzamentos podem ocorrer ao acaso, situacao em que as
frequencias genicas, em media, nao se alteram. No entanto, em populacoes reais, geral-
mente, isso nao acontece, pois a manutencao do fundo genetico implicaria ausencia de
evolucao.
Em uma populacao tıpica, apenas alguns indivıduos se reproduzem, geralmente os
indivıduos mais virtuosos ou melhor adaptados ao meio. Os indivıduos selecionam os
seus parceiros, privilegiando os seus semelhantes e proximos, aumentando a homozigotia2
e fazendo surgir anomalias geneticas.
Em uma populacao real, a probabilidade de um indivıduo reproduzir esta, normal-
mente, relacionada a sua aptidao ou sucesso reprodutivo, que depende da capacidade de
sobrevivencia ate a idade reprodutiva.
3.5.3 Deriva Genetica
A deriva genetica e um processo estocastico, temporario, que modifica as frequencias
genicas das especies ao longo do tempo. A deriva genetica e mais frequente em populacoes
com tamanhos efetivos reduzidos, sendo que as alteracoes induzidas poderao nao ser
adaptativas.
2Situacao em que a maioria ou totalidade de uma populacao e constituıda de indivıduos com genotipos
AA ou aa.
44
Geralmente, a deriva genetica ocorre em populacoes cujo efetivo reprodutor e inferior
a 100 indivıduos. Conclui-se que o efetivo reprodutor nao possui uma amostra total do
fundo genetico da populacao original. Esses desvios podem, aleatoriamente, levar ao
desaparecimento de certos alelos e fixacao de outros, independentemente do seu valor
adaptativo.
A diminuicao da frequencia de determinados alelos em populacoes pequenas reduz a
capacidade de adaptacao as alteracoes ambientais, o que pode levar ao declınio da especie,
por fixacao de alelos menos favoraveis.
3.5.4 Selecao Natural
A selecao natural pode ser definida como uma diferenca na viabilidade e fertilidade dos in-
divıduos. Algumas mutacoes sao desfavoraveis ou mesmo letais, mas seu acumulo devera
ser descartado pela selecao pois o mutante com caracterısticas desfavoraveis provavel-
mente sera eliminado.
A teoria de Darwin considera que so parte da descendencia sobrevive e se reproduz
e diferentes casais produzem diferentes numeros de descendentes viaveis. Assim, os por-
tadores de caracterısticas com maior capacidade adaptativa constituem a maioria dos
sobreviventes e, nas geracoes seguintes, tenderao a aumentar.
A selecao natural e um dos fatores mais importantes no controle da microevolucao
— alteracoes simples na frequencia genica em populacoes locais. A selecao e responsavel
pelas alteracoes de maiores dimensoes e pela aparicao de novos grupos taxonomicos — ma-
croevolucao. Tais alteracoes sao o resultado de centenas ou milhares de microevolucoes,
unidas e ampliadas pela pressao seletiva do ambiente.
3.5.5 Efeito Gargalo
O efeito de gargalo e um evento evolucionario em que, por um motivo qualquer, uma
porcentagem significativa de uma populacao morre ou e impedida de se reproduzir. Este
efeito faz aumentar a deriva genetica em uma populacao, que e inversamente proporcional
ao tamanho efetivo da populacao.
Uma consequencia natural do efeito gargalo e a perda da diversidade. Mesmo com a
retomada do tamanho inicial da populacao, a reducao do fundo genetico nao permite que
a diversidade original seja alcancada.
A perda da diversidade tende a ser um indicador de gargalo mais sensıvel que outros
45
indicadores, como a reducao da heterozigosidade (BROOKES et al., 1997). Esse fenomeno
pode ser observado na cadeia de DNA, onde cada locus genico pode ter 100 ou mais alelos
e a reducao de apenas quatro desses alelos pode ser claramente visualizado (GILBERT et
al., 1990).
3.5.6 Tamanho da Populacao
Variacoes das frequencias genotıpicas e genicas ocorrem em grandes populacoes, embora
estes efeitos sejam mais significativos em populacoes menores equivalentes3. Fatores como
o efeito gargalo e a migracao unidirecional reduzem o tamanho da populacao acentuando
a acao de mecanismos como deriva genetica e selecao nas frequencias genotıpicas e genicas
(RAIJMANN et al., 1994; SHAW et al., 1994).
3.6 TAMANHO EFETIVO DA POPULACAO
Quando os efeitos da mutacao, selecao e migracao nao estao presentes, algumas propri-
edades geneticas, tais como heterozigosidade, frequencia genica e genotıpica, se mantem
constantes em uma populacao infinitamente grande. Em uma populacao finita, no en-
tanto, essas propriedades se modificam de geracao para geracao como consequencia de
um processo estocastico — deriva genetica —, resultado da amostragem de um numero
finito de gametas durante a reproducao e sobrevivencia (WANG, 2005). Fisher (1930)
e Wright (1931), ao estudarem o efeito da deriva genetica sobre populacoes pequenas,
criaram o conceito e a teoria matematica do tamanho efetivo da populacao (Ne).
O tamanho efetivo da populacao (Ne) e definido como o tamanho de uma populacao
ideal de Wright-Fisher (FISHER, 1930; WRIGHT, 1931) tal que algumas propriedades
geneticas, tais como heterozigosidade, frequencia genica e genotıpica, tenham as mesmas
caracterısticas comportamentais da populacao real em questao (WRIGHT, 1931; CROW;
KIMURA, 1970; CABALLERO, 1994; FRANKHAM et al., 2002; HANSEN et al., 2006).
Existe um forte interesse em conhecer o tamanho efetivo de populacoes naturais e
artificiais em estudos de diversas areas, como genetica de populacoes, evolucao e con-
servacao das especies (WANG, 2005). Em situacoes que o tamanho efetivo Ne e pequeno,
a populacao pode rapidamente perder a diversidade genetica (CROW; DENNISTON, 1988;
FRANKHAM, 1995; SCHWARTZ et al., 1998). O conhecimento do tamanho efetivo Ne e
3As populacoes sao equivalentes em frequencia genica, porem, com tamanhos diferentes.
46
uma informacao importante porque pode prever a perda da diversidade genetica de uma
populacao ou probabilidade de extincao de uma especie (LEBERG, 2005).
3.6.1 Modelo de Wright-Fisher
O modelo de Wright-Fisher (WRIGHT, 1931; FISHER, 1930) (MWF) representa um modelo
de populacao ideal, composta de N indivıduos diploides ou 2N indivıduos haploides, onde
cada descendente tem apenas um ascendente.
O modelo de Wright-Fisher possui as seguintes caracterısticas:
1. O tamanho da populacao e constante, portanto, as geracoes nao se sobrepoem.
2. Os descendentes sao gerados por cruzamentos aleatorios.
3. Cada descendente herda as informacoes geneticas do seu ascendente.
4. O numero de filhos gerado por cada indivıduo segue uma distribuicao de Poisson.
5. Nao ha selecao.
Em uma populacao ideal de Wright-Fisher, todos os indivıduos tem igual probabi-
lidade de serem geradores de descendentes. No entanto, em populacoes reais, apenas
uma parte dos indivıduos produz descendentes. Portanto, apenas essa parcela de gera-
dores influenciara a estrutura genetica da geracao descendente e o tamanho efetivo da
populacao.
O tamanho efetivo da populacao depende de varios fatores demograficos e ecologicos
(NUNNEY, 1993; NOMURA, 2005b). Na ausencia de selecao e com a distribuicao de Poisson
para o numero de filhos por casal, o tamanho efetivo da populacao e diretamente ligado
ao numero de pais (WRIGHT, 1931) e pode ser definido como segue
Ne =4NmNf
Nm +Nf, (3.20)
sendo Nm e Nf o numero de generos masculinos e femininos, respectivamente.
Em uma populacao ideal, existem Ne indivıduos reprodutores, com o mesmo numero
de generos masculinos e femininos que se cruzam de forma aleatoria e a queda da va-
riabilidade genetica e 1/(2Ne). O tamanho efetivo da populacao define o tamanho de
uma populacao ideal cujo efeito da deriva genetica sobre a frequencia genica ou a taxa
de decaimento da heterozigosidade e a mesma na populacao atual. O tamanho efetivo
47
da populacao pode ser visto como uma medida de representatividade genetica de uma
amostra de indivıduos e e um importante parametro na genetica de populacoes, pois
mede a taxa de deriva genetica e cruzamento consanguıneo (WANG, 1997; SANTIAGO;
CABALLERO, 1998; VENCOVSKY; CROSSA, 1999).
3.6.2 Tipos de Tamanho Efetivo
Existem varios fatores que afetam o tamanho efetivo da populacao, a saber, o numero
de descendentes viaveis, o numero de filhos gerados por par de indivıduos, a variacao no
numero de indivıduos por geracao, a desigualdade de sexos na populacao, dentre outros.
Por consequencia, existem muitas formas de encontrar o tamanho efetivo da populacao,
dependendo da propriedade genetica de interesse. Por exemplo, o tamanho efetivo da po-
pulacao pode ser calculado em funcao da variancia das frequencias genotıpicas ou genicas,
do grau de cruzamentos consanguıneo, da mutacao ou da deriva genetica (CROW; KIMURA,
1970; EWENS, 1982; GREGORIOUS, 1991; CABALLERO, 1994; CROSSA; VENCOVSKY, 1994;
CHARLESWORTH et al., 2003).
Os conceitos de tamanho efetivo da populacao mais utilizados sao o tamanho efetivo
por consanguinidade ou perda de heterozigosidade (em ingles, inbreeding effective popu-
lation size) e o tamanho efetivo por variancia (em ingles, variance effective population
size). O tamanho efetivo por perda de heterozigosidade (Ne(h)) preve a taxa de perda de
heterozigosidade. O tamanho efetivo por variancia (Ne(v)) mede a variancia da mudanca
da frequencia genica. Em situacoes complexas, onde a demografia das populacoes varia
ou nao existe um estado de equilıbrio, essas duas medidas de tamanho efetivo Ne podem
ser muito diferentes (CHESSER et al., 1993; WANG, 1997). Todavia, Ne(h) e Ne(v) podem
ser aproximadamente iguais em populacoes em equilıbrio ou assintoticamente iguais em
populacoes em desequilıbrio quando a media harmonica e utilizada no calculo do tamanho
efetivo (POLLAK, 2002).
A partir dos modelos basicos de tamanho efetivo por perda de heterozigosidade e
por variancia, muitos modelos foram derivados (ROBERTSON, 1961; CROW; KIMURA,
1970; GREGORIUS, 1991; CABALLERO, 1994; LEBERG, 2005; WANG, 2005). As proximas
subsecoes apresentam alguns modelos basicos do tamanho efetivos da populacao, a saber,
por perda de heterozigosidade, por variancia, com tamanho da populacao variavel e com
selecao.
48
3.6.3 Tamanho Efetivo por Perda de Heterozigosidade
A heterozigosidade, He, de uma populacao pode ser definida como a probabilidade de dois
alelos quaisquer serem diferentes em um fundo genetico. Em uma populacao de Wright-
Fisher sem mutacao com tamanho 2N , a probabilidade de dois indivıduos na geracao
1 terem um mesmo ascendente da geracao 0 e 1/(2N). Esses mesmos dois indivıduos
tem, obviamente, uma probabilidade 1 − 1/(2N) de terem ascendentes diferentes, que
por sua vez tem probabilidade He(0) de serem diferentes entre si. Assim, na geracao 1, a
probabilidade de dois indivıduos serem diferentes e definida por
He(1) =1
2N· 0 + (1−
1
2N) ·He(0)
= (1−1
2N)He(0). (3.21)
Conclui-se, pois, que a perda de heterozigosidade a cada geracao em uma populacao ideal
de Wright-Fisher pode ser definida como
∆He =He(k)
He(k − 1)= 1−
1
2N. (3.22)
Assim, a dinamica da heterozigosidade, considerando duas geracoes sucessivas, pode
ser descrita como
He(k + 1) = He(k)
(1−
1
2N
). (3.23)
Generalizando, a heterozigosidade de uma populacao de tamanho fixo N na geracao
k pode ser expressa em funcao da sua heterozigosidade inicial, como segue
He(k) = He(0) (1−1
2N)k. (3.24)
Considerando N , Equacao 3.22, o tamanho efetivo da populacao por perda de hete-
rozigosidade, Ne(∆He), pode-se defini-lo como
Ne(∆He) =1
2(1−∆He), (3.25)
tambem chamado de tamanho efetivo da populacao por cruzamento consanguıneo (do
ingles, inbreeding effective population size).
49
3.6.4 Tamanho Efetivo por Variancia
Em uma populacao ideal, a amostra de gametas e binomial e a variancia da mudanca da
frequencia genica pode ser expressa como
σ2∆p =
p(1− p)
2N, (3.26)
sendo p a frequencia genica de um dado alelo em uma populacao ideal infinita. Assim,
em uma populacao ideal de Wright-Fisher, pode-se definir, a partir da Equacao 3.26, o
tamanho efetivo da populacao por variancia como
Ne(σ2) =
p(1− p)
2 σ2∆p
. (3.27)3.6.5 Tamanho Efetivo com N Variavel
Em uma populacao nao ideal com tamanho variavel ao longo das geracoes, a perda de
heterozigosidade na geracao k pode ser expressa como
He(k) = He(0)(1−1
2N(0))× · · · × (1−
1
2N(k − 1)). (3.28)
Considerando a populacao ideal de Wright-Fisher equivalente, que possui a mesma taxa
de perda de heterozigosidade, tem-se
(1−2
2Ne)k = (1−
1
2N(0))× · · · × (1−
1
2N(k − 1)) (3.29)
e, portanto,
1−2
2Ne=
((1−
1
2N(0))× · · · × (1−
1
2N(k − 1))
)1/k
. (3.30)Aproximando
1−2
2Ne
≈1
2k
((1−
1
2N(0)) + · · ·+ (1−
1
2N(k − 1))
), (3.31)
obtem-se
Ne ≈t
1N(0)
+ · · ·+ 1N(k−1)
, (3.32)que corresponde a media harmonica da sequencia N(0), · · · , N(k − 1).
50
3.6.6 Tamanho Efetivo com Selecao
Dentre os fatores que influenciam o tamanho efetivo da populacao, a variacao do numero
de descendentes gerado por indivıduo e um dos que provocam maior efeito (CROW; DEN-
NISTON, 1988; CABALLERO, 1994; NOMURA, 2005b). O problema do efeito da selecao
sobre o tamanho efetivo da populacao foi tratado pela primeira vez por Robertson (1961),
que introduziu a ideia do efeito acumulativo da selecao ao longo das geracoes. Sobre o
efeito da selecao, o tamanho Ne pode ser obtido pela formula desenvolvida por Wright
(1938), como segue
Ne =4N
2 + Vk, (3.33)
sendo Vk a variancia do numero de descendentes gerado por indivıduo. Sobre o efeito da
selecao, a variancia Vk se torna
Vk = S2k + 4C2, (3.34)
sendo S2k o componente amostral da variancia (que e igual a variancia Vk na selecao
aleatoria) e 4C2 o componente resultante de fatores nao-aleatorios (e.g., aptidao e selecao
natural). O tamanho efetivo da populacao apos uma geracao se torna
Ne =4N
2 + S2k + 4C2
. (3.35)A Equacao 3.35 nao considera o efeito acumulativo da selecao. Quando a selecao e
contınua, geracao a geracao, o tamanho efetivo da populacao decai com as geracoes e se
aproxima de um valor assintotico (NOMURA, 2005a). Para incorporar o efeito acumula-
tivo, Robertson (1961) introduziu o efeito acumulativo da selecao ao longo das geracoes.
Nesse modelo, espera-se que a vantagem seletiva de um indivıduo sobre seus descendentes
seja de 50% por geracao. A vantagem seletiva total ao longo das geracoes torna-se
Q = 1 +1
2+ (
1
2)2 + (
1
2)3 + · · · = 2, (3.36)
o que significa que o componente seletivo 4C2 da variancia Vk deve ser multiplicado por
Q2 para se obter a previsao assintotica. Portanto, o tamanho efetivo assintotico e definido
por
Ne =4N
2 + S2k + 4Q2C2
. (3.37)51
Detalhes heurısticos e teoricos da serie da Equacao 3.36 sao apresentados por Robertson
(1961), Wray e Thompson (1990) e Santiago e Caballero (1995).
3.6.7 Desvio do Equilıbrio de Hardy-Weinberg
Na ausencia de selecao, mutacao e migracao, uma populacao infinita em geracoes discretas
e com cruzamentos aleatorios atende o equilıbrio de Hardy-Weinberg (EHW). Em uma
populacao finita, a deriva genetica produz desvios tanto na frequencia genica quanto
na heterozigosidade (KIMURA; CROW, 1963). O desvio em relacao ao EHW para uma
populacao de Wright-Fisher de tamanho N , segundo Crow e Kimura (1970), pode ser
calculado pela expressao
α = −1
2N − 1. (3.38)
Esse desvio pode ser atribuıdo a amostra estatıstica aleatoria de um numero finito de
descendentes.
A variacao do desvio do EHW em relacao ao tamanho da populacao e dado pela
derivada
dα
dN=
2
(2N − 1)2. (3.39)
Para uma populacao muito grande tem-se
dα
dN≈
1
2N2,
e para uma populacao ideal de Hardy-Weinberg, N → ∞, tem-se dα/dN = 0, isto e, α
nao varia e nao ha desvio do EHW.
Pode-se verificar, pela Equacao 3.39, que quanto maior o tamanho da populacao,
menor a sensibilidade do desvio α as variacoes de N .
O desvio α tem influencia direta no tamanho efetivo da populacao, que tende a dimi-
nuir a medida que o desvio do EHW aumenta, pois em uma populacao ideal de Wright-
Fisher tem-se
Ne =1
2(1− α). (3.40)
52
3.7 OUTROS TAMANHOS EFETIVOS DA POPULACAO
Existem varios outros metodos para calcular o tamanho efetivo da populacao. Por exem-
plo, Crow e Kimura (1970) definiram Ne baseado na variancia do numero de descendentes
por indivıduo, como segue
Ne =2N(k + 1)
σ2
µ(1 + αk) + (1− αk))
, (3.41)sendo µ a media de descendentes por indivıduo, σ2 a variancia e Nk+1 o numero de
descendentes na geracao k + 1. Em uma populacao com cruzamento aleatorio, segundo
Crow e Kimura, espera-se
αk =−1
2N(k)− 1. (3.42)
Quando 2N(k) e muito grande, considerando αk = 0 em uma populacao panmıtica, nao
ocorrera um desvio significativo em Ne. Assim, a variancia do tamanho efetivo torna-se
Ne =2N(k − 1)
σ2
µ+ 1
. (3.43)Pudovkin et al. (1996) determinou o tamanho efetivo da populacao para indivıduos
bialelicos como segue
Ne =1
2D+
1
2(D + 1), (3.44)
sendo D = He/(He − H ′e), He = 2p(1 − p) e H ′
e a heterozigosidade esperada. Para
loci/indivıduos multialelicos, D e definido pela Equacao 3.11.Alguns modelos estimam o tamanho efetivo da populacao de forma temporal, com
amostras de duas ou mais geracoes. Em um modelo basico, amostras de alelos em duas
geracoes subsequentes sao colhidas e analisadas. O objetivo e estimar a variancia tem-
poral da frequencia genica, F , refletindo a magnitude da deriva genetica. Existem varios
estimadores de F , por exemplo, Nei e Tajima (1981) o definiu como
F =1
na
na∑
i=1
(pi − qi)2
12(pi + qi) + pi qi
, (3.45)sendo pi e qi as frequencias genicas do alelo i em um locus com na alelos na primeira e
segunda amostras de geracoes nao necessariamente subsequentes, respectivamente. Com
o valor estimado, F , encontra-se o tamanho efetivo da populacao como
53
Ne =k − 2
2(F − 1
2A(0)− 1
2A(k)
) , (3.46)sendo A(0) e A(k) o numero de amostras nas geracoes 0 e k, respectivamente.
3.8 DISCUSSOES FINAIS
Este capıtulo introduziu conceitos importantes da biodiversidade, em especial na diver-
sidade genetica de populacoes. Uma das metricas mais importante para determinar a
diversidade de especies e populacoes foi apresentada e analisada. A enfase deste capıtulo
foi apresentar conceitos que descrevem a representatividade e a dinamica da diversidade
genetica de populacoes.
Pode ser destacado o equilıbrio de Hardy-Weinberg como um dos conceitos mais
importantes do tema em questao, pois mostra a perda da diversidade como uma con-
sequencia da evolucao das especies ou populacoes. O desvio desse equilıbrio, Secao 3.6.7,
mostra a sensibilidade da diversidade em relacao ao tamanho da populacao. O desvio do
EHW, alem de um importante indicador de perda de diversidade, pode ser utilizado para
auxiliar o calculo da diversidade de populacoes.
O tamanho efetivo da populacao, apresentado na Secao 3.6, e outro importante con-
ceito porque pode quantificar a deriva genetica, um fenomeno aleatorio que contribui
de forma significante para o decaimento da diversidade. Alem dos conceitos basicos, fo-
ram apresentados modelos derivados, encontrados na literatura, que podem ser utilizados
como modelos de referencia de diversidade, ou como pontos de partida para estes.
54
CAPITULO 4
CONTROLE ADAPTATIVO E DE FUNCAO DE
DISTRIBUICAO DE PROBABILIDADE
4.1 INTRODUCAO
O objetivo do controle e direcionar o comportamento de sistemas dinamicos. Isso sig-
nifica manter a saıda do processo em valores constantes (regulacao) ou forca-la a seguir
uma funcao do tempo (rastreamento). Este capıtulo apresenta duas abordagens diferen-
tes de sistemas de controle, o controle adaptativo (NARENDRA; ANNASWAMY, 2005) e o
controle de funcao de distribuicao de probabilidade (WANG, 2000a). A primeira aborda-
gem, apresentada na Secao 4.4, se aplica a sistemas onde existem incertezas em relacao
aos parametros do processo. A segunda abordagem, apresentada na Secao 4.5, se aplica
a sistemas estocasticos, onde, normalmente, o objetivo e controlar a saıda media ou a
variancia da saıda.
Narendra (1996) classificou em tres nıveis as dificuldades encontradas em sistemas de
controle: (i) complexidade, (ii) nao linearidade e (iii) incerteza. Na grande maioria dos
problemas de controle, existe um certo grau de incerteza em relacao ao processo a ser
controlado. A estrutura e/ou os parametros do processo podem variar de maneira des-
conhecida. Uma das formas de tratar as incertezas e utilizar o controle adaptativo, que
identifica ou estima os parametros nao conhecidos do processo ou ajusta os parametros
do controlador (ASTROM; WITTENMARK, 1995; WITTENMARK, 2002; NARENDRA; AN-
NASWAMY, 2005).
O controle adaptativo e um sistema de controle que adapta a propria estrutura em
funcao das condicoes do ambiente. Em outras palavras, o controle adaptativo ajusta a
estrategia de controle de acordo com as mudancas na dinamica do processo. Assim, o
controle adaptativo pode ser definido como um controle com parametros ajustaveis e um
mecanismo para ajustar estes parametros (ASTROM; WITTENMARK, 1995).
Nao existe uma definicao formal totalmente aceita sobre o que e o controle adaptativo.
No entanto, ha um consenso que um sistema de controle de ganho constante nao e um
55
sistema adaptativo. Em decorrencia da existencia do mecanismo de ajuste dos parametros
do controlador, o controle em geral torna-se nao-linear, aumentando a complexidade do
seu projeto. O esquema de controle adaptativo generico, apresentado na Figura 4.1, possui
dois lacos, o primeiro — presente em todo sistema de controle realimentado — fornece
a resposta do processo aos ajustes do controlador, o segundo laco — presente apenas
no controle adaptativo — fornece a resposta do mecanismo de ajuste de parametros do
controlador considerando a saıda do processo.
Figura 4.1 Diagrama de blocos de um sistema de controle adaptativo.
Existem quatro abordagens de controle adaptativo (ASTROM; WITTENMARK, 1995),
a saber, (i) agendamento de ganho (ADG), onde as variaveis correlacionam o compor-
tamento dinamico do processo aos valores dos parametros do controlador; (ii) sistema
adaptativo por modelo de referencia (SAMR), que utiliza um modelo como referencia
que determina como a saıda do processo deve responder ao sinal de controle; (iii) regula-
dor auto-ajustavel (RAA), onde o controlador automaticamente ajusta seus parametros
para obter as propriedades do sistema de malha fechada; e (iv) sistema de controle dual
(SCD), que utiliza o controle adaptativo estocastico, empregando criterios da teoria de
otimizacao, onde existem incertezas sobre os parametros do controlador.
O controle de funcao de distribuicao de probabilidade da saıda de um processo es-
tocastico em vez de sua media e variancia tem sido cada vez mais utilizado em processos
como polimerizacao (Doyle III et al., 2003; CROWLEY et al., 2000), cristalizacao (BRAATZ,
2002; MA et al., 2002), processos alimentıcios (EEK; BOSGRA, 2000; GOMMEREN et al.,
56
2000) e fabricacao de papeis (YUE et al., 2001, 2002).
Este metodo de controle estocastico, denominado controle da distribuicao estocastica
limitada (do ingles, bounded stochastic distribution control) (WANG, 2000a), tem como
objetivo controlar a PDF da saıda de um dado processo. A ideia principal e desenvolver
uma estrategia de controle que aproxime a PDF da saıda do processo de uma PDF
desejada. Embora modelos matematicos possam ser utilizados para obter a PDF da
saıda, estes modelos sao, normalmente, complicados e demandam um elevado esforco
computacional. Com o objetivo de elaborar um controle de PDF adequado e de baixo
custo computacional, redes neurais (HAYKIN, 2001) tem sido utilizadas para aproximar
estatıstica e dinamicamente a PDF da saıda de processos estocasticos (WANG, 2000a,
1999, 2000b). Uma rede neural pode ser aplicada apenas se um conjunto de dados de
entrada de controle e PDF da saıda estiver disponıvel.
Este capıtulo apresenta os principais conceitos dos metodos de controle adaptativo por
modelo de referencia e de funcao de distribuicao de probabilidade. Esses metodos sao
utilizados como bases das estrategias de ajuste de dois modelos de controle de parametros
de algoritmos evolucionarios, apresentados no Capıtulo 6. O objetivo dos dois modelos
propostos e controlar a diversidade da populacao, impedindo a convergencia prematura
e adaptando-se as mudancas de um ambiente dinamico. O restante deste capıtulo esta
organizado como segue. A Secao 4.2 descreve as caracterısticas de um sistema dinamico
nao-linear. A Secao 4.3 apresenta alguns problemas de controle nao-linear. A Secao 4.4
descreve os conceitos gerais de sistemas adaptativos. A Secao 4.4 fornece uma visao geral
dos metodos de controle adaptativo e a Subsecao 4.4.1 descreve, em detalhes, o sistema
adaptativo por modelo de referencia. Nas Subsecoes 4.4.1.1 e 4.4.1.2 sao apresentados
dois dos principais metodos de controle adaptativo por modelo de referencia, o metodo
MIT e metodo de Lyapunov, assim como os criterios empregados para se alcancar a
estabilidade de Lyapunov. A Secao 4.5 descreve a modelagem de um sistema estocastico
via redes neurais B-spline (WANG, 2000a) e a estrategia utilizada pelo controle de funcao
de distribuicao de probabilidade da saıda de um processo estocastico. Na Secao 4.6, sao
feitas as consideracoes finais.
4.2 SISTEMA DINAMICO NAO-LINEAR
Um sistema dinamico nao-linear, discreto, a ser controlado pode ser descrito pelas se-
guintes equacoes de estado
57
x(k + 1) = f(x(k), u(k))
y(k) = g(x(k)), (4.1)sendo u(k) ∈ ℜr, y(k) ∈ ℜm e x(k) ∈ ℜn os vetores das variaveis de entrada, saıda e
estado no tempo discreto k, respectivamente. As funcoes f : ℜn×ℜr → ℜn e g : ℜn → ℜm
sao nao-lineares. O objetivo e elaborar uma estrategia que encontre um vetor de entrada
u(k) que produza saıdas y(k) que se comportem da maneira deseja. Se r = 1 e m = 1,
o sistema sera chamado de SISO (do ingles, single input and single output). Se r > 1 e
m > 1, o sistema sera chamado de MIMO (do ingles, multiple input and multiple output).
4.3 PROBLEMAS DE CONTROLE NAO-LINEAR
No sistema da Figura 4.1, se as funcoes f e g sao conhecidas, tem-se um problema
de controle nao-linear. Se as funcoes f e g sao parcialmente conhecidas ou nao sao
conhecidas, trata-se de um problema de controle adaptativo nao-linear. Os diferentes
tipos de problemas de controle podem ser classificados como segue (NARENDRA, 1996):� Problemas de controle nao-linear (f e g conhecidas) e controle adaptativo nao-linear
(f e g nao conhecidas).� Controle baseado em vetor de estado e controle baseado em entradas e saıdas.� Parametros do controlador determinados previamente (off-line) e ajustados em
tempo real (on-line).� Processos invariantes no tempo e processos variantes no tempo.
Os problemas supracitados, de regulacao ou rastreamento, podem ser formulados como
segue (NARENDRA, 1996): dado um sistema, e.g., Figura 4.1, em equilıbrio na origem (i.e.,
f(0, 0) = 0), determine o sinal de controle tal que:
1. O estado de equilıbrio x = 0 seja assintoticamente estavel.
2. A saıda y seja mantida em um valor constante y∗ (referencia), i.e., limk→∞ y(k) = y∗.
3. A saıda siga o valor desejado y∗(k), que seja uma saıda limitada de um sistema
nao-linear.
58
4. A saıda y(k) siga um sinal limitado y∗(k), tal que limk→∞ |y(k)− y∗(k)| = 0.
Os problemas de controle dos itens 1-3 sao conhecidos como regulacao e os problemas
do item 4 sao conhecidos como rastreamento. Os problemas de controle do Item 4 podem
ser tratados por dois caminhos diferentes. No primeiro, conhecido como rastreamento
assintotico, y(k) se aproxima de y∗(k) assintoticamente. No segundo, conhecido como
rastreamento exato, y(k) se aproxima de y∗(k) exatamente apos um numero exato n de
passos, isto e, y(k) = y∗(k), ∀k ≥ n.
4.4 SISTEMAS ADAPTATIVOS
No agendamento de ganho (ADG) e possıvel ajustar os parametros do controlador pelo
monitoramento das condicoes de operacao do processo. No ADG, encontram-se variaveis
auxiliares, de agendamento, que estao correlacionadas as mudancas na dinamica do pro-
cesso. Assim, e possıvel responder aos efeitos das variacoes dos parametros do processo
por ajustes nos parametros do controlador. Uma das dificuldades na elaboracao do pro-
jeto do ADG e encontrar as variaveis de agendamento. Quando as variaveis de agen-
damento sao determinadas, o controle de parametros e calculado sobre um numero de
condicoes de operacao utilizando um metodo adequado. Em seguida, o controlador e
ajustado para cada uma das condicoes de operacao. A estabilidade e o desempenho do
sistema sao, normalmente, avaliados por simulacao, com especial atencao nas transicoes
entre as diferentes condicoes de operacao. Existem duas desvantagens do ADG: a ine-
xistencia de um retorno sobre os ajustes feitos nos parametros do controlador que possa
corrigir agendamentos equivocados e o significativo tempo gasto com o projeto do sis-
tema. A vantagem do ADG e a rapidez com que os parametros do controlador podem
responder as mudancas do processo.
O regulador auto-ajustavel (RAA) pertence a classe dos metodos de ajuste indireto,
que estimam os parametros do processo e ajustam os parametros do controlador baseado
nessa estimativa. O RAA e composto de dois lacos, o laco interno constituıdo pelo
processo e do retorno para o controlador e o laco externo constituıdo pelo estimador de
parametros do processo e pelo mecanismo de ajuste dos parametros do controlador. O
RAA e considerado um sistema automatico de modelagem e projeto, onde os parametros
do processo e do controlador sao atualizados a cada perıodo de amostragem, em tempo
real.
O sistema de controle dual (SCD) e tambem um sistema de controle indireto que
59
leva em consideracao a incerteza na estimativa dos parametros do processo. Nos demais
metodos de controle adaptativo citados neste capıtulo, supoem-se que os parametros do
processo — estimados em tempo real — nao sao conhecidos, mas sao constantes. Quando
os parametros do processo sao constantes, as incertezas decrescem depois que a estimativa
se inicia. Mas as incertezas podem ser grandes no inıcio ou os parametros podem variar
com o tempo. Nesse caso, e importante que a estrategia de controle seja uma funcao dos
parametros estimados e de suas incertezas nessa estimativa. O SCD utiliza a teoria do
controle estocastico em que o processo, seus parametros e o ambiente sao descritos por
um modelo estocastico. O controlador e composto por duas partes: um estimador, que
gera uma distribuicao de probabilidade condicional do estado do processo — chamado de
hiperestado –, e um regulador, que corresponde a uma funcao que mapeia o espaco do
hiperestado para o espaco das variaveis de controle.
O sistema adaptativo por modelo de referencia (SAMR) e um metodo baseado em um
modelo que descreve o comportamento do processo. O objetivo e ajustar os parametros
do controlador de forma que o processo siga o comportamento do modelo de referencia. As
proximas subsecoes apresentam em detalhes dois dos mais utilizados metodos de controle
adaptativo por modelo de referencia, os metodos MIT e de Lyapunov.
4.4.1 Sistema Adaptativo por Modelo de Referencia
O sistema adaptativo por modelo de referencia (SAMR) e um controlador adaptativo
cuja resposta de desempenho e fornecida por um modelo de referencia (ASTROM; WIT-
TENMARK, 1995; NARENDRA; ANNASWAMY, 2005). O SAMR possui dois lacos, um tıpico
dos sistemas de controle composto pelo controlador e o processo, laco interno, e outro laco
que ajusta o parametro do controlador, denominado laco externo. A Figura 4.2 apresenta
o diagrama de blocos do SAMR.
O laco interno relaciona o sinal de referencia uc com a saıda do processo y. O laco
externo relaciona o sinal de controle u, as saıdas do processo y e do modelo de referencia
ym com o parametro do controlador θ. O sinal de controle u e gerado em funcao do sinal
de referencia uc, do parametro θ (ja ajustado) e da saıda atual do processo y(t). O sinal
de controle produz a nova saıda do processo y(t + 1). O modelo de referencia pode ser
linear ou nao-linear e nao ter entrada (i.e., ym e simplesmente uma funcao do tempo)
(NARENDRA; ANNASWAMY, 2005). Nesse caso, nao existe a entrada uc no diagrama de
blocos da Figura 4.2.
60
Figura 4.2 Diagrama de blocos do sistema adaptativo por modelo de referencia.
O mecanismo para ajustar os parametros do controlador no SAMR pode ser ob-
tido de duas formas (ASTROM; WITTENMARK, 1995): utilizando o metodo do gradiente,
pelo metodo MIT, ou a teoria da estabilidade, pelo metodo de Lyapunov. As proximas
subsecoes apresentam esses dois metodos de ajuste parametrico.
4.4.1.1 Metodo MIT A regra ou metodo MIT foi a abordagem original do sistema
adaptativo por modelo de referencia, desenvolvido pelo laboratorio de instrumentacao
do Instituto de Tecnologia de Massachusetts (MIT, do ingles Massachusetts Institute of
Technology).
No metodo do MIT, o controlador responde em funcao da saıda do modelo de re-
ferencia, ym, com o objetivo de minimizar a funcao custo
J(θ) =1
2e2, (4.2)
sendo θ o parametro do controlador e
e = ym − y. (4.3)Tendo como objetivo minimizar J(θ), o ajuste de θ e realizado no sentido contrario
do gradiente, isto e,
61
dθ
dt= −η
∂J
∂θ= −ηe
∂e
∂θ, (4.4)
sendo η ∈ (0, 1] o tamanho do passo do ajuste de θ sobre a superfıcie de J(θ). Em um
sistema discreto,
θ(k + 1) = θ(k)− η e(k)∂e(k)
∂θ, (4.5)
Quando existem varios parametros ajustaveis, θ e um vetor.
Na regra do MIT, a funcao custo J(θ) deve ser contınua e diferenciavel, visto que
seu gradiente e utilizado no ajuste dos parametros do controlador. Por utilizar o metodo
do gradiente, de busca local, o metodo MIT pode ter seu desempenho degradado pela
presenca de mınimos locais em funcoes custo J(θ) multimodais.
A derivada parcial ∂e/∂θ, chamada derivada de sensibilidade, fornece a influencia do
erro e sobre os ajustes de θ. Existem outras alternativas para a funcao custo da Equacao4.2, como, por exemplo,
J(θ) = |e|, (4.6)sendo o gradiente definido por
dθ
dt= −η
∂e
∂θsign(e) (4.7)
ou
dθ
dt= −η sign
(∂e
∂θ
)sign(e). (4.8)
4.4.1.2 Teoria de Lyapunov O matematico russo Alekdandr Lyapunov (1857-1918)
investigou equacoes diferenciais nao lineares do tipo
dx
dt= f(x), f(0) = 0. (4.9)
Considerando que f(0) = 0, a equacao tem a solucao x(t) = 0. Para garantir que a
solucao exista e seja unica, e preciso supor que f(x) e localmente Lipschitz, isto e,
‖f(x)− f(y)‖ ≤ L ‖x− y‖ (4.10)62
na vizinhanca da origem, sendo L > 0 uma constante. Lyapunov investigou se a solucao
para 4.9 e estavel em relacao as perturbacoes.
A estabilidade de Lyapunov define que a solucao x(t) = 0 para a Equacao 4.9 e estavel
se para um dado ǫ > 0 existe um numero δ(ǫ) > 0 tal que todas as solucoes com condicoes
iniciais
‖x(0)‖ < δ (4.11)tem a propriedade
‖x(t)‖ < ǫ, 0 ≤ t <∞. (4.12)Outras propriedade importantes da estabilidade de Lyapunov sao:� A solucao e instavel se ela nao for estavel.� A solucao e assintoticamente estavel se ela for estavel e puder ser encontrado um
valor de δ tal que todas as solucoes com ||x(0)|| < δ tem a propriedade que ||x(t)|| →
0 quando t→∞.� Se a solucao for assintoticamente estavel para qualquer valor, entao ela e global-
mente assintoticamente estavel.� A estabilidade de Lyapunov refere-se a estabilidade de uma solucao particular, e
nao para a equacao diferencial.
Lyapunov desenvolveu um metodo para investigar a estabilidade baseado em uma
funcao com propriedades especiais.
4.4.1.2.1 Teorema da Estabilidade de Lyapunov Uma funcao V : ℜn → ℜ e positiva
definida na regiao U ⊂ ℜn se
1. V (0) = 0
2. V (x) > 0, x ∈ U e x 6= 0.
A funcao V e positiva semi-definida se a Condicao 2 e substituıda por V (x) ≥ 0.
Se existe uma funcao V : ℜn → ℜ positiva definida tal que sua derivada ao longo da
solucao da equacao diferencial 4.9, isto e,
63
dV
dt=
∂V T
∂x
dx
dt
=∂V T
∂xf(x) = −W (x) (4.13)
seja negativa semi-definida, entao a solucao x(t) = 0 para a Equacao 4.9 e estavel. Se
a derivada dV/dt for negativa definida, entao a solucao e assintoticamente estavel. Se
dV/dt < 0 e V (x) → ∞ quando ||x|| → ∞, entao a solucao e globalmente assinto-
ticamente estavel. A funcao V e chamada funcao de Lyapunov do sistema 4.9. A
prova do teorema de Lyapunov pode ser encontrada em (ASTROM; WITTENMARK, 1995;
NARENDRA; ANNASWAMY, 2005).
4.5 CONTROLE DE PDF DA SAIDA DE SISTEMAS ESTOCASTICOS
Em um processo estocastico sujeito a um ruıdo nao-Gaussiano, a funcao de distribuicao
de probabilidade da saıda y, γ(y, u), definida no intervalo [a, b], e controlada pela entrada
u ∈ ℜ. Assumindo que o intervalo [a, b] e conhecido e γ(y, u) e contınua e limitada, o
modelo da PDF da saıda pode ser estabelecido pela seguinte aproximacao (WANG, 2000a)
γ(y, u) =
n∑
i=1
wi(u)Bi(y), (4.14)sendo wi o peso da i-esima funcao de base radial Bi, ∀i = 1, . . . , n. Sendo γ(y, u) uma
funcao de distribuicao de probabilidade definida em [a, b], a seguinte restricao deve ser
satisfeita
∫ b
a
γ(y, u) dy =n∑
i=1
wi(u) bi = 1, (4.15)sendo
bi =
∫ b
a
Bi(y) dy (4.16)uma constante positiva.
4.5.1 Modelo Dinamico
Quando o processo estocastico e dinamico, existe uma relacao dinamica entre wi e u
(WANG, 1999). Em uma relacao linear dinamica, um modelo discreto pode ser formulado
64
como segue
W (k + 1) = AW (k) +B u(k), (4.17)sendo A ∈ ℜn×n e B ∈ ℜn×1 matrizes que caracterizam a natureza dinamica do sistema,
W (k) = [w1(k), w2(k), . . . , wn(k)]T ∈ ℜn (4.18)
o vetor de estado do sistema amostrado em t = kT , u(kT ) a amostra de u(t) no tempo
t = kT e T o intervalo de amostra.
Assumindo que o vetor inicial W (0) e conhecido, entao a partir da Equacao 4.17observa-se que W (k) depende de
U(k − 1) = u(k − 1), u(k − 2), . . . , u(0), (4.19)o que significa que a PDF correspondente a W (k) tambem depende de U(k−1) e torna-se
γ(y, U(k − 1)) = γ(k, y) = [C1(y), Bn(y)]W (k), (4.20)sendo
C1(y) = [B1(y), B2(y), . . . , Bn−1(y)] ∈ ℜ1×(n−1). (4.21)
Mesmo u e W sendo obtidas por meio discreto, a saıda y e ainda contınua e a funcao
γ(y, U(k − 1)) e contınua em relacao a y.
Como a restricao da Equacao 4.15 deve ser satisfeita, apenas n− 1 variaveis do vetor
W (k) sao independentes. Assim, a dimensao da equacao de estado 4.17 deve ser reduzida
para n − 1 para representar o sistema estocastico. A partir da Equacao 4.15, pode ser
obtido
wn(k) =1
bn(1− bT V (k)), (4.22)
sendo
bT = [b1, b2, . . . , bn−1] ∈ ℜn−1 (4.23)
bi =
∫ b
a
Bi(y) dy (4.24)V (k) = [w1(k), w2(k), . . . , wn−1(k)]
T ∈ ℜn−1 (4.25)(4.26)
65
Particionando as matrizes A e B como
A =
(A′
1 A′2
A′3 A′
4
)(4.27)
e
B =
(B′
1
B′2
), (4.28)
sendo A′1 ∈ ℜ
(n−1)×(n−1), A′2 ∈ ℜ
(n−1)×1, A′3 ∈ ℜ
1×(n−1), A′4 ∈ ℜ, B′
1 ∈ ℜ(n−1)×1 e B′
2 ∈ ℜ.
Substituindo wn, Equacao 4.22, na saıda γ, Equacao 4.20, obtem-se uma nova expressao
para a saıda, como segue
γ(k, y) = γ(y, U(k − 1)) = [C1(y)−Bn(y)
bnbT ]V (k) +
Bn(y)
bn. (4.29)
Estabelecendo
G = A′
1 −A′
2
bT
bn∈ ℜ(n−1)×(n−1) (4.30)
H = B′
1 ∈ ℜ(n−1)×1 (4.31)
E =A′
2
bn∈ ℜ(n−1)×1 (4.32)
L(y) =Bn(y)
bn,∈ ℜ (4.33)
C(y) = C1(y)−Bn(y)
bnbT ∈ ℜ1×(n−1), (4.34)
(4.35)o modelo de espaco de estado, Equacoes 4.17 e 4.20, pode, entao, ser reduzido a
V (k + 1) = GV (k) +H u(k) + E
γ(y, u(k)) = C(y)V (k) + L(y) (4.36)Assim, a Equacao 4.36 representa o espaco de estados para um sistema dinamico. Pode
ser verificado, tambem, que para qualquer {V(k), G,H,E}, a restricao 4.15 e satisfeita.
Ademais, para um sistema conhecido ou nao, L(y) e sempre conhecido para uma funcao
de base Bn(y) selecionada.
66
4.5.2 Modelagem de Sistemas Dinamicos Lineares
A partir do modelo da Equacao 4.36, o sistema e identificado determinando-se as matrizes
G, H e E. Cada sequencia de {u(k)} gera uma sequencia de {V (k)} e cada vetor V (k)
corresponde a uma funcao de densidade de probabilidade γ(y, U(k−1)) dada pela Equacao4.36. A cada amostra de tempo k, a PDF γ(y, U(k−1)) deve ser medida com um numero
de amostras de saıda na amostra de tempo k como segue
γ(y, U(k − 1))← {y1(k), y2(k), . . . , yN(k)} (4.37)sendo yi(k) a i-esima amostra da saıda e N e o numero de amostras. Assim, a funcao de
distribuicao acumulativa no tempo k pode ser calculada como
F (y, U(k − 1)) =1
N(numero de {yi(k) ≤ y}) ∀y ∈ [a, b] (4.38)
Portanto, a PDF no tempo k pode ser obtida como
γ(y, U(k − 1)) =∆F (y, U(k − 1))
∆y, (4.39)
sendo ∆F (y, U(k−1)) e ∆y os valores incrementais de F (y, U(k−1)) e y, respectivamente.
Considerando o operador de atraso z−1, i.e., z−1u(k) = u(k − 1), e
f(k, y) = γ(y, U(k − 1))− L(y) = C(y)V (k)
= C(y) (I − z−1 G)−1(H u(k − 1) + E) (4.40)De acordo com a teoria das matrizes (WANG, 2000a), f(k, y) pode ser expandida para a
forma parametrizada
f(k, y) = a1 f(k − 1, y) + . . .+ an−1 f(k − n+ 1, y) +
C(y)D0 u(k − 1) + . . .+ C(y)Dn−2 u(k − n+ 1)
=n−1∑
i=1
ai f(k − i, y) +n−2∑
j=0
C(y)Dj u(k − 1− j) (4.41)Para qualquer y ∈ [a, b], o termo C(y)Dju(k−1−j), j = 0, . . . , n − 2, pode ser expresso
como
67
C(y)Dj u(k−1−j) =
n−1∑
i=1
dji u(k−1−j)Bi(y) (4.42)sendo dji o i-esimo componente do vetor Dj, j = 0, . . . , n− 2. Denotando
θ = [a1, . . . , an, d01, d02, . . . , d0(n−1),
d11, d12, . . . , d1(n−1), . . . ,
d(n−2)1, d(n−2)2, . . . , d(n−2)(n−1)]T ∈ ℜ(n−1)2+n (4.43)
φ(y, k) = [f(k − 1, y), f(k − 2, y), . . . , f(k − n + 1, y),
u(k − 1)B1(y), u(k − 1)B2(y), . . . , u(k − 1)Bn−1(y), . . .
u(k − n+ 1)B1(y), u(k − n + 1)B2(y), . . . , (4.44)u(k − n+ 1)Bn−1(y), C(y)]T ∈ ℜ(n−1)2+n,
Assim, a Equacao 4.41 pode ser expressa como
f(k, y) = θT φ(y, k). (4.45)Para identificar o sistema da Equacao 4.45, assume-se que f(y, uk) pode ser represen-
tada por N amostras a cada instante k, isto e, f(yl, uk), ∀l = 1, . . . , N . Assim, o seguinte
metodo de identificacao dos quadrados mınimos (AGUIRRE, 2000; LJUNG, 1987) pode ser
formulado para estimar o vetor θ:
1. A cada tempo k, coletar u(k) e um conjunto de {yki}, i = 1, . . . , N ;
2. Utilizar as Equacoes 4.38 e 4.39 e {yki}, para formular f(k, y);
3. Selecionar um conjunto arbitrario Yls = {yi}, i = 1, . . . ,M , do intervalo [a, b];
4. Utilizar o algoritmo dos quadrados mınimos
θ(l + 1) = θ(l) +P (l) ΦT (yl, uk) ǫ(l)
1 + Φ(yl, uk)P (l) ΦT (yl, uk)(4.46)
ǫ(l) = f(yl, uk) Φ(yl, uk) θ(l) (4.47)P (l + 1) =
(I −
P (l) ΦT (yl, uk) Φ(yl, uk)
1 + Φ(yl, uk)P (l) ΦT (yl, uk)
)P (l), (4.48)
em relacao a i para calcular θ(M) como uma estimativa de θ na amostra de tempo
k, sendo I uma matriz identidade e P (1) = 106I(n−1)m e θ(0) = θ0.
68
5. Incrementar 1 em k e voltar ao Passo 1 ate o termino dos dados amostrais.
Neste algoritmo, proposto por Wang (2000a), o conjunto de dados coletados {yki} e
utilizado para formar a PDF γ(y, U(k−1)) para calcular f(k)(y). Portanto, o conjunto de
dados Yls e diferente de {yki}, o que representa a maior diferenca deste algoritmo e dos
algoritmos de identificacao de sistemas (AGUIRRE, 2000; LJUNG, 1987) que usam {yki}
para estimar os parametros do sistema. Assim como todos os algoritmos de estimacao,
a convergencia do algoritmo de Wang (2000a) depende do numero de condicoes, sendo,
portanto, difıcil de garantir a convergencia (AGUIRRE, 2000; LJUNG, 1987).
4.5.3 Estrategia de Controle de PDF
Depois de estabelecido o modelo do sistema, a proxima fase e projetar a estrategia de
controle. Os metodos existentes podem ser classificados em algoritmos de controle fixos
para sistemas conhecidos ou algoritmos de controle adaptativo para sistemas nao conhe-
cidos. A seguir apresenta-se uma estrategia de controle para sistemas conhecidos, isto e,
para sistemas dinamicos lineares cujas matrizes G, H e E sao conhecidas.
O objetivo do algoritmo de controle e encontrar uma sequencia {u(k)} tal que a
funcao de densidade de probabilidade da saıda do processo aproxima-se ao maximo de
uma funcao de densidade de probabilidade pre-definida, g(y), que e independente de
{u(k)}.
No algoritmo de controle, {u(k)} deve ser selecionado tal que o criterio de desempenho
J =
∫ b
a
(γ(y, U(k))− g(y))2 dy. (4.49)seja minimizado. Considerando f(k + 1, y) = γ(y, U(k))− L(y), para todo y ∈ [a, b], de
forma analoga a Equacao 4.40, obtem-se
f(k + 1, y) = a1 f(k, y) + . . .+ an−1 f(k − n+ 2, y) +
C(y)D0 u(k) + . . .+ C(y)Dn−2 u(k − n + 2) (4.50)Substituindo a Equacao 4.50 na Equacao 4.49, o criterio de desempenho torna-se
J =
∫ b
a
(n−1∑
i=2
ai f(k − i+ 1, y) + C(y)Di−1 u(k − i+ 1) + L(y)
−g(y) + a1 f(k, y) + C(y)D0 u(k))2 dy. (4.51)
69
Assumindo
g(y) = −
(n−1∑
i=2
ai f(k − i+ 1, y) + C(y)Di−1 u(k − i+ 1)
)− L(y) +
g(y)− a1 f(k, y), (4.52)obtem-se
J =
∫ b
a
(C(y)D0 u(k)− g(y))2 dy. (4.53)
Sendo f(k − i, y) = C(y)V (k − i) e u(k − i) conhecidos para i = 0, 1, 2, . . ., quando o
tempo amostral e k, g(y) e uma funcao conhecida em relacao a y. Assim, o criterio J
resulta
J =
(∫ b
a
(C(y)D0)2 dy
)u(k)2
−2
(∫ b
a
(C(y)D0g(y))2 dy
)u(k) +
∫ b
a
g(y)2 dy. (4.54)Para minimizar J , a entrada de controle u(k) pode ser obtida resolvendo
∂J
∂u(k)= 0. (4.55)
Considerando que a integral∫ bag(y)2dy e independente da entrada de controle u(k), esta
ultima pode ser obtida por
u(k) =
∫ baC(y)D0g(y)dy∫ ba(C(y)D0)2dy
(4.56)O algoritmo de controle para sistemas dinamicos lineares e apresentado a seguir:
1. No tempo amostral k, coletar u(k) e um conjunto {yki};
2. Utilizar as Equacoes 4.38 e 4.39, L(y), e {yki} para formular f(k, y);
3. Para j = 1, 2, . . . , n − 1, usar f(k − j, y), {u(k − 1), u(k − 2), . . . , u(k − n + 2)},
todos os parametros conhecidos na Equacao 4.50 e uma dada distribuicao desejada
g(y) para calcular g(y);
70
4. Calcular as integrais∫ baC(y)D0g(y)dy e
∫ ba(C(y)D0)
2dy;
5. Calcular u(k), usando a Equacao 4.56, e aplicar no sistema;
6. Incrementar k em uma unidade e voltar ao Passo 1.
Esta estrategia de controle e executada com u(k) como uma funcao de entradas pas-
sadas e um numero finito de PDFs atual e passadas da saıda do sistema.
4.6 DISCUSSOES FINAIS
Este capıtulo apresentou duas abordagens de controle de sistemas, o controle adaptativo
e o controle de PDF. A principal vantagem do SAMR e a utilizacao de um modelo de
referencia como exemplo de comportamento para o processo. Os ajustes dos parametros
do controlador e do sinal de controle sao baseados nesse modelo de referencia.
O controle de PDF, aplicado a sistemas estocasticos, tem como objetivo controlar a
PDF da saıda do processo ao inves de sua media ou variancia. Essa diferenca em relacao
aos metodos classicos de controle estocasticos pode ser vantajosa porque controlando
a PDF se esta tambem controlando, indiretamente, a media e variancia da saıda do
processo. O controle de PDF realiza, primeiramente, a identificacao da PDF da saıda
utilizando redes neurais. Em seguida, o metodo do gradiente descendente e utilizado para
ajustar a entrada do processo de modo a minimizar o erro entre as PDFs da saıda do
processo e a desejada.
Os dois modelos de controle aplicados aos algoritmos evolucionarios possuem vanta-
gens e desvantagens. O SAMR com o metodo MIT e um modelo de implementacao mais
simples, pode utilizar o modelo de dinamica de populacoes apresentado no Capıtulo 5
e o modelo de referencia segue premissas baseadas em modelos de populacoes reais. O
metodo MIT tem as desvantagens de nao garantir a convergencia, entre as diversidades
da populacao e do modelo de referencia, e nao controlar direta ou indiretamente a distri-
buicao dos indivıduos no espaco de solucoes. Uma determinada diversidade, ainda que
proxima ao modelo de referencia, nao garante uma distribuicao ideal dos indivıduos no
espaco de solucoes.
O controle de PDF aplicado aos algoritmos evolucionarios tem como vantagens o
controle da diversidade esperada na geracao subsequente e tambem, indiretamente, a
distribuicao dos indivıduos no espaco de solucoes. As desvantagens desse modelo sao a
71
sua complexidade de implementacao, necessitando modelar o processo evolucionario, e o
custo computacional elevado das acoes de controle.
Apesar das desvantagens, presentes em qualquer modelo de controle ou otimizacao,
ambos os modelos tem vantagens que os tornam promissores em diversas aplicacoes com-
plexas, com ambientes dinamicos, multimodalidade e multiobjetivos.
72
CAPITULO 5
MODELO DE DINAMICA DE POPULACOES
5.1 INTRODUCAO
Para melhorar o desempenho de um algoritmo evolucionario (AE) e importante entender a
sua dinamica. Por exemplo, os metodos de controle da diversidade normalmente nao tem
informacoes precisas do processo evolucionario, apenas o erro entre as diversidades atual e
desejada e conhecido (WONG et al., 2003; URSEM et al., 2002; DIVERSITY-BASED. . . , 2007).
Alguns modelos de AEs ja foram propostos, como Goldberg (1989) e Radcliffe (1991).
No entanto, esses modelos nao tratam a dinamica do AE em relacao a diversidade da
populacao. Alternativamente, existem algumas formulacoes que tratam a dinamica dos
AEs, como Vose e Liepins (1991), Stark e Spall (2003), Bethke (1981) e P.-Bennett et
al. (1994). Muitos desses modelos nao podem ser utilizados na analise da dinamica dos
AEs porque eles precisam de um conhecimento previo da probabilidade de transicao de
estados.
O objetivo deste capıtulo e apresentar um novo modelo de dinamica da frequencia
genica que reflete o comportamento da diversidade da populacao em relacao a um de-
terminado gene. Este modelo leva em consideracao os principais fatores que compoem
a dinamica de populacoes, a saber, selecao, pressao de selecao e taxa de mutacao. Por-
tanto, e possıvel analisar o impacto que tais fatores causam na variacao da diversidade
da populacao. A partir da abordagem proposta, um modelo de processo evolucionario e
formalizado, abrindo possibilidades de se estabelecer estrategias de controle que minimi-
zem o desvio entre a diversidade da populacao e do seu modelo de referencia. Portanto,
e possıvel analisar a variacao da diversidade em relacao a tais parametros.
O restante deste capıtulo e organizado como segue. A Secao 5.2 mostra o metodo
de calculo da diversidade de populacoes utilizado. Na Secao 5.3, o modelo de dinamica
de populacoes e apresentado em detalhes. A Secao 5.4 descreve a analise de sensibi-
lidade da diversidade de populacoes em relacao aos parametros geneticos utilizados no
modelo proposto. Na Secao 5.5, os experimentos que consolidam o modelo de dinamica
de populacoes sao reportados. A Secao 5.6 apresenta as discussoes finais.
73
5.2 CALCULANDO A DIVERSIDADE DA POPULACAO
Como apresentado no Capıtulo 3, existem varias formas de calcular a diversidade de uma
populacao (MAGURRAN, 2004; URSEM et al., 2002). O modelo de dinamica de populacoes
proposto calcula a diversidade pela funcao da heterozigosidade de Simpson (MAGURRAN,
2004), substituindo He por Γ, como segue
Γ = 1−
na∑
i=1
(pi)2, (5.1)
sendo na o numero de alelos e pi a taxa de ocorrencia do i-esimo alelo.
O numero de alelos, na, depende da representacao do problema. Para genotipos com
codificacao binaria e inteira, na e mensuravel, pois os valores dos genes sao discretos.
Por exemplo, na representacao binaria, na = 2; na representacao inteira, na e igual ao
numeros de inteiros utilizados na representacao do problema; por exemplo, no problema
do caixeiro viajante com 10 cidades, na = 10.
Para genotipos com codificacao real, na nao e mensuravel, pois os intervalos dos genes
sao contınuos. Portanto, o numero de alelos e calculado dividindo o domınio do gene em
subintervalos, isto e, na e igual ao numero de subintervalos. Assim, o gene com valor
pertencente ao subintervalo j e definido como o alelo gij, isto e, um alelo do tipo j do
gene i. O tamanho do subintervalo, que define um tipo de alelo, e calculado como segue
∆g =gmax − gmin
na, (5.2)
sendo gmin e gmax os limites mınimo e maximo que definem o intervalo do gene. Assim,
o primeiro e o na-esimo tipo de alelo estao contidos nos subintervalos [gmin, gmin + ∆g)
e [gmax −∆g, gmax], respectivamente. Por exemplo, se um gene for definido no intervalo
[−10, 10] e na = 10, o tamanho dos subintervalos sera 2.0 e os tipos de alelos serao
definidos nos subintervalos
Alelo tipo 1: [−10,−8),
Alelo tipo 2: [−8,−6),...
Alelo tipo (na − 1): [6, 8),
Alelo tipo na: [8, 10].
74
Para indivıduos com mais de um gene, espera-se que a diversidade da populacao seja
representada pela heterozigosidade de um unico gene, Equacao 5.1. Por exemplo, em um
problema de maximizacao, definido pela funcao quadratica
f = 100−10∑
i=1
x2i , (5.3)
uma populacao com 100 indivıduos, cada um com 10 genes, e criada para encontrar o
ponto otimo localizado na origem, X∗ = [0, 0, . . . , 0]T . A Tabela 5.1 mostra os parametros
do AE utilizado para essa tarefa de maximizacao da funcao quadratica, Equacao 5.3. O
objetivo deste exemplo e analisar o comportamento da diversidade da populacao em
relacao a diferentes genes.
Tabela 5.1 Parametros do problema de otimizacao de uma funcao quadratica f (Equacao 5.3).Parametros Valor
Tamanho da populacao 100
Numero de genes 10
Intervalo dos genes [-10, 10]
Numero de alelos 10
Taxa de selecao de pais 1.0
Metodo de cruzamento 2 pontos
Taxa de cruzamento 0.7
Metodo de mutacao Uniforme
Taxa de mutacao 0.05
Metodo de selecao Roleta
Pressao de selecao 0.08
Numero de geracoes 100
Modelo de populacao Generacional
A Tabela 5.2 mostra a diversidade da populacao calculada apos 100 geracoes por um
metodo baseado na distancia Euclideana (MAGURRAN, 2004; URSEM et al., 2002) e pela
Equacao 5.1, baseada na heterozigosidade, He. Para esse ultimo, tres genes, escolhidos
aleatoriamente, foram utilizados para calcular a diversidade da populacao. Em todos os
experimentos, ha uma tendencia de queda da diversidade da populacao.
A Figura 5.1 mostra os histogramas as distribuicoes inicial e final dos alelos para os
75
−10 −5 0 5 100
5
10
15(a) Distribuição alélica inicial do gene 1
Oco
rrên
cia
−10 −5 0 5 100
50
100
Oco
rrên
cia
(b) Distribuição alélica final do gene 1
−10 −5 0 5 100
5
10
15(c) Distribuição alélica inicial do gene 4
Oco
rrên
cia
−10 −5 0 5 100
50
100(d) Distribuição alélica final do gene 4
Oco
rrên
cia
−10 −5 0 5 100
5
10
15(e) Distribuição alélica inicial do gene 9
Tipo de alelo
Oco
rrên
cia
−10 −5 0 5 100
50
100
Oco
rrên
cia
(f) Distribuição alélica final do gene 9
Tipo de alelo
Figura 5.1 Distribuicoes genicas iniciais e finais dos genes 1, 4 e 9.
76
Tabela 5.2 Diversidades inicial e final nos experimentos da funcao quadratica f , Equacao 5.3.Metodo Γ(0) Γ(100)
Euclideano 17.7073 2.5888
Eq. 5.1 (Gene #1) 0.8736 0.0810
Eq. 5.1 (Gene #4) 0.8858 0.0787
Eq. 5.1 (Gene #9) 0.8930 0.0895
genes 1, 4 e 9. As distribuicoes iniciais sao aproximadamente uniformes. Depois de 100
geracoes, as distribuicoes dos tres genes mostram tendencias de queda da diversidade da
populacao.
Tabela 5.3 Estatıstica para os metodos baseados na heterozigosidade, He.
Min Max
Metodo Inicial Final Inicial Final
Eq. 5.1 (Gene #1) 5 0 14 95
Eq. 5.1 (Gene #4) 5 0 14 96
Eq. 5.1 (Gene #9) 7 0 13 97
A Tabela 5.3 mostra as ocorrencias mınima (Min) e maxima (Max) dos alelos para
o metodo baseado na funcao da heterozigosidade, no inıcio (Inicial) e apos 100 geracoes
(Final). Os valores mınimos e maximos iniciais mostram distribuicoes que tendem a
uniforme. Os valores das ocorrencias finais mostram a tendencia de queda da diversidade
para todos os genes analisados.
As simulacoes mostraram que genes diferentes produzem semelhantes dinamicas da
diversidade da populacao, Figura 5.1 e Tabelas 5.2 e 5.3. Nos experimentos com os genes
1, 4 e 9, as diversidades e as distribuicoes genicas iniciais e finais foram aproximadamente
iguais. Assim, sugere-se que qualquer gene utilizado pode representar o comportamento
da distribuicao genica e da diversidade da populacao. Portanto, o calculo da diversidade
em funcao de um gene pode ser tao representativo quanto a diversidade medida pela
distancia Euclideana ou pela media das distribuicoes de todos os genes.
77
5.3 MODELO DE DINAMICA DE POPULACOES
Esta secao apresenta um novo modelo de dinamica de populacoes que descreve o compor-
tamento da frequencia genica e da diversidade da populacao. A partir das justificativas
apresentadas na Secao 5.2, o modelo proposto descreve a diversidade da populacao em
relacao a um unico gene com na alelos, denominado gene de referencia, considerando a
pressao de selecao e a taxa de mutacao como parametros de fatores evolutivos. Neste
modelo de dinamica de populacoes, a recombinacao nao e considerada por nao influen-
ciar a frequencia genica, pois quando um indivıduo e selecionado para o cruzamento o seu
alelo do gene de referencia ja esta garantido na proxima geracao no modelo de populacao
generacional. O modelo de dinamica de populacoes proposto tem, portanto, as seguintes
caracterısticas gerais:� genotipo com codificacao real;� gene de referencia definido no intervalo [gmin, gmax], com na alelos, isto e, com na
sub-intervalos;� todos os indivıduos sao candidatos a pais;� modelo de populacao e generacional;� nao ha migracao;� populacao e infinita; e� selecao proporcional a aptidao ou por torneio.
O modelo e formulado em dois estagios, a selecao de pais para cruzamento e a mutacao.
Na selecao de pais para cruzamento, a probabilidade de selecao dos indivıduos e uma
funcao da pressao de selecao, β. As frequencias genicas depois dos cruzamentos sao
modificadas em funcao da taxa de mutacao, pm. Este modelo utiliza mutacao uniforme;
entretanto, qualquer metodo de mutacao pode ser utilizado para descrever a dinamica de
populacoes.
A frequencia genica de um determinado tipo de alelo na proxima geracao depende
do numero de indivıduos selecionados cujo alelo e deste mesmo tipo. Isso ocorre porque
quando um indivıduo e selecionado para o cruzamento, o alelo do seu gene de referencia
ja esta garantido na proxima geracao.
78
A selecao de pais para cruzamento e efetuada em duas selecoes: na primeira, todos
os indivıduos participam; na segunda, o indivıduo selecionado na primeira selecao nao e
considerado. Assim, a selecao para cruzamento garante que o alelo do gene de referencia
de um indivıduo esteja garantido na proxima geracao. Como esses dois eventos sao
excludentes, a probabilidade do alelo do gene de referencia de um indivıduo estar na
proxima geracao e a soma das probabilidades deste indivıduo ser selecionado na primeira
e segunda selecao de pais para cruzamento.
A probabilidade de selecao de um indivıduo depende do metodo de selecao. Na selecao
proporcional a aptidao, ou roleta, a probabilidade do i-esimo indivıduo ser selecionado
para cruzamento na primeira selecao pode ser definida como
ps1(i) =wi∑Nj=1wj
, (5.4)sendo wi = w(fi) uma funcao da aptidao, fi, tipicamente expressa como
wi = fi, (5.5)ou
wi = exp(β fi), (5.6)sendo β a pressao de selecao, que determina o impacto da aptidao sobre a probabilidade
de selecao. Assim, e possıvel controlar a pressao de selecao quando utilizada a Equacao5.6. Por exemplo, para β = 0, a selecao sera aleatoria (wi = 1, ∀i = 1, . . . , N); a medida
que β aumenta, a pressao de selecao torna-se cada vez mais alta — tendendo a elitista.
A Figura 5.2 mostra a influencia da pressao de selecao sobre a probabilidade de selecao
de um indivıduo, para wi da Equacao 5.6, em funcao de diferentes pressoes de selecao em
duas populacoes com 3 e 100 indivıduos, N = {3, 100}. Nas duas populacoes, o melhor
indivıduo tem aptidao igual a 200. Na populacao com tres indivıduos, os outros dois
indivıduos tem aptidoes iguais a 100 e 50. Na populacao com 100 indivıduos, o pior
indivıduo tem aptidao igual a 50 e os demais indivıduos tem aptidoes que variam entre
51 e 199.
Na populacao menor, N = 3, e possıvel observar grandes variacoes na probabilidade
de selecao do indivıduos com pior e melhor aptidoes — para diferentes pressoes de selecao.
Para a pressao de selecao mais baixa, β = 0.01, as probabilidades de selecao do melhor
e pior indivıduos sao, aproximadamente, 0.6 e 0.14; para a pressao de selecao mais alta,
β = 0.1, as probabilidades de selecao do melhor e pior indivıduos sao proximas de 0.99
79
e zero. Na populacao maior, N = 100, a probabilidade de selecao e quase uniforme em
relacao a pressao de selecao. Para a pressao de selecao mais baixa, as probabilidades de
selecao sao, aproximadamente, iguais. Para a pressao de selecao mais alta, a probabilidade
de selecao do melhor indivıduo e proxima de 0.17, pouco elitista se comparada a populacao
menor, com tres indivıduos — a probabilidade de selecao e aproximadamente igual a 1
para o melhor indivıduo. Ja em relacao ao pior indivıduo, a probabilidade de selecao e,
tambem, proxima de zero. A medida que uma populacao cresce, a selecao proporcional a
aptidao tende a ser menos elitista e a sensibilidade da probabilidade de selecao em relacao
a pressao de selecao tende a ser menor.
0.02 0.04 0.06 0.08 0.10
0.2
0.4
0.6
0.8
1(a) Probabilidade de seleção do melhor indivíduo
Pressao de seleção (β)
Pro
babi
lidad
e de
sel
eção
0.02 0.04 0.06 0.08 0.10
0.05
0.1
0.15
0.2(b) Probabilidade de seleção do pior indivíduo
Pressao de seleção (β)
Pro
babi
lidad
e de
sel
eção
N = 3N = 100
N = 3N = 100
Figura 5.2 Probabilidade de selecao do i-esimo indivıduo em funcao da pressao de selecao, β.
Na selecao por torneio, a probabilidade de selecao depende do tamanho do grupo do
torneio, G, e da posicao do indivıduo no ranking das melhores aptidoes. Na selecao por
torneio, a probabilidade de selecao e definida como segue
ps1(i) = 1−
(N − 1−Ns
G
)
(N
G
) , (5.7)sendo Ns o numero de indivıduos com melhor aptidao do que o i-esimo indivıduo. Para
o melhor indivıduo, Ns = 0; para o pior, Ns = N − 1. Nesse tipo de selecao, a pressao de
selecao pode ser definida como
β =G
N, (5.8)
80
para β ∈ [1/N, 1]. Por exemplo, para G = N , i.e., β = 1, a pressao de selecao e maxima,
elitista, garantindo que o melhor indivıduo seja selecionado; para G = 1, i.e., β = 1/N ,
nao ha pressao, a selecao e aleatoria.
Na segunda selecao de pais para cruzamento, as probabilidades de selecao modificam-
se proporcionalmente a probabilidade de selecao do primeiro indivıduo selecionado. As-
sim, quanto maior ps1(·) do primeiro indivıduo selecionado, maiores as variacoes das pro-
babilidades de selecao dos demais indivıduos da populacao. Por outro lado, quanto
maior a populacao, menores as variacoes das probabilidades de selecao dos indivıduos
nao selecionados na primeira selecao de pais para cruzamento. Na segunda selecao para
cruzamento, a probabilidade de selecao do i-esimo indivıduo ser selecionado quando o
j-esimo indivıduo foi selecionado na primeira selecao e definida como
ps(i,j) = p(−j)s(i) ps(j), (5.9)
sendo p(−j)s(i) a probabilidade de selecao do i-esimo indivıduo da populacao sem o j-esimo
indivıduo. As probabilidades ps(i,j), ∀j = 1, . . . , N , sao oriundas de eventos excludentes;
assim, a probabilidade de selecao do i-esimo individuo na segunda selecao para cruza-
mento e definida como
ps2(i) =
N∑
j=1
ps(i,j), i 6= j. (5.10)Finalmente, a probabilidade do i-esimo indivıduo ser selecionado para cruzamento, na
primeira ou segunda selecao, resulta em
ps(i) = ps1(i) + ps2(i). (5.11)O numero de descendentes de um indivıduo, Nd(·), dentre os λ descendentes na
proxima geracao, produzidos por λ/2 cruzamentos ou ensaios de Bernoulli e uma variavel
aleatoria com distribuicao binomial B(λ/2, ps(·)), definida pela funcao de distribuicao de
probabilidade (FARIAS et al., 1998)
f(x) = P [Nd(i) = x] =
(λ/2
x
)pxs(i) (1− ps(i))
λ/2−x. (5.12)Portanto, o valor esperado de descendentes do i-esimo indivıduo, isto e, a media de
Nd(i), e determinado pela media
81
E[Nd(i)] =
λ/2∑
j=0
j × P [Nd(i) = j]
=
λ/2∑
j=0
j
(λ/2
j
)pjs(i) (1− ps(i))
λ/2−j
=
λ/2∑
j=1
λ
2
(λ/2− 1
j − 1
)pj−1s(i) ps(i) (1− ps(i))
(λ/2−1)−(j−1)
=λ
2ps(i)
λ/2−1∑
j=1
(λ/2− 1
v
)pvs(i) (1− ps(i))
λ/2−1−v
=λ
2ps(i), (5.13)
sendo j(λ/2j
)= λ/2
(λ/2−1j−1
)uma identidade, 0 ≤ j ≤ λ/2, e v = j − 1.
O numero de ocorrencias do q-esimo alelo, Na(q), na proxima geracao e igual a soma
de todos os descendentes cujo alelo e do tipo q. Assim, o numero esperado de alelos do
tipo q e definido como
E[Na(q)] =∑
i∈Sq
E[Nd(i)], (5.14)sendo Sq o conjunto dos indivıduos cujo gene de referencia e do alelo tipo q.
Apos o cruzamento, a distribuicao genica da populacao pode ser alterada pela mutacao.
Os genes com alelos do tipo q podem ser modificados, assim como genes com alelos dife-
rentes do tipo q podem se transformar em tipo q. Pela mutacao, a probabilidade de um
gene com alelo do tipo q mutar para outro tipo de alelo e
pm(q) = pm
(1−
1
na
), (5.15)
sendo (1− 1/na) a probabilidade de um indivıduo mutar para um alelo diferente do tipo
q, considerando que a mutacao e realizada em funcao de uma distribuicao uniforme no
intervalo [gmin, gmax]. A probabilidade pm(q) considera que, ao ser mutado, um gene pode
assumir o mesmo alelo anterior a mutacao. Isso ocorre porque na mutacao uniforme uti-
lizada todo o domınio do gene e considerado — incluindo o seu valor anterior a mutacao.
Assim, apesar de mutado, o gene pode continuar possuindo um alelo do tipo q.
82
Dentre os E[Na(q)] alelos tipo q, o numero de alelos mutados que tornam-se tipo nao-q,
Ma(q), e uma variavel aleatoria com distribuicao binomial B(E[Na(q)], pm(q)), definida pela
funcao de distribuicao de probabilidade
f(x) = P [Ma(q) = x]
=
(E[Na(q)]
x
)pxm(q) (1− pm(q))
E[Na(q)]−x. (5.16)Assim, a partir dos E[Na(q)] descendentes com genes tipo q, o valor esperado de indivıduos
que sao mutados e tornam-se alelos tipo nao-q e
E[Ma(q)] = E[Na(q)] pm(q). (5.17)A mutacao pode, tambem, contribuir para a criacao de indivıduos com alelos tipo
q quando os N − E[Na(q)] descendentes com alelos tipo nao-q sao mutados e tornam-
se indivıduos com alelo tipo q. A probabilidade de um descendente mutar e seu gene
tornar-se um alelo tipo q e
pm(q) = pm1
na. (5.18)
O numero de descendentes mutados que tornam-se alelos tipo q, Ma(q), e, tambem,
uma variavel aleatoria com distribuicao binomial B(N − E[Na(q)], pm(q)). Assim, o valor
esperado de descendentes com alelos tipo nao-q, N −E[Na(q)], que sao mutados para tipo
q e
E[Ma(q)] = (N −E[Na(q)]) pm(q). (5.19)Portanto, o numero esperado de descendentes com alelos tipo q e definido pelas con-
tribuicoes da selecao de pais e mutacao, como segue
E[Ra(q)] = E[Na(q)]− E[Ma(q)] + E[Ma(q)]
= E[Na(q)]− E[Na(q)] pm(q) + (N − E[Na(q)]) pm(q), (5.20)sendo Ra(q) uma variavel aleatoria e E[Ra(q)] o numero esperado de descendentes com
alelo tipo q. Substituindo as Equacoes 5.15 e 5.18 na Equacao 5.20 tem-se
83
E[Ra(q)] = E[Na(q)]−E[Na(q)] pm
(1−
1
na
)+(N − E[Na(q)]
)pm
1
na
= E[Na(q)]
[1− pm
(1−
1
na
)− pm
1
na
]+N pm
1
na
= E[Na(q)] (1− pm) +N pm1
na. (5.21)
As frequencias genicas na geracao subsequente pode, portanto, ser aproximada pela
razao entre o numero esperado de alelos e o tamanho da populacao, isto e
ψi(k + 1) =E[Ra(i)]
N(k + 1), ∀i = 1, . . . , na, (5.22)
sendo N(k + 1) = N para uma populacao de tamanho fixo. Agora, a partir da Equacao5.1, e possıvel estimar a diversidade da populacao substituindo pi por ψi(k + 1), da
Equacao 5.22, como segue
Γ(k + 1) = 1−
na∑
i=1
[ψi(k + 1)]2. (5.23)A Equacao 5.21 mostra que as frequencias genicas, ψq(k + 1), na proxima geracao,
k+1, e influenciada pelo numero esperado de indivıduos, E[Ra(q)], que e funcao da pressao
de selecao, β, e pela taxa de mutacao, pm. A pressao de selecao afeta diretamente a
probabilidade de selecao, privilegiando os indivıduos com melhor aptidao a medida que
β cresce. Assim, a partir da pressao de selecao e possıvel controlar o numero esperado
de descendentes, E[Ra(i)], ∀i = 1, . . . , N . Aumentando a taxa de mutacao, o numero
esperado de descendentes com alelo tipo q, E[Ra(q)], tende a diminuir, favorecendo a
diversidade.
O modelo proposto nesta secao descreve a dinamica da frequencia genica em funcao
de dois parametros de fatores evolutivos, β e pm. Esse modelo de dinamica de populacoes
formaliza, atraves das Equacoes 5.22 e 5.23, um modelo de processo evolucionario. Alem
da dinamica da diversidade, a Equacao 5.22 contribuira para a elaboracao da estrategia
de controle da diversidade.
5.4 GRADIENTE ESTOCASTICO E ANALISE DE SENSIBILIDADE
Seja uma distribuicao de probabilidade Gu, de uma variavel aleatoria z dependente de
uma variavel de controle u, para toda Funcao H , Gu integravel, Y = H(z) pode ser
84
estimada como segue
F (u) = Eu(Y ) =
∫H(z) dGu(z). (5.24)
Se existir uma estimativa Yu da derivada ∇F (u), isto e, um vetor Yu com a propriedade
E(Yu) = ∇F (u), (5.25)Yu e chamado o gradiente estocastico de Y .
A constante ∇F (u) e um gradiente estocastico, que, normalmente, nao esta disponıvel
(WU; CAO, 1997). A estimativa do gradiente estocastico pode, usualmente, ser obtida uti-
lizando diferencas finitas. Ainda, se o sistema e analisado por simulacoes, o gradiente
estocastico estimado pode ser obtido pelo metodo da taxa de probabilidade (do ingles,
likelihood ratio method) (ANDRADOTTIR et al., 1993) ou analise de perturbacao (HO; CAO,
1983). O metodo das diferencas finitas, proposto por Kiefer e Wolfowitz (1952), assu-
mindo apenas uma variavel de controle, estima o gradiente estocastico como
Y =Y (1) − Y (2)
2c, (5.26)
sendo que Y (1) tem a distribuicao Gu+c, Y(2) a distribuicao Gu−c e c uma constante
positiva muito pequena (c → 0+). A estimativa Y , Equacao 5.26, e denominada quasi-
gradiente.
No modelo de dinamica de populacoes proposto, a analise de sensibilidade apresenta
a variacao da saıda do processo evolucionario, diversidade da populacao, em relacao as
variaveis de controle.
A diversidade da populacao e uma variavel aleatoria influenciada por muitos fatores,
a saber, as taxas de selecao de pais e reproducao, as probabilidades de cruzamento e
mutacao, a pressao de selecao, dentre outros.
No modelo de populacao generacional, adotado neste modelo de dinamica de po-
pulacoes, as taxas de selecao de pais e reproducao sao iguais a 1.0, isto e, todos os
indivıduos sao candidatos a pais e o numero de filhos gerados, por geracao, e igual ao
tamanho da populacao. A probabilidade de cruzamento tambem nao influencia a diver-
sidade, pois quando um indivıduo e selecionado o alelo do seu gene ja esta garantido
na proxima geracao. Portanto, apenas a probabilidade de mutacao, pm, e a pressao de
selecao, β, exercem influencia sobre a variacao da diversidade da populacao do modelo
proposto.
85
Neste modelo, as diversidades atual e estimada substituem, respectivamente, as variaveis
Y 1 e Y 2 do gradiente estocastico, Equacao 5.26, as frequencias genicas ψi, i = 1, . . . , na,
substituem a variavel aleatoria z e a variavel de controle u pode ser representada por pm
ou β. Assim, pelo quasi-gradiente (KIEFER; WOLFOWITZ, 1952), Equacao 5.26, e possıvel
estimar a sensibilidade da diversidade da populacao em relacao as variaveis de controle.
5.5 TESTES PARA VALIDACAO DO MODELO
O modelo de dinamica de populacoes foi testado em varios experimentos com diferentes
tamanhos de populacao e numeros de alelos. A analise foi baseada no erro em relacao ao
valor encontrado em um algoritmo evolucionario padrao. Todos os experimentos utiliza-
ram genotipos com codificacao real para a funcao quadratica
f = a− b
L∑
i=1
x2i , (5.27)
sendo a = 100, b = 10−5, e L = 10 o numero de genes. A funcao de aptidao, Equacao5.27, tem valor otimo, X∗, na origem, sendo f(X∗) = 100.
A Tabela 5.4 mostra os valores dos parametros utilizados nos experimentos. O tama-
nho da populacao variou de 10 a 400 indivıduos e a taxa de selecao de pais foi 1.0, isto
e, toda a populacao pode ser selecionada para o cruzamento. Para cada experimento,
foram feitas 30 execucoes.
A analise do desempenho foi baseada nas seguintes estatısticas alcancadas durante o
processo evolucionario para os resultados medios de 30 execucoes:� Mın. e Max.: erros mınimo e maximo.� EM: erro medio.� DP: desvio padrao.� EPM: erro percentual medio, isto e, |Γ(k) − Γ(k)|/Γ(k), sendo Γ(k) a diversidade
estimada pelo modelo proposto na geracao k.
O modelo de dinamica de populacoes foi criado para uma populacao infinita onde
as frequencias genicas esperadas nao tem erros. Dois tipos de implementacoes foram
executadas, a primeira com 10 alelos e a segunda com 100 alelos. O objetivo foi analisar
o impacto de diferentes numeros de alelos sobre a previsao da diversidade de populacoes
86
Tabela 5.4 Parametros utilizados nos experimentos.
Parametros Valor
Tamanho da populacao 10,20,50,100,200 e 400
Numero de genes 10
Numero de alelos { 10, 100 }
Taxa de selecao de pais 1.0
Metodo de cruzamento 2-pontos
Taxa de cruzamento 0.7
Metodo de mutacao Uniforme
Taxa de mutacao 0.05
Metodo de selecao Roleta
Pressao de selecao 0.01
Numero de geracoes 100
Modelo de populacao Generacional
finitas em genotipos com codificacao real. A Figura 5.3 mostra as barras de erro da
previsao da diversidade da populacao para as populacoes de 10, 100 e 400 indivıduos.
Como esperado, o erro de previsao tende a diminuir quando o tamanho da populacao
aumenta.
A Tabela 5.5 mostra as estatısticas das previsoes em todos os experimentos com
na = 10. Os EPMs para 10 e 20 indivıduos foram elevados, no entanto, este modelo
de dinamica de populacoes pode ser utilizado para esses tamanhos de populacao quando
uma alta precisao de previsao nao e requerida, e.g., para analise de tendencia.
Para as populacoes maiores, 100 e 400 indivıduos, os erros de previsao foram muito
menores do que nas demais populacoes. Os desvios padrao para estes tamanhos de
populacao tambem foram baixos, sugerindo robustez na previsao pois as variacoes do
erro foram baixas.
Os experimentos com 100 alelos alcancaram resultados similares aos casos de 10 ale-
los, com as mesmas tendencias. Isto e, baixo erro de previsao para populacoes de 100
indivıduos ou mais e baixo desvio padrao para todos os tamanhos de populacao. As
Figuras 5.3(b), 5.3(d) e 5.3(f) mostram as barras de erro das previsoes de diversidade
para 100 alelos nas populacoes de 10, 100 e 400 indivıduos, respectivamente. Todos os
erros de previsao para 100 alelos podem ser vistos na Tabela 5.5.
87
0
0.5
1
(a) Populaçao com 10 indivíduos e na = 10
Div
ersi
dade
0
0.5
1
(b) Populaçao com 10 indivíduos e na = 100
Div
ersi
dade
0
0.5
1
(c) Populaçao com 100 indivíduos e na = 10
Div
ersi
dade
0
0.5
1
(d) Populaçao com 100 indivíduos e na = 100
Div
ersi
dade
0 20 40 60 80 1000
0.5
1
(e) Populaçao com 400 indivíduos e na = 10
Geraçoes
Div
ersi
dade
0 20 40 60 80 1000
0.5
1
(f) Populaçao com 400 indivíduos e na = 100
Geraçoes
Div
ersi
dade
Figura 5.3 Barras de erros de previsao de diversidade para as populacao de 10, 100 e 400
indivıduos.
88
Tabela 5.5 Erros de previsao de diversidade com na = 10.
10 alelos 100 alelos
Pop. Mın. Max. EM DP EPM Mın. Max. EM DP EPM
10 0.0770 0.1497 0.1156 0.0154 30.96 0.0743 0.1462 0.1103 0.0149 30.00
20 0.0604 0.1285 0.0946 0.0146 20.31 0.0482 0.1118 0.0764 0.0152 14.06
50 0.0500 0.1134 0.0764 0.0145 12.57 0.0299 0.0675 0.0443 0.0071 06.59
100 0.0445 0.0955 0.0652 0.0116 09.77 0.0164 0.0432 0.0277 0.0051 03.54
200 0.0380 0.0776 0.0586 0.0096 07.29 0.0876 0.0287 0.0193 0.0042 02.61
400 0.0144 0.0388 0.0252 0.0048 03.43 0.0072 0.0194 0.0130 0.0021 01.43
Os resultados estatısticos para 10 e 100 alelos foram muito semelhantes, com erros
menores na implementacao com 100 alelos. Para populacoes com 100 indivıduos ou mais,
os erros podem ser considerados aceitaveis para alguns problemas. Por exemplo, no
controle da diversidade de populacoes proposto por Diversity-Based. . . (2007), a variacao
da diversidade em relacao ao sinal de controle, dΓ/du, foi considerada constante por nao
ter sido formulado um modelo de processo evolucionario. Com o modelo de dinamica
de populacoes proposto, e possıvel aproximar essa derivada. Os erros apresentados para
populacoes maiores podem ser considerados aceitaveis considerando que sem o modelo de
dinamica de populacoes a derivada dΓ/du e constante, cujo erro nao e mensuravel. Na
analise da evolucao utilizando o equilıbrio de Hardy-Weinberg (HARDY, 1908; WEINBERG,
1908), os erros apresentados nas populacoes com 100 indivıduos ou mais sao proximos
dos erros amostrais de populacoes biologicas (LOPES, 1999; RIDLEY, 2004).
Em todos as populacao, as implementacoes com 10 e 100 alelos tiveram baixos desvios
padrao, o que tambem pode ser observado na Figura 5.3. Esses resultados mostram a
robustez do modelo de dinamica de populacoes, pois. As variacoes do erro de previsao
para 10 e 100 alelos estao plotadas nas Figuras 5.4 e 5.5, para populacoes de 10 e 400
indivıduos. Tanto para populacao de 10 indivıduos quanto para 400 indivıduos, a variacao
do erro e maior nos experimentos com 10 alelos.
A Figura 5.6 mostra o erro percentual medio para populacoes com 10 e 100 alelos.
Para ambos os casos, o perfil das curvas foram semelhantes, isto e, o erro percentual
medio tende a decair com o aumento da populacao a uma taxa semelhante. A partir
da populacao de 100 indivıduos, o EPM e baixo se comparado a menor populacao, em
torno de 5%. A partir dessa populacao de 100 indivıduos, o erro continua decrescendo,
mas a uma taxa pequena. Isso mostra que, mesmo o modelo de dinamica de populacoes
89
0 20 40 60 80 100 1200
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
Gerações
Err
o de
pre
visã
o
N = 10N = 400
Figura 5.4 Variacao do erro nas populacoes com 10 e 400 indivıduos com na = 10.
0 20 40 60 80 100 1200
0.05
0.1
0.15
0.2
0.25
Gerações
Err
o de
pre
visã
o
N = 10N = 400
Figura 5.5 Variacao do erro nas populacoes com 10 e 400 indivıduos com na = 100.
tendo sido elaborado para populacoes infinitas, a partir de populacoes de 100 indivıduos
os erros de previsao sao reduzidos.
5.6 DISCUSSOES FINAIS
Este capıtulo apresentou um novo modelo de dinamica de populacoes que descreve o
comportamento da frequencia genica e da diversidade da populacao. O modelo foi ide-
alizado para uma populacao generacional infinita. Para aplicacoes com genotipos com
codificacao real, o calculo da diversidade da populacao e feito dividindo o domınio do
gene em sub-intervalos que representam os tipos de alelos. O modelo proposto e baseado
90
0 50 100 150 200 250 300 350 4000
5
10
15
20
25
30
35
Tamanho da população
Err
o pe
rcen
tual
méd
io
10 alelos100 alelos
Figura 5.6 Erro medio para 10 e 100 alelos.
na frequencia genica, uma variavel aleatoria dependente de dois parametros: a taxa de
mutacao e a pressao de selecao.
No modelo de dinamica de populacoes proposto, a complexidade computacional e
maior na selecao para cruzamento. Nessa fase, o calculo da probabilidade de selecao
demanda um esforco computacional mais significativo, em especial no segundo sorteio
de pais para cruzamento, onde as probabilidades de selecao devem ser re-calculadas.
Entretanto, para populacoes maiores, com 100 indivıduos ou mais, pode-se considerar
a probabilidade de selecao do segundo sorteio de pais igual a do primeiro sorteio —
como mostrou o exemplo da Secao 5.3. Na segunda fase do calculo da frequencia genica,
envolvendo a mutacao, ha um baixo esforco computacional, sem atraso significativo do
processo evolucionario, pois executa-se apenas dois calculos de produto para cada tipo
de alelo.
Como mostra a Figura 5.6, o erro medio tende a decrescer a medida que a populacao
aumenta. Os resultados com gene de 10 e 100 alelos foram semelhantes em todos os indica-
dores, mostrando independencia em relacao ao numero de alelos. Para as populacoes com
10, 20 e 50 indivıduos, os erros de previsao da diversidade foram mais elevados se com-
parados as demais populacoes, especialmente para as populacoes de 10 indivıduos onde
os erros foram de 30.96% and 30.00% para 10 e 100 alelos, respectivamente. Entretanto,
em problemas com populacoes menores, e.g., 10 indivıduos, se nao for necessaria precisao
elevada, o modelo proposto pode ser utilizado para sinalizar tendencias de variacao ou
evolucao.
O modelo de dinamica de populacoes proposto formaliza o modelo do processo evo-
91
lucionario, viabilizando sua aplicacao no controle de parametros de fatores evolutivos,
controle de diversidade e analise de convergencia e sensibilidade em algoritmos evolu-
cionarios. O quasi-gradiente, Equacao 5.26, pode ser utilizado para ajustar um parametro
genetico em um problema de controle de diversidade (DIVERSITY-BASED. . . , 2007). Nes-
sas aplicacoes, um modelo de processo evolucionario e importante nao so para entender
a sua dinamica, mas tambem para definir estrategias de adaptacao.
Adicionalmente, este modelo de dinamica de populacoes pode ser utilizado para es-
tudo de biodiversidade e evolucao em populacoes naturais, principalmente porque estas
populacoes sao, normalmente, elevadas, tornando as previsoes mais confiaveis. Por exem-
plo, o modelo pode ser utilizado para comparar a frequencia genica prevista com o modelo
de Hardy-Weimberg. Assim, e possıvel estimar se os fatores evolutivos estao atuando e a
populacao esta evoluindo ou esta em equilıbrio.
92
CAPITULO 6
MODELOS DE CONTROLE DE PARAMETROS
6.1 INTRODUCAO
Este capıtulo apresenta dois modelos para controle da diversidade em algoritmos evolu-
cionarios, o controle adaptativo, apresentado da Secao 6.2 ate a Secao 6.5, e o controle
da PDF da diversidade, apresentado da Secao 6.6 ate a Subsecao 6.6.3. As propostas
incluem um modelo de referencia, um modelo de processo evolucionario e estrategias de
controle. No controle adaptativo, a pressao de selecao ou a taxa de mutacao e utilizada
como sinal de controle e a estrategia de controle visa ajustar a entrada do processo e
os parametros do controlador com o objetivo de aproximar a diversidade da populacao
da diversidade do modelo de referencia. No controle da PDF da diversidade, a taxa de
mutacao e a entrada do processo e a estrategia de controle visa ajustar esta entrada com
o objetivo de aproximar a PDF da diversidade de uma PDF de referencia.
O modelo de controle adaptativo, denominado Controle Adaptativo por Diversidade
de Referencia (DRAC, do ingles, Diversity-Reference Adaptive Control), cria uma nova
concepcao de controle de diversidade em AEs. O controle e baseado em um modelo de
referencia com premissas gerais fundamentadas a partir do Capıtulo 3. O objetivo e
encontrar parametros que permitam que o processo evolucionario siga o comportamento
do modelo de referencia — do ponto de vista da diversidade. A vantagem deste metodo
e possibilitar a elaboracao, teorica ou empiricamente, de um modelo de referencia que
permita ao processo evolucionario o melhor desempenho possıvel.
O modelo de controle de PDF, denominado Algoritmo Evolucionario Adaptativo Ba-
seado na Funcao de Distribuicao de Probabilidade de Diversidade (PDFEA, do ingles,
Probability Density Function Based Evolutionary Algorithm), adota uma concepcao dife-
rente. No PDFEA, o objetivo e controlar a PDF da diversidade do processo evolucionario,
ao inves do valor da diversidade. Adicionalmente, neste tipo de controle se esta tambem
controlando a diversidade esperada — media. Ao se controlar a PDF da saıda do processo
evolucionario, se esta automaticamente controlando o seu valor medio, considerando que
o valor medio da PDF da saıda do processo e a diversidade esperada na proxima geracao.
93
O controle de PDF tem, ainda, a possibilidade de um controle indireto da distribuicao
dos indivıduos no espaco de solucoes. A PDF da diversidade nao e um histograma
da distribuicao dos indivıduos no espaco de solucoes. Portanto, uma PDF com menor
variancia, mais estreita, significa que a diversidade esta menos sujeita as variacoes na
proxima geracao. Isso ocorre exatamente quando os indivıduos estao mais distribuıdos
no espaco de solucoes ou existem muitos tipos de alelos presentes em um determinado
gene. Assim, em uma geracao nao havera grande variacao de diversidade, como mostra
a Figura 6.4(a). No inıcio, a diversidade esperada para a proxima geracao e alta e
sua variancia e baixa. Por outro lado, uma PDF com maior variancia significa pouca
distribuicao dos indivıduos no espaco de solucoes ou a existencia de poucos tipos de
alelos em um determinado gene. Assim, em uma geracao, podera ocorrer grande variacao
da diversidade com o espalhamento de um grupo de indivıduos ou com o surgimento
ou aumento de um tipo de alelo. Portanto, ao se controlar a PDF, a distribuicao dos
indivıduos no espaco de solucoes esta, indiretamente, sendo controlada.
O restante deste capıtulo esta organizado como segue. A Secao 6.2 apresenta dois
modelos de referencia de diversidade propostos. A Secao 6.3 descreve dois modelos de
processo evolucionario. A Secao 6.4 apresenta a proposta de processo evolucionario como
um sistema de controle. A Secao 6.5 apresenta a estrategia de controle para ajustes
do sinal de controle e dos parametros do controlador, nas Subsecoes 6.5.1 e 6.5.2, e um
mecanismo de selecao proposto, na Subsecao 6.5.3. A Secao 6.6 apresenta o controle de
PDF aplicado aos AEs. A Subsecao 6.6.1 demonstra como calcular a PDF da diversidade
de populacoes de AEs. A Subsecao 6.6.2 descreve como gerar amostras para identificar
o modelo do processo evolucionario. A Subsecao 6.6.3 apresenta a estrategia de controle
de diversidade em AEs. A Secao 6.7 apresenta as discussoes finais sobre os modelos de
controle propostos.
6.2 MODELO DE REFERENCIA DE DIVERSIDADE
O modelo de referencia apresenta um comportamento da diversidade que deve ser se-
guido pelo processo evolucionario. Enquanto o processo evolucionario tem como objetivo
encontrar a solucao otima, o sistema de controle ajusta os parametros do controlador
a fim de que a diversidade da populacao se aproxime o maximo possıvel da diversidade
determinada pelo modelo de referencia. O modelo de referencia pode ser genericamente
expresso como
94
Γm(k + 1) = Φ(Γm(k), uc(k), k), (6.1)sendo Φ(·) uma funcao nao-linear, Γm a saıda do modelo de referencia, uc o sinal de
comando (i.e., a entrada do modelo) e k o instante discreto de tempo (geracao).
A partir do modelo de Hardy-Wimberg (HARDY, 1908; WEINBERG, 1908), apresentado
na Secao 3.4, e possıvel concluir que nao existe evolucao sem variacao genica. Conside-
rando essa premissa, um modelo geral de diversidade e criado com base em duas hipoteses:
1. Durante o processo evolucionario, e necessario que a diversidade da populacao de-
cresca para haver evolucao; e
2. A diversidade possua um valor mınimo para manter um equilıbrio entre exploracao
e explotacao.
Adicionalmente, a cada mudanca do ambiente, a diversidade do modelo de referencia
salta do seu valor atual, Γm(k), para o valor da diversidade inicial, Γm(0), aumentando
de forma induzida a diversidade da populacao. Portanto, propoe-se um modelo geral de
diversidade que decai do seu valor inicial ate um mınimo pre-determinado. Propoe-se,
tambem, um aumento da diversidade apos as mudancas do ambiente, detectadas pela
variacao negativa da aptidao do melhor indivıduo.
Nesta tese, sao propostos tres diferentes modelos de referencia com as caracterısticas
supracitadas. O primeiro modelo, denominado modelo de referencia exponencial, possui
decaimento exponencial no tempo, como
Γm(k) = exp(−uc (k − kl)), (6.2)sendo kl a geracao que ocorreu a ultima mudanca do ambiente. O modelo de referencia
exponencial tem seu decaimento controlado pelo sinal de comando uc, que e alterado por
decisao do projetista, condicoes do ambiente ou desempenho do AE.
O segundo modelo, denominado modelo de referencia linear, possui decaimento linear,
definido pela expressao
Γm(k) =
{Γ(0)−A k−kl
K, se k − kl < K
Γmin, caso contrario,(6.3)
sendo A uma constante e K o numero de geracoes da fase de decaimento de diversidade,
depois da qual a diversidade e fixada em um valor mınimo, Γmin, pre-determinado. Assim,
quanto menor K, mais rapido sera o decaimento da diversidade.
95
O terceiro modelo de diversidade e baseado na dinamica da heterozigosidade, Equacao3.23, no qual o sinal de comando, uc, e o tamanho efetivo da populacao, Ne, e a hetero-
zigosidade, He, substituıda pela diversidade do modelo de referencia. Para todos os tres
modelos de referencia propostos, Γm(k) = Γmin, se Γm(k) for menor que Γmin, sendo Γmin
a diversidade mınima do modelo de referencia e Γm(0) = Γ(0).
6.3 MODELO DO PROCESSO EVOLUCIONARIO
O comportamento do processo evolucionario e descrito pelo modelo de dinamica de po-
pulacoes apresentado no Capıtulo 5, resultando o sistema
ψi(k + 1) = hψ(ψi(k), u(k)), ∀i = 1, . . . , na, (6.4)Γ(k) = 1−
na∑
i=1
[ψi(k)]2, (6.5)
sendo ψi a frequencia genica do i-esimo alelo, u o sinal de controle (variavel de entrada),
hψ(·) uma funcao estocastica nao-linear, Equacao 5.22, que descreve a frequencia genica
da populacao, Γ(k) a diversidade da populacao no tempo discreto k (geracao) e na o
numero de tipos de alelos, calculado conforme a implementacao, Secao 5.2.
A pressao de selecao, β, e a taxa de mutacao, pm, sao os parametros dos fatores
evolutivos escolhidos como sinal de controle. A pressao de selecao regula o peso da
aptidao sobre o processo de selecao, influenciando a variacao da diversidade da populacao.
A mutacao, naturalmente, tende a aumentar a diversidade ou minimizar a sua perda. Se a
acao da mutacao for maior que os efeitos multi-fatoriais que causam a perda da diversidade
em geracoes sucessivas, a diversidade aumentara; caso contrario, apenas minimizara a sua
perda. Para esses dois parametros, sao definidas estrategias de controle que mantenham
a diversidade da populacao nos nıveis determinados.
Este modelo de processo evolucionario calcula a frequencia genica e a diversidade de
um gene especıfico do indivıduo. A dinamica da funcao hψ(·) em relacao a diversidade e,
aproximadamente, a mesma para todos os genes do indivıduo, como mostram os testes
apresentados na Secao 5.2. No entanto, e possıvel utilizar mais de um gene na ava-
liacao da diversidade da populacao, aplicando, por exemplo, a media de um conjunto de
diversidades genicas calculadas pela Equacao 6.5.96
6.4 CONTROLE ADAPTATIVO DO PROCESSO EVOLUCIONARIO
A Figura 6.1 mostra o diagrama de blocos do sistema de controle por modelo de referencia
aplicado ao controle de parametros dos algoritmos evolucionarios. O sistema de controle
possui dois lacos, o interno, envolvendo o processo evolucionario e o controlador, que
retorna a saıda do processo, e o externo, composto pelo processo e mecanismo de ajuste,
o qual e responsavel pelas mudancas dos parametros do controlador.
O mecanismo de ajuste parametrico utiliza o desvio entre a saıda desejada, Γm(k),
e a saıda do processo evolucionario, Γ(k), na geracao k, para atualizar os parametros
do controlador. O controlador tem como entradas o sinal de comando, uc, o retorno
do processo evolucionario, atraves da diversidade Γ, e os parametros do controlador,
θ1, . . . , θnp, sendo np o numero de parametros do controlador. A saıda do controlador e o
sinal de controle, u, que neste caso e a pressao de selecao, β, ou a taxa de mutacao, pm.
Figura 6.1 Controle de parametros pelo SAMR.
6.5 ESTRATEGIA DE CONTROLE ADAPTATIVO
A estrategia de controle adaptativo proposta baseia-se nos ajustes da entrada de controle
e dos parametros do controlador. Tais ajustes sao realizados em funcao do desvio da
saıda do modelo de referencia e da diversidade da populacao. O objetivo da estrategia
97
de controle e estabelecer
limk→∞
|Γm(k)− Γ(k)| = 0. (6.6)Esta secao apresenta duas estrategia de controle, uma baseada apenas no sinal de
comando e no parametro do controlador e outra baseada no sinal de comando, na saıda
do processo evolucionario e nos parametros do controlador. As proximas subsecoes apre-
sentam essas estrategias de controle.
6.5.1 Estrategia Baseada no Sinal de Comando
Nesta estrategia, o sinal de controle e uma funcao do sinal de comando, uc, e do parametro
do controlador, θ. A lei de controle e, portanto, definida como
u(k) = θ(k) uc(k). (6.7)O metodo MIT e empregado para ajustar o parametro θ, que tem como objetivo
minimizar a funcao custo
J(θ) =1
2e2, (6.8)
sendo
e(k) = Γm(k)− Γ(k) (6.9)o erro ou desvio entre a saıda do modelo de referencia, Γm, e a diversidade da populacao,
Γ, na geracao k. O ajuste de θ, Secao 4.4.1.1, e realizado no sentido contrario do gradiente
de J , isto e,
dθ
dt= −η e
de
dθ
= η edΓ
dθ. (6.10)
sendo η uma constante que define o tamanho do passo sobre a superfıcie de J . Utilizando
a regra da cadeia em dΓ/dθ, o ajuste de θ torna-se
dθ
dt= η e
dΓ
du
du
dθ. (6.11)
98
A partir da Equacao 6.7, chega-se a du/dθ = uc, transformando o ajuste de θ em
dθ
dt= η e
dΓ
duuc. (6.12)
A derivada dΓ/du e aproximada pelo quasi-gradiente estocastico, Equacao 5.26, para
u = {β, pm}. O sistema de controle apresentado nesta subsecao e equivalente ao da
Figura 6.1, sem o laco usual que liga a saıda do processo evolucionario a entrada do
controlador.
6.5.2 Estrategia Baseada no Sinal de Comando e na Saıda do Processo
Esta estrategia de controle e baseada em dois lacos, o interno retorna ao controlador a
saıda do processo evolucionario e o externo ajusta os parametros do controlador atraves
do desvio entre as saıdas do processo e a desejada. Portanto, o sinal de controle e definido
como
u(k) = θ1(k) uc(k)− θ2(k) Γ(k), (6.13)sendo θ = [θ1 θ2]
T o vetor de parametros do controlador.
Pelo metodo MIT, os ajustes dos parametros do controlador, θi, i = 1, 2, sao realizados
como segue
dθidt
= −η e∂e
∂θi, i = 1, 2. (6.14)
Aplicando a regra da cadeia em dΓ/dθi, i = 1, 2, e utilizando a Equacao 6.13 para
encontrar ∂u/∂θi, i = 1, 2, tem-se
∂e
∂θ1= −
∂Γ
∂u
∂u
∂θ1
= −∂Γ
∂uuc (6.15)
e
∂e
∂θ2= −
∂Γ
∂u
∂u
∂θ2
=∂Γ
∂uΓ. (6.16)
99
A derivada parcial ∂Γ/∂u e, assim como na subsecao anterior, aproximada pelo quasi-
gradiente estocastico, Equacao 5.26. O sistema de controle apresentado nesta subsecao e
equivalente ao da Figura 6.1.
6.5.3 Mecanismo de Selecao
A partir do equilıbrio de Hardy-Weinberg, Secao 3.4, conclui-se que nao ha evolucao
sem variacao genica. Por esse motivo, e importante que o controle da diversidade seja
tal que a evolucao da populacao, do ponto de vista da aptidao media da populacao,
nao seja prejudicada. Contudo, mesmo em uma populacao ideal de Wright-Fisher, com
selecao aleatoria e sem migracao, ocorre perda de diversidade em consequencia da de-
riva genetica. A perda da diversidade e, pois, inerente em populacoes naturais ou de
algoritmos evolucionarios com baixas taxas de mutacao.
Pelas razoes supracitadas, o mecanismo de selecao proposto determina que parte da
populacao seja selecionada de modo a preservar a diversidade. A outra parte da po-
pulacao e selecionada por um metodo padrao (e.g., torneio ou roleta), tendendo a evoluir
a populacao do ponto de vista da sua aptidao media. Ademais, para garantir que a
melhor solucao sempre prevaleca e possibilitar a deteccao de variacoes do ambiente, o
melhor indivıduo sempre e selecionado para a proxima geracao.
O mecanismo de selecao proposto e executado em tres estagios, a saber:
1. Selecao do melhor indivıduo para assegurar a permanencia da melhor solucao na
proxima geracao;
2. Selecao de αN indivıduos por selecao padrao (e.g., torneio ou roleta). Este estagio
tende a selecionar os indivıduos mais aptos, provavelmente, proximos do melhor
indivıduo, que criarao nichos propiciando a explotacao nesta regiao; e
3. Selecao dos (1 − α)N − 1 indivıduos restantes em funcao das suas distancias ao
ponto medio geometrico da populacao utilizando a Equacao 5.6, substituindo fi por
di.
Quando nao ha pressao de selecao, i.e., β = 0, os metodos padroes de selecao tornam-
se aleatorios. No entanto, como descrito no Capıtulo 3, mesmo com selecao aleatoria ha
perda de diversidade. Isso so nao ocorre se a taxa de mutacao for alta, o que inevitavel-
mente causa instabilidade no processo de busca por aumento da aleatoriedade. Mesmo
100
sem pressao de selecao havera perda de diversidade. Por essa razao, o Estagio 3 tem forte
enfase no controle da diversidade, pois a selecao e efetuada em funcao das distancias dos
(1 − α)N − 1 indivıduos restantes ao ponto medio geometrico da populacao. Portanto,
quanto maior di de um indivıduo, maior wi e sua probabilidade de selecao. Como descrito
na Secao 5.3, aumentando a pressao de selecao, as probabilidades de selecao de indivıduos
mais aptos sao elevadas.
A Figura 6.2 mostra o pseudo-codigo do modelo de controle adaptativo de diversidade
proposto, sendo, P (k) a populacao na geracao k, Q(k) uma sub-populacao de P (k) com
indivıduos candidatos a pais, F (k) uma populacao de filhos de Q(k), F ′(k) a populacao
F (k) apos a mutacao e S(k) a populacao de selecionados para a proxima geracao, k + 1.
Figura 6.2 Pseudo-codigo do metodo de controle de diversidade proposto — DRAC
6.6 CONTROLE DE PDF APLICADO AOS AES
Nesta abordagem, a PDF da diversidade da populacao de AEs e controlada ao inves da
propria diversidade. O controle da diversidade da populacao fornece uma indicacao global
101
da diversidade, sem uma indicacao da distribuicao dos indivıduos no espaco de solucoes.
No processo evolucionario, quando apenas a diversidade for controlada pode-se conseguir
que seu nıvel seja o desejavel sem que a distribuicao dos indivıduos no espaco de solucoes
seja adequado. Por exemplo, mesmo se a maioria da populacao estiver muito proxima do
melhor indivıduo, a diversidade pode se aproximar do valor desejado se alguns indivıduos
estiverem afastados do ponto medio da populacao. Entretanto, essa proximidade excessiva
da maioria da populacao ao melhor indivıduo pode prejudicar a busca global.
Se a PDF da diversidade for controlada, estara sendo controlada a diversidade espe-
rada para a proxima geracao e, indiretamente, a distribuicao dos indivıduos no espaco de
solucoes. Por exemplo, a Figura 6.3 mostra as PDFs de duas populacoes, ambas com a
mesma diversidade media. Na Figura 6.3(a), a PDF tem pouca variancia, o que significa
que provavelmente havera pouca variacao da diversidade na proxima geracao. Isso pode
ocorrer porque a maioria dos indivıduos esta concentrada na vizinhanca do ponto medio
da populacao. Assim, os descendentes tendem a surgir nessa mesma vizinhanca, variando
pouco a diversidade se a taxa de mutacao for baixa. Nesse caso, um aumento da taxa
de mutacao poderia dissipar um pouco mais a populacao, aumentando a variancia da
PDF da diversidade. Na Figura 6.3(b), a PDF tem maior variancia, o que significa uma
populacao mais distribuıda no espaco de solucoes. Logo, a diversidade podera assumir
um intervalo de valores maior na proxima geracao. No controle da diversidade, e.g.,
por modelo de referencia, essa identificacao da distribuicao dos indivıduos no espaco de
solucoes nao pode ser feita apenas pelo valor da diversidade.
0 0.2 0.4 0.6 0.8 10
0.2
0.4
0.6
0.8
1(a)
Γ(k+1)
PD
F
0 0.2 0.4 0.6 0.8 10
0.2
0.4
0.6
0.8
1(b)
Γ(k+1)
PD
F
Figura 6.3 PDFs de duas populacoes com mesma diversidade media.
O controle da PDF da diversidade da populacao pode equilibrar melhor a distribuicao
102
dos indivıduos no espaco de solucoes, permitindo maior equilıbrio entre explotacao e
exploracao. Ademais, o controle da PDF e, tambem, um controle indireto da diversidade,
pois ao se ajustar a PDF da diversidade aproxima-se o seu valor medio do valor medio
da PDF desejada.
O metodo de controle da PDF (WANG, 2000a) aplicado aos algoritmos evolucionarios
e implementado em tres fases:
1. geracao de amostras da diversidade da populacao;
2. identificacao do modelo do processo evolucionario via rede neural B-Spline; e
3. execucao do processo evolucionario utilizando a estrategia de controle de PDF.
As proximas subsecoes apresentam em detalhes as tres fases supracitadas.
6.6.1 Calculo da PDF da Diversidade
No inıcio do processo evolucionario, a diversidade da populacao e normalmente alta,
pois os indivıduos estao distribuıdos em grande parte do espaco de solucoes, resultando
uma PDF da diversidade com media alta e variancia baixa. Assim, a diversidade da
populacao tem pouca sensibilidade aos parametros do processo evolucionario. Ao longo
das geracoes, a diversidade tende a diminuir e a PDF torna-se mais sensıvel as variacoes
dos parametros. Essa particularidade pode ser observada na Figura 6.4, para o espaco
de solucoes da funcao de Ackley (EIBEN; SMITH, 2003), onde a taxa de mutacao foi
utilizada como sinal de controle, u. A Figura 6.4(a) mostra a PDF da populacao inicial,
as Figuras 6.4(b) e (c), depois de 100 e 200 geracoes, mostram PDFs similares, pois nao
ha grande variacao da diversidade desde a geracao inicial. A Figura 6.4(d) mostra a PDF
da populacao na geracao 500, que apresenta significativa sensibilidade as variacoes da
taxa de mutacao.
A justificativa para tal sensibilidade esta na distribuicao dos indivıduos no espaco
de solucoes. Quanto mais distribuıdos menor e a sensibilidade da diversidade, pois e ne-
cessario que muitos indivıduos sejam modificados para que haja uma variacao significativa
da diversidade, e vice-versa. O aumento da taxa de mutacao tende a aumentar a diversi-
dade, qualquer que seja seu nıvel. Entretanto, para uma mesma taxa de mutacao, quanto
menor a diversidade de uma populacao maior a variacao da diversidade em geracoes su-
cessivas. Por essa razao, a PDF tem maior variancia ao longo de centenas de geracoes,
devido a tendencia natural de queda da diversidade.
103
00.33
0.671.0
0
10
200
0.5
1
Γ
(a) PDF na populaçao inicial
u
PD
F
00.33
0.671.0
0
10
200
0.2
0.4
Γ
(b) PDF na geraçao 100
u
PD
F
00.33
0.671.0
0
10
200
0.2
0.4
Γ
(c) PDF na geraçao 200
u
PD
F
00.33
0.671.0
0
10
200
0.1
0.2
Γ
(d) PDF na geraçao 500
u
PD
F
Figura 6.4 PDF de uma populacao da geracao inicial ate a geracao 500.
104
Seja uma configuracao de parametros do processo evolucionario em uma geracao k, a
diversidade da populacao na proxima geracao, k + 1, pode assumir um valor dentro de
um intervalo em decorrencia da natureza estocastica do processo evolucionario. A PDF
da diversidade, γ(·, ·), em uma dada geracao k, e calculada considerando esse intervalo,
que tem uma distribuicao de probabilidade que corresponde a PDF da diversidade da
populacao na proxima geracao, k + 1.
6.6.2 Geracao de Amostras e Identificacao do Modelo do Processo Evolucionario
A geracao das amostras para identificacao da PDF da diversidade da populacao e feita
simulando o processo evolucionario. A identificacao do modelo, apresentada na Subsecao
4.5.2, considera o processo evolucionario como um sistema estocastico dinamico linear.
No modelo proposto, o processo evolucionario possui uma entrada de controle, a taxa
de mutacao, pm, porque sensibiliza significativamente a diversidade da populacao. Na
aproximacao do modelo estocastico, Secao 4.5.2, o processo e dinamico e linear, isto
e, a relacao entre wi e u (u = pm), i = 1, . . . , n, varia linearmente em funcao do
tempo. Portanto, a partir de uma determinada geracao, encontram-se os pesos vi,j ,
i = 1, . . . , n, j = 1, . . . , m, das funcoes de base radial.
A identificacao do modelo da PDF depende de varios fatores, como o espaco de
solucoes, que possui suas proprias particularidades, como a incidencia de platos, numero
de picos e suas inclinacoes. Por essas razoes, e necessario identificar um modelo de PDF
para cada espaco de solucoes.
A identificacao do modelo da PDF e realizado com o auxılio de uma populacao P (k),
colhendo amostras de diversidade da populacao descendente P (k+ 1) dada uma taxa de
mutacao, pm(k). Assim, cada valor de pm(k), para uma populacao P (k), produzira uma
PDF γ(Γ, pm) a partir de NΓ amostras, isto e,
γ(Γ, pm)← {Γ1, . . . ,ΓNΓ}, (6.17)
sendo Γi a i-esima amostra de diversidade. Com essas amostras de diversidade, e possıvel
calcular a funcao de distribuicao acumulativa, como segue
F (Γ, pm) =1
NΓ
(numero de Γi ≤ Γ), ∀Γ ∈ [a, b], i = 1, . . . , NΓ. (6.18)Portanto, a PDF da diversidade para uma dada taxa de mutacao, pm, pode ser obtida
como
105
γ(Γ, pm) =∆F (Γ, pm)
∆Γ, (6.19)
sendo ∆F (Γ, pm) e ∆Γ valores incrementais de F (Γ, pm) e Γ, respectivamente. Para se
construir o modelo de PDF, repete-se o procedimento anterior para todos os valores de
pm desejados, estabelecidos em um intervalo discreto.
A PDF desejada pode ser determinada de varias formas diferentes, pode ser fixa
durante todo o processo evolucionario ou pode variar em intervalos pre-determinados ou
de acordo com um retorno de desempenho do processo.
0 2 4 6 8 100
0.2
0.4
0.6
0.8(a)
Diversidade desejada (Γd)
γ(Γd, u
k)
0 2 4 6 8 100.18
0.2
0.22
0.24
0.26
0.28
0.3(b)
Diversidade desejada (Γd)
γ(Γd, u
k)
Figura 6.5 PDF desejada: (a) concentrada no melhor indivıduo ou gene e (b) distribuıda em
tres nichos no espaco de solucoes.
A Figura 6.5(a) mostra duas PDFs desejadas com distribuicao normal N(µ, σ2), sendo
µ a diversidade media e σ2 a variancia. Na Figura 6.5(b), a PDF desejada possui uma
distribuicao particular com tres picos de maior probabilidade de ocorrencia, sendo o maior
deles na diversidade media.
6.6.3 Estrategia de Controle de PDF
Esta secao apresenta o metodo de controle de PDF da diversidade a partir do algoritmo
apresentado na Secao 4.5.3. Como um sistema dinamico, que pode ser expresso um passo
a frente, tem-se
f(k + 1,Γ) = a1 f(k,Γ) + . . .+ an−1 f(k − n+ 2,Γ) +
C(Γ)D0 u(k) + . . .+ C(Γ)Dn−2 u(k − n + 2), (6.20)106
para todo Γ ∈ [a, b], sendo f(k,Γ) = γ(Γ, U(k)) − L(Γ). O objetivo do sistema de
controle e encontrar uma sequencia {pm(k)}, tal que a PDF da diversidade da populacao
se aproxime ao maximo de uma funcao de distribuicao de probabilidade pre-definida.
No algoritmo de controle, {pm(k)} deve ser selecionado de tal forma a minimizar o
seguinte criterio de desempenho
J =
∫ b
a
(γ(y, U(k))− g(y))2 dy. (6.21)
Substituindo a Equacao 6.20 na Equacao 6.21, o criterio J torna-se
J =
∫ b
a
(
n−1∑
i=2
ai f(k − i+ 1,Γ) + C(Γ)Di−1 u(k − i+ 1) + L(Γ)
−g(Γ) + a1 f(k,Γ) + C(Γ)D0 u(k))2 dΓ. (6.22)
Assumindo
g(Γ) = −
(n−1∑
i=2
ai f(k − i+ 1,Γ) + C(Γ)Di−1 u(k−i+1)
)− L(Γ) +
g(Γ)− a1 f(k,Γ), (6.23)sendo g(Γ) a PDF desejada, obtem-se
J =
∫ b
a
(C(Γ)D0 u(k)− g(Γ))2 dΓ. (6.24)Sendo f(k − i,Γ) = C(Γ)V (k − i) e u(k − i) conhecidos para i = 0, 1, 2, . . ., quando o
tempo amostral e k, g(Γ) e uma funcao conhecida em relacao a Γ. Assim, o criterio J
resulta
J =
(∫ b
a
(C(Γ)D0)2 dΓ
)u(k)2
−2
(∫ b
a
(C(Γ)D0g(Γ))2 dΓ
)u(k) +
∫ b
a
g(Γ)2 dΓ. (6.25)Para minimizar J , a entrada de controle u(k) pode ser obtida resolvendo
∂J
∂u(k)= 0. (6.26)
107
Considerando que a integral∫ bag(Γ)2dΓ e independente da entrada de controle u(k), esta
ultima pode ser obtida por
u(k) =
∫ baC(y)D0g(y)dy∫ ba(C(y)D0)2dy
(6.27)O algoritmo de controle de PDF da diversidade de algoritmos evolucionario e apre-
sentado a seguir:
1. Na geracao k, coletar pm(k) e um conjunto {Γki};
2. Utilizar as Equacoes 6.18 e 6.19, L(Γ), e {Γki} para formular f(k,Γ);
3. Para j = 1, 2, . . . , n− 1, usar f(k− j,Γ), {pm(k− 1), pm(k− 2), . . . , pm(k−n+2)},
todos os parametros conhecidos na Equacao 6.20 e uma dada distribuicao desejada
g(Γ) para calcular g(Γ);
4. Calcular as integrais∫ baC(Γ)D0k(Γ)dΓ e
∫ ba(C(Γ)D0)
2dΓ;
5. Calcular pm(k), usando a Equacao 6.27, e aplicar no processo evolucionario;
6. k = k + 1 e voltar ao passo 1 se o criterio de parada nao for atendido.
Figura 6.6 Diagrama de blocos do metodo de controle de PDF de diversidade.
No passo 1, o conjunto {Γki} e gerado a partir do proprio processo evolucionario,
como descrito na Subsecao 6.6.2. No passo 2, as amostras {Γki} geram γ(Γ, Uk−1), via
Equacoes 6.18 e 6.19, que subtraıdo em L(Γ) gera f(k,Γ). No passo 3, valores passados
108
de f(·, ·) e u, e uma PDF desejada, g(Γ), sao utilizados para encontrar g(Γ). Finalmente,
depois de calculadas as integrais do passo 4, o sinal de controle u = pm e encontrado
e aplicado no passo 4. A Figura 6.6 mostra o diagrama de blocos do metodo de con-
trole de PDF aplicado a AEs proposto. Todo o algoritmo descrito anteriormente esta
contido no bloco Controlador (RN B-spline), que tem como entrada a diversidade
da populacao na geracao k, a PDF desejada, PDFd, e os parametros do processo evolu-
cionario, {P (k), ψ(k)}, isto e, toda a populacao e os parametros dos fatores evolutivos
(e.g., pm(k), pc, β). Esse ultimo, {P (k), ψ(k)}, utilizado para simular o processo evolu-
cionario e gerar {Γki}. A saıda do controlador e o sinal de controle, pm, que e aplicado
no processo evolucionario.
6.7 DISCUSSOES FINAIS
Este capıtulo apresentou duas abordagens de controle de parametros em algoritmos evo-
lucionarios, os controles adaptativo e de PDF. A primeira abordagem, utilizando controle
adaptativo (NARENDRA; ANNASWAMY, 2005), visa controlar a diversidade da populacao
segundo um modelo de referencia. A segunda abordagem, utilizando controle de PDF
(WANG, 2000a), tem como objetivo controlar a funcao de distribuicao de probabilidade
da diversidade da populacao.
Os principais objetivos do controle da diversidade sao aumentar o numero de regioes
exploradas no espaco de busca e evitar a convergencia prematura. O controle adaptativo
trata o processo evolucionario como um processo a ser controlado. Na elaboracao dessa
abordagem, foi proposto um modelo de referencia geral, baseado em hipoteses funda-
mentadas pelo Capıtulo 3. O sistema de controle considera como variavel de entrada do
processo a pressao de selecao e/ou a taxa de mutacao. Para a determinacao do sinal de
controle e dos parametros do controlador, foram propostas duas estrategias de controle
baseadas no metodo MIT.
Os ajustes dos parametros do controlador contribuem para tornar o sistema de controle
mais sensıvel as condicoes do ambiente. A utilizacao de um modelo de referencia, alem
de guiar o mecanismo de ajuste com mais precisao, pode contribuir para se alcancar um
modelo de referencia que proporcione um melhor desempenho do processo evolucionario.
A abordagem de controle de PDF em AEs realiza, primeiramente, a identificacao
da PDF da saıda do processo evolucionario utilizando uma rede neural B-Spline. Apli-
cado aos AEs, esse metodo realiza a identificacao do processo quando a diversidade da
109
populacao atinge a diversidade media da PDF desejada. Em seguida, o metodo do gra-
diente descendente e utilizado para ajustar a entrada do processo — a taxa de mutacao.
A principal vantagem do controle de PDF em AEs e poder, tambem, controlar a
diversidade media esperada para a proxima geracao, a variancia e, indiretamente, a dis-
tribuicao dos indivıduos no espaco de solucoes, como descrito na Secao 6.6. Assim, e
possıvel testar diferentes PDFs desejadas para cada tipo de problema e tentar encontrar
um padrao de distribuicao dos indivıduos que alcance melhores resultados.
110
CAPITULO 7
ESTUDO DE CASOS
7.1 INTRODUCAO
Os metodos propostos, DRAC e PDFEA, foram testados e analisados em 26 experimen-
tos, onde investigou-se o comportamento do modelo de referencia, o rastreamento do
sistema de controle e o desempenho em relacao ao AGP e seis algoritmos evolucionarios
adaptativos, a saber, diversity control-oriented genetic algorithm (DCGA) (SHIMODAIRA,
2001), Subsecao 2.5.1, diversity-guided evolutionary algorithm (DGEA) (URSEM et al.,
2002), Subsecao 2.5.2, elitism-based and random immigrants genetic algorithm (ERIGA)
(YANG; TINOS, 2007), Subsecao 2.5.1, random immigrants genetic algorithm (RIGA)
(GREFENSTETTE, 1992), Subsecao 2.5.1, trigged hypermutation (THM) (COBB, 1990),
Subsecao 2.5.1, e two-loop real-coded genetic algorithm (TRAM) (HERRERA; LOZANO,
2000), Subsecao 2.5.1. Os parametros utilizados por esses metodos foram os mesmos
sugeridos por seus autores nos respectivos trabalhos.
O metodo DRAC, Secao 6.5, foi implementado em tres versoes ao longo desta tese
de doutorado. A primeira versao, DRAC v1 (GOUVEA JR.; ARAUJO, 2008a), nao utiliza
o modelo de dinamica de populacoes (GOUVEA JR.; ARAUJO, 2008b), Capıtulo 5, tem a
pressao de selecao, β, como sinal de controle e o mecanismo de selecao proposto, Secao
6.5.3. A segunda versao utiliza o modelo de dinamica de populacoes e duas abordagens,
DRAC v2, que utiliza a pressao de selecao como sinal de controle, e DRAC v2.a, que
adota a taxa de mutacao, pm, como sinal de controle.
O modelo de referencia de diversidade foi analisado em 4 experimentos comparando
o desempenho dos tres modelos apresentados na Secao 6.2. O objetivo foi reforcar a
hipotese, apresentada na mesma secao, que define um modelo de referencia geral inde-
pendente de um modelo analıtico. O rastreamento do sistema de controle foi investigado
em 6 experimentos com dois ambientes distintos utilizando as tres versoes do metodo
DRAC. Finalmente, os metodos DRAC v2, DRAC v2.a e PDFEA foram testados em 16
experimentos com seis ambientes com caracterısticas distintas, apresentados no Apendice
A, comparando seus desempenhos com um AGP e os seis AEs adaptativos supracitados.
111
O restante deste capıtulo esta organizado como segue. A Secao 7.2 apresenta o pla-
nejamento dos experimentos. A Secao 7.3 descreve o metodo utilizado para simular
ambientes dinamicos. A Secao 7.4 investiga o rastreamento realizado pelo sistema de
controle. Na Secao 7.5, sao realizados experimentos com diferentes modelos de referencia
de diversidade com o objetivo de mostrar que a hipotese apresentada na Secao 6.2 nao
depende de um modelo analıtico. A Secao 7.6 apresenta os experimentos com dois ambi-
entes contınuos, a funcao de Ackley (EIBEN; SMITH, 2003), na Subsecao 7.6.1, e a funcao
de Schwefel (SCHWEFEL, 1995), na Subsecao 7.6.2. A Secao 7.7 apresenta os experimen-
tos com a funcao nao-contınua do gerador moving peaks (MORRISON, 2004). Nas Secoes
7.8 e 7.9, sao apresentados experimentos com dois problemas NP-completo de otimizacao
combinatoria, a saber, o problema da mochila e o projeto de rede de radio-transmissores.
A Secao 7.10 apresenta experimentos com um problema de roteamento. Na Secao 7.12,
sao feitas as discussoes finais.
7.2 PLANEJAMENTO DOS EXPERIMENTOS
Esta secao apresenta os parametros gerais utilizados por todos os algoritmos evolu-
cionarios utilizados, assim como os parametros individuais caracterısticos de cada al-
goritmo. A maioria desses parametros utilizou os valores recomendados pelos respectivos
autores, e em alguns casos valores que alcancaram os melhores desempenhos nos expe-
rimentos. Os experimentos utilizaram problemas teste apresentados no Apendice A, a
saber, as funcoes contınuas de Ackley (EIBEN; SMITH, 2003) e Schwefel (1995), Secao
A.2, o gerador de ambiente nao-contınuo moving peaks (MORRISON, 2004), Secao A.3, e
os problemas combinatorios da mochila (SMITH; GOLDBERG, 1992), Secao 7.8, o projeto
de rede de radio-transmissores, Secao 7.9, e o roteamento de redes, Secao 7.10. Com
excecao do roteamento de redes, em todos os experimentos foram simulados ambientes
dinamicos com variacoes cıclicas de 40 geracoes, que mudavam a localizacao do otimo
global, os parametros estruturais ou as restricoes do problema. No roteamento de redes,
as variacoes ocorreram a ciclos de 100 geracoes, um numero constatado, empiricamente,
como mınimo para construcao de caminhos validos.
A seguir sao apresentados os parametros individuais, caracterısticos de cada algoritmo
evolucionario:� No DCGA, a probabilidade de selecao, Equacao 2.13, foi adaptada para genotipos
com codificacao real, substituindo a distancia de Hamming, Hi, pela distancia Eu-
112
clidiana. Para os coeficientes c e α foram utilizados os valores 0.01 e 0.19, respec-
tivamente;� No DGEA, Γmin = 0.02 e Γmax = 0.2;� No DRAC, Γmin = 0.1 e Γm(k) = 0.5Γ(0) apos as mudancas do ambiente;� No RIGA, o numero de imigrantes aleatorios, ni, foi de 30 indivıduos;� No ERIGA, o numero de imigrantes, composto por duas sub-populacoes de imigran-
tes elitistas e aleatorios, ni = nei+nri, foi de 30 indivıduos, sendo o numero mınimo
de imigrantes de cada sub-populacao igual a 4 indivıduos e a taxa de decrescimento,
α, igual a 2 indivıduos;� No THM, foi utilizado uma taxa de hiper-mutacao igual a 0.5 por duas geracoes
consecutivas apos as mudancas do ambiente;� No TRAM, δmin foi 1.0e-100, ∆0 foi 1, G0 foi 100 geracoes e Gmin foi 5 geracoes.
A metrica de diversidade da populacao foi baseada na Equacao 3.11 e o modelo de
referencia foi definido em funcao da dinamica da heterozigosidade, Equacao 3.23, sendo
Γmin = 0.1Γ(0) e Ne = 10. No modelo de referencia, a diversidade decresce ate um
valor mınimo pre-determinado. A Tabela 7.1 mostra os valores dos parametros comuns
utilizados por todos os AEs. A taxa de mutacao igual a 0.05 foi atribuıda aos AEs
que fixam este parametro, como, por exemplo, o AGP. Para cada experimento, foram
realizadas 30 execucoes com um conjunto de sementes comum para todos os AEs. A
analise de desempenho, baseada nos valores medios das 30 execucoes, considerou:� MMA: media das melhores aptidoes (MORRISON, 2004) por geracao, definida como
FT =1
G
G∑
g=1
(1
M
M∑
m=1
Fm,g
), (7.1)
sendo Fm,g a melhor aptidao da g-esima geracao na m-esima execucao, M o numero
de execucoes, e G o numero de geracoes. Se G→∞, o efeito da variacao da melhor
aptidao causado sobre FT em qualquer geracao e reduzido.� DP: desvio padrao de MMA, que pode refletir a variacao da melhor aptidao depois
das mudancas do ambiente.
113
� P(·): os resultados apresentaram distribuicao normal; portanto, foi aplicado o teste
de hipotese, pelo metodo t-test, para nıvel de significancia de 0.05, em relacao ao
MMA de um dos metodos propostos comparado aos demais AEs. Os resultados sao
apresentados com as seguintes notacoes: sinal de adicao (+), se o metodo proposto
for superior; sinal de subtracao (–), se o metodo proposto for inferior; ou sinal
aproximado (≈), se os resultados forem estatisticamente iguais.
Tabela 7.1 Parametros fixos comuns utilizados nos experimentos.
Parametro Valor
Tamanho da populacao 120
Dimensao (# de genes) 30
Taxa de selecao de pais 0.5
Probabilidade de cruzamento 0.6
Metodo de cruzamento 2-pontos
Probabilidade de mutacao 0.05
Metodo de selecao Torneio
Tamanho do grupo do torneio 10
Modelo de sel. de sobreviventes Generacional
Numero de geracoes 1 mil
7.3 DINAMICA DOS AMBIENTES
Para simular um ambiente dinamico, com variacoes discretas, utilizou-se para todos os
ambientes o metodo implementado no gerador moving peaks, que utiliza uma funcao nao-
linear de uma dimensao com passo de transicao simples, que tende a aumentar sua com-
plexidade progressivamente. Uma funcao que atende esses requisitos e a funcao logıstica,
descrita como segue
Y (k + 1) = AY (k) (1− Y (k)), (7.2)sendo A uma constante e Y (k) o valor da funcao na geracao k. A constante A determina
a complexidade da dinamica do ambiente. Por exemplo, se A = 2.9, Y converge para um
valor estavel; a medida que A cresce, surgem dinamicas mais complexas. Valores de A
maiores que 3.5 geram uma sequencia caotica de Y . A Figura 7.1 mostra duas sequencias
114
de Y , Y (0) = 0.5, para A = 2.9, que gera valores sempre iguais a 0.6552 depois de,
aproximadamente, 56 iteracoes, e A = 3.8, que gera uma sequencia caotica.
0 20 40 60 800
0.2
0.4
0.6
0.8
1(a) Sequencia de Y para A = 2.9.
Iteraçoes
Y(k
)
0 20 40 60 800
0.2
0.4
0.6
0.8
1(b) Sequencia de Y para A = 3.8.
Iteraçoes
Y(k
)
Figura 7.1 Sequencias geradas pela funcao logıstica para diferentes valores de A.
Nos experimentos realizados, consideram-se tres tipos de comportamentos dinamicos,
dois lineares e um caotico. O comportamento dinamico linear pode ter variacoes peque-
nas, A = 1.05, ou grandes, A = 1.95. O comportamento dinamico caotico tem variacoes
aleatorias, A = 3.9. Os valores de Y determinam o tamanho do intervalo de variacao do
ambiente. Por exemplo, em um problema onde a variacao do ambiente e determinada
pela mudanca da coordenada do otimo no espaco de solucoes, sua dinamica e definida
pela expressao
X∗
i (k + 1) = X∗
i (k) + Y (k) ·Xr, i = 1, . . . , Nd, (7.3)sendo X∗
i o otimo da i-esima variavel de decisao, Xr = Xmax − Xmin e Nd o numero de
variaveis de decisao. Para variacoes pequenas, Y (k) = 0.0476 e produzido, i.e., quando o
ambiente varia, o otimo move-se 4.76% de Xr. Para variacoes grande, Y (k) = 0.4872, i.e.,
o otimo move-se 48.72% de Xr, e para variacoes caoticas, o otimo move-se aleatoriamente.
Na simulacao de um ambiente dinamico, X∗ pode ser substituido por uma restricao, como
o peso limite, C, no problema da mochila, ou um parametro estrutural, como o valor da
conexao entre dois nos no roteamento de redes.
7.4 ANALISE DE RASTREAMENTO
O objetivo do metodo de controle de diversidade proposto e alcancar a estabilidade as-
sintotica
115
limk→∞
e = Γm(k)− Γ(k) = 0. (7.4)Entretanto, a estrategia de controle com o metodo MIT nao garante a convergencia
e = 0, para k → ∞. Porem, a estrategia elaborada pode alcancar uma convergencia
com margem de erro aceitavel, considerando a natureza do processo evolucionario. Em
decorrencia da deriva genetica somada a uma baixa taxa de mutacao, mesmo sem pressao
de selecao, a diversidade da populacao tende a decair. Com uma taxa de mutacao elevada,
a diversidade tende a aumentar. O equilıbrio entre a deriva genetica, somada a selecao, e
a taxa de mutacao pode levar a saıda do processo evolucionario a convergir com a saıda
do modelo de referencia com uma margem de erro aceitavel. Portanto, e possıvel que o
modelo de referencia seja rastreado pelo processo evolucionario.
Na primeira versao do DRAC (DIVERSITY-BASED. . . , 2007; GOUVEA JR.; ARAUJO,
2008a), nao foi utilizado o modelo de dinamica de populacoes (GOUVEA JR.; ARAUJO,
2008b), Capıtulo 5. Assim, no metodo DRAC v1, a derivada dΓ/du, Equacao 6.12, e es-
tabelecida como uma constante. Com isso, o sistema de controle fica mais parametrizado
e nao tem a sensibilidade do erro em relacao ao sinal de controle.
Com a utilizacao do modelo de dinamica de populacoes, foi possıvel calcular a derivada
dΓ/du, pelo quasi-gradiente de Γ, Equacao 5.26. Assim, foi possıvel criar um modelo de
controle menos parametrizado, que ajusta o sinal de controle conforme sua sensibilidade
sobre o erro, e.
Esta secao apresenta 6 experimentos com todas as versoes do DRAC com dois ambi-
entes com diferentes dinamicas. O objetivo destes experimentos e analisar a convergencia
do sistema de controle de diversidade proposto. Foram utilizados o gerador moving peaks,
MP, e o problema da mochila, PM. Para cada ambiente, utilizou-se um comportamento
estatico e dois dinamicos com variacoes grandes e caoticas.
7.4.1 Analise de Rastreamento em Ambientes Estaticos
Os Experimentos 7.4.1.a, moving peaks, e 7.4.1.b, problema da mochila, utilizaram ambi-
entes estaticos. Desse modo, pode-se analisar a tendencia de convergencia quando a di-
versidade do modelo de referencia for fixa, apos atingir um valor mınimo pre-estabelecido.
DRAC v1 utilizou dΓ/du = {0.1, 10} nos Experimentos 7.4.1.a e 7.4.1.b, respectivamente.
Esses valores, obtidos empiricamente, foram os que alcancaram os melhores resultados
em relacao ao erro medio, e, em cada experimento.
116
A Figura 7.2 mostra as diversidades do modelo de referencia e da populacao, e o erro,
e = Γm − Γ, em uma simulacao no gerador moving peaks. Em todos os experimentos,
observa-se, pela diversidade e, mais claramente, pelo erro uma tendencia de rastreamento
ao longo das geracoes. Os saltos do erro, ocorridos em alguns instantes, sao decorrentes
da natureza estocastica do processo evolucionario que eleva a diversidade da populacao
em algumas geracoes. Entretanto, apos tais picos, o erro tende a decair, aproximando a
diversidade da populacao da saıda do modelo de referencia.
0 200 400 600 800 10000
0.5
1(a) Estabilidade no DRAC v1
Div
ersi
dade
0 200 400 600 800 1000−0.5
0
0.5
1
(b) Erro, e = Γm
− Γ, no DRAC v1
Err
o
0 200 400 600 800 10000
0.5
1(c) Estabilidade no DRAC v2
Div
ersi
dade
0 200 400 600 800 1000−0.5
0
0.5
1
(d) Erro, e = Γm
− Γ, no DRAC v2
Err
o
0 200 400 600 800 10000
0.5
1(e) Estabilidade no DRAC v2.a
Div
ersi
dade
Geraçoes0 200 400 600 800 1000
−0.5
0
0.5
1
(f) Erro, e = Γm
− Γ, no DRAC v2.a
Err
o
Geraçoes
Figura 7.2 Analise de rastreamento no moving peaks em ambiente estatico.
A Figura 7.3 mostra as diversidades e os erros no problema da mochila — Experimento
7.4.1.b. Nas duas versoes do DRAC onde o sinal de controle e a pressao de selecao, Figuras
7.3(a)-(d), observa-se a dificuldade do sistema de controle de aproximar a diversidade
da populacao da saıda do modelo de referencia. Essa dificuldade vem da natureza do
117
ambiente, onde indivıduos geneticamente distintos podem ter aptidoes muito diferentes.
Assim, a selecao nao favorece a criacao de nichos de indivıduos geneticamente similares, o
que tende a diminuir a diversidade. Por essa razao, ha forte variabilidade da diversidade
e o sistema de controle com a pressao de selecao, mesmo utilizando o mecanismo proposto
na Secao 6.5.3, nao tem grande efeito sobre a diversidade.
No experimento com o DRAC v2.a, Figuras 7.3(e)-(f), onde o sinal de controle e a
taxa de mutacao, observa-se que a diversidade da populacao fica proxima da saıda do
modelo de referencia, ainda que existam picos do erro. Ao contrario da pressao de selecao,
a taxa de mutacao tem forte efeito sobre a diversidade, pois a mutacao, quando elevada,
provoca grande variacao genetica. Outro fator importante e a utilizacao do modelo de
dinamica de populacoes, que auxilia o sistema de controle ao considerar a sensibilidade
da diversidade em relacao ao sinal de controle.
A Tabela 7.2 mostra o erro medio, e, e o desvio padrao do erro, DP(e), nos dois
ambientes estaticos — Experimentos 7.4.1.a e 7.4.1.b. Nos experimentos com o moving
peaks, os erros medios e os desvios padrao foram muito menores do que nos experimentos
com o problema da mochila, especialmente nas versoes DRAC v1 e v2. O ambiente
moving peaks, ainda que nao-contınuo, proporcional aptidoes semelhantes aos indivıduos
situados nas vizinhancas dos picos. Essa caracterıstica, em ambientes estaticos, favorece
o controle da diversidade.
Nos experimentos com o problema da mochila, os erros medios e os desvios padrao
foram mais significativos nas versoes DRAC v1 e v2 se comparados com a versao DRAC
v2.a. No problema da mochila, as versoes baseadas na pressao de selecao, DRAC v1 e
v2, obtiveram e e DP(e) semelhantes. Na versao DRAC v2.a, e foi baixo, assim como o
DP(e), ambos comparaveis aos valores que esta versao obteve no ambiente moving peaks.
Tabela 7.2 Resultados da analise de rastreamento em ambientes estaticos: Experimentos
7.4.1.a e 7.4.1.b.
Problema Metodo e DP(e)
DRAC v1 0.0402 0.0622
M.Peaks DRAC v2 0.0530 0.0948
DRAC v2.a 0.0451 0.0714
DRAC v1 0.1862 0.1502
Mochila DRAC v2 0.1882 0.1964
DRAC v2.a 0.0752 0.1085
118
0 200 400 600 800 10000
0.5
1(a) Estabilidade no DRAC v1
Div
ersi
dade
0 200 400 600 800 1000−1
−0.5
0
0.5
(b) Erro, e = Γm
− Γ, no DRAC v1
Err
o
0 200 400 600 800 1000
−0.5
0
0.5
(d) Erro, e = Γm
− Γ, DRAC v2
Err
o
0 200 400 600 800 10000
0.5
1
Geraçoes
Div
ersi
dade
(e) Estabilidade no DRAC v2.a0 200 400 600 800 1000
0
0.5
1(c) Estabilidade no DRAC v2
Div
ersi
dade
0 200 400 600 800 1000
−0.5
0
0.5
(f) Erro, e = Γm
− Γ, DRAC v2.a
Geraçoes
Err
o
ΓΓ
m
ΓΓ
m
ΓΓ
m
Figura 7.3 Analise de rastreamento no problema da mochila em ambiente estatico.
119
7.4.2 Analise de Rastreamento em Ambientes Dinamicos Cıclicos: 200 Geracoes
Os Experimentos 7.4.2.a, com o moving peaks, e 7.4.2.b, com o problema da mochila,
utilizaram ambientes dinamicos com variacoes grandes a ciclos de 200 geracoes. Para
alcancar o melhor resultado em relacao ao erro medio, e, DRAC v1 utilizou dΓ/du =
{0.5, 12} nos Experimentos 7.4.2.a e 7.4.2.b, respectivamente.
As Figuras 7.4(a)-(d) mostram as diversidades e o erro no moving peaks em experimen-
tos com as versoes DRAC v1 e v2, baseadas na pressao de selecao. Nestes experimentos,
observa-se a tendencia de a diversidade da populacao acompanhar a diversidade do mo-
delo de referencia. Porem, observa-se tambem a dificuldade de elevar-se a diversidade
da populacao nos picos de crescimento do modelo de referencia — em decorrencia das
variacoes do ambiente. Dentre as versoes DRAC v1 e v2, a primeira, sem a dinamica de
populacoes, teve mais facilidade de elevar a diversidade por ter utilizado dΓ/du elevado,
mas o erro nos intervalos de Γm constante e menor.
As Figuras 7.4(e)-(f) mostram a diversidade e o erro no moving peaks para a versao
DRAC v2.a, baseada na taxa de mutacao. O erro de rastreamento da versao DRAC
v2.a, Figura 7.4(f), e menor do que os erros das versoes baseadas na pressao de selecao.
Isso ocorreu porque nos picos do modelo de referencia a diversidade da populacao e
rapidamente elevada na versao DRAC v2.a. Mais uma vez observa-se a dificuldade de se
aumentar a diversidade quando o sinal de controle e a pressao de selecao. Nos intervalos
de Γm fixa, assim como nos experimentos com ambientes estaticos, o erro tende a ser
reduzido em todas as versoes do DRAC.
As Figuras 7.5(a)-(d) mostram as diversidades e os erros no problema da mochila,
para as versoes DRAC v1 e v2. Assim como nos experimentos com ambiente estatico,
as versoes baseadas na pressao de selecao tem dificuldade de acompanhar o modelo de
referencia. Mesmo nos intervalos de Γm fixa, ha pouca tendencia de reducao do erro. As
Figuras 7.5(e)-(f) mostram a convergencia e o erro do DRAC v2.a no problema da mochila.
Neste experimento, observa-se o rastreamento produzido pelo sistema de controle mesmo
nos picos do modelo de referencia.
A Tabela 7.3 mostra os resultados dos Experimentos 7.4.2.a e 7.4.2.b. No Experimento
7.4.2.a, moving peaks, diferentemente do experimento com ambiente estatico, e e DP(e)
do DRAC v2.a, baseada na taxa de mutacao, sao significativamente menores do que os
valores das versoes DRAC v1 e v2, baseadas na pressao de selecao.
No problema da mochila, e e DP(e) foram maiores do que nos experimentos do moving
120
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
(a) Estabilidade no DRAC v1
0 200 400 600 800 1000−0.5
0
0.5
1
Err
o
(b) Erro, e = Γm
− Γ, no DRAC v1
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
(c) Estabilidade no DRAC v2
0 200 400 600 800 1000−0.5
0
0.5
1
Err
o
(d) Erro, e = Γm
− Γ, no DRAC v2
ΓΓ
m
ΓΓ
m
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
Geraçoes
(e) Estabilidade no DRAC v2.a
0 200 400 600 800 1000−1
−0.5
0
0.5
1
(f) Erro, e = Γm
− Γ, no DRAC v2.a
Geraçoes
Err
o
ΓΓ
m
Figura 7.4 Analise de rastreamento no moving peaks em ambiente dinamico com variacoes
cıclicas de 200 geracoes.
121
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
(a) Estabilidade no DRAC v1
0 200 400 600 800 1000−1
−0.5
0
0.5
1
Err
o
(b) Erro, e = Γm
− Γ, no DRAC v1
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
(c) Estabilidade no DRAC v2
0 200 400 600 800 1000−1
−0.5
0
0.5
Err
o
(d) Erro, e = Γm
− Γ, no DRAC v2
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
Geraçoes
(e) Estabilidade no DRAC v2.a
0 200 400 600 800 1000−1
−0.5
0
0.5
1
Err
o
Geraçoes
(f) Erro, Γm
− Γ, no DRAC v2.a
ΓΓ
m
ΓΓ
m
ΓΓ
m
Figura 7.5 Analise de rastreamento no problema da mochila em ambiente dinamico com va-
riacoes cıclicas de 200 geracoes.
122
peaks, assim como ocorreu nos experimentos com ambientes estaticos. O DRAC v2.a
obteve melhores resultados do que as versoes DRAC v1 e v2, o que reforca a maior
eficiencia do sistema de controle baseado na taxa de mutacao em rastrear o modelo de
referencia.
Tabela 7.3 Resultados da analise de rastreamento em ambientes dinamicos com variacoes
cıclicas de 200 geracoes: Experimentos 7.4.2.a e 7.4.2.b.
Problema Metodo e DP(e)
DRAC v1 0.1245 0.1826
M.Peaks DRAC v2 0.1392 0.2041
DRAC v2.a 0.0885 0.1277
DRAC v1 0.1960 0.1765
Mochila DRAC v2 0.2546 0.1907
DRAC v2.a 0.1236 0.1609
7.4.3 Analise de Rastreamento em Ambientes Dinamicos Cıclicos: 40 Geracoes
Os Experimentos 7.4.3.a e 7.4.3.b utilizaram ambientes dinamicos com variacoes caoticas
a ciclos de 40 geracoes. A Figura 7.6 mostra as diversidades e o erro em uma simulacao
no gerador moving peaks. Neste experimentos, a frequencia de variacao menor dificulta
o rastreamento, resultando erros maiores em relacao aos experimentos anteriores. Entre-
tanto, todas as versoes do DRAC tenderam a rastrear o modelo de referencia, o que pode
ser observado principalmente nas Figuras 7.6(b), (d) e (f). Os picos de variacao, mais
acentuados do que nos experimentos anteriores, sao consequencia de um ambiente que
varia com maior frequencia. Assim como nos experimentos anteriores, a versao DRAC
v2.a, Figuras 7.6(e)-(f), apresentou melhor rastreamento.
A Figura 7.7 mostra as diversidades e o erro no problema da mochila. Neste ambiente,
a diversidade media da populacao tende a ser maior do que no moving peaks, como pode
ser observado tambem nos experimentos anteriores. A natureza do ambiente somada
a maior frequencia de variacoes e sua caracterıstica caotica dificulta o rastreamento do
modelo de referencia. A versao DRAC v2.a, assim como nos experimentos anteriores,
obteve melhor rastreamento.
A Tabela 7.4 mostra os resultados dos Experimentos 7.4.3.a e 7.4.3.b. Como esperado
em razao da maior variacao do ambiente, os erros medios e os desvios padrao no moving
123
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
(a) Estabilidade no DRAC v1
0 200 400 600 800 1000−0.5
0
0.5
1
Err
o
(b) Erro, Γm
− Γ, no DRAC v1
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
(c) Estabilidade no DRAC v2
0 200 400 600 800 1000−0.5
0
0.5
1
Err
o
(d) Erro, Γm
− Γ, no DRAC v2
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
Geraçoes
(e) Estabilidade no DRAC v2.a
0 200 400 600 800 1000−0.5
0
0.5
1
Err
o
Geraçoes
(f) Erro, Γm
− Γ, no DRAC v2.a
ΓΓ
m
ΓΓ
m
ΓΓ
m
Figura 7.6 Analise de rastreamento no moving peaks em ambiente dinamico com variacoes
cıclicas de 40 geracoes.
124
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
(a) Estabilidade no DRAC v1
0 200 400 600 800 1000−1
−0.5
0
0.5
1
Err
o
(b) Erro, Γm
− Γ, no DRAC v1
0 200 400 600 800 10000
0.5
1
Div
ersi
dade
(c) Estabilidade no DRAC v2
0 200 400 600 800 1000−1
−0.5
0
0.5
1
Err
o
(d) Erro, Γm
− Γ, no DRAC v2
0 200 400 600 800 10000
0.5
1
Geraçoes
Div
ersi
dade
(e) Estabilidade no DRAC v2.a
0 200 400 600 800 1000−0.5
0
0.5
1
Geraçoes
Err
o
(f) Erro, Γm
− Γ, no DRAC v2.a
ΓΓ
m
ΓΓ
m
ΓΓ
m
Figura 7.7 Analise de rastreamento no problema da mochila em ambiente dinamico com va-
riacoes cıclicas de 40 geracoes.
125
peaks foram maiores do que nos experimentos anteriores. Ja no problema da mochila,
com excecao da versao DRAC v2.a, os erros foram similares aos ocorridos no Experimento
7.4.2.b — ciclos de 200 geracoes. Esses resultados podem ser explicados pela dificuldade
de rastreamento do sistema de controle baseado na pressao de selecao. Assim, a maior
frequencia de variacao do ambiente nao influenciou o desempenho do sistema de controle.
O desempenho do DRAC v2.a foi superior as versoes baseadas na pressao de selecao, mas
foi inferior ao proprio desempenho nos experimentos anteriores — com menor variacao
do ambiente. Dessa vez, o DRAC v2.a, que tem melhor capacidade de rastreamento que
as versoes baseadas na pressao de selecao, teve seu desempenho degradado pela maior
variacao do ambiente.
Tabela 7.4 Resultados da analise de rastreamento em ambientes dinamicos com variacoes
cıclicas de geracoes: Experimentos 7.4.3.a e 7.4.3.b.
Problema Metodo e DP(e)
DRAC v1 0.1876 0.1440
M.Peaks DRAC v2 0.1632 0.1515
DRAC v2.a 0.1372 0.1114
DRAC v1 0.2090 0.1750
Mochila DRAC v2 0.2389 0.1312
DRAC v2.a 0.1653 0.1560
7.4.4 Discussoes Finais Sobre o Rastreamento
Os experimentos realizados nesta secao apresentaram dois ambientes distintos, a funcao
nao-linear do moving peaks e o problema combinatorio da mochila. No primeiro ambiente,
o controle da diversidade da populacao, e consequente tendencia a diminuicao do erro, e
uma tarefa nao muito complexa, pois a selecao favorece indivıduos geneticamente seme-
lhantes. Por exemplo, indivıduos geneticamente semelhantes ao melhor indivıduo terao
mais chance de sobrevivencia ou de gerarem mais descendentes se a pressao de selecao
for alta. Assim, podera haver decaimento da diversidade. No problema da mochila, essa
caracterıstica nao e tao marcante, pois indivıduos geneticamente semelhantes podem ter
aptidoes completamente diferentes e, consequentemente, aumento da pressao de selecao
pode nao decair a diversidade.
Nas versoes DRAC v1 e v2, baseadas na pressao de selecao, foi possıvel rastrear o
126
sistema com uma margem de erro aceitavel em todos os experimentos com o moving
peaks. Ja no problema da mochila, as caracterısticas citadas no paragrafo anterior impe-
dem um controle efetivo da diversidade pela pressao de selecao. Ainda assim, o modelo
de referencia tem uma importante funcao, a de indicar o sentido de crescimento da di-
versidade. Em ambientes com alta frequencia de variacao, essa caracterıstica pode ser
importante, pois a diversidade media do modelo de referencia tende a ser maior.
Na versao DRAC v2.a, baseada na taxa de mutacao, houve rastreamento com margem
de erro baixa em todos os experimentos. A taxa de mutacao, como sinal de controle, e
a razao para esses resultados. Em um processo evolucionario com taxa de mutacao
elevada, inevitavelmente havera aumento da diversidade da populacao. Ao contrario,
uma taxa de mutacao reduzida somada a deriva genetica e a pressao de selecao tende
a decair a diversidade. O equilıbrio entre esses fatores, decorrente principalmente do
modelo de dinamica de populacoes (GOUVEA JR.; ARAUJO, 2008b), tende a reduzir o erro
principalmente quando a taxa de mutacao e utilizada como sinal de controle.
7.5 EXPERIMENTOS COM MODELOS DE REFERENCIA
Esta secao apresenta os resultados dos experimentos realizados com os tres modelos de
referencia de diversidade apresentados na Subsecao 6.2. O objetivo e mostrar que a partir
de propriedades gerais, a funcao que implementa o modelo de referencia nao influencia o
desempenho do sistema de controle proposto.
Foram realizados quatro experimentos com dois ambientes com caracterısticas dis-
tintas, o gerador moving peaks e o problema de otimizacao combinatoria da mochila.
Para cada ambiente, foram testadas as seguintes configuracoes: mudancas cıclicas de
40 geracoes e dinamica com variacoes pequenas e mudancas cıclicas de 200 geracoes e
dinamica com variacoes grandes.
Os seguintes parametros foram utilizados para os modelos de referencia: no modelo
exponencial (Exp), Equacao 6.2, uc = 0.008; no modelo linear (Lin), Equacao 6.3, K =
150; e no modelo baseado na dinamica da heterozigosidade (Het), Equacao 3.23, Ne = 50.
Em todos os modelos de referencia, a diversidade mınima foi 0.1 Γ(0). Esses valores foram
obtidos empiricamente, em testes preliminares.
A Tabela 7.5 mostra os resultados do Experimento 7.5.a, moving peaks, onde foram
estabelecidas mudancas cıclicas de 40 geracoes e dinamica com variacoes pequenas. Com
mudancas a intervalos curtos e deslocamento pequeno do otimo global, todos os tres
127
modelos de referencia alcancaram resultados semelhantes, muito abaixo do valor do otimo
global. Os DPs tambem foram semelhantes, o que sinaliza que todos os modelos de
referencia proporcionaram evolucoes equivalentes apos as mudancas do ambiente. As
diversidades medias tambem foram similares, pois as curvas dos modelos de referencia
foram equivalentes, isto e, os decaimentos das diversidades foram, aproximadamente,
iguais e os valores mınimos das diversidades foram os mesmos.
Tabela 7.5 Experimento 7.5.a: moving peaks, ciclos de 40 geracoes e dinamica com variacoes
pequenas.
Metodo MMA DP Γ
Lin 111.1646 49.5744 0.2485
Exp 107.4242 52.0324 0.2446
Het 110.3487 50.0194 0.2495
A Tabela 7.6 mostra os resultados do Experimento 7.5.b, moving peaks, onde foram
estabelecidas mudancas cıclicas de 200 geracoes e dinamica com variacoes grandes. Nova-
mente, os tres modelos de referencia alcancam resultados semelhantes nos tres indicadores
— MMA, DP e Γ. Apesar da dinamica deste experimento possuir variacoes grandes, o ci-
clo de variacao maior permitiu aos tres modelos de referencia maior tempo para evolucao
e MMAs muito superiores aos seus equivalentes no experimento anterior. Os DPs neste
experimento foram maiores que no experimento anterior. Essa diferenca nao significa um
pior desempenho no Experimento 7.5.b, mas que houve maior evolucao em decorrencia
do maior ciclo de variacao.
Tabela 7.6 Experimento 7.5.b: moving peaks, ciclos de 200 geracoes e dinamica com variacoes
grandes.
Metodo MMA DP Γ
Lin 209.3086 66.1312 0.1771
Exp 211.0457 63.2844 0.1883
Het 209.9314 64.6761 0.1896
A Tabela 7.7 mostra os resultados do Experimento 7.5.c, problema da mochila, onde
foram estabelecidas mudancas cıclicas de 40 geracoes e dinamica com variacoes peque-
nas. Neste problema, o otimo nao e modificado por sua localizacao espacial, mas por
uma mudanca do valor da restricao (peso maximo permitido, C). Seguindo a tendencia
128
dos experimentos anteriores, os resultados dos tres modelos de referencia foram, aproxi-
madamente, iguais. As diversidades medias foram significativamente maiores do que nos
experimentos anteriores, em razao do tipo de problema que proporciona menor perda de
diversidade — como ja comentado na Secao 7.4.
Tabela 7.7 Experimento 7.5.c: Problema da Mochila, ciclos de 40 geracoes e dinamica com
variacoes pequenas.
Metodo MMA DP Γ
Lin 11318 88.5006 0.6868
Exp 11299 88.4346 0.6839
Het 11295 89.8067 0.6906
A Tabela 7.8 mostra os resultados do Experimento 7.5.d., problema da mochila, onde
foram estabelecidas mudancas cıclicas de 200 geracoes e dinamica com variacoes grandes.
Neste experimento, os resultados dos tres modelos de referencia foram, novamente, muito
proximos. As diversidades medias foram similares as suas equivalentes no Experimento
7.5.c.
Tabela 7.8 Experimento 7.5.d: Problema da Mochila, ciclos de 200 geracoes e dinamica com
variacoes grandes.
Metodo MMA DP Γ
Lin 11639 111.0548 0.6415
Exp 11625 111.7521 0.6394
Het 11640 111.8992 0.6333
7.5.1 Discussoes Finais Sobre os Modelos de Referencia
Os quatro experimentos com dois ambientes diferentes, cada um com dois ciclos de va-
riacao, mostraram resultados semelhantes em todos os aspectos, i.e., os valores medios das
melhores aptidoes medias, dos desvios padroes e das diversidades. Os resultados mostram
que o algoritmo evolucionario proposto baseado nas hipoteses de modelos de referencia
apresentadas na Secao 6.2 nao depende de um modelo matematico especıfico, mas em um
modelo que atenda as especificacoes gerais do modelo de referencia de diversidade.
Os resultados dos experimentos foram alcancados com parametros do modelo de re-
ferencia escolhidos empiricamente. No entanto, esses parametros, qualquer que seja o
129
modelo de referencia, podem ser ajustados adaptativamente, baseados em algum criterio
de desempenho do AE. Por exemplo, o valor da diversidade do modelo de referencia apos
a mudanca do ambiente pode ser ajustado conforme a dinamica do ambiente. Em uma
dinamica com variacoes pequenas, pode ser mais apropriado que a diversidade do mo-
delo de referencia seja ajustada para um valor apenas um pouco superior ao atual ou em
funcao de algum indicador do processo evolucionario — em vez do valor da diversidade
inicial.
7.6 EXPERIMENTOS COM FUNCOES CONTINUAS
Seis experimentos foram realizados com funcoes contınuas, tres com a funcao de Ackley
(EIBEN; SMITH, 2003), Experimentos 7.6.1.a-c, e tres com a funcao de Schwefel (1995),
Experimentos 7.6.2.a-c, sendo a, b e c as dinamicas com variacoes pequenas, grandes e
caoticas.
7.6.1 Experimentos com a Funcao de Ackley
As Tabelas 7.9, 7.10 e 7.11 mostram os resultados dos experimentos com a funcao de
Ackley (EIBEN; SMITH, 2003). No Experimento 7.6.1.a, Tabela 7.9, dinamica linear com
variacoes pequenas, as duas versoes do DRAC foram superadas pelos metodos ERIGA
e TRAM, obtiveram resultados similares ao RIGA e AGP, e superaram os demais AEs.
Neste tipo de dinamica, um pico elevado de diversidade do modelo de referencia apos a
mudanca do ambiente pode ser prejudicial, pois o otimo global desloca-se para regioes
proximas a sua localizacao atual. Assim, o pico de diversidade do modelo de referencia
pode causar muito espalhamento da populacao na superfıcie de solucoes.
Como esperado, devido ao deslocamento elevado do otimo global, os resultados gerais
de todos os algoritmos no Experimento 7.6.1.b foram inferiores aos alcancados no Ex-
perimento 7.6.1.a. No Experimento 7.6.1.b, Tabela 7.10, DRAC v2, seguido do DRAC
v2.a, obtiveram os melhores resultados. Neste caso, o impulso do modelo de referencia
seguido de um decaimento controlado da diversidade da populacao beneficiou os modelos
propostos.
No Experimento 7.6.1.c, Tabela 7.11, dinamica caotica, DRAC v2 foi superado pelos
metodos ERIGA e DRAC v2.a, e obteve resultado equivalente a maioria dos AEs, su-
perando apenas os metodos DGEA e THM. A razao para esta diferenca, em relacao ao
Experimento 7.6.1.b, pode ser atribuıda aos instantes em que a variacao do ambiente e
130
Tabela 7.9 Resultados do Experimento 7.6.1.a: funcao de Ackley, variacoes pequenas.
Metodo MMA DP Γ P(v2) P(v2.a)
DCGA 34.7832 1.0850 0.2968 + –
DGEA 35.7829 1.6741 0.1439 + –
DRAC v2 36.9183 2.0969 0.2320 –
DRAC v2.a 33.3686 0.8000 0.1513 +
ERIGA 37.9404 2.3606 0.1000 – –
RIGA 36.8968 2.0625 0.1016 ≈ –
AGP 36.9357 2.0935 0.1011 ≈ –
THM 36.6597 2.0076 0.1040 + –
TRAM 37.7313 2.4205 0.0908 – –
pequena. O metodo DRAC v2.a obteve resultados semelhantes ao ERIGA.
Na dinamica com variacoes pequenas, Experimento 7.6.1.a, ERIGA alcancou os me-
lhores resultados. Nessa dinamica, os imigrantes elitistas beneficiaram-se do deslocamento
do otimo para uma regiao muito proxima do seu valor atual, pois o ERIGA tem uma
taxa de mutacao constante e baixa.
Na dinamica com variacoes grandes, Experimento 7.6.1.b, a diversidade elevada apos
as mudancas do ambiente, estabelecida pelo modelo de referencia, proporcionou as duas
versoes do DRAC os melhores resultados. Nesse tipo de dinamica, um grande espalha-
mento da populacao no espaco de solucoes apos as mudancas do ambiente mostra-se
determinante.
Na dinamica caotica, Experimento 7.6.1.c, ERIGA e DRAC v2.a obtiveram os melho-
res resultados. Novamente, os impulsos da diversidade do modelo de referencia, acom-
panhados pela diversidade da populacao, beneficiaram o DRAC v2.a. No entanto, esse
impulso de diversidade nao beneficiou o DRAC v2, pois este metodo nao rastreia o modelo
de referencia tao eficientemente quanto o DRAC v2.a. O bom desempenho do ERIGA
nessa dinamica pode ser atribuıdo as ocorrencias de variacoes pequenas do ambiente.
7.6.2 Experimentos com a Funcao de Schwefel
As Tabelas 7.12, 7.13 e 7.14 mostram os resultados dos experimentos com a funcao de
Schwefel. No Experimento 7.6.2.a, Tabela 7.12, os melhores resultados foram alcancados
pelos metodos ERIGA e TRAM. Novamente, a dinamica com variacoes pequenas beneficia
131
Tabela 7.10 Resultados do Experimento 7.6.1.b: funcao de Ackley, variacoes grandes.
Metodo MMA DP Γ P(v2) P(v2.a)
DCGA 33.3073 0.5732 0.2442 + +
DGEA 32.9274 0.3392 0.1374 + +
DRAC v2 33.5875 0.7776 0.2334 –
DRAC v2.a 33.3982 0.9068 0.1540 +
ERIGA 33.3299 0.7389 0.0965 + +
RIGA 33.3042 0.7077 0.0965 + +
AGP 33.3356 0.7981 0.0875 + +
THM 33.3884 0.8437 0.0954 + ≈
TRAM 33.4159 0.8406 0.0809 + ≈
os AEs que nao espalham demasiadamente a populacao apos as mudancas do ambiente.
Nos Experimentos 7.6.2.b e 7.6.2.c, Tabelas 7.13 e 7.14, DRAC v2 e v2.a superaram os
demais AEs. No Experimento 7.6.2.b, o modelo de referencia, seguido pelas diversidades
das populacoes dos metodos DRAC v2 e v2.a, beneficiou o processo de busca. Tambem no
Experimento 7.6.2.c, dinamica caotica, DRAC v2 e v2.a obtiveram resultados similares e
superiores aos demais AEs.
Nos Experimentos 7.6.2.b e 7.6.2.c, e importante observar o baixo desvio padrao
obtido pelo DRAC v2 e v2.a em relacao aos demais AEs. Esses valores mostram que
esses metodos reaproximam de regioes promissoras apos as mudancas do ambiente mais
rapido do que os demais AEs. Os benefıcios dos baixos DPs podem ser observados na
Figura 7.9, variacoes grandes, onde a curva do melhor indivıduo do DRAC v2 cresce mais
rapido do que dos demais AEs. Na Figura 7.10, dinamica caotica, DRAC v2.a tem uma
curva sempre superior aos demais AEs. Entretanto, apesar de DRAC v2 e v2.a terem
alcancados resultados estatisticamente iguais, DRAC v2 teve MMA superior. Isso se deve
a capacidade do DRAC v2 se aproximar de uma regiao promissora mais rapido do que o
DRAC v2.a. Essa capacidade foi refletiva no DP do DRAC v2, aproximadamente, 50%
menor do que no DRAC v2.a.
7.7 EXPERIMENTOS COM O GERADOR MOVING PEAKS
Os metodos propostos foram testados em tres experimentos com o gerador moving peaks.
Para estes experimentos, Hi ∈ [0, 100], Ri ∈ [2, 7] e xij ∈ [−100, 100], ∀i = 1, . . . , Np, e
132
−15000
−10000
−5000
(a)
Me
lho
r a
ptid
ao
−12000
−10000
−8000
−6000
−4000(b)
Me
lho
r a
ptid
ao
−1.5
−1
−0.5x 10
4 (c)
Me
lho
r a
ptid
ao
0 100 200 300 400 500 600 700 800 900 1000−2
−1.5
−1
−0.5
x 104 (d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.8 Melhores aptidoes no Experimento 7.6.2.a: funcao de Schwefel, variacoes pequenas.
133
−5−4−3−2−1
x 104 (a)
Me
lho
r a
ptid
ao
−8
−6
−4
−2
0x 10
4 (b)
Me
lho
r a
ptid
ao
−10−8−6−4−2
x 104 (c)
Me
lho
r a
ptid
ao
100 200 300 400 500 600 700 800 900 1000
−4
−3
−2
−1
x 104 (d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.9 Melhores aptidoes no Experimento 7.6.2.b: funcao de Schwefel, variacoes grandes.
134
−2.5
−2
−1.5
−1x 10
4 (a)
Me
lho
r a
ptid
ao
−4
−2
0x 10
4 (b)
Me
lho
r a
ptid
ao
−6
−4
−2
0x 10
4 (c)
Me
lho
r a
ptid
ao
100 200 300 400 500 600 700 800 900 1000
−3
−2
−1x 10
4 (d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.10 Melhores aptidoes no Experimento 7.6.2.c: funcao de Schwefel, variacoes caoticas.
135
Tabela 7.11 Resultados do Experimento 7.6.1.c: funcao de Ackley, variacoes caoticas.
Metodo MMA DP Γ P(v2) P(v2.a)
DCGA 32.7134 0.1207 0.2541 ≈ +
DGEA 32.6899 0.1113 0.1237 + +
DRAC v2 32.7168 0.1206 0.1822 +
DRAC v2.a 32.7389 0.1352 0.1504 –
ERIGA 32.7436 0.1411 0.0667 – ≈
RIGA 32.7105 0.1161 0.0629 ≈ +
AGP 32.7142 0.1209 0.0561 ≈ +
THM 32.7063 0.1164 0.0612 + +
TRAM 32.7175 0.1175 0.0504 ≈ +
∀j = 1, . . . , n, sendo Np = 50.
No Experimento 7.7.a, Tabela 7.15, dinamica com variacoes pequenas, o melhor re-
sultado foi alcancado pelo ERIGA, estatisticamente igual aos metodos RIGA e DRAC
v2.a. DRAC v2 foi superado pelos metodos ERIGA, RIGA e THM. Neste experimento,
mesmo com variacoes pequenas, o impulso de diversidade apos a mudanca do ambiente foi
satisfatorio. A prova disso sao os desempenhos dos metodos DRAC v2 e v2.a, o primeiro
que tem dificuldade de acompanhar o modelo de referencia e o segundo que acompanha
com boa precisao. A Figura 7.11 mostra as melhores aptidoes de todos os AEs no Expe-
rimento 7.7.a. Observa-se, claramente, que o DRAC v2.a teve os maiores picos de melhor
aptidao na maioria do processo evolucionario. O MMA do DRAC v2.a so e pouco infe-
rior em relacao aos metodos baseados em imigrantes, apesar de estatisticamente igual,
porque sua melhor aptidao sempre decai mais apos as mudancas do ambiente, em razao
do espelhamento da populacao. Entretanto, seu retorno a uma regiao promissora e mais
rapido do que os demais AEs. Essas colocacoes podem ser reforcadas pelo DP do DRAC
v2.a, que e superior ao dos metodos ERIGA e RIGA.
No Experimento 7.7.b, Tabela 7.16, dinamica com variacoes grandes, as duas versoes
do DRAC obtiveram os melhores resultados. Alem de um MMA significativamente su-
perior, o DP do DRAC v2 tambem foi menor, mostrando maior estabilidade e retorno
mais rapido a vizinhanca do otimo apos as mudancas do ambiente. A Figura 7.12 mostra
os desempenhos dos AEs no Experimento 7.7.b. DRAC v2 teve maior aptidao antes da
mudanca do ambiente e sempre retornou a uma regiao promissora mais rapido do que os
136
Tabela 7.12 Resultados do Experimento 7.6.2.a: funcao de Schwefel com variacoes pequenas.
Metodo MMA DP Γ P(v2) P(v2.a) P(PDF)
DCGA -9502.0825 5336.6701 0.2928 + – ≈
DGEA -9764.3638 5685.8565 0.1417 + – ≈
DRAC -9050.4756 5347.2403 0.1945 – ≈
DRAC v2.a -43552.8191 101881.9885 0.1714 + +
PDFEA -9562.8191 5678.9885 0.1365 + –
ERIGA -7339.6891 5689.3941 0.0628 – – –
RIGA -8920.1792 5522.4429 0.0733 ≈ – ≈
AGP -9525.6640 6440.1422 0.0722 + – ≈
THM -9925.5109 6464.1826 0.0757 + – ≈
TRAM -7935.5391 6850.5871 0.0670 – – –
demais AEs.
No Experimento 7.7.c, Tabela 7.17, dinamica caotica, os melhores resultados foram
alcancados pelos metodos ERIGA e DRAC v2.a — com os indicadores MMA e DP muito
semelhantes. Novamente, DRAC v2.a foi comparavel ao ERIGA em um ambiente com
dinamica caotica. A Figura 7.13 mostra os desempenhos dos AEs nestes experimen-
tos. DRAC v2.a e sempre superior aos demais AEs antes das mudancas do ambiente.
Entretanto, os perfis de crescimento das melhores aptidoes de todos os AEs sao, aproxi-
madamente, iguais.
A Figura 7.14 mostra as melhores aptidoes dos metodos propostos, DRAC v2, DRAC
v2.a e PDFEA, em todos os experimentos com o moving peaks. No Experimento 7.7.a,
variacoes pequenas, Figura 7.14(a), DRAC v2.a e claramente superior aos demais AEs
propostos, sempre alcancando aproximadamente a mesma aptidao uma geracao antes da
variacao do ambiente. No Experimento 7.7.b, variacoes grandes, Figura 7.14(b), DRAC
v2 sempre retoma seu valor anterior a mudanca do ambiente mais rapido do que os demais
AEs propostos. No Experimento 7.7.c, variacoes caoticas, Figura 7.14(c), a diferenca entre
as melhores aptidoes e pouco visıvel, mas pode-se observar picos maiores no DRAC v2.a.
Nos experimentos com o moving peaks, e possıvel concluir que o DRAC v2.a obteve o
melhor desempenho geral. Esse metodo alcancou os melhores resultados, estatisticamente
iguais ao ERIGA, nas dinamicas com variacoes pequenas e caotica; entretanto com melhor
aptidao superior antes das mudancas do ambiente. No experimento com dinamica com
137
−200
0
200
400(a)
Me
lho
r a
ptid
ao
−200
0
200
400(b)
Me
lho
r a
ptid
ao
−200
0
200
400(c)
Me
lho
r a
ptid
ao
0 100 200 300 400 500 600 700 800 900 1000−200
0
200
400(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.11 Melhor aptidao no Experimento 7.7.a.: moving peaks com dinamica com variacoes
pequenas.
138
−200
0
200
400(a)
Me
lho
r a
ptid
ao
−200
0
200
400(b)
Me
lho
r a
ptid
ao
−200
0
200
400(c)
Me
lho
r a
ptid
ao
0 100 200 300 400 500 600 700 800 900 1000−200
0
200
400(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.12 Melhor aptidao no Experimento 7.7.b: moving peaks com dinamica com variacoes
grandes.
139
−200
0
200
400(a)
Me
lho
r a
ptid
ao
−200
0
200
400(b)
Me
lho
r a
ptid
ao
−200
0
200
400(c)
Me
lho
r a
ptid
ao
0 100 200 300 400 500 600 700 800 900 1000−200
0
200
400(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.13 Melhor aptidao no Experimento 7.7.c: moving peaks com dinamica caotica.
140
0 100 200 300 400 500 600 700 800 900 1000−200
0
200
400(a) MP com variaçoes pequenas
Div
ers
ida
de
0 100 200 300 400 500 600 700 800 900 1000−200
0
200
400
Div
ers
ida
de
(b) MP com variaçoes grandes
0 100 200 300 400 500 600 700 800 900 1000−200
0
200
400
Div
ers
ida
de
Geraçoes
(c) MP com variaçoes caoticas
DRAC v2DRAC v2.aPDFEA
DRAC v2DRAC v2.aPDFEA
DRAC v2DRAC v2.aPDFEA
Figura 7.14 Melhor aptidao dos metodos propostos no moving peaks.
141
Tabela 7.13 Resultados do Experimento 7.6.2.b: funcao de Schwefel com variacoes grandes.
Metodo MMA (×104) DP (×104) Γ P(v2) P(v2.a) P(PDF)
DCGA -9.1070 22.0591 0.2818 + + +
DGEA -8.7506 20.6198 0.1839 + + +
DRAC v2 -2.7022 5.3540 0.3048 – –
DRAC v2.a -4.4616 10.1056 0.1725 + –
PDFEA -7.4346 16.2316 0.1528 + +
ERIGA -6.1802 21.5019 0.1446 + + –
RIGA -5.5126 19.4660 0.1885 + ≈ –
AGP -9.7644 24.7750 0.1495 + + +
THM -7.9949 24.3469 0.1958 + + ≈
TRAM -12.4897 26.0835 0.1433 + + +
variacoes grandes, DRAC v2.a obteve o segundo melhor desempenho. Como o DRAC
v2.a e o metodo proposto que melhor acompanha o modelo de referencia, os impulsos
de diversidade apos as mudancas do ambiente, podem ter sido determinantes em um
ambiente nao-contınuo.
Paradoxalmente, no experimento com dinamica com variacao grande, o metodo que
obteve o melhor desempenho foi aquele, dos metodos propostos, que tem maior dificuldade
de acompanhar o modelo de referencia, o DRAC v2. As conclusoes nao sao definitivas,
mas o que pode ter contribuıdo para esse resultado e que no DRAC v2 apenas parte de
sua populacao e atribuıda ao controle da diversidade. Assim, o seu aumento de diver-
sidade nao acompanhou o modelo de referencia, contribuindo positivamente para o seu
desempenho. Nos experimentos com dinamicas com variacoes pequenas e caotica, a dimi-
nuicao da pressao de selecao, no metodo DRAC v2, na tentativa de elevar a diversidade
apos as mudancas do ambiente, pode ter prejudicado a selecao dos melhores indivıduos,
comprometendo o desempenho deste metodo.
7.8 EXPERIMENTOS COM O PROBLEMA DA MOCHILA
Os Experimentos 7.8.a-c utilizaram o problema da mochila, Secao A.4, sendo xi ∈
{0, 1, 2, 3, 4}, wi = vi = i, i = 1, . . . , n, e C ∈ [200, 1500]. As Tabelas 7.18, 7.19 e
7.20 mostram os resultados medios dos experimentos com o problema da mochila, para
dinamicas com variacoes pequenas, grandes e caoticas, respectivamente. Nestes experi-
142
Tabela 7.14 Resultados do Experimento 7.6.2.c: funcao de Schwefel com variacoes caoticas.
Metodo MMA (×104) DP (×104) Γ P(v2) P(v2.a) P(PDF)
DCGA -7.5294 17.6572 0.2762 + + ≈
DGEA -7.3022 16.9183 0.1817 + + ≈
DRAC v2 -3.7500 4.7851 0.3208 ≈ –
DRAC v2.a -3.7234 8.1519 0.1707 ≈ –
PDFEA -6.4356 13.3459 0.1451 + +
ERIGA -5.5521 17.8669 0.1424 + + –
RIGA -4.9537 15.7939 0.1842 + + –
AGP -8.1793 20.3450 0.1397 + + +
THM -6.8412 20.1313 0.1899 + + +
TRAM -10.2825 22.1347 0.1316 + + +
mentos, DGEA utilizou Γmin = 0.5 e Γmax = 0.75; e DRAC v2.a utilizou Γmin = 0.5 e
Γm(k) = 0.75Γ(0) apos a mudanca do ambiente.
DRAC v2 obteve o melhor desempenho no Experimento 7.8.a — dinamica com va-
riacoes pequenas. A Tabela 7.18 mostra os principais indicadores deste experimento, onde
todos os AEs obtiveram resultados melhores em relacao aos seus proprios desempenhos
nos demais experimentos. Essa diferenca pode ser atribuıda a pequena variacao do peso
maximo, C. DRAC v2 obteve o menor desvio padrao, DP, mostrando maior estabilidade
ao recuperar o valor da melhor aptidao, anterior a variacao do ambiente, mais rapido do
que os demais AEs.
A Figura 7.15 mostra as melhores aptidoes no Experimento 7.8.a — dinamica com
variacoes pequenas. Apenas os AEs baseados em imigrantes, Figura 7.15(b), em alguns
intervalos, tiveram seus desempenhos equivalentes ao DRAC v2. Em relacao aos de-
mais AEs, DRAC v2 teve desempenho visivelmente superior, com trajetoria do melhor
indivıduo mais alta e estavel do que nos demais AEs.
DRAC v2.a obteve o melhor desempenho no Experimento 7.8.b, dinamica com va-
riacoes grandes, seguido pelo DRAC v2, estatisticamente inferior, mas com MMA proximo,
Tabela 7.19. DRAC v2 e DRAC v2.a obtiveram o menor e o maior DP, respectivamente,
o que mostra que a melhor aptidao do metodo baseado na taxa de mutacao, DRAC v2.a,
teve maior oscilacao — a sua melhor aptidao decresceu mais em razao do seu maior va-
lor, mas recuperava-se quase sempre alcancando o valor anterior a mudanca do ambiente.
143
0
500
1000(a)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aDCGADGEA
0
500
1000
1500(b)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aERIGARIGA
0
500
1000(c)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aSGA
0 100 200 300 400 500 600 700 800 900 10000
500
1000(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
Figura 7.15 Melhor aptidao no Experimento 7.8.a: problema da mochila com variacoes pe-
quenas.
144
Tabela 7.15 Resultados do Experimento 7.7.a: moving peaks com variacoes pequenas.
Metodo MMA DP Γ P(v2) P(v2.a) P(PDF)
DCGA 89.7986 46.4868 0.3244 + + +
DGEA 102.8617 49.7650 0.1488 + + ≈
DRAC v2 107.5770 51.4211 0.2475 + –
DRAC v2.a 125.5015 84.5042 0.1929 – –
PDFEA 103.6478 44.5476 0.2264 + +
ERIGA 128.2046 47.6416 0.1019 – ≈ –
RIGA 126.6664 39.9665 0.1135 – ≈ –
AGP 105.6296 50.5478 0.1083 ≈ + ≈
THM 115.7410 48.7583 0.1107 – + –
TRAM 108.1533 56.7968 0.1005 ≈ + –
Esse comportamento pode ser observado na Figura 7.16, que mostra que os valores dos
metodos DRAC v2 e v2.a foram quase sempre superiores aos demais AEs.
No Experimento 7.8.c, variacoes caoticas, DRAC v2.a obteve novamente o melhor
resultado, maior MMA e menor DP, mostrando maior estabilidade, Tabela 7.20. Na
Figura 7.17, observa-se que a melhor aptidao do DRAC v2.a mantem-se superior aos
demais AEs na maioria das geracoes e e a que menos oscila.
A Figura 7.18 mostra as aptidoes dos metodos propostos — DRAC v2, DRAC v2.a
e PDFEA. Apenas no primeiro experimento, variacoes pequenas, PDFEA supera DRAC
v2.a e em nenhum experimento supera DRAC v2. No Experimento 7.8.a, Figura 7.18(a),
DRAC v2 e o mais estavel, com aptidao mais elevada e menor oscilacao. Nos Experi-
mentos 7.8.b e 7.8.c, Figuras 7.18(b) e 7.18(c), o comportamento do ambiente torna as
melhores aptidoes muito oscilantes. Nesses dois experimentos, DRAC v2.a comporta-se
de uma maneira mais estavel. No Experimento 7.8.c, Figura 7.18(c), houveram alguns
intervalos onde os picos de melhor aptidao do DRAC v2 foram maiores do que no DRAC
v2.a. Entretanto, o comportamento mais estavel do DRAC v2.a proporcionou-lhe um
MMA maior, Tabela 7.20. No problema da mochila, os metodos propostos, DRAC v2 e
v2.a, obtiveram os melhores resultados em todos os experimentos. Diferentemente dos
experimentos com funcoes contınuas e nao-contınua, no problema da mochila, o metodo
proposto DRAC v2 superou os demais AEs no experimento com dinamica com variacoes
pequenas.
145
400
600
800(a)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aDCGADGEA
200
400
600
800(b)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aERIGARIGA
400
600
800(c)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aSGA
0 100 200 300 400 500 600 700 800 900 1000400
600
800(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
Figura 7.16 Melhor aptidao no Experimento 7.8.b: problema da mochila com variacoes gran-
des.
146
0
500
1000(a)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aDCGADGEA
0
500
1000(b)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aERIGARIGA
0
500
1000(c)
Me
lho
r a
ptid
ao
DRAC v2DRAC v2.aSGA
0 100 200 300 400 500 600 700 800 900 10000
500
1000(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
Figura 7.17 Melhor aptidao no Experimento 7.8.c: problema da mochila com variacoes
caoticas.
147
0 100 200 300 400 500 600 700 800 900 1000200
400
600
800
1000
Me
lho
r a
ptid
ao
(a) Problema da mochila com variaçoes pequenas
DRAC v2DRAC v2.aPDFEA
0 100 200 300 400 500 600 700 800 900 1000200
400
600
800
Me
lho
r a
ptid
ao
(b) Problema da mochila com variaçoes grandes
DRAC v2DRAC v2.aPDFEA
0 100 200 300 400 500 600 700 800 900 10000
500
1000
Me
lho
r a
ptid
ao
Geraçoes
(c) Problema da mochila com variaçoes caoticas
DRAC v2DRAC v2.aPDFEA
Figura 7.18 Melhor aptidao nos metodos propostos: problema da mochila.
148
Tabela 7.16 Resultados do Experimento 7.7.b: moving peaks com variacoes grandes.
Metodo MMA DP Γ P(v2) P(v2.a) P(PDF)
DCGA 82.0944 77.4021 0.3072 + + +
DGEA 91.8578 84.8899 0.2054 + + +
DRAC v2 164.7222 67.1858 0.3209 – –
DRAC v2.a 125.3414 85.0542 0.1947 + –
PDFEA 105.4356 75.0354 0.2175 + +
ERIGA 123.2319 87.3126 0.1943 + ≈ –
RIGA 113.3119 79.5980 0.2297 + + –
AGP 91.8599 87.9963 0.1860 + + +
THM 101.8531 86.6538 0.2330 + + ≈
TRAM 94.7369 89.1211 0.1645 + + +
A Figura 7.19 mostra as diversidades dos metodos DGEA, DRAC v2, ERIGA, RIGA
e THM no Experimento 7.8.a — variacoes pequenas. Observa-se que a diversidade do
DRAC v2, Figura 7.19(b), e uma das mais elevadas e a que menos oscila. Entretanto,
esse perfil de diversidade do DRAC v2 pode nao ser a principal razao para seu melhor
desempenho, mas sim sua forma de controle de diversidade baseada na pressao de selecao
e distancia do melhor indivıduo. Os demais AEs descreveram diversidades elevadas, o
que pode prejudicar a explotacao. No DRAC v2, a diversidade tambem e elevada, mas
como uma parte da populacao e selecionada em funcao da distancia do melhor indivıduo,
indivıduos proximos deste sao selecionados independentemente das suas aptidoes, o que
pode manter uma explotacao satisfatoria.
A Figura 7.20 mostra as diversidades dos AEs que obtiveram os melhores desempenhos
no Experimento 7.8.c — dinamica caotica. Com excecao do DRAC v2.a, Figura 7.20(c), os
demais AEs descreveram perfis de diversidade semelhantes, com valores elevados e pouca
oscilacao. Desta vez, o melhor desempenho do DRAC v2.a pode ser atribuıdo ao seu perfil
de diversidade, que forca o seu decaimento beneficiando a explotacao e elevando-a apenas
quando ocorre uma mudanca do ambiente. O segundo melhor desempenho do DRAC v2
pode ser atribuıdo ao mesmo motivo descrito no paragrafo anterior, na dinamica com
variacoes pequenas, a variacao da pressao de selecao e a selecao de parte da populacao
em funcao da distancia ao melhor indivıduo.
Os metodos propostos DRAC v2 e v2.a alcancaram os melhores resultados. Neste tipo
149
0
0.5
1
Div
ers
ida
de
(a) DGEA
0
0.5
1
Div
ers
ida
de
(b) DRAC v2
0
0.5
1
Div
ers
ida
de
(c) ERIGA
0
0.5
1
Div
ers
ida
de
(d) RIGA
0 100 200 300 400 500 600 700 800 900 10000
0.5
1
Div
ers
ida
de
(e) THM
Geraçoes
Figura 7.19 Diversidades no Experimento 7.8.a: problema da mochila com variacoes pequenas.
150
0
0.5
1(a) DGEA
Div
ers
ida
de
0
0.5
1(b) DRAC v2
Div
ers
ida
de
0
0.5
1
Div
ers
ida
de
(c) DRAC v2.a
0
0.5
1
Div
ers
ida
de
(d) RIGA
0 100 200 300 400 500 600 700 800 900 10000
0.5
1
Div
ers
ida
de
Geraçoes
(e) THM
Figura 7.20 Diversidades no Experimento 7.8.c: problema da mochila com variacoes caoticas.
151
Tabela 7.17 Resultados do Experimento 7.7.c: moving peaks com variacoes caoticas.
Metodo MMA DP Γ P(v2) P(v2.a) P(PDF)
DCGA 77.3741 84.2767 0.3163 + + +
DGEA 87.9430 91.4246 0.2134 + + +
DRAC v2 105.6635 83.1811 0.3767 + –
DRAC v2.a 127.4921 90.4937 0.1933 – –
PDFEA 101.3245 88.3276 0.1919 ≈ +
ERIGA 128.6350 92.1129 0.2064 – ≈ –
RIGA 115.4404 82.8222 0.2313 – + –
AGP 88.6695 94.2602 0.1935 + + +
THM 103.6392 91.6389 0.2365 ≈ + ≈
TRAM 91.6162 94.5133 0.1708 + + +
de problema, mesmo no experimento com variacoes pequenas o DRAC v2 obteve o melhor
resultado. Esses resultados mais uma vez sinalizam que grandes impulsos de diversidade
apos variacoes pequenas do ambiente sao pouco recomendadas. Essa suposicao e reforcada
pelo resultado inferior do DRAC v2.a, que acompanha o modelo de referencia de forma
satisfatoria. Por outro lado, o DRAC v2, que nao acompanha adequadamente o modelo
de referencia, alcancou os melhores resultados. Os fatores que podem ter proporcionado
tal desempenho do DRAC v2 sao o controle da diversidade utilizando apenas parte da
populacao e a variacao da pressao de selecao. Essa ultima proporcionando apenas um
pequeno aumento da diversidade pela diminuicao da pressao de selecao quando ocorrem
variacoes do ambiente.
7.9 EXPERIMENTOS COM O PROJETO DE REDE DE RADIO-TRANSMISSORES
Os metodos propostos foram testados em dois experimentos com projeto de rede de radio-
transmissores, apresentado na Secao A.5. Nestes experimentos, a area total de cobertura
foi de 16384 um2 (unidades de medida) com 30 radio-transmissores, Nt, cada um com
cobertura de 400 um2. Para simular um problema dinamico, a cada variacao do ambiente
0 a 10 radio-transmissores podem sair de operacao.
A Figura 7.21 e a Tabela 7.21 mostram os resultados do Experimento 7.9.b — dinamica
com variacoes grandes. O melhor resultado foi obtido pelo ERIGA seguido pelo DRAC
v2.a; entretanto, os resultados desses dois metodos foram proximos — o MMA do ERIGA
152
Tabela 7.18 Resultados do Experimento 7.8.a: problema da mochila com variacoes pequenas.
Metodo MMA DP Γ P(v2) P(v2.a) P(PDF)
DCGA 758.2990 97.4729 0.4735 + – –
DGEA 637.0294 82.8003 0.6388 + + +
DRAC v2 823.4922 62.4434 0.6739 – –
DRAC v2.a 709.6787 72.9952 0.4620 + +
PDFEA 731.5467 71.4562 0.3174 + –
ERIGA 760.8411 75.9367 0.5233 + – –
RIGA 739.0867 72.7542 0.7386 + – –
AGP 740.2996 95.1760 0.3478 + – –
THM 787.1178 70.3255 0.6303 + – –
TRAM 593.5792 88.4583 0.2921 + + +
foi apenas 0.74% superior ao do DRAC v2.a. Mesmo com variacoes grandes do ambiente,
os resultados gerais nao foram muito divergentes. O melhor MMA foi 10.80% superior ao
pior, obtido pelo TRAM. Entre os melhores resultados, ERIGA e DRAC v2.a, tambem
nao houve diferenca significativa dos DPs, o que mostra que as oscilacoes causadas pelas
variacoes do ambiente afetaram de forma similar esses dois metodos.
A Figura 7.22 e a Tabela 7.22 mostram os resultados do Experimento 7.9.c — dinamica
com variacoes caoticas. Neste experimento, os metodos baseados em imigrantes e o AGP
foram superiores aos metodos propostos DRAC v2 e v2.a. Entretanto, assim como no
Experimento 7.9.b, as diferencas dos MMAs e DPs entre os AEs que alcancaram os
melhores e os metodos propostos tambem nao foram muito significativas.
7.10 EXPERIMENTOS COM O ROTEAMENTO DE REDES
No problema do roteamento de redes, foi utilizada uma rede com 40 nos e em media 10
conexoes por no. O valor das arestas, pesos das conexoes, variou entre 50 e 100. Nenhuma
heurıstica foi implantada para estabelecer conexoes validas entre nos, estabeleceu-se uma
penalidade de 10 vezes o valor da maior conexao da rede para um caminho invalido, isto e,
entre nos nao conectados. Para simular um ambiente dinamico, os pesos das conexoes sao
alterados de acordo com um intervalo e cada par de nos pode perder ou estabelecer uma
conexao a uma probabilidade de 0.05. Neste experimento, ocorreram variacoes cıclicas
de 100 geracoes.
153
200
400
600
800(a)
Me
lho
r a
ptid
ao
200
400
600
800(b)
Me
lho
r a
ptid
ao
200
400
600
800(c)
Me
lho
r a
ptid
ao
0 100 200 300 400 500 600 700 800 900 1000200
400
600
800(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.21 Melhor aptidao no Experimento 7.9.b: problema RND com variacoes grandes.
154
200
400
600
800(a)
Me
lho
r a
ptid
ao
200
400
600
800(b)
Me
lho
r a
ptid
ao
200
400
600
800(c)
Me
lho
r a
ptid
ao
0 100 200 300 400 500 600 700 800 900 1000200
400
600
800(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.22 Melhor aptidao no Experimento 7.9.c: problema RND com variacoes caoticas.
155
Tabela 7.19 Resultados do Experimento 7.8.b: problema da mochila com variacoes grandes.
Metodo MMA DP Γ P(v2) P(v2.a) P(PDF)
DCGA 579.2853 27.3861 0.6471 + + ≈
DGEA 593.6173 35.5919 0.6437 + + –
DRAC v2 683.8334 21.1139 0.7118 + –
DRAC v2.a 695.2540 51.0121 0.4623 – –
PDFEA 577.3245 41.3267 0.3136 + +
ERIGA 580.8886 38.5311 0.6893 + + ≈
RIGA 577.6567 33.2258 0.7954 + + ≈
AGP 579.5936 29.2703 0.2767 + + ≈
THM 579.6192 28.0350 0.6376 + + ≈
TRAM 579.3441 28.0489 0.3071 + + ≈
A Tabela 7.23 mostra os resultados do Experimento 7.10.b — dinamica com variacoes
grandes. Os melhores resultados foram obtidos pelos metodos DRAC v2.a, TRAM e
DRAC v2. Os menores DPs foram obtidos pelos metodos THM, AGP e RIGA. Nesse caso,
dados os seus MMAs, menores DPs nao significam maior rapidez para retomar caminhos
perdidos ou menor decaimento da melhor aptidao apos as mudancas do ambiente. A
Figura 7.23 mostra que sao necessarias aproximadamente 300 geracoes para a construcao
dos caminhos validos. Apos esse perıodo, ha uma queda da melhor aptidao apos as
mudancas do ambiente, mas nos metodos DRAC v2.a, v2 e TRAM ha rapida reconstrucao
de caminhos validos. Pela Figura 7.23, fica evidente nos metodos baseados em imigrantes,
no AGP e no THM a dificuldade de encontrar caminhos validos em todo o processo
evolucionario.
A Tabela 7.23 mostra os resultados do Experimento 7.10.c — dinamica caotica. No-
vamente, os melhores resultados foram alcancados pelos metodos DRAC v2.a, TRAM e
DRAC v2. Como mostra a Figura 7.24, os perfis das melhores aptidoes de todos os AEs
foram semelhantes ao Experimento 7.10.b. Entretanto, como esperado, todos os AEs ob-
tiveram resultados superiores em relacao aos seus proprios desempenhos no Experimento
7.10.b, visto que na dinamica caotica algumas variacoes do ambiente podem ser pequenas
— o que pode produzir menor variacao da melhor aptidao.
A vantagem de um AE sobre um metodo de busca heurıstica, como o A∗ (RUSSELL;
NORVIG, 2002), e que o primeiro, apos uma mudanca do ambiente, nao precisa refazer a
156
0
0.2
0.4(a)
Me
lho
r a
ptid
ao
0
0.2
0.4(b)
Me
lho
r a
ptid
ao
0
0.2
0.4(c)
Me
lho
r a
ptid
ao
0 100 200 300 400 500 600 700 800 900 10000
0.2
0.4(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.23 Melhor aptidao no Experimento 7.10.b: roteamento de redes com variacoes gran-
des.
157
0
0.2
0.4(a)
Me
lho
r a
ptid
ao
0
0.2
0.4(b)
Me
lho
r a
ptid
ao
0
0.2
0.4(c)
Me
lho
r a
ptid
ao
0 100 200 300 400 500 600 700 800 900 10000
0.2
0.4(d)
Me
lho
r a
ptid
ao
Geraçoes
DRAC v2DRAC v2.aTHMTRAM
DRAC v2DRAC v2.aSGA
DRAC v2DRAC v2.aERIGARIGA
DRAC v2DRAC v2.aDCGADGEA
Figura 7.24 Melhor aptidao no Experimento 7.10.c: roteamento de redes com variacoes
caoticas.
158
Tabela 7.20 Resultados do Experimento 7.8.c: problema da mochila com variacoes caoticas.
Metodo MMA DP Γ P(v2) P(v2.a) P(PDF)
DCGA 478.1139 163.3025 0.5645 + + +
DGEA 691.4971 87.3743 0.6358 + + –
DRAC v2 708.6517 98.4109 0.7220 + –
DRAC v2.a 745.3781 92.5337 0.4621 – –
PDFEA 563.6782 137.1536 0.3254 + +
ERIGA 568.6066 126.0794 0.6765 + + –
RIGA 607.0150 108.8241 0.8607 + + –
AGP 447.4142 172.4034 0.4401 + + +
THM 572.4740 119.7634 0.8116 + + –
TRAM 317.8635 161.6541 0.3021 + + +
busca desde o no inicial. O controle da diversidade pode restabeler um caminho valido
em um tempo relativamente curto, pois permite criar nichos promissores de indivıduos
semelhantes ao melhor indivıduo. Por exemplo, um indivıduo, constituıdo de um caminho
invalido, geneticamente semelhante ao melhor indivıduo pode tornar-se a melhor solucao
apos uma variacao do ambiente. Isso nao ocorre em uma busca heurıstica, que so fornece
um caminho como solucao. Assim, apos uma variacao do ambiente, a busca heurıstica
deve ser reiniciada.
Nos experimentos com o roteamento de redes, os metodos propostos DRAC v2 e
v2.a obtiveram os melhores resultados, estatisticamente similar ao TRAM. Entretanto,
nos dois experimentos com este ambiente, o DRAC v2.a obteve o maior MMA. Esses
resultados evidenciam a pertinencia do controle da diversidade; primeiro, porque impulsos
de diversidade apos as mudancas do ambiente e uma diversidade mınima podem ser
beneficos ao processo de busca, como ja colocado; e segundo, porque o DRAC v2.a e,
dentre os metodos propostos, o que melhor acompanha o modelo de referencia.
7.11 ANALISE DE DESEMPENHO
Esta secao apresenta uma analise geral do desempenho dos AEs nos experimentos apre-
sentados nas Secoes 7.6-7.10. A Tabela 7.25 mostra os AEs que alcancaram os melhores
resultados por ambiente.
Nos ambientes contınuos e nao-contınuos, Ackley, Schwefel e moving peaks, com
159
Tabela 7.21 Resultados do Experimento 7.9.b: problema RND com variacoes grandes.
Metodo MMA DP Γ P(v2) P(v2.a)
DCGA 578.3851 27.3905 0.3232 ≈ +
DGEA 557.1768 30.0620 0.2287 + +
DRAC v2 579.3893 28.1078 0.3415 +
DRAC v2.a 581.2514 27.3502 0.1727 –
ERIGA 585.5472 26.7146 0.1759 – –
RIGA 576.1863 27.2945 0.1726 + +
AGP 578.1888 25.5665 0.1640 ≈ +
THM 538.2718 26.4928 0.3680 + +
TRAM 529.5377 35.5996 0.2057 + +
dinamicas com variacoes pequenas, o ERIGA obteve os melhores resultados — esta-
tisticamente equivalente ao TRAM nos ambientes contınuos. Esses resultados indicam
que o impulso de diversidade de todas as versoes do DRAC deve ser compatıvel com o
comportamento do ambiente. Nesses ambientes, com dinamicas com variacoes pequenas,
os metodos propostos sempre foram superados pelo ERIGA. Em decorrencia da pequena
variacao da localizacao do otimo, fica sinalizado que a diversidade nao pode ter grande im-
pulso. Por outro lado, na dinamica com variacoes grandes, DRAC v2 foi sempre superior,
mostrando a importancia do impulso de diversidade. Nas variacoes caoticas, ERIGA teve
o melhor na funcao de Ackley e no moving peaks ; na funcao de Schwefel, as duas versoes
do DRAC obtiveram os melhores resultados. Em ambientes com dinamica conhecida,
pode-se, inicialmente, ajustar o impulso de diversidade proporcional ao comportamento.
A dificuldade da dinamica caotica e a impossibilidade de prever a magnitude da variacao
do ambiente, necessitando um ajuste em tempo real.
Nos problemas combinatorios, mochila, RND e roteamento, DRAC v2.a obteve o
melhor desempenho na maioria dos experimentos — quatro em sete realizados. Nos
tres experimentos com dinamicas caoticas, onde nao e possıvel prever a magnitude da
variacao, DRAC v2.a obteve melhor resultado em dois deles. Os resultados mostram,
pois, a importancia do controle da diversidade nesse tipo de problema, onde indivıduos
geneticamente semelhantes ao melhor indivıduo podem ter aptidoes completamente di-
ferentes. Como os melhores resultados foram alcancados pelo AE que melhor rastreia o
modelo de referencia, fica sinalizado que o controle da diversidade pode beneficiar o pro-
160
Tabela 7.22 Resultados do Experimento 7.9.c: problema RND com variacoes caoticas.
Metodo MMA DP Γ P(v2) P(v2.a)
DCGA 575.7083 29.5403 0.3362 – ≈
DGEA 553.7130 27.9893 0.2330 + +
DRAC v2 572.2024 28.5650 0.2898 +
DRAC v2.a 575.8723 27.3103 0.1789 –
ERIGA 578.6673 23.8050 0.1788 – –
RIGA 578.7508 30.4068 0.1637 – –
AGP 577.8629 30.7522 0.1732 – –
THM 534.4965 27.7028 0.3690 + +
TRAM 539.4918 35.1445 0.2364 + +
cesso evolucionario em ambientes combinatorios dinamicos. Nesses problemas, indivıduos
geneticamente semelhantes ao melhor indivıduo, mas com baixa aptidao, podem ser pro-
missores apos uma mudanca do ambiente. Entretanto, esses indivıduos, pelas suas baixas
aptidoes, tendem a serem excluıdos em um AE padrao. Com o controle da diversidade,
esses indivıduos podem prevalecer, pois um nıvel mınimo de diversidade e estabelecido.
Outra analise importante e sobre os tempos de execucao, a Tabela 7.26 mostra os tem-
pos medios, em segundos, e seus desvios padroes (DP) em todos os ambientes. Os tempos
do PDFEA nao sao apresentados porque este metodo foi implementado no Matlab(R), em
linguagem interpretada cujos tempos de execucao sao muito superiores, impossibilitando
uma comparacao direta com os demais AEs.
O AE que teve o menor tempo de execucao foi o DGEA por realizar um numero
menor de operacoes — apenas cruzamentos no modo explotacao e apenas mutacao no
modo exploracao. O AE com maior tempo de execucao foi o DCGA em decorrencia do
seu modo de selecao oneroso computacionalmente. Os metodos propostos, DRAC v2 e
v2.a, obtiveram tempos aproximadamente iguais a maioria dos AEs. Em relacao ao AGP,
com excecao do DRAC v2 nos ambientes moving peaks e RND, os tempos dos metodos
propostos foram aproximadamente iguais.
Em relacao aos metodos propostos, o DRAC v2, com seu modelo de populacao per-
manente, so nao teve tempo de execucao menor que o DRAC v2.a nos ambientes moving
peaks e RND. Esses resultados se devem ao menor numero de operacoes de cruzamento
e mutacao executadas nesse modelo de populacao — 50% do modelo de populacao gene-
161
Tabela 7.23 Resultados do Experimento 7.10.b: roteamento de redes com variacoes grandes.
Metodo MMA DP Γ P(v2) P(v2.a)
DCGA 0.1671 0.0465 0.1821 ≈ +
DGEA 0.1447 0.0385 0.1502 + +
DRAC v2 0.1671 0.0458 0.1945 +
DRAC v2.a 0.1726 0.0456 0.1401 –
ERIGA 0.1342 0.0280 0.1662 + +
RIGA 0.1257 0.0276 0.1656 + +
AGP 0.1256 0.0275 0.1686 + +
THM 0.0507 0.0082 0.3498 + +
TRAM 0.1710 0.0486 0.0721 – ≈
racional do DRAC v2.a. Por outro lado, nos ambientes moving peaks e RND, cujo custo
computacional para o calculo da aptidao e muito maior do que nos demais ambientes,
DRAC v2 teve tempo medio maior do que o DRAC v2.a — 36% maior no moving peaks e
74% maior no RND. Uma das razoes para esses tempos superiores e o metodo de selecao
do DRAC v2, que recalcula as aptidoes de parte da populacao a cada geracao.
7.12 DISCUSSOES FINAIS
Este capıtulo investigou o comportamento dos metodos de controle de diversidade propos-
tos, DRAC e PDFEA, em 26 experimentos, onde foram analisados o modelo de referencia,
a capacidade de rastreamento do sistema de controle e o desempenho em diferentes am-
bientes dinamicos. Os metodos foram comparados com o AGP e seis algoritmos evolu-
cionarios adaptativos.
Na Secao 7.4, o desempenho do rastreamento do sistema de controle foi analisado
em dois ambientes distintos com diferentes dinamicas. A meta dos metodos propostos e
equilibrar a deriva genetica somada a selecao com ajustes na taxa de mutacao, pm, ou na
pressao de selecao, β, aproximando a diversidade da populacao da saıda do modelo de
referencia. As versoes DRAC v2 e v2.a, que utilizam o modelo de dinamica de populacoes,
Capıtulo 5, tem a vantagem de diminuir a parametrizacao do sistema de controle, visto
que a derivada dΓ/dθ e calculada em tempo real.
Os experimentos com o ambiente moving peaks mostraram que o DRAC, em todas as
suas versoes, pode rastrear a saıda do modelo de referencia, minimizando o erro e = Γm−
162
Tabela 7.24 Resultados do Experimento 7.10.c: roteamento de redes com variacoes caoticas.
Metodo MMA DP Γ P(v2) P(v2.a)
DCGA 0.1699 0.0464 0.1921 ≈ +
DGEA 0.1433 0.0388 0.1452 + +
DRAC v2 0.1709 0.0474 0.1300 +
DRAC v2.a 0.1758 0.0461 0.1444 –
ERIGA 0.1329 0.0275 0.1659 + +
RIGA 0.1271 0.0285 0.1657 + +
AGP 0.1245 0.0271 0.1664 + +
THM 0.0511 0.0085 0.3412 + +
TRAM 0.1744 0.0501 0.0684 – ≈
Γ, em ambientes contınuos ou nao-contınuos, onde nas vizinhancas dos otimos as aptidoes
dos indivıduos sao aproximadamente iguais. Nesses ambientes, os sinais de controle
sao mais efetivos, pois indivıduos geneticamente semelhantes ao melhor indivıduo tem
aptidoes aproximadamente iguais, potencializando a selecao. Assim, essa caracterıstica
somada a uma pressao de selecao maior, nas versoes DRAC v1 e v2, ou a uma taxa de
mutacao menor, DRAC v2.a, tende a decair a diversidade com maior intensidade. Em
oposicao ao decaimento da diversidade, uma pressao de selecao menor ou uma taxa de
mutacao maior tende a aumentar a diversidade. Nesses ambientes, e mais facil rastrear
a diversidade do modelo de referencia.
Os experimentos com o problema da mochila mostraram que as versoes DRAC v1 e v2
nao sao eficientes para rastrear a diversidade do modelo de referencia neste tipo de ambi-
ente — mesmo com comportamento estatico. Em problemas combinatorios, a selecao nao
contribui efetivamente para o decaimento da diversidade como em ambientes contınuos,
pois indivıduos geneticamente semelhantes podem ter aptidoes muito diferentes, e vice-
versa. Assim, de um grupo de indivıduos semelhantes, aqueles com pior aptidao tendem a
ser extintos, o que nao contribui para a reducao da diversidade. DRAC v2.a rastreou me-
lhor o modelo de referencia do que DRAC v2 em todos os experimentos com o problema
da mochila. Ao contrario da pressao de selecao, a taxa de mutacao tem forte influencia
sobre a diversidade. Com o auxılio do modelo de dinamica de populacoes, Capıtulo 5, que
fornece a sensibilidade da diversidade em relacao aos parametros evolucionarios, dΓ/du,
foi possıvel rastrear o modelo de referencia com margem de erro baixa quando utilizado
163
Tabela 7.25 Analise geral de desempenho.
Tabela 7.26 Tempos medios de execucao dos AEs.
164
o DRAC v2.a.
Na Secao 7.5, a hipotese do modelo de referencia, Secao 6.2, foi reforcada quando
modelos analıticos distintos proporcionaram o mesmo desempenho do metodo DRAC.
Os experimentos com dois tipos de ambientes com diferentes ciclos de variacao mostra-
ram resultados semelhantes em relacao aos indicadores MMA, DP e Γ. Os parametros
do modelo de referencia foram escolhidos empiricamente. No entanto, tais parametros,
qualquer que seja o modelo analıtico, podem ser ajustados adaptativamente em funcao de
algum criterio de desempenho do AE. Por exemplo, o impulso de diversidade do modelo
de referencia apos a mudanca do ambiente pode ser ajustado conforme a dinamica do
ambiente — por exemplo, em funcao da variacao da melhor aptidao ou da frequencia da
mudanca. A partir dos resultados dos experimentos, conclui-se que o DRAC pode ser
implementado apenas em funcao de especificacoes gerais do modelo de referencia, como
a diversidade mınima, Γmin, ou o pico de diversidade apos a mudanca do ambiente.
A Secao 7.6 apresentou os experimentos com as funcoes contınuas de Ackley e Schwefel.
Em uma analise geral, os metodos propostos DRAC v2, DRAC V2.a e PDFEA obtiveram
resultados inferiores aos metodos ERIGA e TRAM nos experimentos com dinamica com
variacoes pequenas. Os parametros do modelo de referencia, Γmin e Γm apos as mudancas
do ambiente, foram os mesmos para todos os experimentos. Assim, os valores elevados de
Γm apos as mudancas do ambiente podem ter dispersado demasiadamente a populacao,
em especial nos metodos DRAC v2.a e PDFEA cujas diversidades sao mais sensıveis ao
sinal de controle — a taxa de mutacao.
Nos experimentos com dinamicas com variacoes grandes e caoticas, o perfil do mo-
delo de referencia favoreceu os metodos DRAC v2 e v2.a, em especial nos experimentos
com variacoes grandes, onde estes metodos alcancaram os melhores desempenhos. No
experimento com a funcao de Schwefel, os melhores resultados alcancados pelos metodos
DRAC v2 e v2.a podem ser observados nos seus menores DPs, Tabelas 7.13 e 7.14, que
indicam menores variacoes dos seus MMAs, e pela Figura 7.10, que mostra que as melho-
res aptidoes destes metodos recuperam seus valores anteriores as mudancas do ambiente
mais rapido do que os demais AEs.
Nos experimentos com o moving peaks, Secao 7.7, com dinamica com variacoes pe-
quenas, ERIGA, RIGA e DRAC v2.a obtiveram os melhores resultados. DRAC v2 e
PDFEA nao obtiveram resultados satisfatorios. Nos experimentos com variacoes gran-
des, DRAC v2 e v2.a obtiveram os melhores resultados. Nos experimentos com variacoes
caoticas, ERIGA e DRAC v2.a obtiveram os melhores resultados. Em ambientes como o
165
moving peaks, indivıduos tem aptidoes semelhantes nas vizinhancas de otimos. Portanto,
nessas regioes ocorrem-se os mesmos efeitos de ambientes contınuos em relacao ao com-
portamento da diversidade. Por essa razao, atribui-se um resultado nao satisfatorio aos
metodos propostos em dinamicas com variacoes pequenas. Ao contrario, em dinamicas
com variacoes grandes e caoticas, DRAC v2 e v2.a alcancaram os melhores resultados,
o que pode ser atribuıdo ao modelo de referencia que impulsiona a diversidade apos as
mudancas do ambiente.
No problema combinatorio da mochila, DRAC v2 e v2.a obtiveram resultados sig-
nificativamente superiores aos demais AEs. Normalmente, a diversidade nao decai com
muita intensidade em razao da selecao em problemas combinatorios, Figuras 7.19 e 7.20.
Isso ocorre porque indivıduos geneticamente semelhantes podem ter aptidoes muito dife-
rentes, e vice-versa, impedindo a criacao de nichos em torno do melhor indivıduo. Assim,
um indivıduo sem boa aptidao, geneticamente semelhante ao melhor indivıduo, apos a
variacao do ambiente pode ter sua aptidao melhorada. Isso so ocorrera se houver di-
minuicao da diversidade, por alta pressao de selecao, no DRAC v2, ou baixa taxa de
mutacao, no DRAC v2.a. Por controlarem a diversidade, decaindo-a ate Γm, DRAC v2
e v2.a obtiveram resultados muito satisfatorios nos problema combinatorios da mochila.
No roteamento de redes, DRAC v2.a obteve o melhor resultado, estatisticamente igual
ao TRAM, seguido do DRAC v2 e DCGA nos experimentos com dinamicas com variacoes
grandes e caoticas. Os algoritmos baseados em imigrantes, ERIGA e RIGA, obtiveram os
piores resultados. O mesmo fenomeno ocorrido no problema da mochila, caracterıstico de
problemas combinatorios, aconteceu no roteamento de redes. Neste caso, um indivıduo
geneticamente semelhante ao melhor indivıduo que forma um caminho invalido pode
tornar-se valido apos a mudanca do ambiente. Isso so ocorrera se houver um nicho em
torno do melhor indivıduo, que por sua vez causara uma diminuicao da diversidade da
populacao. Metodos que nao diminuem a diversidade de forma controlada, como os
baseados em imigrantes, tem dificuldades de criar tais nichos. Portanto, essas colocacoes
justificam o melhor desempenho do DRAC v2.a, que dos metodos propostos e o que
melhor controla a diversidade da populacao.
Tendo como objetivo atuar em ambientes dinamicos, recuperando a melhor aptidao
anterior a variacao do ambiente o mais rapido possıvel, o objetivo dos metodos propostos,
em especial as versoes do DRAC, foi alcancado. Nesta analise de desempenho, foram
utilizados varios ambientes com caracterısticas distintas. Todos os metodos propostos,
DRAC v2, DRAC v2.a e PDFEA, obtiveram resultados inferiores, principalmente em
166
relacao aos AEs baseados em imigrantes, na maioria dos experimentos com dinamicas
com variacoes pequenas. Esses resultados sinalizam a necessidade de um modelo de
referencia que interaja com o ambiente, principalmente em relacao a sua dinamica. Ao
contrario, os metodos propostos DRAC v2 e v2.a mostraram-se superiores aos demais AEs
na maioria dos experimentos com dinamicas com variacoes grandes e caoticas. Quando
isso nao ocorreu, pelo menos um desses metodos foram equivalentes aos metodos ERIGA
ou TRAM.
167
CAPITULO 8
CONCLUSOES E TRABALHOS FUTUROS
Os algoritmos evolucionarios (AEs) possuem parametros cujos valores tem influencia
direta no desempenho do processo evolucionario. A determinacao dos valores desses
parametros, na maioria das vezes realizada durante o processo evolucionario, pode melho-
rar o desempenho de AEs em problemas de otimizacao, busca, modelagem ou simulacao.
Este trabalho apresentou dois metodos de controle de parametros de algoritmos evo-
lucionarios cujo principal objetivo e controlar a diversidade da populacao. O primeiro,
DRAC, baseia-se no sistema adaptativo por modelo de referencia (ASTROM; WITTEN-
MARK, 1995) e o segundo, PDFEA, e fundamentado no controle de funcao de distribuicao
de probabilidade (WANG, 2000a). O PDFEA pode ser considerado um novo paradigma
de controle de diversidade em algoritmos evolucionarios. A partir de um novo modelo de
dinamica de populacoes, o processo evolucionario foi formalizado analiticamente. Esse
modelo foi, tambem, utilizado no sistema de controle do DRAC.
O modelo de dinamica de populacoes proposto formalizou um modelo de processo evo-
lucionario e atuou no ajuste do parametro do controlador, por meio de sua aproximacao
da derivada dΓ/dθ. Esse modelo, apesar de idealizado para populacoes infinitas, mostrou
que realiza previsoes de diversidade que tendem a serem mais precisas para populacoes
maiores que 50 indivıduos. Esses resultados sao importantes porque as populacoes reais
ou de AEs sao, normalmente, maiores que 100 indivıduos.
O modelo de controle adaptativo, DRAC, criou uma nova concepcao de controle de
diversidade em AEs. Foi criado um modelo de referencia com caracterısticas gerais,
independente de funcoes analıticas, a partir das fundamentacoes teoricas apresentadas no
Capıtulo 3. Alguns experimentos, Secao 7.5, mostraram que modelos analıticos distintos
podem proporcionar ao DRAC o mesmo desempenho em ambientes e ciclos de variacao
distintos.
Apesar de o metodo MIT nao garantir a convergencia para uma estabilidade as-
sintotica, e = 0, para k →∞, os experimentos apresentados na Secao 7.4 mostraram que
o sistema de controle pode rastrear o modelo de referencia de forma satisfatoria quando
168
utilizada a taxa de mutacao como sinal de controle, DRAC v2.a. Esses resultados mostra-
ram que e possıvel contrapor os fenomenos que causam a perda da diversidade — deriva
genetica e selecao. Nesse contexto, a dinamica de populacoes, ao fornecer a variacao
da diversidade em relacao ao sinal de controle, teve grande importancia, pois diminui a
parametrizacao do sistema de controle ao calcular dΓ/dθ em tempo real.
O modelo de controle de parametros baseado no controle de PDF, apresentado na
Secao 6.6 e implementado em carater inicial, representa um importante topico de pesquisa
na computacao evolucionaria, pois abre duas possibilidades:
1. Controle da diversidade da populacao; e
2. Controle da distribuicao dos indivıduos no espaco de solucoes.
Ao longo deste doutorado, os modelos e resultados obtidos foram reportados e publi-
cados em varios congressos, a saber� Population dynamic model for gene frequency prediction in evolutionary algorithms
(GOUVEA JR.; ARAUJO, 2008b).� Diversity control based on population heterozygosity dynamic (GOUVEA JR.; ARAUJO,
2008a).� Diversity-based model reference for genetic algorithms in dynamic environment (DIVERSITY-
BASED. . . , 2007).� Multicast routing using genetic algorithm seen as a permutation problem (ARAUJO
et al., 2006).� Roteamento de redes multicast utilizando computacao evolucionaria (GOUVEA JR.
et al., 2005).
A elaboracao desses artigos, suas revisoes e crıticas da comunidade cientıfica tiveram
grande importancia no desenvolvimento desta tese.
Os experimentos do Capıtulo 7, que compararam os metodos propostos, DRAC e
PDFEA, com um AGP e seis AEs adaptativos, mostrou que as versoes DRAC podem
ter melhor desempenho em ambientes com dinamicas com grandes variacoes ou com
comportamento caotico. Em ambientes com variacoes pequenas, na maioria dos casos,
os metodos propostos obtiveram desempenho inferior aos metodos ERIGA e TRAM. A
169
principal causa pode ser atribuıda ao elevado impulso de diversidade apos as mudancas
do ambiente, definida pelo modelo de referencia, que pode ter espalhado demasiadamente
a populacao em relacao a pequena variacao do ambiente. Assim, indivıduos proximos do
melhor indivıduo, que poderiam ser promissores apos a mudanca do ambiente, afastaram-
se do novo otimo.
Nos problemas combinatorios, o metodo DRAC obteve resultado superior na maioria
dos experimentos, mesmo com dinamicas com variacoes pequenas, o que pode estar rela-
cionado a diversidade elevada de alguns AEs. Em problemas combinatorios, indivıduos
proximos do melhor indivıduo podem ter baixa aptidao, reduzindo suas chances de so-
brevivencia ou de gerar descendentes. Assim, nao havera nichos em torno do melhor
indivıduo — como acontece em ambientes contınuos onde indivıduos na vizinhanca do
otimo tem aptidoes semelhantes. Portanto, nao havera grande reducao da diversidade
em decorrencia da selecao. No DRAC, ao reduzir a diversidade, guiada pelo modelo de
referencia, indivıduos proximos do melhor indivıduo tem mais chances de sobreviver ou
gerar descendentes. Esses indivıduos, que a princıpio tem baixa aptidao, podem tornar-se
promissores apos as mudancas do ambiente. Por exemplo, um indivıduo geneticamente se-
melhante ao melhor indivıduo, mas que apresenta um caminho invalido em um problema
de roteamento, pode tornar-se um caminho valido apos uma mudanca do ambiente. Com
uma diversidade elevada, essa situacao tende a nao ocorrer, pois normalmente nao ha
nichos em torno do otimo.
O objetivo principal dos metodos propostos, principalmente as versoes duas DRAC,
foi alcancado, visto que os metodos propostos foram projetados para ambientes comple-
xos — multimodais e dinamicos. Foram utilizados varios ambientes com caracterısticas
distintas em relacao a dinamica e aos ciclos de variacao. O metodo proposto PDFEA,
implementado em carater inicial, foi inferior a maioria dos demais AEs nos experimen-
tos realizados. Os modelos DRAC v2 e v2.a mostraram-se superiores aos demais AEs
na maioria dos experimentos com dinamicas com variacoes grandes e caoticas. Quando
isso nao ocorreu, pelo menos um desses metodos foi equivalente aos metodos ERIGA ou
TRAM.
8.1 TRABALHOS FUTUROS
Este trabalho abre varias possibilidade de pesquisa e investigacao. O modelo de dinamica
de populacoes, apesar de idealizado para AEs, pode tambem ser utilizado em populacoes
170
biologicas. Na computacao evolucionaria, outros modelos de controle de parametros de
fatores evolutivos podem ser elaborados; por exemplo, no controle da distribuicao alelica
de um determinado gene. Assim, a partir do alelo do melhor indivıduo, pode-se controlar
a distribuicao de indivıduos na vizinhanca deste alelo, otimizando a explotacao.
Em populacoes biologicas, o modelo de dinamica de populacoes pode ser utilizado
na previsao da perda de diversidade, principalmente porque estas populacoes sao, nor-
malmente, elevadas, tornando as previsoes mais precisas. Pode-se estimar as frequencias
genicas ou genotıpicas de uma populacao ou especie, compara-las com as previsoes do
modelo de Hardy-Weimberg, prever evolucoes e quais os fatores evolutivos mais atuaram.
Assim, nao seria necessario esperar a proxima geracao para analisar a evolucao de uma
populacao.
Outra possibilidade de trabalho futuro e o aprimoramento do modelo de referencia
de diversidade, utilizado no controle adaptativo. Como identificado nos experimentos, o
modelo de referencia tem parametros que influenciam o desempenho do AE. No modelo
baseado na dinamica da heterozigosidade, Equacao 3.23, esses parametros sao o tamanho
efetivo da populacao, a diversidade mınima e a magnitude do impulso de diversidade
apos as mudancas do ambiente. O tamanho efetivo da populacao influencia o decaimento
da diversidade e pode ser ajustado para variar conforme a evolucao media da populacao.
A diversidade mınima tem influencia tanto na explotacao, como na manutencao de al-
guns indivıduos com baixas aptidoes, mas que apos uma mudanca do ambiente podem
tornar-se indivıduos promissores. Finalmente, um dos parametros que demostrou maior
influencia no desempenho das versoes DRAC foi a magnitude do impulso de diversidade
do modelo de referencia apos as mudancas do ambiente. Em alguns experimentos com
dinamicas com variacoes pequenas, a saıda do modelo de referencia apos as mudancas
do ambiente influenciou negativamente o desempenho das versoes DRAC. Portanto, as
seguintes propostas podem ser testadas e analisadas:
1. Elaborar uma estrategia que ajuste um ou todos os parametros do modelo de re-
ferencia durante o processo evolucionario; e
2. Identificar uma configuracao parametrica do modelo de referencia que melhor se
adeque ao tipo de problema (e.g., contınuo, combinacional, multiobjetivo).
O controle de PDF aplicado aos algoritmos evolucionarios tambem abre varias possibi-
lidades, tanto de pesquisa quanto de aplicacoes, principalmente em ambientes dinamicos
171
e multiobjetivos. Alguns caminhos incluem a analise do comportamento da PDF ao longo
das geracoes e apos as mudancas do ambiente. Uma area de aplicacao que pode ser pro-
missora e a dos problemas multiobjetivos, onde o controle da distribuicao dos indivıduos
no espaco de solucoes pode posicionar um grupo de indivıduos na regiao de Paretto.
Encontrar uma PDF desejada que proporcione o melhor desempenho do AE e outra
questao importante a ser tratada. Da mesma forma proposta em relacao ao modelo de
referencia, e possıvel propor uma PDF ajustavel ao longo do processo evolucionario ou
uma PDF pre-ajustada em funcao do tipo de problema. Entretanto, o maior desafio do
controle de PDF e torna-lo menos oneroso computacionalmente. Algumas medidas podem
ser feitas com o intuito de amenizar o esforco computacional. Tais medidas incluem o
ajuste do sinal de controle em intervalos onde o processo evolucionario e, por aproximacao,
tratado como um sistema estatico.
Esta tese de doutorado tambem abre outras possibilidades de controle de parametros.
Outros parametros de fatores evolutivos podem ser utilizados pelos metodos de controle
propostos, como, por exemplo, o intervalo de mutacao (para implementacoes de genotipos
com valores reais), taxa de cruzamento, o tipo de cruzamento, numero de indivıduos
selecionados no estagio 3 do mecanismo de selecao, Secao 6.5.3, e o tamanho da populacao.
Esses parametros tem influencia tanto na variacao da diversidade da populacao quanto no
desempenho do algoritmo evolucionario do ponto de vista da aptidao media da populacao.
Finalmente, um topico que tambem pode ser considerado e a relacao dos parametros
do sistema de controle com o desempenho do AE ao longo das geracoes. Dentre esses
parametros, destacam-se a diversidade mınima do modelo de referencia, que pode variar
conforme o crescimento da aptidao media da populacao, e a diversidade apos a mudanca
do ambiente, que pode variar conforme o decaimento da melhor aptidao apos as mudancas
do ambiente.
172
APENDICE A
FUNCOES PADRONIZADAS PARA TESTE
A.1 INTRODUCAO
Este apendice apresenta problemas teste (benchmarks) que sao utilizados para analises e
comparacoes do metodo proposto com outros algoritmos adaptaveis presentes na litera-
tura dos AEs, alem do algoritmo genetico padrao (AGP).
Sao apresentados seis benchmarks divididos em tres classes de problemas, a saber,
funcoes contınuas e nao-contınuas multimodais, e problemas combinatorios. Na Secao
A.2, duas funcoes contınuas multimodais; na Secao A.3, o gerador moving peaks de su-
perfıcies nao-contınuas multimodais, cujo comportamento pode ser estatico ou variar de
levemente dinamico, com mudancas suaves, ate caotico; na Secao A.4, o problema da mo-
chila, um problema de otimizacao combinacional NP-completo que pode ser aplicado em
muitos problema praticos; na Secao A.5, o problema de alocacao de radio-transmissores
de telecomunicacoes; e, finalmente, na Secao A.6, um problema de roteamento de redes
de transportes.
A.2 FUNCOES CONTINUAS
Todas as funcoes objetivo apresentadas nesta secao sao contınuas, utilizadas em pro-
blemas de minimizacao; isto e, no ponto otimo, f(X) possui o menor valor de toda a
superfıcie, sendo
f(X∗) = 0.
Portanto, para utilizacao destas funcoes em problemas de maximizacao, faz-se
f(X) = −f(X).
A funcao de Ackley (1987) e altamente multimodal com centenas de otimos locais e
apenas um otimo global. A superfıcie da funcao de Ackley e descrita no intervalo
173
xi ∈ [−60, 60],
∀i = 1, . . . , n. O modelo analıtico da funcao de Ackley e descrito por
fAck = 20− 20 exp
−0.2
√√√√ 1
n
n∑
i=1
(xi − φ)2
− exp
(1
n
n∑
i=1
cos(2π(xi − φ))
), (A.1)
sendo φ a coordenada do otimo global (i.e., X∗ = [φ, . . . , φ]T ).
A funcao de Schwefel (1995) e, tambem, altamente multimodal. Sua taxa de con-
vergencia ao longo dos eixos cartesianos e baixa, pois seu gradiente nao e orientado ao
longo dos eixos. A superfıcie da funcao de Schwefel e descrita no intervalo
xj ∈ [−65, 65],
∀j = 1, . . . , n. O modelo analıtico da funcao de Schwefel e descrito como segue
fSch = 418.98276n−
n∑
i=1
(i∑
j=1
(xj − φ)
)2
. (A.2)Os problemas desta secao podem se tornar dinamicos substituindo xi por xi + ϕi em
todas as equacoes, sendo [ϕ1, . . . , ϕn]T a coordenada do otimo global na superfıcie de
busca.
A.3 GERADOR MOVING PEAKS
O gerador moving peaks (MORRISON; JONG, 1999) produz uma superfıcie descontınua,
composta de Np picos (otimos). A seguir sao apresentados as principais caracterısticas
do gerador moving peaks, no sentido morfologico e dinamico.
A.3.1 Morfologia
Para especificar a morfologia basica da superfıcie gerada por moving peaks, utiliza-se um
“campo de cones” com diferentes alturas e declives aleatoriamente criados. O modelo
estatico do gerador moving peaks pode ser especificado para qualquer dimensao, como
segue
174
fMP(X) = maxi=1,...,Np
[Hi −Ri
√(x1 − x1i)2 + · · ·+ (xn − xni)2
], (A.3)
sendo cada cone i especificado por sua localizacao (x1i, . . . , xni), sua altura Hi e seu
declive Ri. Os cones sao combinados na funcao fMP pelo operador max.
A morfologia aleatoria produzida pelo gerador moving peaks e baseada nos intervalos
dos parametros dos cones, definidos como segue
Hi ∈ [Hmin, Hmax],
Ri ∈ [Rmin, Rmax]
e
xji ∈ [−1, 1],
∀i = 1, . . . , Np e ∀j = 1, . . . , n.
Existem varias vantagens de se utilizar a funcao da Equacao A.3 como base estatica
para ambientes dinamicos, a saber (MORRISON; JONG, 1999):
1. a habilidade de representar uma grande quantidade de superfıcies complexas;
2. a superfıcie contem regioes nao-diferenciaveis;
3. as caracterısticas da superfıcie sao parametrizadas;
4. a funcao da Equacao A.3 pode e facilmente estendida para dimensoes elevadas;
5. a funcao da Equacao A.3 oferece tres caracterısticas (Hi, Ri e xji, ∀i = 1, . . . , Np; ∀j =
1, . . . , n) que podem ser dinamicas.
A Figura A.1 mostra dois exemplos de superfıcies produzidas aleatoriamente pelo
gerador moving peaks, para (a) 5 e (b) 100 picos.
A.3.2 Dinamica
A dinamica do ambiente criado pelo gerador moving peaks e definida em tempo dis-
creto. O metodo utilizado por Morrison e Jong (1999) para criar muitas caracterısticas
dinamicas para a superfıcie gerada pela Equacao A.3 aplica a funcao logıstica. Essa
funcao e unidimensional, nao-linear e pode gerar comportamentos progressivos variando
do simples ate o complexo. A funcao logıstica e descrita como segue
175
050
100
0
50
100−500
0
500
(a) Np = 5
050
100
0
50
100−200
−100
0
100
(b) Np = 100
Figura A.1 Superfıcies produzidas aleatoriamente pelo gerador moving peaks para (a) 5 e (b)
100 picos.
y(t+ 1) = Ay(t) (1− y(t)), (A.4)sendo A uma constante e y(t) o valor da funcao logıstica na iteracao t (y(0) 6= 0). A
medida que A cresce, o comportamento dinamico se torna mais complexo. Por exemplo,
para A = 2.2, y tende para o valor de 0.5455; para A = 3.3, y entra em bifurcacao,
atingindo o par de valores {0.8236, 0.4794}; para A = 3.5, o comportamento se torna
mais complexos, y gerando os valores do conjunto {0.3828, 0.5009, 0.8269, 0.8750}; para
valor ainda maiores de A, y gera uma sequencia caotica.
Morrison e Jong utilizaram o valor de y, produzido em cada iteracao, para determinar
a magnitude das mudancas morfologicas e dinamicas do ambiente. O valor de A determina
a caracterıstica dinamica do ambiente. O procedimento para se obter uma dinamica
complexa e descrito pelas seguintes especificacoes:
1. o numero de picos da superfıcie que serao dinamicos;
2. a dinamica sera aplicada a altura Hi do pico , ao seu declive Ri, a sua coordenada
(x1i, . . . , xni) ou a qualquer combinacao desses parametros.
A escolha de A determina a caracterıstica das mudancas — passos pequenos e iguais,
grandes e iguais, de diferentes tamanhos ou caoticos. As mudancas na superfıcie da
funcao da Equacao A.3 sao efetuadas em funcao do valor de y, a cada ciclo.
176
A.4 PROBLEMA COMBINATORIO DA MOCHILA
O problema da mochila e um problema de otimizacao combinatoria NP-completo limitado
(SMITH; GOLDBERG, 1992). O objetivo e encontrar a melhor escolha de um conjunto de
objetos a ser colocado em uma mochila para uma viagem. Dado um conjunto de n tipos
de objetos, cada um com um peso proprio, wi, e um valor ou importancia, vi, determine
a quantidade de cada tipo de objeto, xi, tal que o peso total,
n∑
i=1
xi wi, (A.5)seja menor que um limite estabelecido, C, e o valor total,
n∑
i=1
xi vi, (A.6)seja o maior possıvel. Para simular um ambiente dinamico, o peso total, C, pode ser
modificado.
A.5 PROJETO DE REDE DE RADIO-TRANSMISSORES
O projeto de rede de radio-transmissao (RND, do ingles Radio Network Design) e um
problema de otimizacao NP-completo importante em tecnologias moveis cujo objetivo e
cobrir a maior area possıvel com o menor numero de estacoes base transceptoras (BTS,
do ingles Base Transceiver Station).
As informacoes armazenadas em cada posicao da grade operacional deve considerar:� o grau de cobertura;� se e uma posicao disponıvel para transmissao;� se uma BTS esta alocada ou nao;� o tipo de transmissor.
A funcao objetivo de um problema RND pode ser definida como segue
fRND =(CT )2
Nt, (A.7)
177
sendo CT a taxa de cobertura e Nt o numero de radio-transmissores (BTSs) utilizados.
A taxa CT corresponde a soma das coberturas das BTSs dividido pela area geografica
tratada pelo problema. A funcao objetivo da Equacao A.7 esta sujeita as seguintes
restricoes:� conjunto de localizacoes disponıveis para as BTSs e pre-definida;� as BTSs sao do tipo omnidirecional ou quadrada;� cobertura associada: raio × (20 ou 30).
A.6 ROTEAMENTO DE REDES DE TRANSPORTES
Um sistema de roteamento e um conjunto de meios cujo objetivo e atender demandas de
uma rede de transportes. Essa rede pode ser representada como um grafo nao-orientado
G(V,A), onde as V vertices sao ligas pelas A arestas. Alem de suprir as demandas, um
sistema de roteamento tem como objetivo alcancar um atendimento otimo do ponto de
vista de uma metrica em questao, como, por exemplo, no menor tempo ou na menor
distancia total percorrida. A Figura A.2 apresenta um grafo nao-orientado com oito
vertices e 14 arestas. Nesse exemplo, os numeros entre parenteses representam os pesos
das arestas, que podem ser as distancias entre as vertices, em um problemas de distri-
buicao de suprimentos, ou os atrasos medios de envios de pacotes, em um problema de
roteamento de redes de computadores.
Figura A.2 Grafo nao-orientado de um problema de roteamento de redes.
Dentre as principais aplicacoes praticas, podem ser destacadas a distribuicao de jor-
nais, manufaturados, bebidas, valores e produtos quımicos; o recolhimento de borracha e
lixo; o roteamento de helicopteros, linhas aereas, robos de manufatura, pacotes de redes
178
de computadores e fluxo de comunicacoes em redes de telecomunicacoes, dentre outros
(GOLDBARG; LUNA, 2000).
179
REFERENCIAS BIBLIOGRAFICAS
ACKLEY, D. H. A connectionist machine for genetic hillclimbing. Boston, MA, USA:
Kluwer Academic Publishers, 1987.
AGUIRRE, L. A. Introducao a identificacao de sistemas: tecnicas lineares e nao-lineares
aplicadas a sistemas reais. Belo Horizonte, MG, Brasil: Ed. UFMG, 2000.
AMOS, W.; BALMFORD, A. When does conservation genetics matter? Heredity, v. 87,
p. 257–265, 2001.
AMOS, W.; HARWOOD, J. Factors affecting levels of genetic diversity in natural
populations. Philosophical Transactions of the Royal Society of London - Series B:
Biological Sciences, v. 353, n. 1366, p. 177–186, 1998.
ANDRADOTTIR, S.; HEVMAN, D. P.; OTT, T. J. Variance reduction through
smoothing and control variates for markov chain simulations. ACM Transactions on
Modeling and Computer Simulation, v. 3, n. 3, p. 167–189, 1993.
ANGELINE, P. J. Adaptive and Self-adaptive Evolutionary Computation. Piscataway,
NJ: IEEE Press, 1995.
ARABAS, J.; MICHALEWICZ, Z.; MULAWKA, J. Gavaps – a genetic algorithm with
varying population size. In: Proceedings of the First IEEE International Conference on
Evolutionary Computing. [S.l.]: IEEE Press, 1994. p. 73–78.
ARAUJO, A. F. R. et al. Multicast routing using genetic algorithm seen as a permutation
problem. In: IEEE 20th International Conference on Advanced Information Networking
and Applications. Viena: [s.n.], 2006.
ASTROM, K. J.; WITTENMARK, B. Adaptive Control. 2. ed. [S.l.]: Addison-Wesley,
1995.
180
BACK, T. Self-adaptation in genetic algorithms. In: VARELA, F.; BOURGINE, P.
(Ed.). Proceedings of the First European Conference on Artificial Life. [S.l.]: MIT Press,
1992. p. 263–271.
BACK, T. Optimal mutation rates in genetic search. In: FORREST, S. (Ed.).
Proceedings of the 5th International Conference on Genetic Algorithms. San Mateo, CA,
USA: Morgan Kaufmann, 1993. p. 2–8. ISBN 1-55860-299-2.
BACK, T. Evolutionary Algorithms in Theory and Practice. New York, NY, USA:
Oxford University Press, 1996.
BACK, T.; SCHUTZ, M. Intelligent mutation rate control in canonical genetic
algorithms. In: International Syposium on Methodologies for Intelligent Systems
(ISMIS’96). [S.l.]: Springer, 1996. p. 158–167.
BEIGUELMAN, B. Genetica de Populacoes Humanas.
http://lineu.icb.usp.br/bbeiguel/Genetica Populacoes, 2005. Disponıvel em:
<http://lineu.icb.usp.br/bbeiguel/Genetica Populacoes>.
BENDTSEN, C. N.; KRINK, T. Dynamic memory model for non-stationary
optimization. In: Proceedings of the Fourth Congress on Evolutionary Computation –
CEC’02. [S.l.: s.n.], 2002. v. 1, p. 145–150.
BETHKE, A. D. Genetic algorithms as function optimizers. Tese (Doutorado), 1981.
BEYER, H. G.; RUDOLPH, G. Local performance measures. In: . Handbook
of Evolutionary Computation. [S.l.]: Oxford University Press, 1997. cap. B.2.4, p.
B2.4:1–B2.4:27.
BRAATZ, R. Advanced control of crystallization pocesses. Annual Reviews in Control,
v. 26, p. 87–99, 2002.
BRANKE, J. Memory enhanced evolutionary algorithms for changing optimization
problems. In: Proceedings of the 1999 Congress on Evolutionary Computation – CEC’99.
[S.l.: s.n.], 1999. v. 3, p. 1875–1882.
BRANKE, J. Evolutionary approaches to dynamic optimization problems: a survey. In:
BRANKE, J.; BACK, T. (Ed.). Evolutionary Algorithms for Dynamic Optimization
Problems. San Francisco, CA, USA: [s.n.], 2001. p. 27–30.
181
BRANKE, J. Evolutionary Optimization in Dynamic Environment. Norwell,
Massachusetts, USA: Kluwer Academic Publishers, 2002.
BROOKES, M. I. et al. Genetic analysis of founder bottlenecks in the rare british
butterfly Plebejus argus. Conservation Biology, v. 11, n. 3, p. 648–661, 1997.
BUI, L. T.; BRANKE, J.; ABBASS, H. Multi-objective optimization for dynamic
environments. In: Proceedings of the Congress on Evolutionary Computation. Edinburgh,
UK: IEEE press, 2005.
CABALLERO, A. Developments in the prediction of effective population size. Heredity,
v. 73, p. 657–679, 1994.
CHAMPELY, S.; CHESSEL, D. Measuring biological diversity using euclidean metrics.
Environmental and Ecological Statistics, Kluwer Academic, v. 9, n. 2, p. 167–177, June
2002.
CHARLESWORTH, B.; CHARLESWORTH, D.; BARTON, N. H. The effects of genetic
and geographic structure on neutral variation. Annual Review of Ecological Systems,
v. 34, p. 99–125, 2003.
CHESSER, R. K. et al. Genetics, 1993.
COBB, H. G. An investigation into the use of hypermutation as an adaptive operator
in genetic algorithms having continuous, time-dependent nonstationary environments.
Washington, 1990.
CORNE, D.; ROSS, P.; FANG, H.-L. Fast practical evolutionary timetabling. [S.l.], 1994.
CROSSA, J.; VENCOVSKY, R. Implications of the variance effective population size on
the genetic conservation of monoecious species. Theorical and Applied Genetics, v. 89,
n. 7, p. 936–942, 1994.
CROW, J. F.; DENNISTON, C. Inbreeding and variance effective population numbers.
Evolution, v. 42, p. 482–495, 1988.
CROW, J. F.; KIMURA, M. An Introduction to Population Genetic Theory. Minnesota:
Burgess Publishing, 1970.
182
CROWLEY, T. et al. Control of particle size distribution described by a population
balance model of semibatch emulsion polymerisation. J. Process Control, v. 10, p.
419–432, 2000.
DARWIN, C. A Origem das Especies. [S.l.]: Ediouro, 2004.
DAVIS, L. Adapting operator probabilities in genetic algorithms. In: Proceedings of
Third Int. Genetic Algorithms. [S.l.: s.n.], 1989. p. 61–69.
DIVERSITY-BASED Model Reference for Genetic Algorithms in Dynamic Environment.
In: 2007 IEEE Congress on Evolutionary Computation, CEC’07. Singapore, South
Korea: IEEE Press, 2007.
Doyle III, F.; HARRISON, C.; CROWLEY, T. Hybrid model-based approach to
batch-to-batch control of particle size distribution in emulsion polymerization. Comp.
Chem. Eng., v. 27, p. 1153–1163, 2003.
DROSTE, S.; JANSEN, T.; WEGENER, I. Dynamic parameter control in simple
evolutionary algorithms. In: Proceedings of the Foundations of Genetic Algorithms. [S.l.:
s.n.], 2001. v. 6, p. 275–294.
EEK, R. A.; BOSGRA, O. H. Controllability of particulate processes in relation to the
sensor characteristics. Powder Technology, v. 108, p. 137–146, 2000.
EIBEN, A. E.; HINTERDING, R.; MICHALEWICZ, Z. Parameter control in
evolutionary algorithms. IEEE Transactions on Evolutionary Computation, v. 3, n. 2, p.
124–141, 1999.
EIBEN, A. E.; SMITH, J. E. Introduction to Evolutionary Computing. Berlin: Springer,
2003.
ELDRIDGE, A. Optimal mutation rates and recombination: the effect of population
size and gene length. In: . [S.l.: s.n.], 2002.
EWENS, W. J. On the concept of effective population size. Theoretical Population
Biology, v. 21, p. 373–378, 1982.
FARIAS, A. A.; SOARES, J. F.; CeSAR, C. C. Introducao a Estatıstica. second. [S.l.]:
LTC, 1998.
183
FISHER, R. A. The Genetical Theory of Natural Selection. [S.l.]: Oxford University
Press, 1930.
FOGEL, D. B. Evolutionary Computation. Piscataway, NJ: IEEE Press, 1995.
FOGEL, D. B.; FOGEL, L. J.; ATMAR, J. W. Meta-evolutionary programming. In:
CHEN, R. (Ed.). Proceedings of the 25th Asilomar Conference on Signals, Systems and
Computers. San Jose, CA: Maple Press, 1991. v. 1, p. 540–545.
FRANKHAM, R. Effective population size/adult population size ratios in wildlife: a
review. Genetical Research, v. 66, p. 95–107, 1995.
FRANKHAM, R.; BALLOU, J. D.; BRISCOE, D. Introduction to Conservation
Genetics. Cambridge: Cambridge University Press, 2002.
GILBERT, D. A. et al. Genetic fingerprinting reflects population differentiation in the
california channel-island fox. Nature, v. 344, n. 6268, p. 764–767, 1990.
GOEDERT, C. Germoplasma: o que e isso? Seed News, v. 6, n. 3, 2002.
GOLDBARG, M. C.; LUNA, H. P. L. Otimizacao Combinatoria e Programacao Linear.
Rio de janeiro: Campus, 2000.
GOLDBERG, D. E. Genetic Algorithms in Search, Optimization and Machine Learning.
Reading, MA: Addison-Wesley, 1989.
GOLDBERG, D. E.; SMITH, R. E. Nonstationary function optimization using genetic
algorithms with dominance and diploidy. In: ICGA. [S.l.: s.n.], 1987. p. 59–68.
GOMMEREN, H. et al. Modelling and control of a jet mill plant. Powder Technology,
v. 108, p. 147–154, 2000.
GOUVEA JR., M. M.; ARAUJO, A. F. R. Diversity control based on population
heterozygosity dynamic. In: 2008 IEEE Congress on Evolutionary Computation,
CEC’08. Hong Kong: [s.n.], 2008.
GOUVEA JR., M. M.; ARAUJO, A. F. R. Population dynamic model for gene
frequency prediction in evolutionary algorithms. In: 2008 IEEE Congress on
Evolutionary Computation, CEC’08. Hong Kong: [s.n.], 2008.
184
GOUVEA JR., M. M.; GARROZI, C.; LEITaO, A. R. Roteamento de redes multicast
utilizando computacao evolucionaria. In: V Encontro Nacional de Inteligencia Artificial,
ENIA’05. Sao Leopoldo, RS, Brasil: [s.n.], 2005.
GREFENSTETTE, J. J. Genetic algorithms for changing environments. In: .
Parallel Problem Solving from Nature. [S.l.]: North-Holland, 1992. v. 2, p. 137–144.
GREGORIOUS, H.-R. On the concept of effective number. Theoretical Population
Biology, v. 40, n. 2, p. 269–283, 1991.
GREGORIUS, H.-R. On the concept of effective number. Theoretical Population
Biology, v. 40, p. 269–283, 1991.
HANSEN, M. M. et al. Loss of genetic variation in hatchery-reared indian major carp,
Catla catla. Journal of Fish Biology – Sup. B, v. 69, p. 229–241, 2006.
HARDY, G. H. Mendelian proportions in a mixed population. Science, v. 78, p. 49–50,
1908.
HAYKIN, S. Redes Neurais: Princıpios e Pratica. Second. Porto Alegre: Bookman,
2001.
HERRERA, F.; LOZANO, M. Two-loop real-coded genetic algorithms with adaptive
control of mutation step sizes. Applied Intelligence, v. 13, n. 3, p. 187–204, nov 2000.
HERRERA, F.; LOZANO, M.; VERDEGAY, J. L. Fuzzy connectives based crossover
operators to model genetic algorithms population diversity. Fuzzy Sets and Systems,
Elsevier, v. 92, n. 1, p. 21–30, 1997.
HINTERDING, R.; MICHALEWICZ, Z.; EIBEN, A. E. Adaptation in evolutionary
computation: a survey. In: Proceeding of the 4th IEEE Conference Evolutionary
Computation. Indianapolis, USA: IEEE Press, 1997. p. 65–69.
HO, Y. C.; CAO, X. Perturbation analysis and optimization of queueing network.
Journal of Optimization Theory and Apphcation, n. 20, p. 559–589, 1983.
JIN, Y.; BRANKE, J. Evolutionary optimization in uncertain environments: a survey.
v. 9, n. 3, p. 303–317, 2005.
185
KIEFER, J.; WOLFOWITZ, J. Stochastic estimation of the maximum of a regression
function. Ann. Math. Stat., n. 23, p. 462–466, 1952.
KIMURA, M.; CROW, J. F. The measurement of effective population numbers.
Evolution, v. 17, p. 279–288, 1963.
KOZA, J. R. Genetic Programming. [S.l.]: MIT Press, 1992.
KUSHNER, H.; CLARK, D. Stochastic Approximation for Constrained and
Unconstrained Systems. [S.l.]: Springer, 1978.
LEBERG, P. Genetic approaches for estimating the effective size of populations. Journal
of Wildlife Management, v. 69, n. 4, p. 1385–1399, 2005.
LEBERG, P. L. Efects of population bottlenecks on genetic diversity as measured by
allozyme electrophoresis. Evolution, v. 46, p. 447–494, 1992.
LEE, M.; TAKAGI, H. Dynamic control of genetic algorithms using fuzzy logic
techniques. In: FORREST, S. (Ed.). Proceedings of the Fifth International Conference
on Genetic Algorithms. [S.l.]: Morgan Kaufmann, 1993. p. 76–83.
LI, C. C. Pseudo-random mating populations. in celebration of the 80th anniversary of
the hardy-weinberg law. Genetics, v. 119, p. 731–737, 1988.
LIS, J. Parallel genetic algorithm with the dynamic control parameter. In: Proceedings
of the 1996 IEEE Conference on Evolutionary Computation. Piscataway, NY: IEEE
Press, 1996. p. 324–329.
LJUNG, L. System identification: theory for the user. Englewood Cliffs, NJ, USA:
Prentice Hall, 1987.
LOPES, S. Bio. fourth. [S.l.]: Saraiva, 1999.
MA, D. L.; TAFTI, D. K.; BRAATZ, R. D. Optimal control and simulation of
multidimensional crystallization processes. Computers and Chemical Engineering, v. 26,
p. 1103–1116, 2002.
MAGURRAN, A. E. Measuring Biological Diversity. Oxford, UK: Blackwell, 2004.
MALEY, C. Mutation rates as adaptations. Journal of Theoretical Biology, v. 186, p.
339–348, 1997. Disponıvel em: <citeseer.ist.psu.edu/maley00mutation.html>.
186
MAZA, M. D. L.; YURET, D. Dynamic hillclimbing. AI Expert, v. 9, n. 3, 1994.
MEIYI, L.; ZIXING, C.; GUOYUN, S. An adaptive genetic algorithm with diversity-
guided mutation and its global convergence property. Journal of Central South
University of Technology, Journal of Central South University of Technology, v. 11, n. 3,
p. 323–327, 2004.
MONSIEURS, P.; FLERACKERS, E. Reducing population size while maintaining
diversity. In: RYAN, C. et al. (Ed.). Genetic Programming, Proceedings of EuroGP’2003.
Essex, UK: Springer Berlin / Heidelberg, 2003. v. 2610, p. 142–152.
MORRISON, R. W. Designing Evolutionary Algorithms for Dynamic Environments.
Berlin: Springer, 2004.
MORRISON, R. W.; JONG, K. A. D. A test problem generator for non-stationary
environments. In: Proceedings of the 1999 Congress on Evolutionary Computation –
CEC’99. [S.l.: s.n.], 1999. p. 2047–2053.
ONAL, H. Preservation of species and genetic diversity. American Journal of Agricultural
Economics, Blackwell Publishers, v. 85, n. 2, p. 437–447, May 2003.
NARENDRA, K. S. Neural networks for control: theory and practice. Proceedings of the
IEEE, v. 84, n. 10, p. 1385–1406, 1996.
NARENDRA, K. S.; ANNASWAMY, A. M. Stable Adaptive Systems. [S.l.]: Dover
Publications, 2005.
NEI, M.; TAJIMA, F. Genetic drift and estimation of effective population size. Genetics,
v. 98, p. 625–640, 1981.
NGUYEN, D. H. M.; WONG, K. P. Controlling diversity of evolutionary algorithms.
In: Proceedings of the Second International Conference on Machine Learning and
Cybernetics. [S.l.: s.n.], 2003. p. 775–780.
NOMURA, T. Developments in prediction theories of the effective size of populations
under selection. Animal Science Journal, v. 76, p. 87–96, 2005.
NOMURA, T. Effective population size under random mating with a finite number of
matings. Genetics, v. 171, p. 1441–1442, 2005.
187
NUNNEY, L. The influence of mating system and overlapping generations on effective
population size. Evolution, v. 47, p. 1349–1341, 1993.
OCHOA, G.; HARVEY, I.; BUXTON, H. Optimal mutation rates and selection pressure
in genetic algorithms. In: Proceedings of the Genetic and Evolutionary Computation
Conference (GECCO’00). [S.l.: s.n.], 2000. p. 315–322.
OGATA, K. Engenharia de Controle Moderno. 3. ed. [S.l.]: Prentice-Hall, 1998.
P.-Bennett, A.; SHAPIRO, J. L.; RATTRAY, M. A statistical mechanics formulation of
the dynamics of genetic algorithms. Lecture notes in Computer Science, Springer-Verlag,
Berlin, v. 865, p. 17–27, 1994.
PIERRE, D. A. Optimization Theory with Applications. Mineola, NY: Dover, 1986.
POLLAK, E. Eigenvalue effective population numbers for populations that vary
cyclically in size. Math. Bioscience, v. 177, p. 11–24, 2002.
PUDOVKIN, A. I.; ZAYKIN, D. V.; HEDGECOCK, D. On the potential for estimating
the effective number of breeders from heterozygote-excess in progeny. Genetics, v. 144,
p. 383–387, 1996.
RADCLIFFE, N. J. Equivalence class analysis of genetic algorithms. Complex Systems,
v. 5, n. 2, p. 183–205, 1991.
RAIJMANN, L. E. L. et al. Genetic variation and outcrossing rate in relation to
population size in Gentiana pneumonanthe l. Conservation Biology, v. 8, p. 1014–1994,
1994.
RAO, C. R. Diversity and dissimilarity coefficients: A unified approach. Theoretical
Population Biology, v. 21, p. 24–43, 1982.
RECHENBERG, R. Evolutionsstrategie: Optimierung technischer Syseme nach
Prinzipien der biologischen Evolution. Stuttgart: Frommann-Holzboog, 1973.
RICHTER, J. N.; PAXTON, J. Adaptive evolutionary algorithms on unitation, Royal
Road and Longpath functions. In: Proceedings of IASTED Computational Intelligence
Conference 2005. Calgary, Alberta: [s.n.], 2005.
RIDLEY, M. Evolution. third. [S.l.]: Wiley-Blackwell, 2004.
188
ROBERTSON, A. Inbreeding in artificial selection programmes. Genetical Research,
v. 2, p. 189–194, 1961.
RUSSELL, S.; NORVIG, P. Artificial Intelligence: A Modern Approach. Second. New
Jersey: Prentice Hall, 2002.
S.-VOOSEN, D.; MUHLENBEIN, H. Strategy adaptation by competing subpopulations.
In: Parallel Problem Solving from Nature (PPSN III). Jerusalem: Springer, 1994. p.
199–208.
S.-VOOSEN, D.; MUHLENBEIN, H. Adaptation of population sizes by competing
subpopulations. In: Proceedings of the 1996 IEEE Conference on Evolutionary
Computation. Piscataway, NY: IEEE Press, 1996. p. 330–335.
SANTIAGO, E.; CABALLERO, A. Effective size of populations under selection.
Genetics, v. 139, p. 1013–1030, 1995.
SANTIAGO, E.; CABALLERO, A. Effective size and polymorphism of linked neutral
loci in populations under directional selection. Genetics, v. 149, p. 2105–2117, 1998.
SCHWARTZ, M. K.; TALLMON, D. A.; LUIKART, G. Review of DNA-based census
and effective population size estimators. Animal Conservation, v. 1, p. 293–299, 1998.
SCHWEFEL, H.-P. Evolution and Optimum Seeking. Chichester, UK: John Wiley, 1995.
SEBAG, M.; SCHOENAUER, M. Controlling crossover through inductive learning. In:
DAVIDOR, Y. (Ed.). Proceeding of the Third Conference on Parallel Problem Solving
from Nature. [S.l.]: Springer-Verlag, 1994. p. 209–218.
SHANNON, C. E. A mathematical theory of communication. The Bell System Technical
Journal, v. 27, p. 379–423, 623–656, 1948.
SHAW, P. W. et al. Factors affecting the distribution of genetic variability in the guppy,
Poecilia reticulata. Journal of Fish Biology, v. 45, n. 5, p. 875–888, 1994.
SHIMODAIRA, H. A diversity control-oriented-genetic algorithm (DCGA): performance
in function optimization. In: 2001 IEEE Congress on Evolutionary Computation. Seoul,
Korea: [s.n.], 2001. p. 44–51.
189
SIMOES, A.; COSTA, E. On biologically inspired genetic operators: transformation
in the standard genetic algorithm. In: SPECTOR, L. et al. (Ed.). 2001 Proceedings of
the Genetic and Evolutionary Computation Conference (GECCO’2001). San Francisco,
USA: Morgan Kaufmann Publishers, 2001. p. 584–591.
SIMOES, A.; COSTA, E. Parametric study to enhance the genetic algorithm’s
performance when using transformation. In: LANGDON, W. B. et al. (Ed.). Proceedings
of the Genetic and Evolutionary Computation Conference – GECCO’02. New York:
Morgan Kaufmann Publishers, 2002. p. 697. ISBN 1-55860-878-8.
SIMOES, A.; COSTA, E. Using genetic algorithms to deal with dynamic environments:
a comparative study of several approaches based on promoting diversity. In: ALII, W.
B. L. et (Ed.). Proceedings of the Genetic and Evolutionary Computation Conference
(GECCO’2002). New York, USA: Morgan Kaufmann Publishers, 2002.
SIMOES, A.; COSTA, E. An immune system-based genetic algorithm to deal with
dynamic environments: diversity and memory. In: PEARSON, D. W.; STEELE, N. C.;
ALBRECHT, R. (Ed.). Proceedings of the Sixth International Conference on Neural
Networks and Genetic Algorithms – ICANNGA’2003. Roanne, France: Springer, 2003.
p. 168–174.
SMITH, J.; FOGARTY, T. C. Recombination strategy adaptation via evolution of gene
linkage. In: Proceedings of the Third IEEE International Conference on Evolutionary
Computing. [S.l.]: IEEE Press, 1996. p. 826–831.
SMITH, J. E.; FOGARTY, T. C. Operator and parameter adaptation in genetic
algorithms. Soft Computing, v. 1, n. 2, p. 81–87, 1997.
SMITH, R. E.; GOLDBERG, D. E. Diploidy and dominance in artificial genetic search.
Complex Systems, v. 6, n. 3, p. 251–285, 1992.
SOLOW, A.; POLASKY, S.; BROADUS, J. On the measurement of biological diversity.
Journal of Environmental Economics and Management, Academic Press, v. 24, n. 1, p.
60–68, January 1993.
SPEARS, W. M. Adapting crossover in a genetic algorithm. In: MCDONNELL, J. R.;
REYNOLDS, R. G.; FOGEL, D. B. (Ed.). Proceedings of the Fourth Annual Conference
on Evolutionary Programming. Cambridge, MA: MIT Press, 1995. p. 367–384.
190
SRINIVAS, M.; PATNAIK, L. M. Adaptive probabilities of crossover and mutation in
genetic algorithms. IEEE Transactions on Systems, Man and Cybernetics, v. 24, n. 4, p.
656–667, Apr 1994.
STARK, A. E. The hardy-weinberg principle. Genetics and Molecular Biology, Scielo,
v. 28, p. 485–485, 09 2005. ISSN 1415-4757.
STARK, D. R.; SPALL, J. C. Rate of convergence in evolutionary computation. In:
2003 IEEE American Control Conference. [S.l.]: IEEE, 2003. p. 1932–1937.
THIERENS, D. Adaptive mutation rate control schemes in genetic algorithms. In:
Proceedings of the 2002 Congress on Evolutionary Computation – CEC’02. [S.l.: s.n.],
2002. v. 1, p. 980–985.
URSEM, R. K. et al. Analysis and modeling of control tasks in dynamic systems. IEEE
Transactions on Evolutionary Computation, v. 6, n. 4, p. 378–389, 2002.
VAVAK, F.; FOGARTY, T. C. A comparative study of steady state and generational
genetic algorithms for use in nonstationary environments. In: AISB Workshop on
Evolutionary Computing, Lecture Notes in Computer Science. Berlin: Springer-Verlag,
1996. v. 1143, p. 297–304.
VENCOVSKY, R.; CROSSA, J. Variance Effective Population Size under Mixed Self
and Random Mating with Applications to Genetic Conservation of Species. Crop
Science, v. 39, n. 5, p. 1282–1294, 1999.
VOSE, M. D.; LIEPINS, G. E. Punctuated equilibria in genetic search. Complex
Systems, v. 5, n. 1, p. 31–44, 1991.
WANG, H. Robust control of the output probability density functions for multivariable
stochastic systems with guaranteed stability. IEEE Transactions on Automatic Control,
v. 44, p. 2103–2107, 1999.
WANG, H. Bounded Dynamic Stochastic Systems: Modelling and Control. London:
Springer-Verlag, 2000.
WANG, H. Control for bounded pseudo armax stochastic systems via linear b-spline
approximations. In: Proceedings of the 39th IEEE Conference on Decision and Control.
Sydney, Australia: [s.n.], 2000. p. 3369–3374.
191
WANG, J. Effective size and f-statistics of subdivided populations. i. monoecious species
with partial selfing. Genetics, v. 146, p. 1453–1463, 1997.
WANG, J. Effective population size under random mating with a finite number of
matings. Philosophical Transactions of the Royal Society - B, v. 360, p. 1395–1409, 2005.
WEIKARD, H.-P.; MAARTEN, P.; JUSTUS, W. Diversity measurement combining
relative abundances and taxonomic distinctiveness of species. Diversity Distributions,
v. 12, p. 215–217, March 2006.
WEINBERG, W. Uber den nachweis der vererbung beim menschen. Jahreshefte Verein
f. vaterl. Naturk. in Wurtemberg, v. 64, p. 368–382, 1908.
WEITZMAN, M. L. On diversity. Quarterly Journal of Economics, MIT Press, v. 107,
n. 2, p. 363–405, May 1992.
WINEBERG, M.; OPPACHER, F. Distances between populations. In: The Proceedings
of the Fifth Genetic and Evolutionary Computation Conference (GECCO’2003).
Chicago, USA: Morgan Kaufmann Publishers, 2003. p. 1481–1492.
WITTENMARK, B. Adaptive dual control. In: UNBEHAUEN, H. (Ed.). Control
Systems, Robotics and Automation, Encyclopedia of Life Support Systems (EOLSS),
Developed under the auspices of the UNESCO. Oxford, UK: Eolss Publishers, 2002.
WONG, Y.-Y. et al. A novel approach in parameter adaptation and diversity
maintenance for genetic algorithms. Soft Computing, Springer-Verlag, v. 7, n. 8, p.
506–515, 2003.
WRAY, N. R.; THOMPSON, R. Predictions of rates of inbreeding in selected
populations. Genetical Research, v. 55, p. 41–54, 1990.
WRIGHT, S. Evolution in mendelian populations. Genetics, v. 16, p. 97–159, 1931.
WRIGHT, S. Size of population and breeding structure in relation to evolution. Science,
v. 87, p. 430–431, 1938.
WU, Q. H.; CAO, Y. J. Stochastic optimization of control parameters in genetic
algorithms. In: Evolutionary Computation, 1997., IEEE International Conference on.
[S.l.: s.n.], 1997. p. 77–80.
192
YANG, S. Genetic algorithms with elitism-based immigrants for changing optimization
problems. Applications of Evolutionary Computing, Lecture Notes in Computer Science,
Springer-Verlag, v. 4448, p. 627–636, 2007.
YANG, S.; TINOS, R. A hybrid immigrants scheme for genetic algorithms in dynamic
environments. International Journal of Automation and Computing, Springer, v. 4, n. 3,
p. 243–254, 2007.
YUE, H. et al. On-line web formation control using stochastic distribution methods. In:
Proc. of 2002 Control Systems. Stockholm, Sweden: [s.n.], 2002. p. 318–322.
YUE, H. et al. Real-time entropy control of stochastic systems for an improved paper
web formation. J. Measu. and Control, v. 34, p. 134–139, 2001.
193
194