ALGORITMO EVOLUCIONARIO´ ADAPTATIVO EM PROBLEMAS ...

Universidade Federal de Pernambuco

Centro de Informatica

Pos-graduacao em Ciencia da Computacao

ALGORITMO EVOLUCIONARIO

ADAPTATIVO EM PROBLEMAS

MULTIMODAIS DINAMICOS

Maury Meirelles Gouvea Junior

TESE DE DOUTORADO

Recife

12 de Marco de 2009

Universidade Federal de Pernambuco

Centro de Informatica

Maury Meirelles Gouvea Junior

ALGORITMO EVOLUCIONARIO ADAPTATIVO EM PROBLEMAS

MULTIMODAIS DINAMICOS

Trabalho apresentado ao Programa de Pos-graduacao em

Ciencia da Computacao do Centro de Informatica da Uni-

versidade Federal de Pernambuco como requisito parcial

para obtencao do grau de Doutor em Ciencia da Com-

putacao.

Orientador: Prof. Dr. Aluizio Fausto Ribeiro Araujo

Recife

12 de Marco de 2009

Para Laura, meu amor, minha companheira inseparavel.

AGRADECIMENTOS

Aos meus pais, Maury e Alda, pelo amor que sempre me deram, pelo exemplo de uniao,

perseveranca e cuidado que sempre foram e serao.

Ao meu orientador, Prof. Dr. Aluizio Fausto Ribeiro Araujo, pela oportunidade e

pelos direcionamentos tecnicos e metodologicos.

A Pontifıcia Universidade Catolica de Minas Gerais (PUC Minas), em especial, ao Pro-

Reitor Prof. Dr. Joao Francisco de Abreu e a Magda Soares Nunes, assessora executiva,

pelo apoio e concessao do Plano Permanente de Capacitacao Docente.

Ao Conselho Nacional de Desenvolvimento Cientıfico e Tecnologico (CNPq), pelo

suporte financeiro atraves de bolsa de estudos.

Aos professores e funcionarios do Centro de Informatica da Universidade Federal de

Pernambuco, pela atencao e apoio recebidos.

Ao Industrial Control Centre da Universidade de Strathclyde, Glasgow, Escocia, em

especial, aos Prof. Dr. Michael Grimble, Prof. Dr. Leonardo Giovanini e Prof. Dr.

Reza Katebi, pela oportunidade, hospitalidade e importantes contribuicoes ao trabalho

durante meu estagio neste centro de pesquisa.

Ao Prof. Dr. Jose Wilson Costa e ao Prof. MSc. Lucio Mauro Pereira, coordenado-

res do curso de Sistemas de Informacao da PUC Minas, campus Contagem, pelo apoio

irrestrito, amizade e por proporcionar-me um bom ambiente de trabalho.

A toda a minha famılia, sempre unida, em especial, as minhas queridas irmas, Magali

e Meirinha, pelos momentos de muita alegria. Ao meu grande amigo, e tio, Emmo Sanna,

por ter sido um dos primeiros a mostrar-me o caminho cientıfico.

Um agradecimento muito especial ao meu amigo James McKinstry, pela amizade tao

consolidada e pelo grande apoio durante minha permanencia em Glasgow, Escocia.

Um agradecimento muito especial ao meu amigo Cıcero Garrozi, pela amizade e com-

panheirismo sempre demonstrados. Aos demais amigos do Recife, em especial, Pedro

Cecconello, Adriana Freitas, Ricardo Ramos, Paula, Joel Silva e Sergio Murilo, por esta-

rem sempre perto, proporcionando momentos muito agradaveis.

v

Na sobrevivencia dos indivıduos e racas favorecidas, durante a luta

constante e recorrente pela existencia, vemos uma forma poderosa e

incessante de selecao.

—CHARLES DARWIN (1809 – 1882)

RESUMO

Os algoritmos evolucionarios sao metodos de otimizacao e busca global baseados em po-

pulacoes. Como nas populacoes biologicas, um algoritmo evolucionario perde diversidade,

ao longo de geracoes, restringindo a busca em uma regiao restrita do espaco de solucoes e

prejudicando a busca global. Em ambientes complexos, multimodais e dinamicos, a perda

de diversidade torna-se um problema ainda mais crıtico, pois a busca deve ser abrangente

e o algoritmo se adaptar o mais rapido possıvel.

Um algoritmo evolucionario possui parametros cujos valores influenciam tanto o re-

sultado do processo quanto a diversidade da populacao. Esta tese apresenta dois novos

metodos de controle de parametros de algoritmos evolucionarios, o controle adaptativo e

o controle da funcao de distribuicao de probabilidade. O objetivo desses metodos e con-

trolar a diversidade da populacao de acordo com funcoes pre-determinadas. O processo

evolucionario e, portanto, tratado como um problema de controle, cujos parametros do

algoritmo evolucionario sao as entradas de controle e a diversidade da populacao e a saıda

do processo.

No metodo de controle adaptativo, a estrategia de controle e baseada no sistema adap-

tativo por modelo de referencia, onde uma diversidade de referencia e utilizada como mo-

delo de comportamento para a diversidade do processo evolucionario. O segundo metodo

tem como objetivo manter a funcao de distribuicao de probabilidade da diversidade da

populacao proxima de uma distribuicao determinada. Assim, a distribuicao da populacao

no espaco de solucoes e tambem indiretamente controlada. Para esse metodo manter um

controle de baixo custo computacional, utiliza-se uma rede neural B-spline para modelar

o processo evolucionario.

Em problemas de controle, e necessario conhecer o modelo do processo para se ela-

borar uma estrategia de controle. Assim, foi proposto um novo modelo de dinamica

de populacoes que descreve o comportamento da frequencia genica e da diversidade de

populacoes. Baseado nesse modelo, o processo evolucionario e formalizado matemati-

camente. Portanto, o metodo de controle adaptativo proposto utiliza esse modelo de

vii

RESUMO viii

dinamica de populacoes na estrategia de controle.

Os dois metodos de controle de diversidade propostos foram validados em estudos de

casos. Todos os problemas utilizados tiveram caracterısticas multimodais e dinamicas,

com comportamentos que variaram de uniforme, pequenas e grandes variacoes, a caotica.

Os desempenhos dos metodos propostos foram comparadas com um algoritmo genetico

padrao e outros seis algoritmos evolucionarios adaptativos.

Palavras-chave: Algoritmos evolucionarios; Controle adaptativo; Dinamica de po-

pulacoes; Sistemas estocasticos; Controle estocastico; Controle de parametros; Redes

neurais B-spline; Diversidade.

ABSTRACT

Evolutionary algorithms are global optimization and search methods based on popu-

lations. As in biological populations, an evolutionary algorithm loses diversity, along

generations, constraining the search to a specific region of the solutions space and impai-

ring the global search. In complex, multimodal and dynamic, environments the diversity

loss becomes a more serious problem, because the search must be comprehensive and

algorithm should evolve as quickly as possible.

An evolutionary algorithm has parameters in which their values influence both the

outcome of the process and the diversity of the population. This thesis presents two

new parameter control methods for evolutionary algorithms, the adaptive control and

the probability density function control. These methods aim to control the population

diversity according to predefined functions. Therefore, the evolutionary process is treated

as a control problem, which the evolutionary algorithm parameters are the control inputs

and the population diversity is the process output.

In the adaptive control method, the control strategy is based on the model-reference

adaptive control, where a reference diversity is used as a behavior model for the diversity

of the evolutionary process. The second method aims to make the probability density

function (PDF) of the population diversity to be close to a determined PDF. Thus, the

population distribution on the solutions space is also indirectly controlled. In order to

keep low the computational effort, this second method uses a B-spline neural network to

model the evolutionary process.

In control problems, it is necessary to know the process model to create a control

strategy. Thus, a population dynamics model was proposed to describe the gene frequency

and diversity behaviors of populations. Based on this model, the evolutionary process is

mathematically formalized. Therefore, the proposed adaptive control method uses this

population dynamics model into the control strategy.

The two proposed diversity control methods were validated in several case studies

using benchmark problems. All of them had multimodal and dynamic features, with

ix

ABSTRACT x

behaviors that varied from linear, small- and large-sized, to chaotic. The performances

of the proposed methods were compared with a standard genetic algorithm and other six

adaptive evolutionary algorithms.

Keywords: Evolutionary algorithms; Adaptive control; Population dynamics; Stochas-

tic systems; Stochastic control; Parameter control; B-spline neural networks; Diversity.

SUMARIO

Capıtulo 1—Introducao 1

1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1.1 Objetivos Especıficos . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Escopo do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Capıtulo 2—Algoritmos Evolucionarios Adaptativos 8

2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2 Controle de Parametros Determinıstico . . . . . . . . . . . . . . . . . . . 10

2.3 Controle de Parametros Adaptativo . . . . . . . . . . . . . . . . . . . . . 12

2.4 Controle de Parametros Auto-Adaptativo . . . . . . . . . . . . . . . . . . 18

2.5 Adaptacao para Manutencao ou Controle da Diversidade . . . . . . . . . 21

2.5.1 Manutencao da Diversidade . . . . . . . . . . . . . . . . . . . . . 21

2.5.2 Controle da Diversidade . . . . . . . . . . . . . . . . . . . . . . . 29

2.6 Discussoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Capıtulo 3—Genetica de Populacoes e Biodiversidade 35

3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.2 Genetica de Populacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.3 Metricas de Diversidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.4 Equilıbrio de Hardy-Weinberg . . . . . . . . . . . . . . . . . . . . . . . . 40

3.5 Fatores que Afetam o Equilıbrio de Hardy-Weinberg . . . . . . . . . . . . 43

3.5.1 Mutacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.5.2 Cruzamentos Nao-Aleatorios . . . . . . . . . . . . . . . . . . . . . 44

3.5.3 Deriva Genetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.5.4 Selecao Natural . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.5.5 Efeito Gargalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

xi

SUMARIO xii

3.5.6 Tamanho da Populacao . . . . . . . . . . . . . . . . . . . . . . . . 46

3.6 Tamanho Efetivo da Populacao . . . . . . . . . . . . . . . . . . . . . . . 46

3.6.1 Modelo de Wright-Fisher . . . . . . . . . . . . . . . . . . . . . . . 47

3.6.2 Tipos de Tamanho Efetivo . . . . . . . . . . . . . . . . . . . . . . 48

3.6.3 Tamanho Efetivo por Perda de Heterozigosidade . . . . . . . . . . 49

3.6.4 Tamanho Efetivo por Variancia . . . . . . . . . . . . . . . . . . . 50

3.6.5 Tamanho Efetivo com N Variavel . . . . . . . . . . . . . . . . . . 50

3.6.6 Tamanho Efetivo com Selecao . . . . . . . . . . . . . . . . . . . . 51

3.6.7 Desvio do Equilıbrio de Hardy-Weinberg . . . . . . . . . . . . . . 52

3.7 Outros Tamanhos Efetivos da Populacao . . . . . . . . . . . . . . . . . . 53


Capıtulo 4—Controle Adaptativo e de PDF 55

4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2 Sistema Dinamico Nao-Linear . . . . . . . . . . . . . . . . . . . . . . . . 57

4.3 Problemas de Controle Nao-Linear . . . . . . . . . . . . . . . . . . . . . 58

4.4 Sistemas Adaptativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.4.1 Sistema Adaptativo por Modelo de Referencia . . . . . . . . . . . 60

4.4.1.1 Metodo MIT . . . . . . . . . . . . . . . . . . . . . . . . 61

4.4.1.2 Teoria de Lyapunov . . . . . . . . . . . . . . . . . . . . 62

4.4.1.2.1 Teorema da Estabilidade de Lyapunov . . . . . 63

4.5 Controle de PDF da Saıda de Sistemas Estocasticos . . . . . . . . . . . . 64

4.5.1 Modelo Dinamico . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.5.2 Modelagem de Sistemas Dinamicos Lineares . . . . . . . . . . . . 67

4.5.3 Estrategia de Controle de PDF . . . . . . . . . . . . . . . . . . . 69


Capıtulo 5—Modelo de Dinamica de Populacoes 73

5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.2 Calculando a Diversidade da Populacao . . . . . . . . . . . . . . . . . . . 74

5.3 Modelo de Dinamica de Populacoes . . . . . . . . . . . . . . . . . . . . . 78

5.4 Gradiente Estocastico e Analise de Sensibilidade . . . . . . . . . . . . . . 84

5.5 Testes para Validacao do Modelo . . . . . . . . . . . . . . . . . . . . . . 86

SUMARIO xiii


Capıtulo 6—Modelos de Controle de Parametros 93

6.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6.2 Modelo de Referencia de Diversidade . . . . . . . . . . . . . . . . . . . . 94

6.3 Modelo do Processo Evolucionario . . . . . . . . . . . . . . . . . . . . . . 96

6.4 Controle Adaptativo do Processo Evolucionario . . . . . . . . . . . . . . 97

6.5 Estrategia de Controle Adaptativo . . . . . . . . . . . . . . . . . . . . . 97

6.5.1 Estrategia Baseada no Sinal de Comando . . . . . . . . . . . . . . 98

6.5.2 Estrategia Baseada no Sinal de Comando e na Saıda do Processo 99

6.5.3 Mecanismo de Selecao . . . . . . . . . . . . . . . . . . . . . . . . 100

6.6 Controle de PDF Aplicado aos AEs . . . . . . . . . . . . . . . . . . . . . 101

6.6.1 Calculo da PDF da Diversidade . . . . . . . . . . . . . . . . . . . 103

6.6.2 Geracao de Amostras e Identificacao do Modelo do Processo Evo-

lucionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

6.6.3 Estrategia de Controle de PDF . . . . . . . . . . . . . . . . . . . 106


Capıtulo 7—Estudo de Casos 111

7.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

7.2 Planejamento dos Experimentos . . . . . . . . . . . . . . . . . . . . . . . 112

7.3 Dinamica dos Ambientes . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

7.4 Analise de Rastreamento . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

7.4.1 Analise de Rastreamento em Ambientes Estaticos . . . . . . . . . 116

7.4.2 Analise de Rastreamento em Ambientes Dinamicos Cıclicos: 200

Geracoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

7.4.3 Analise de Rastreamento em Ambientes Dinamicos Cıclicos: 40

Geracoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

7.4.4 Discussoes Finais Sobre o Rastreamento . . . . . . . . . . . . . . 126

7.5 Experimentos com Modelos de Referencia . . . . . . . . . . . . . . . . . . 127

7.5.1 Discussoes Finais Sobre os Modelos de Referencia . . . . . . . . . 129

7.6 Experimentos com Funcoes Contınuas . . . . . . . . . . . . . . . . . . . . 130

7.6.1 Experimentos com a Funcao de Ackley . . . . . . . . . . . . . . . 130

SUMARIO xiv

7.6.2 Experimentos com a Funcao de Schwefel . . . . . . . . . . . . . . 131

7.7 Experimentos com o Gerador Moving Peaks . . . . . . . . . . . . . . . . 132

7.8 Experimentos com o Problema da Mochila . . . . . . . . . . . . . . . . . 142

7.9 Experimentos com o Projeto de Rede de Radio-Transmissores . . . . . . 152

7.10 Experimentos com o Roteamento de Redes . . . . . . . . . . . . . . . . . 153

7.11 Analise de Desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159


Capıtulo 8—Conclusoes e Trabalhos Futuros 168

8.1 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

Apendice A—Funcoes Padronizadas para Teste 173

A.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

A.2 Funcoes Contınuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

A.3 Gerador Moving Peaks . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

A.3.1 Morfologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

A.3.2 Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

A.4 Problema Combinatorio da Mochila . . . . . . . . . . . . . . . . . . . . . 177

A.5 Projeto de Rede de Radio-Transmissores . . . . . . . . . . . . . . . . . . 177

A.6 Roteamento de Redes de Transportes . . . . . . . . . . . . . . . . . . . . 178

LISTA DE FIGURAS

1.1 Analise de desempenho de metodos de otimizacao realizada por Goldberg

(1989). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2.1 Diversidade da populacao vista por fmax − f (SRINIVAS; PATNAIK, 1994). 16

2.2 Pseudo-codigo do laco interno do TRAM. . . . . . . . . . . . . . . . . . . 25

2.3 Pseudo-codigo do laco externo do TRAM. . . . . . . . . . . . . . . . . . 26

2.4 Pseudo-codigo do RIGA . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.5 Pseudo-codigo do ERIGA . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4.1 Diagrama de blocos de um sistema de controle adaptativo. . . . . . . . . 56

4.2 Diagrama de blocos do sistema adaptativo por modelo de referencia. . . . 61

5.1 Distribuicoes genicas iniciais e finais dos genes 1, 4 e 9. . . . . . . . . . . 76

5.2 Probabilidade de selecao do i-esimo indivıduo em funcao da pressao de

selecao, β. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5.3 Barras de erros de previsao de diversidade para as populacao de 10, 100 e

400 indivıduos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

5.4 Variacao do erro nas populacoes com 10 e 400 indivıduos com na = 10. . 90

5.5 Variacao do erro nas populacoes com 10 e 400 indivıduos com na = 100. . 90

5.6 Erro medio para 10 e 100 alelos. . . . . . . . . . . . . . . . . . . . . . . . 91

6.1 Controle de parametros pelo SAMR. . . . . . . . . . . . . . . . . . . . . 97

6.2 Pseudo-codigo do metodo de controle de diversidade proposto — DRAC . 101

6.3 PDFs de duas populacoes com mesma diversidade media. . . . . . . . . . 102

6.4 PDF de uma populacao da geracao inicial ate a geracao 500. . . . . . . . 104

6.5 PDF desejada: (a) concentrada no melhor indivıduo ou gene e (b) dis-

tribuıda em tres nichos no espaco de solucoes. . . . . . . . . . . . . . . . 106

6.6 Diagrama de blocos do metodo de controle de PDF de diversidade. . . . 108

xv

LISTA DE FIGURAS xvi

7.1 Sequencias geradas pela funcao logıstica para diferentes valores de A. . . 115

7.2 Analise de rastreamento no moving peaks em ambiente estatico. . . . . . 117

7.3 Analise de rastreamento no problema da mochila em ambiente estatico. . 119

7.4 Analise de rastreamento no moving peaks em ambiente dinamico com va-

riacoes cıclicas de 200 geracoes. . . . . . . . . . . . . . . . . . . . . . . . 121

7.5 Analise de rastreamento no problema da mochila em ambiente dinamico

com variacoes cıclicas de 200 geracoes. . . . . . . . . . . . . . . . . . . . 122

7.6 Analise de rastreamento no moving peaks em ambiente dinamico com va-

riacoes cıclicas de 40 geracoes. . . . . . . . . . . . . . . . . . . . . . . . . 124

7.7 Analise de rastreamento no problema da mochila em ambiente dinamico

com variacoes cıclicas de 40 geracoes. . . . . . . . . . . . . . . . . . . . . 125

7.8 Melhores aptidoes no Experimento 7.6.2.a: funcao de Schwefel, variacoes

pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

7.9 Melhores aptidoes no Experimento 7.6.2.b: funcao de Schwefel, variacoes

grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

7.10 Melhores aptidoes no Experimento 7.6.2.c: funcao de Schwefel, variacoes

caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

7.11 Melhor aptidao no Experimento 7.7.a.: moving peaks com dinamica com

variacoes pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

7.12 Melhor aptidao no Experimento 7.7.b: moving peaks com dinamica com

variacoes grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

7.13 Melhor aptidao no Experimento 7.7.c: moving peaks com dinamica caotica. 140

7.14 Melhor aptidao dos metodos propostos no moving peaks. . . . . . . . . . 141

7.15 Melhor aptidao no Experimento 7.8.a: problema da mochila com variacoes

pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

7.16 Melhor aptidao no Experimento 7.8.b: problema da mochila com variacoes

grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

7.17 Melhor aptidao no Experimento 7.8.c: problema da mochila com variacoes

caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

7.18 Melhor aptidao nos metodos propostos: problema da mochila. . . . . . . 148

7.19 Diversidades no Experimento 7.8.a: problema da mochila com variacoes

pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

7.20 Diversidades no Experimento 7.8.c: problema da mochila com variacoes

caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

LISTA DE FIGURAS xvii

7.21 Melhor aptidao no Experimento 7.9.b: problema RND com variacoes grandes.154

7.22 Melhor aptidao no Experimento 7.9.c: problema RND com variacoes caoticas.155

7.23 Melhor aptidao no Experimento 7.10.b: roteamento de redes com variacoes

grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

7.24 Melhor aptidao no Experimento 7.10.c: roteamento de redes com variacoes

caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

A.1 Superfıcies produzidas pelo gerador moving peaks . . . . . . . . . . . . . 176

A.2 Grafo nao-orientado de um problema de roteamento de redes. . . . . . . 178

LISTA DE TABELAS

3.1 Probabilidades de cruzamento ao acaso. . . . . . . . . . . . . . . . . . . . 43

3.2 Distribuicoes genotıpicas em uma geracao de descendentes. . . . . . . . . 43

5.1 Parametros do problema de otimizacao de uma funcao quadratica f (Equacao5.3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

5.2 Diversidades inicial e final nos experimentos da funcao quadratica f , Equacao5.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

5.3 Estatıstica para os metodos baseados na heterozigosidade, He. . . . . . . 77

5.4 Parametros utilizados nos experimentos. . . . . . . . . . . . . . . . . . . 87

5.5 Erros de previsao de diversidade com na = 10. . . . . . . . . . . . . . . . 89

7.1 Parametros fixos comuns utilizados nos experimentos. . . . . . . . . . . . 114

7.2 Resultados da analise de rastreamento em ambientes estaticos: Experi-

mentos 7.4.1.a e 7.4.1.b. . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

7.3 Resultados da analise de rastreamento em ambientes dinamicos com va-

riacoes cıclicas de 200 geracoes: Experimentos 7.4.2.a e 7.4.2.b. . . . . . . 123

7.4 Resultados da analise de rastreamento em ambientes dinamicos com va-

riacoes cıclicas de geracoes: Experimentos 7.4.3.a e 7.4.3.b. . . . . . . . . 126

7.5 Experimento 7.5.a: moving peaks, ciclos de 40 geracoes e dinamica com

variacoes pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

7.6 Experimento 7.5.b: moving peaks, ciclos de 200 geracoes e dinamica com

variacoes grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

7.7 Experimento 7.5.c: Problema da Mochila, ciclos de 40 geracoes e dinamica

com variacoes pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

7.8 Experimento 7.5.d: Problema da Mochila, ciclos de 200 geracoes e dinamica

com variacoes grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

7.9 Resultados do Experimento 7.6.1.a: funcao de Ackley, variacoes pequenas. 131

7.10 Resultados do Experimento 7.6.1.b: funcao de Ackley, variacoes grandes. 132

xviii

LISTA DE TABELAS xix

7.11 Resultados do Experimento 7.6.1.c: funcao de Ackley, variacoes caoticas. 136

7.12 Resultados do Experimento 7.6.2.a: funcao de Schwefel com variacoes pe-

quenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

7.13 Resultados do Experimento 7.6.2.b: funcao de Schwefel com variacoes

grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

7.14 Resultados do Experimento 7.6.2.c: funcao de Schwefel com variacoes

caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

7.15 Resultados do Experimento 7.7.a: moving peaks com variacoes pequenas. 145

7.16 Resultados do Experimento 7.7.b: moving peaks com variacoes grandes. . 149

7.17 Resultados do Experimento 7.7.c: moving peaks com variacoes caoticas. . 152

7.18 Resultados do Experimento 7.8.a: problema da mochila com variacoes

pequenas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

7.19 Resultados do Experimento 7.8.b: problema da mochila com variacoes

grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

7.20 Resultados do Experimento 7.8.c: problema da mochila com variacoes

caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

7.21 Resultados do Experimento 7.9.b: problema RND com variacoes grandes. 160

7.22 Resultados do Experimento 7.9.c: problema RND com variacoes caoticas. 161

7.23 Resultados do Experimento 7.10.b: roteamento de redes com variacoes

grandes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

7.24 Resultados do Experimento 7.10.c: roteamento de redes com variacoes

caoticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

7.25 Analise geral de desempenho. . . . . . . . . . . . . . . . . . . . . . . . . 164

7.26 Tempos medios de execucao dos AEs. . . . . . . . . . . . . . . . . . . . . 164

CAPITULO 1

INTRODUCAO

Os algoritmos evolucionarios (AEs) sao metodos de busca global, baseados na teoria

da evolucao de Darwin (2004), aplicaveis em problema de otimizacao, modelagem e

simulacao (GOLDBERG, 1989; EIBEN; SMITH, 2003; BRANKE, 2002). Goldberg (1989)

mostrou que metodos classicos de otimizacao ou busca, como, por exemplo, gradiente

descendente e conjugado (PIERRE, 1986), tem desempenho superior a algoritmos evo-

lucionarios e a metodos de busca aleatoria quando aplicados em classes especıficas de

problemas, Figura 1.1. Contudo, em problemas dinamicos e multimodais, com funcoes

objetivo nao-diferenciaveis, muitos metodos classicos nao sao aplicaveis.

Os algoritmos evolucionarios, assim como outros metodos de otimizacao ou busca,

possuem parametros cujos valores tem influencia direta no desempenho do processo de

busca. Determinar os valores desses parametros, que a priori nao tem nenhum relaciona-

mento com o ambiente, e uma tarefa nao trivial e muitos esforcos tem sido despendidos

para encontrar algoritmos e heurısticas que possam faze-lo (EIBEN et al., 1999; ANGELINE,

1995).

Figura 1.1 Analise de desempenho de metodos de otimizacao realizada por Goldberg (1989).

Basicamente, existem duas formas de determinar os valores dos parametros de um

1

algoritmo evolucionario, por ajuste previo ou controle de parametros. No ajuste previo,

os valores dos parametros sao determinados antes do inıcio do processo evolucionario.

No controle de parametros, os parametros sao ajustados durante o processo evolucionario

de acordo com uma estrategia pre-definida ou em conformidade com o desempenho do

algoritmo. Estrategias que ajustem esses parametros durante o processo evolucionario e

uma das areas de pesquisa mais promissora da computacao evolucionaria.

Os algoritmos evolucionarios com parametros ajustaveis aplicados a problemas de oti-

mizacao ou busca em ambientes estaticos, isto e, em espacos cujos otimos nao mudam

suas localizacoes ou as restricoes do problema sao fixas, tem sua importancia consolidada

na literatura atraves de testes empıricos e demonstracoes teoricas (EIBEN et al., 1999).

Entretanto, em ambientes dinamicos, o problema torna-se mais complexo, aumentando a

relevancia dos metodos de controle de parametros. Um algoritmo de otimizacao ou busca

em ambientes dinamicos deve adaptar-se rapidamente as novas condicoes e explorar o

maior numero de regioes possıvel. O algoritmo evolucionario padrao (GOLDBERG, 1989)

nao se mostra apto a resolver problemas de otimizacao ou busca em ambientes dinamicos

porque tende a convergir prematuramente, dificultando a adaptacao as variacoes do am-

biente (BRANKE, 2001; JIN; BRANKE, 2005).

Em muitos trabalhos, a dinamica do ambiente e tratada introduzindo memoria (BENDT-

SEN; KRINK, 2002; GOLDBERG; SMITH, 1987), controlando a diversidade (BUI et al., 2005;

COBB, 1990; GREFENSTETTE, 1992; MONSIEURS; FLERACKERS, 2003; SIMOES; COSTA,

2001, 2002a) ou, ainda, mesclando os dois primeiros metodos (SIMOES; COSTA, 2003).

Ao adicionar memoria aos AEs e possıvel armazenar boas solucoes e utiliza-las quando

ocorrerem variacoes no ambiente (BRANKE, 1999, 2001; JIN; BRANKE, 2005). A memoria

pode ser introduzida ao AE de duas formas: implıcita, que utiliza representacao redun-

dante (i.e., o indivıduo possui um genotipo com mais informacoes para definir o fenotipo);

ou explıcita, que armazena as melhores solucoes, utilizando-as quando ocorrem variacoes

no ambiente. Goldberg e Smith sugeriram uma extensao para o algoritmo evolucionario

padrao que agrega memoria com representacao redundante (GOLDBERG; SMITH, 1987).

Bendtsen e Krink (2002) utilizaram memoria explıcita movendo gradualmente os in-

divıduos armazenados para perto do melhor indivıduo da geracao atual.

O controle da diversidade permite que o numero de regioes exploradas durante o

processo evolucionario seja mantido ou variado. Assim, a adaptacao as mudancas do

ambiente pode ser mais rapida. No algoritmo evolucionario padrao, e difıcil manter a

diversidade porque os indivıduos tendem a convergir prematuramente para regioes es-

2

pecıficas do espaco de busca (GOLDBERG, 1989). Em ambientes dinamicos, a tendencia

de convergencia da populacao e uma restricao importante, pois dificulta a resposta rapida

as variacoes do ambiente. Varios pesquisadores elaboraram metodos diretos e indiretos de

controle da diversidade. Por exemplo, Cobb (1990) introduziu a hipermutacao gatilhada,

Grefenstette (1992) apresentou a imigracao aleatoria, Simoes e Costa (2001, 2002a) uti-

lizaram o princıpio da transmutacao genetica, Bui et al. (2005) utilizaram a abordagem

multiobjetivo para tratar ambientes dinamicos.

Esta tese propoe dois metodos de controle da diversidade de AEs, o primeiro baseado

no controle adaptativo e o segundo no controle estocastico. O uso do controle adapta-

tivo para ajustes dos parametros do algoritmo evolucionario se justifica pela presenca de

incertezas inerentes a processos evolucionarios. O metodo de controle adaptativo utili-

zado, denominado controle adaptativo por modelo de referencia (ASTROM; WITTENMARK,

1995; NARENDRA; ANNASWAMY, 2005), se aplica ao problema do controle de parametros

por existir na literatura algumas hipoteses que sugerem determinados comportamentos

para um algoritmo evolucionario (BEYER; RUDOLPH, 1997; BUI et al., 2005; COBB, 1990;

GREFENSTETTE, 1992; SIMOES; COSTA, 2001). O controle adaptativo por modelo de re-

ferencia e utilizado para controlar a diversidade, contribuindo para reduzir o problema

da convergencia prematura, aumentar o numero de regioes exploradas pela populacao e

responder de maneira mais rapida e eficiente as mudancas do ambiente.

O segundo metodo proposto utiliza os princıpios do controle de funcao de distribuicao

de probabilidade (PDF, do ingles, probability density function) (WANG, 2000a). Esse

metodo foi idealizado e inicialmente desenvolvido no Industrial Control Centre da Uni-

versidade de Strathclyde, em Glasgow, Escocia, com a supervisao do Prof. Dr. Michael

Grimble e do Prof. Dr. Leonardo Giovanini. Esse metodo de controle estocastico tem

como objetivo desenvolver uma estrategia de controle que aproxime a PDF da saıda do

processo de uma PDF desejada. Embora modelos matematicos possam ser utilizados para

obter a PDF da saıda, estes modelos sao, normalmente, complicados e demandam um ele-

vado esforco computacional. Com o objetivo de elaborar um controle de PDF adequado

e de baixo custo computacional, redes neurais, em especial a B-spline, tem sido utilizadas

para aproximar estatıstica e dinamicamente a PDF da saıda de processos estocasticos

(WANG, 2000a, 1999, 2000b). Uma B-spline pode ser aplicada apenas se um conjunto de

dados da entrada de controle e da PDF da saıda do processo estiver disponıvel.

Para elaborar um sistema de controle e necessario conhecer o modelo do processo.

Normalmente, os metodos de controle de diversidade nao tem informacoes precisas do

3

processo evolucionario. Apenas o desvio entre as diversidades atual e de referencia e

conhecido (WONG et al., 2003; URSEM et al., 2002; DIVERSITY-BASED. . . , 2007). Alguns

modelos de algoritmos evolucionarios ja foram propostos (GOLDBERG, 1989; RADCLIFFE,

1991); no entanto, esses modelos nao tratam a dinamica do algoritmo evolucionario em

relacao a diversidade da populacao. Alternativamente, existem algumas formulacoes que

tratam a dinamica dos AEs, como Bethke (1981), Vose e Liepins (1991), P.-Bennett et

al. (1994), Stark e Spall (2003), mas estes modelos nao podem ser utilizados na analise

da dinamica dos AEs porque necessitam de um conhecimento previo da probabilidade de

transicao de estados ou geracoes.

Pelas razoes supracitadas, foi elaborado um novo modelo de dinamica de populacoes

que descreve o comportamento da frequencia genica e da diversidade de populacoes.

Esse modelo considera os principais parametros de fatores evolutivos de uma populacao,

a saber, pressao de selecao, taxa de mutacao, numero de alelos e tamanho efetivo da

populacao. Portanto, foi possıvel, por analise de sensibilidade, identificar o impacto que

tais fatores podem causar na diversidade de populacoes.

A partir do modelo de dinamica de populacoes, formalizou-se um modelo de pro-

cesso evolucionario. Dois modelos de controle foram estabelecidos, o primeiro baseado

no controle adaptativo por modelo de referencia, denominado Controle Adaptativo por

Diversidade de Referencia (DRAC, do ingles, Diversity-Reference Adaptive Control); e o

segundo modelo baseado no controle de funcao de distribuicao de probabilidade, denomi-

nado AE Adaptativo Baseado na Funcao de Distribuicao de Probabilidade de Diversidade

(PDFEA, do ingles, Probability Density Function Based Evolutionary Algorithm).

A validacao dos metodos de controle de parametros propostos foi realizada atraves

de estudos de casos utilizando benchmarks e problemas reais multimodais e dinamicos.

Os metodos propostos, DRAC e PDFEA, foram comparados com o algoritmo genetico

padrao e seis algoritmos evolucionarios adaptativos.

1.1 OBJETIVOS

Esta tese tem como objetivo elaborar dois metodos de controle de parametros de AEs para

problemas de otimizacao ou busca em ambientes complexos, multimodais e dinamicos,

onde sugere-se a utilizacao de parametros ajustaveis. A solucao proposta utiliza metodos

de controle adaptativo e estocastico para ajuste dos parametros de fatores evolutivos,

como selecao e mutacao. A partir de um novo modelo de dinamica de populacoes pro-

4

posto, o processo evolucionario e formalizado analiticamente. O modelo de dinamica de

populacoes e, tambem, utilizado no sistema de controle do metodo DRAC.

1.1.1 Objetivos Especıficos

Esta tese de doutorado tem os seguintes objetivos especıficos:� Pesquisar e analisar criticamente os principais trabalhos sobre controle de parametros

de algoritmos evolucionarios nas ultimas decadas.� Investigar metodos de controle adaptativo apropriados para aplicacao no controle

de parametros de algoritmos evolucionarios.� Estudar o problema da diversidade das especies e de populacoes, levantando poten-

ciais metricas de diversidade que possam ser aplicadas na computacao evolucionaria.

Este estudo tem, tambem, o objetivo de analisar a dinamica da diversidade de po-

pulacoes, conhecendo os principais fatores e consequencias da sua variacao. Dentre

esses fatores destaca-se o impacto da variacao da diversidade sobre a evolucao da

populacao.� Propor e formalizar modelos de referencia baseados em perfis de diversidade de

populacoes estudadas no item anterior.� Desenvolver um modelo de dinamica de populacoes que descreva o comportamento

da diversidade em relacao aos parametros de fatores evolutivos, como mutacao e

selecao.� Elaborar dois novos metodos de controle de parametros de algoritmos evolucionarios

que empregam os fundamentos da teoria de controle. O principal objetivo do

metodo proposto e controlar a diversidade atraves de ajustes dos parametros de

algoritmos evolucionarios. O novo metodo e recomendado, principalmente, para

problemas multimodais com ambientes variaveis em morfologia e dinamica.� Formalizar o controle da diversidade de algoritmos evolucionarios como um pro-

blema de controle. Elaborar uma estrategia de controle que conduza o sistema ao

estado de equilıbrio.� Pesquisar problemas de referencia na literatura da computacao evolucionaria para

validar os metodos propostos.

5

� Realizar estudos de casos em ambientes multimodais e dinamicos, comparando os

metodos propostos com o algoritmo evolucionario padrao e outros algoritmos evo-

lucionarios adaptativos.� Propor melhorias nos metodos de controle de parametros propostos, apos analise

de resultados, para aplicacao em trabalhos futuros.

1.2 ESCOPO DO TRABALHO

O Capıtulo 2 apresenta uma pesquisa bibliografica com analise crıtica dos trabalhos

recentes sobre controle de parametros de algoritmos evolucionarios. Sao apresentadas

as classificacoes dos metodos de controle de parametros por tipo de adaptacao, a saber,

determinıstico, adaptativo e auto-adaptativo. O capıtulo apresenta, tambem, metodos

que promovem e controlam a diversidade das populacoes de algoritmos evolucionarios.

O Capıtulo 3 aborda a diversidade genetica de populacoes, suas caracterısticas e fato-

res que contribuem para sua variacao ao longo de geracoes. Sao apresentados os principais

conceitos de genetica de populacoes e as principais metricas de diversidade de especies e

populacoes presentes na literatura. O equilıbrio de Hardy-Weinberg, uma lei que deter-

mina a constancia genica de uma populacao ideal, e descrito em detalhes. Sao expostos

os principais fatores que afetam o equilıbrio da frequencia genica de uma populacao. Este

capıtulo tambem apresenta um dos parametros mais utilizados na avaliacao da diversi-

dade de populacoes, o tamanho efetivo da populacao. Essa grandeza, baseada em uma

populacao ideal criada pelos cientistas Sewall Wright (1931) e Ronald Fisher (1930), pos-

sui algumas variantes e muitas formas de se calcular. Os conceitos apresentados neste

capıtulo sao empregados na elaboracao de modelos de referencia de diversidade utilizados

no controle de parametros de algoritmos evolucionarios.

O Capıtulo 4 descreve sucintamente quatro metodos de controle adaptativo, a saber,

agendamento de ganho, modelo de referencia, regulador auto-ajustavel e controle dual.

Este capıtulo apresenta, em detalhes, o controle adaptativo por modelo de referencia e

o controle de funcao de distribuicao de probabilidade. No controle adaptativo, duas das

principais estrategias de controle sao apresentados, os metodos MIT e de Lyapunov. No

controle de PDF, a identificacao do processo e realizada por uma rede neural B-spline.

O Capıtulo 5 apresenta um novo modelo de dinamica de populacoes que descreve o

comportamento da frequencia genica e da diversidade de populacoes em relacao a um gene.

Esse modelo leva em consideracao os principais fatores evolutivos, a saber, cruzamento,

6

mutacao e selecao. Com o modelo de dinamica de populacoes proposto e possıvel realizar

previsoes e analisar o impacto que fatores evolutivos causam na diversidade da populacao.

O Capıtulo 6 apresenta duas propostas de controle da diversidade de algoritmos evo-

lucionarios, a primeira utilizando o controle adaptativo por modelo de referencia e a

segunda utilizando o controle da PDF da diversidade. As propostas incluem tres mo-

delos de referencia, um modelo de processo evolucionario e duas estrategias de controle.

No metodo baseado no controle adaptativo, a pressao de selecao e a taxa de mutacao

sao utilizadas como sinal de controle. A estrategia de controle visa ajustar a entrada

do processo e os parametros do controlador para aproximar a diversidade da populacao

da saıda do modelo de referencia. No controle de PDF, a taxa de mutacao e o sinal de

controle e a estrategia de controle ajusta esse sinal com o objetivo de aproximar a PDF

da diversidade da populacao de uma PDF de referencia.

O Capıtulo 7 apresenta 26 experimentos onde os metodos propostos, DRAC e PDFEA,

foram testados e analisados. Investigou-se o comportamento do modelo de referencia,

a capacidade de rastreamento pelo sistema de controle e o desempenho dos metodos

propostos em relacao a um algoritmo genetico padrao e seis algoritmos evolucionarios

adaptativos.

O Capıtulo 8 apresenta as contribuicoes desta tese, conclusoes e sugestoes para tra-

balhos futuros.

7

CAPITULO 2

ALGORITMOS EVOLUCIONARIOS ADAPTATIVOS

2.1 INTRODUCAO

Os algoritmos evolucionarios (AEs) possuem quatro paradigmas principais, a saber, al-

goritmos geneticos (GOLDBERG, 1989), estrategias evolutivas (SCHWEFEL, 1995), pro-

gramacao evolucionaria (FOGEL, 1995) e programacao genetica (KOZA, 1992). Em todos

esses paradigmas, a resolucao do problema e baseada na teoria da evolucao de Darwin

(2004). Inicialmente, um conjunto de solucoes e gerado aleatoriamente, onde cada solucao

e um indivıduo, a qualidade da solucao e a aptidao do indivıduo, o conjunto de solucoes e

uma populacao e o espaco de solucoes e o meio ambiente. Iterativamente, novas solucoes

sao criadas a partir das existentes, via operadores evolucionarios. As piores solucoes,

menos “adaptadas” ao ambiente, tendem a ser eliminadas ao longo do processo evolu-

cionario. Assim, as solucoes melhores tendem a prevalecer, como no processo de evolucao

natural das especies. Nos AEs, o que torna uma solucao melhor ou pior e o valor de sua

aptidao segundo uma ou mais metricas. A probabilidade de um indivıduo transmitir suas

caracterısticas para as proximas geracoes e tambem influenciada pela sua aptidao.

Um algoritmo evolucionario, assim como qualquer metodo de busca, possui parametros

cujos valores tem influencia direta no desempenho do processo de busca. Alguns exemplos

desses parametros sao as probabilidades de cruzamento e mutacao, o tipo de operador de

cruzamento, o tamanho da populacao. Escolher valores para tais parametros, que a priori

nao tem nenhuma ligacao com o ambiente, e uma tarefa nao trivial e muitos esforcos tem

sido despendidos para encontrar algoritmos e heurısticas que possam faze-lo.

Basicamente, existem duas formas de determinar os valores dos parametros de um

algoritmo evolucionario, por ajuste previo ou controle de parametros. No ajuste previo,

os valores dos parametros sao determinados antes do inıcio do processo evolucionario. O

problema dessa abordagem e o fato de, na maioria das vezes, nao se conhecer as carac-

terısticas e o comportamento do ambiente no qual tenta-se chegar a uma solucao. Por

melhor que sejam as tecnicas utilizadas, os ajustes previos dos parametros nao estao rela-

cionados com os caminhos percorridos durante o processo de busca. Em outras palavras,

8

ao longo do processo de busca as condicoes do ambiente podem nao ser as mesmas das

iniciais. Assim, pode ser necessario alterar os valores dos parametros por estes nao esta-

rem adequados as condicoes atuais do processo. Por exemplo, em regioes de otimos locais

ou em estados de baixa diversidade pode ser prominente aumentar a taxa de mutacao.

No controle de parametros, os valores sao ajustados durante o processo evolucionario.

Assim, os parametros podem ser ajustados em funcao de uma estrategia pre-definida ou

em conformidade com os caminhos percorridos pelo algoritmo de busca, de acordo com os

resultados que estes proporcionaram. Encontrar uma estrategia que ajuste os parametros

durante o processo de busca e uma das areas de pesquisa mais atrativa da computacao

evolucionaria.

Muitos autores ja abordaram o problema do controle de parametros na computacao

evolucionaria (EIBEN et al., 1999; ANGELINE, 1995; HINTERDING et al., 1997; SMITH;

FOGARTY, 1997). Eiben et al. (1999) elaboraram uma discussao sobre o controle de

parametros, mostrando sua superioridade em relacao ao ajuste previo. Nesta tese de

doutorado, foram apresentados argumentos que mostram ser inapropriado, em muitas

situacoes, o uso de parametros fixos. As formas de controle de parametros foram classi-

ficadas em funcao do tipo de mecanismo de ajuste, a saber, determinısticos, adaptativos

ou auto-adaptativos.

Os metodos determinısticos modificam os parametros deterministicamente sem uti-

lizar nenhuma informacao do ambiente durante o processo evolucionario. Os metodos

adaptativos utilizam informacoes do ambiente para determinar a direcao ou a magnitude

das mudancas dos parametros. Nos metodos auto-adaptativos, os parametros sao co-

dificados no genotipo do indivıduo e submetidos ao processo evolucionario. A favor da

adaptacao existe a importancia de se interagir com o meio, que pode fornecer informacoes

importantes sobre a qualidade do caminho da busca, direcionando-a para regioes mais

promissoras. As informacoes colhidas do ambiente tambem podem ajudar a compreender

melhor o problema.

Outros autores promovem formas diferentes de classificar os metodos de controle de

parametros. Angeline (1995) classificou as formas de controle de parametros baseado

em nıveis de ajuste, a saber, da populacao, do indivıduo e do componente. Ao nıvel da

populacao, os parametros sao ajustados de forma a produzirem efeitos globais na po-

pulacao. Ao nıvel do indivıduo, as modificacoes sao feitas em cada indivıduo, porem,

aplicadas uniformemente aos seus componentes ou genes. Ao nıvel do componente, os

metodos determinam como cada componente ou gene do indivıduo deve sofrer as al-

9

teracoes. Hinterding et al. (1997) considerou mais um nıvel de adaptacao: do ambiente,

onde a resposta do ambiente para o indivıduo varia. Por exemplo, quando a funcao de ap-

tidao e uma soma ponderada e seus pesos variam, assim como a aptidao de um indivıduo

varia, em resposta a determinadas consideracoes.

Uma outra importante justificativa para o ajuste de parametros de fatores evolu-

cionarios e a manutencao ou controle da diversidade da populacao. Varios autores ja

trataram esse tema com ajustes de parametros (SHIMODAIRA, 2001; URSEM et al., 2002;

YANG; TINOS, 2007; SIMOES; COSTA, 2002b; COBB, 1990; GREFENSTETTE, 1992; WONG

et al., 2003). A perda da diversidade em populacoes finitas, sem migracao e com baixa

taxa de mutacao e iminente apos sucessivas geracoes. Mesmo com selecao aleatoria, sem

pressao de selecao, ha perda de diversidade em populacoes finitas em decorrencia da de-

riva genetica. Em um algoritmo evolucionario, essa perda reduz as regioes exploradas,

contrapondo uma de suas principais vantagens, a busca simultanea em varias regioes do

espaco de solucoes. O algoritmo genetico padrao (AGP), sem ajuste previo de parametros

ou durante o processo evolucionario, tem uma perda de diversidade natural que resulta

em convergencia prematura, isto e, toda a populacao se concentra em uma regiao do

espaco de solucoes. Essa caracterıstica praticamente inviabiliza a utilizacao de AGPs

em problemas complexos, e.g., multimodais e dinamicos, cujo ajuste de parametros de

fatores evolucionarios e quase imprescindıvel.

Este capıtulo descreve e analisa criticamente varios metodos de controle de parametros,

mostrando que na maioria das vezes os mesmos levam significativa vantagem sobre os

metodos de ajuste previo. Os metodos de controle de parametros sao apresentados con-

forme o mecanismo de ajuste. As proximas secoes apresentam tres metodos de controle

de parametros, a saber, o determinıstico, na Secao 2.2, o adaptativo, na Secao 2.3, e o

auto-adaptativo, na Secao 2.4. Na sequencia, a Secao 2.5 apresenta alguns trabalhos que

tratam o problema da manutencao da diversidade, na Subsecao 2.5.1, e o controle da

diversidade, na Subsecao 2.5.2, utilizando metodos de controle de parametros. A Secao

2.6 apresenta as discussoes finais.

2.2 CONTROLE DE PARAMETROS DETERMINISTICO

Os metodos de controle de parametros determinısticos modificam os parametros, normal-

mente, em funcao das geracoes, sem utilizar nenhum retorno do processo evolucionario.

Em um exemplo tıpico de controle de parametros determinıstico, Hinterding et al. (1997)

10

definiu a taxa de mutacao como

pm(k) = 0.5− 0.3k

K, (2.1)

sendo pm a probabilidade ou taxa de mutacao, k a geracao atual e K o numero maximo

de geracoes. Neste caso, a taxa de mutacao decresce de 0.5 ate 0.2, na ultima geracao. O

ajuste de pm e determinıstico, pois nao ha nenhuma informacao do processo evolucionario,

como, por exemplo, o numero de geracoes que a aptidao media da populacao nao melhora.

A Equacao 2.1 e monotonica, o que pode nao ser desejavel quando, por exemplo, a

diversidade da populacao diminui muito. A desvantagem dessa forma de ajuste e que a

taxa de mutacao da Equacao 2.1 nao se relaciona com o problema ou com atributos da

populacao, como sua aptidao media.

Em outro exemplo de controle determinıstico, Back e Schutz (1996) apresentaram

um metodo de ajuste da taxa de mutacao na forma hiperbolica, tambem em funcao das

geracoes, como segue

pm(k) =

(2 +

L− 2

K − 1× k

)−1

, (2.2)sendo L o numero de genes do indivıduo. Esse metodo determinıstico obteve melhor

desempenho em relacao a um modelo auto-adaptativo, proposto no mesmo trabalho, e a

um AGP com taxa de mutacao fixa igual a 1/L.

Droste et al. (2001) criaram um metodo, com representacao binaria1, que ajusta a

taxa de mutacao de acordo com a regra

pm(k) =

{1/L, se pm(k) > 0.5

2 pm(k − 1), caso contrario.(2.3)

Esse algoritmo produz uma taxa de mutacao ciclicamente crescente no intervalo [1/L, 0.5].

Os autores mostraram que o controle dinamico da taxa de mutacao aumenta a velocidade

de convergencia do AE em relacao ao valor mais recomendado para uma taxa de mutacao,

i.e., pm = 1/L.

Thierens (2002) propos um metodo determinıstico inspirado no algoritmo de aprendi-

zagem de Manhattan (KUSHNER; CLARK, 1978), de origem estocastica2, utilizando uma

1Na representacao binaria, as variaveis de decisao do problema sao codificadas no genotipo do in-

divıduo por numeros binarios2Os algoritmos de aprendizagem estocasticos estimam parametros otimos para seus respectivos mo-

delos.

11

taxa de mutacao pm(k) e tres novos indivıduos gerados a partir das taxas de mutacao

pm(k), ωpm(k) e pm(k)/ω, sendo ω uma constante denominada fator de exploracao3.

Thierens utilizou a seguinte regra para executar a aprendizagem de Manhattan:

1. Mutar o indivıduo x das seguintes tres formas:

M(x, pm/ω)→ {x1, pm/λ}

M(x, pm)→ {x2, pm}

M(x, ω pm)→ {x3, λ pm}

2. Selecionar o indivıduo com melhor aptidao dentre

{x, pm}, {x1, pm/λ}, {x2, pm} e {x3, λ pm}

sendo xi, i = 1, 2, 3, o indivıduo mutado a partir de x, λ uma constante denominada

fator de aprendizagem e M(·, ·) uma regra de mutacao, que gera tres novos indivıduos

utilizando uma dentre as taxas de mutacao pm/ω, pm e ω pm. Selecionando sucessivamente

pares { x, pm }, pretende-se alcancar uma taxa de mutacao que tende a gerar indivıduos

melhores. A proporcao que a taxa de mutacao se modifica e determinada pelo fator de

aprendizagem, λ.

A maior vantagem do controle de parametros determinıstico e a sua simplicidade de

implementacao e seu baixo custo computacional. No entanto, em problemas complexos

uma estrategia de ajuste pre-definida, sem interacao com o ambiente, pode nao alcancar

os melhores resultados. Por exemplo, em um problema dinamico, apos a mudanca do

ambiente, pode ser recomendado que a taxa de mutacao aumente por um determinado

perıodo, o que nao e possıvel no controle de parametros determinıstico.

2.3 CONTROLE DE PARAMETROS ADAPTATIVO

Os metodos adaptativos tem um retorno do processo evolucionario para determinar a

direcao ou a magnitude das mudancas dos parametros. A regra de 1/5 de sucesso (RE-

CHENBERG, 1973) para ajuste da taxa de mutacao e um dos principais exemplos de

metodo adaptativo. O mecanismo de ajuste funciona da seguinte forma: se nas n ultimas

geracoes houve sucesso4 em mais de 1/5 das mutacoes, entao a taxa de mutacao sera

3O coeficiente ω determina o grau de variacao do indivıduo, modulando a sua exploracao na superfıcie

de busca. Por essa razao o nome fator de exploracao.4Entende-se como sucesso quando a mutacao melhora a aptidao media da populacao.

12

aumentada; caso contrario, sera diminuıda. Portanto, a regra de 1/5 de sucesso interage

com o ambiente, modificando a taxa de mutacao, a cada n geracoes.

Em outro exemplo de controle adaptativo, Davis (1989) criou um metodo baseado

no desempenho dos operadores do processo evolucionario. O metodo promove alteracoes

nas probabilidades dos operadores baseado nas aptidoes dos descendentes. Assim, os

operadores que geram filhos melhores tem maior probabilidade de atuarem no futuro.

Back (1993) apresentou um estudo sobre taxas de mutacao fixa e adaptavel, com

AGs binarios, utilizando ambientes distintos. Em ambientes unimodais, os resultados

mostraram que uma taxa de mutacao fixa igual a 1/L pode alcancar resultados satis-

fatorios e que taxas de mutacao que decaem a partir deste valor nao aceleram a busca

significativamente. No entanto, para ambientes multimodais, o estudo mostrou que uma

taxa de mutacao adaptavel pode contribuir para que os indivıduos escapem de otimos

locais. Na versao adaptativa, a taxa de mutacao e inversamente proporcional a aptidao

do indivıduo. A ideia e produzir grandes alteracoes em indivıduos com baixa aptidao

e pequenas alteracoes em indivıduos com alta aptidao — beneficiando a explotacao. A

suposicao de produzir pequenas alteracoes em indivıduos com alta aptidao pode ser uma

desvantagem em um problema onde nao se conheca o valor do otimo global ou que pos-

sua otimos locais cujos valores da funcao de aptidao sao elevados. Nesse ultimo caso,

os indivıduos terao dificuldades de escapar de otimos locais cujos valores da funcao de

aptidao sejam elevados, pois suas taxas de mutacao serao baixas.

Lee e Takagi (1993) utilizaram a logica nebulosa para ajustar tres parametros dos al-

goritmos geneticos, a saber, o tamanho da populacao e as taxas de cruzamento e mutacao.

As mudancas dos parametros sao baseadas no desempenho da populacao a cada geracao,

considerando as piores e melhores aptidoes, a aptidao media e sua variacao desde a ultima

acao de controle. Lee e Takagi tiveram como objetivos, alem da aplicacao da logica nebu-

losa nos algoritmos evolucionarios, entender melhor a relacao do controle de parametros

e melhorar o seu desempenho.

O sistema nebuloso, baseado em regras, possui uma base de conhecimento que ne-

cessita de informacoes previas do ambiente. As dificuldades nesse tipo de sistema sao

a necessidade de haver um especialista para modelagem da base de conhecimento e a

aquisicao de informacoes do ambiente quando estas sao imprecisas ou mesmo inexisten-

tes. O ponto chave na abordagem de Lee e Takagi e a elaboracao de um metodo que

projeta, automaticamente, o sistema nebuloso. Outra desvantagem e o onus computaci-

onal causado pela decisao baseada em regras para ajustes dos parametros. Entretanto,

13

segundo os autores, em problemas onde a funcao de aptidao tem alta complexidade, o

tempo de inferencia em comparacao ao tempo total de processamento nao e significativo.

Corne et al. (1994) consideraram as estatısticas de desempenho dos descendentes ge-

rados por varios operadores no problema da construcao de grade horaria semanal. Perio-

dicamente, os operadores que geraram indivıduos mais aptos sao tem suas probabilidades

de aplicacao aumentadas, enquanto que os operadores que geraram indivıduos menos

aptos tem suas probabilidades diminuıdas.

Sebag e Schoenauer (1994) construıram um banco de dados de operadores de cru-

zamento usados no inıcio do processo evolucionario. Esses operadores sao classificados

como ruins ou bons de acordo com as aptidoes dos descendentes (i.e., operadores que

geram descendentes com baixas aptidoes sao rotulados como ruins, e vice-versa). Atraves

de um controle adaptativo, a ideia e prevenir que operadores de cruzamento inadequados

quebrem sequencias de genes promissoras. Primeiramente, decorre-se um processo darwi-

niano convencional, que tem como objetivo armazenar informacao em uma base de dados.

Em seguida, os cruzamentos sao observados e um conjunto de regras para classificacao

dos cruzamentos e construıdo por aprendizagem indutiva — com atualizacoes periodicas.

Na fase seguinte, ja utilizando o controle adaptativo, os cruzamentos classificados como

ruins sao recusados. A existencia de um direcionamento na operacao de cruzamento pode

acelerar o processo evolucionario com uma maior explotacao. No entanto, para montagem

das regras pela aprendizagem indutiva e necessario conhecimento previo do problema.

S.-Voosen e Muhlenbein (1994) dividiram a populacao em sub-populacoes para ajuste

da taxa de mutacao. Na abordagem proposta, o numero de indivıduos da populacao

se mantem fixo, variando o tamanho das sub-populacoes conforme a aptidao do me-

lhor indivıduo da sub-populacao. As sub-populacoes competem pelos mesmos recursos,

de forma que as mais aptas crescem (recebem indivıduos de outras sub-populacoes), e

vice-versa. As competicoes entre sub-populacoes se mostram eficientes e robustas, pois

podem utilizar diferentes estrategias, favorecendo aquelas com parametros e estrategias

mais adequados. Em outro trabalho, S.-Voosen e Muhlenbein (1996) elaboraram uma

metodologia mais abrangente, variando tambem o tamanho da populacao.

A divisao da populacao, alem de favorecer o uso de diferentes estrategias ao mesmo

tempo, sugere a utilizacao de computacao paralela — por exemplo, cada sub-populacao

pode ser conduzida por um processador ou nodo de um cluster. A implementacao pa-

ralela pode aumentar a velocidade de convergencia, pois permite buscas simultaneas em

espacos de solucoes diferentes. Lis (1996) propos uma taxa de mutacao dinamica, uti-

14

lizando o paradigma da programacao paralela. Nesta abordagem, o processador mestre

gera a populacao inicial e a distribui entre os processadores escravos, formando as sub-

populacoes. Cada processador escravo executa sua propria estrategia durante um tempo

denominado epoca ou perıodo de migracao. A cada final de epoca, o processador mestre

avalia os melhores indivıduos, recalcula a taxa de mutacao, monta uma nova populacao e

a distribui novamente aos processadores escravos. Lis determinou um conjunto de nıveis

escalonados de taxa de mutacao, quanto maior o nıvel, maior a taxa de mutacao. Durante

uma epoca, os processadores escravos executam o algoritmo genetico sequencial com suas

respectivas taxas de mutacao. Os ajustes das taxas de mutacao sao feitas como segue:� Se a maior aptidao for de um indivıduo da sub-populacao com a maior taxa de

mutacao, entao as taxas de mutacao de todas as sub-populacoes dos processadores

escravos serao aumentadas em um nıvel.� Senao, se a maior aptidao for de um indivıduo da sub-populacao com a menor taxa

de mutacao, entao as taxas de mutacao de todas as sub-populacoes serao diminuıdas

em um nıvel.� Senao, se a maior aptidao for de um indivıduo de uma sub-populacao com taxa de

mutacao intermediaria, entao nao serao alteradas as taxas de mutacao.

O princıpio do metodo de Lis induzir um aumento ou diminuicao da taxa de mutacao

em funcao do desempenho da sub-populacao com o indivıduo mais apto. Assim, supoe-se

que o nıvel da taxa de mutacao dessa sub-populacao e o mais apropriado para a epoca

atual.

Spears (1995) criou uma forma de adaptacao em que se os dois ultimos bits dos pais

forem iguais a 1, o cruzamento sera uniforme; se os dois ultimos bits forem iguais a 0,

o cruzamento sera de 2-pontos; se os bits forem diferentes, o cruzamento sera escolhido

aleatoriamente. No decorrer das geracoes, a predominancia de um determinado bit pode

significar que seu tipo de cruzamento correspondente esta gerando indivıduos mais aptos.

Um dos principais recursos dos algoritmos evolucionarios e a capacidade de escapar de

otimos locais, pois a taxa da mutacao elevada pode dispersar parte da populacao “presa”

em otimos locais. A Figura 2.1 (SRINIVAS; PATNAIK, 1994) mostra a tendencia de toda

a populacao convergir para uma regiao especıfica do espaco de solucoes. A concentracao

nessa regiao pode ser refletida na diferenca entre a maior aptidao e a aptidao media da

populacao, fmax − f . A medida que os indivıduos convergem para uma regiao de otimo

15

local ou global, a aptidao media tende a crescer e a diferenca fmax− f diminuir. A Figura

2.1 mostra uma regiao de maximo local, com maior aptidao igual a 0.5 (no maximo global,

a funcao de aptidao e igual a 1.0).

Figura 2.1 Diversidade da populacao vista por fmax − f (SRINIVAS; PATNAIK, 1994).

Srinivas e Patnaik apresentaram uma forma adaptativa para evitar a convergencia

em otimos locais. No metodo, as taxas de cruzamento e mutacao variam em funcao da

diferenca fmax − f . Essas formas de adaptacao foram definidas como segue

pc =k1

fmax − f(2.4)

e

pm =k2

fmax − f(2.5)

para as taxas de cruzamento e mutacao, respectivamente, sendo k1 e k2 constantes pre-

viamente definidas. Uma desvantagem desse modo de adaptacao e que ao convergir para

o otimo global, a populacao tem o mesmo espalhamento caso nao se conheca a aptidao

maxima.

Srinivas e Patnaik tambem sugerem um outro controle adaptativo para ajustes das

taxas de cruzamento e mutacao, que variam em funcao da aptidao do proprio indivıduo,

definidas como

pc = k1fmax − f

′

fmax − f(2.6)

16

e

pm = k2fmax − f

fmax − f, (2.7)

sendo f ′ a maior aptidao entre os indivıduos selecionados para o cruzamento e f a ap-

tidao do indivıduo a ser mutado. Dessa forma, aptidoes baixas, tanto para cruzamento

quanto para mutacao, elevam as taxas das Equacoes 2.6 e 2.7, possibilitando que os no-

vos indivıduos sofram grandes alteracoes e, assim, pesquisem novas regioes do espaco de

busca. Quando f ou f ′ atinge valores proximos de fmax, as taxas cruzamento e mutacao

decrescem. A desvantagem do metodo de Srinivas e Patnaik e que nas primeiras geracoes

os indivıduos com melhores aptidoes tem taxas de cruzamento e mutacao baixas — o que

pode ser desejavel, pois nessas primeiras geracoes esses indivıduos podem estar distantes

do otimo global.

Existem diferencas basicas entre as abordagens (i) da Figura 2.1, sem nenhuma

adaptacao, (ii) das Equacoes 2.4 e 2.5 e (iii) das Equacoes 2.6 e 2.7. Na abordagem

(i), ha uma tendencia a rapida convergencia para otimos locais, sem nenhuma acao para

reverter esta situacao. Na abordagem (ii), o disturbio causado pelas taxas das Equacoes2.4 e 2.5 pode impedir que a populacao convirja para o otimo global. Na abordagem (iii),

as Equacoes 2.6 e 2.7 produzem poucas perturbacoes nos indivıduos proximos as regioes

otimas, mas tende a modificar significativamente indivıduos com aptidao baixa. Essa e

a razao principal de nao ocorrer a convergencia prematura da abordagem (iii), enquanto

que na abordagem (i), os indivıduos com baixa aptidao sao eliminados ou convergem

prematuramente para regioes de otimos locais proximas.

Arabas et al. (1994) discutiram dois fatores importantes no processo evolucionario,

o tamanho da populacao e o mecanismo de selecao. O tamanho da populacao tem im-

portancia decisiva no processo evolucionario. Uma populacao pequena, geralmente, con-

duz o processo a uma convergencia prematura. Por outro lado, uma populacao grande

causa muito esforco computacional. O mecanismo de selecao tambem tem influencia di-

reta na convergencia. Se a pressao de selecao for muito grande, a diversidade da populacao

tende a diminuir. Por outro lado, uma pressao pequena torna a busca ineficaz. Tanto a

diversidade quanto a pressao da selecao sao influenciadas pelo tamanho da populacao.

No trabalho de Arabas et al., o tamanho da populacao e variavel e nao ha selecao

direta. O objetivo de variar o tamanho da populacao e tentar encontrar seu valor otimo

nos diferentes estagios do processo evolucionario. Em substituicao a selecao, os autores

17

criaram o parametro tempo de vida, proporcional a aptidao, que determina o numero

de geracoes que um indivıduo permanece na populacao. Assim, os indivıduos com me-

lhores aptidoes permanecem mais tempo no processo, e vice-versa, como no processo

evolucionario biologico.

O metodo de Arabas et al. promove uma pressao de selecao mais suave, pois tambem

pune os indivıduos com aptidoes menores. Os indivıduos menos aptos tem um tempo de-

terminado para melhorarem suas aptidoes. Em um processo evolucionario com pressao de

selecao convencional, os indivıduos menos aptos tendem a serem eliminados em geracoes

sucessivas. Nas primeiras geracoes do metodo de Arabas et al., a populacao cresce ate

que os primeiros indivıduos, com menor tempo de vida, comecem a ser eliminados. O

parametro tempo de vida tende a adequar o tamanho da populacao a regiao onde ela se

encontra. Por exemplo, em uma regiao nao promissora a maioria dos indivıduos tem ap-

tidoes baixas; consequentemente, muitos indivıduos tendem a serem excluıdos mais cedo

— diminuindo a populacao. Em uma regiao promissora, os indivıduos sobrevivem por

mais tempo — aumentando a populacao. Assim, em regioes mais promissoras um numero

maior de indivıduos busca as melhores solucoes. Os resultados obtidos pelo metodo de

Arabas et al. mostraram-se promissores; no entanto, a escolha de uma estrategia otima

para o calculo do parametro tempo de vida e, ainda, um problema em aberto.

O controle de parametros adaptativo tem a vantagem de interagir com o ambiente,

o que pode representar uma vantagem sobre o controle determinıstico. Entretanto, o

controle adaptativo possui um custo computacional maior em relacao ao determinıstico.

Esse custo pode ser minimizado se os ajustes ocorrerem ao nıvel da populacao, como,

por exemplo, os metodos de Rechenberg (1973), Ochoa et al. (2000), Eldridge (2002) e

Srinivas e Patnaik (1994).

2.4 CONTROLE DE PARAMETROS AUTO-ADAPTATIVO

Os metodos auto-adaptativos utilizam o princıpio da evolucao nos proprios parametros,

que sao codificados nos indivıduos e passam por todos os processos evolucionarios —

selecao, cruzamento e mutacao. Por exemplo, um indivıduo com L genes no AGP, re-

presentativos de sua caracterıstica, passa a ter L+ 1 genes no controle auto-adaptativo,

sendo o gene adicional um parametro de fatores evolutivos, como a taxa de mutacao

ou cruzamento, o tipo de operador de cruzamento, dentre outros. Assim, o parametro

adicionado ao indivıduo sofrera todos os efeitos da evolucao.

18

Spears (1995) utilizou uma forma auto-adaptativa para controlar o cruzamento. A

decisao de qual tipo de operador utilizar e tomada adicionando um gene do cruzamento

no indivıduo, onde 1 representa o cruzamento uniforme e 0 o cruzamento de 2-pontos.

Duas formas auto-adaptativas sao possıveis para a tomada de decisao. Na primeira,

denominada local, a decisao depende dos dois indivıduos escolhidos para o cruzamento, se

ambos tem o gene do cruzamento iguais, realiza-se o cruzamento correspondente ao valor

do gene; se os genes forem diferentes, determina-se o tipo de cruzamento aleatoriamente.

Na segunda forma, denominada global, o operador de cruzamento e escolhido conforme a

populacao como um todo. Por exemplo, se em 75% da populacao o gene do cruzamento

for 1, entao o cruzamento uniforme sera usado em 75% dos cruzamentos e o cruzamento de

2-pontos em 25% deles. A ideia geral do metodo de Spears e a decisao de qual operador

de cruzamento utilizar esta relacionada com a maioria, local ou global, supondo que

determinado tipo de cruzamento gerou indivıduos mais bem adaptados.

Outros metodos auto-adaptativos podem ser vistos nos trabalhos de Back (1996),

Fogel et al. (1991), Fogel (1995) e Schwefel (1995). Por exemplo, a mutacao do j-esimo

gene do i-esimo indivıduo de uma populacao pode ser processada como segue

g′ij = gij + σj N(0, 1), (2.8)sendo σj o parametro de adaptacao ou tamanho do passo sobre o espaco de solucoes e

N(0, 1) uma variavel aleatoria gerada a partir de uma funcao de distribuicao normal com

media 0 e desvio padrao 1. No metodo de Schwefel (1995), o parametro de adaptacao e

modificado pela funcao da distribuicao log-normal

σ′

j = σj exp(τ ′N(0, 1) + τ Nj(0, 1)), (2.9)sendo τ e τ ′ as taxas de aprendizagem. No trabalho de Fogel (1995), o parametro de

adaptacao e modificado pela funcao de distribuicao normal

σ′

j = σj + ζ σj N(0, 1), (2.10)sendo ζ uma constante. As Equacoes 2.9 e 2.10 introduzem ruıdo no parametro de

adaptacao, criando solucoes na direcao onde houveram melhorias de indivıduos anteces-

sores (ANGELINE, 1995).

No trabalho de Back (1992), os indivıduos possuem L taxas de mutacao codificadas em

seus genotipos. Assim, cada variavel de decisao possui sua propria taxa de mutacao. Para

19

os problemas unimodais estudados, o metodo com uma taxa de mutacao por indivıduo

(nıvel do indivıduo) com selecao preservativa teve sempre o melhor desempenho. Ja

nos problemas multimodais, o metodo com N taxas de mutacao por indivıduo (nıvel

do componente) com selecao preservativa teve o melhor desempenho. Esses resultados

sugerem que problemas mais complexos necessitam de ajustes mais refinados de suas

variaveis de decisao.

Maley (1997) acrescentou um gene ao genotipo do indivıduo correspondente a taxa

de mutacao, pm ∈ [0, 100], do seu descendente. No metodo de Maley, nao ha reproducao

sexuada, os genes dos pais sao copiados para seus descendentes e entao sofrem dois tipos

de mutacao, uma para o gene taxa de mutacao e outra para os genes-atributo5. O gene

que representa a taxa de mutacao do descendente difere aleatoriamente do gene do pai

em funcao de uma distribuicao de Poisson, com λ = 5, centrada no gene do pai, como

segue

(λx+λ−p) e−λ

(x+ λ− p)!, (2.11)

sendo p o gene do pai transmitido ao descendente e x e o valor em potencial do gene do

descendente. A mutacao dos genes-atributo depende do gene do pai, p, que representa a

taxa de mutacao, resultando

λ = (p

50)3, (2.12)

com λ ∈ [0, 8] usado na distribuicao de Poisson. A variavel λ e o numero medio de bits

que sao mutados nos descendentes durante a reproducao.

Os metodos auto-adaptativos, na maioria dos casos, nao necessitam de uma estrategia

explıcita de ajuste. A ideia principal e que os parametros evoluam com os indivıduos.

Se um indivıduo possuir um parametro com valor inadequado, este tendera a ter uma

baixa aptidao, e vice-versa. O custo computacional, geralmente, nao e muito elevado,

pois apenas acrescenta-se alguns genes nos indivıduos. A principal vantagem do controle

auto-adaptativo, a independencia de uma estrategia de ajuste, pode tambem ser uma des-

vantagem, pois na falta de uma interacao com o ambiente a evolucao da populacao pode

ser mais lenta em relacao aos metodos apresentados nas secoes anteriores, principalmente

o adaptativo.

5Genes que representam apenas as caracterısticas do indivıduo.

20

2.5 ADAPTACAO PARA MANUTENCAO OU CONTROLE DA DIVERSIDADE

Nos algoritmos evolucionarios, conservar a diversidade da populacao ou minimizar a sua

perda pode beneficiar o processo evolucionario de diversas formas, como, por exemplo,

prevenindo a convergencia prematura da populacao, alocando a populacao em solucoes

otimas distintas de Pareto em problemas multiobjetivo ou permitindo que a populacao se

adapte rapidamente as mudancas do ambiente em problemas dinamicos. A convergencia

prematura, na maioria das vezes, pode levar o AE a um resultado sub-otimo, isto e,

convergir a populacao em otimos locais. Encontrar varias solucoes na fronteira de Pareto

significa ter mais opcoes quando a solucao otima de Pareto nao for encontrada. Em

problemas dinamicos, uma populacao bem distribuıda no espaco de solucoes pode evitar

a reinicializacao dos indivıduos depois de uma mudanca do ambiente.

Os metodos de controle de parametros que objetivam a preservacao da diversidade

podem ser divididos em dois paradigmas: manutencao e controle da diversidade. Os

metodos de manutencao da diversidade utilizam estrategias que atenuam sua perda (BUI

et al., 2005; HERRERA et al., 1997; HERRERA; LOZANO, 2000; SIMOES; COSTA, 2002a;

WONG et al., 2003). Os metodos de controle de diversidade tem um valor ou faixa de

diversidade determinada (MEIYI et al., 2004; NGUYEN; WONG, 2003; URSEM et al., 2002).

Assim, as estrategias de controle da diversidade tem como objetivo minimizar a diferenca

entre as diversidades da populacao e a determinada. A diferenca de filosofia entre os

metodos de manutencao e controle da diversidade e a existencia de um valor ou faixa

de diversidade determinada nos ultimos. As duas proximas subsecoes apresentam alguns

desses metodos.

2.5.1 Manutencao da Diversidade

A maioria dos metodos que tratam a diversidade da populacao procuram evitar sua

perda sem estabelecer um valor mınimo desejado. Simoes e Costa (2002b) utilizaram um

ambiente dinamico para fazer um estudo comparativo entre quatro diferentes metodos

de manutencao da diversidade. Os ajustes dos parametros impedem o rapido decaimento

da diversidade, resultado da convergencia prematura. Os metodos utilizados foram o

algoritmo genetico baseado na transmutacao (AGT) (SIMOES; COSTA, 2001), o AGT

melhorado (AGTM) (SIMOES; COSTA, 2002a), o algoritmo genetico com hiper-mutacao

gatilhada (THM) (COBB, 1990) e o algoritmo genetico com imigracao aleatoria (AGIA)

(GREFENSTETTE, 1992).

21

Os dois primeiros metodos, AGT (SIMOES; COSTA, 2001) e AGTM (SIMOES; COSTA,

2002a), baseiam-se no princıpio biologico da transmutacao genetica, que modifica uma

bacteria ao capturar o DNA (do ingles, desoxyribonucleic acid) de celulas inimigas, ad-

quirindo parte de seu codigo genetico. Basicamente, os metodos AGT e AGTM possuem

um reservatorio de segmentos de genes de tamanhos variados, que podem chegar ao ta-

manho de um indivıduo. A cada geracao, os indivıduos selecionados para a transmutacao

sao modificados pelos seguimentos de genes do reservatorio. A diferenca entre os metodos

AGT e AGTM e que o segundo ajusta adequadamente alguns parametros do algoritmo

de modo a melhorar o seu desempenho. Simoes e Costa realizaram estudos parametricos

para obter valores adequados para os quatro parametros: tamanho do seguimento de

genes, taxas de reposicao, mutacao e transmutacao (SIMOES; COSTA, 2002a).

O metodo THM ajusta a taxa de mutacao utilizando um valor base baixo quando o

algoritmo estiver estavel; elevando-o quando o algoritmo tiver seu desempenho degradado

(COBB, 1990). No trabalho de Simoes e Costa (2002b), o valor base para a taxa de

mutacao foi de 0.1, os aumentos da taxa de hiper-mutacao, quando o desempenho do

algoritmo degradava, foram de 10%, 20% e 30%. Os melhores resultados foram alcancados

com a taxa de hipermutacao igual a 10%.

Simoes e Costa testaram os quatro metodos em ambientes dinamicos que variaram

a ciclos de 15, 50, 100 e 200 geracoes. Os resultados mostraram que nas mudancas do

ambiente em ciclos maiores que 30, o metodo AGTM teve o melhor desempenho. Nas

mudancas em ciclos pequenos, o metodo THM teve o melhor desempenho. Observando

a diversidade em ciclos de 300 geracoes, o THM proporcionava baixa diversidade na

populacao nos finais de cada ciclo. Os autores concluıram, portanto, que o metodo AGTM

tem melhor desempenho quando o ambiente e dinamico, principalmente nas mudancas

do ambiente a ciclos maiores que 30 geracoes.

Wong et al. (2003) elaboraram um metodo para ajuste das taxas de cruzamento, pc,

e mutacao, pm, com o intuito de balancear exploracao e explotacao. O processo evolu-

cionario e dividido em dois perıodos: o primeiro utiliza pc e pm com valores aleatorios;

o segundo ajusta pc e pm de acordo com a melhoria das aptidoes obtidas no primeiro

perıodo. A diversidade da populacao e mantida adicionando uma “aptidao de diversi-

dade” a aptidao original do indivıduo. Assim, a diversidade da populacao influencia a

selecao dos sobreviventes de uma forma ponderada, isto e, existe um peso que balanceia

as aptidoes original e de diversidade na nova funcao de aptidao.

Shimodaira (2001) elaborou um metodo, com representacao binaria, para manutencao

22

da diversidade, denominado diversity control-oriented genetic algorithm (DCGA). Em

primeiro lugar, a populacao e agrupada em pares. Cada par e recombinado entre si e seus

descendentes mutados segundo uma probabilidade. Na sequencia, os filhos gerados se

juntam a populacao. A populacao emergente, de pais e filhos, e ordenada de acordo com

as aptidoes. Finalmente, a selecao de sobreviventes e feita de acordo com as seguintes

regras:

1. Os indivıduos duplicados, segundo a paridade de genes, sao eliminados;

2. Os indivıduos sao selecionados de acordo com a probabilidade

ps =

((1− c)

Hi

L+ c

)α, (2.13)

sendo Hi a distancia de Hamming do i-esimo indivıduo ate o indivıduo com melhor

aptidao, c e α, ambos ∈ [0.0, 1.0], sao parametros da taxa de selecao, ps;

3. Se o numero de indivıduos selecionados for menor que o tamanho da populacao

(que e fixo), entao o numero de indivıduos correspondente a esta diferenca e gerado

aleatoriamente.

O metodo de Shimodaira tem justificativas empıricas e teoricas para nao convergir

prematuramente. Os descendentes duplicados reduzem a diversidade, provocando con-

vergencia prematura. Assim, o cruzamento — sempre executado — e a taxa de mutacao

elevada tendem a produzir descendentes geneticamente mais distintos dos seus pais, ex-

plorando diferentes regioes do espaco de solucoes. A pressao de selecao e a diversidade

devem ser externamente controladas, pois o algoritmo evolucionario, por si so, nao pode

discernir um otimo local de um global. Se a pressao de selecao for alta, indivıduos com

melhor aptidao, geneticamente similares ao melhor indivıduo, tenderao a surgir em maior

quantidade causando convergencia prematura.

Shimodaira procurou resolver o problema da convergencia prematura reduzindo apro-

priadamente a pressao de selecao na vizinhanca do melhor indivıduo. A probabilidade

de selecao de sobreviventes, Equacao 2.13, estabelece um limiar entre a tendencia de

eliminar indivıduos proximos ao melhor indivıduo e a selecao de indivıduos distantes do

mesmo. Quanto maior esse limiar, maior a diversidade da populacao. Shimodaira ajusta

o limiar pelos valores de c e α, Equacao 2.13, baseado em tentativa e erro.

A pressao da selecao pode ser ajustada em funcao do problema. Por exemplo, para

ambientes com poucos otimos locais, a pressao de selecao, controlada por c e α, pode ser

23

maior do que em ambientes com muitos otimos locais. Essa relacao com o ambiente pode

alterar a velocidade de convergencia.

(HERRERA; LOZANO, 2000) elaboraram um metodo adaptativo para ajuste do in-

tervalo de mutacao em AE com genotipos com codificacao real, denominado two-loop

real-coded genetic algorithm (TRAM), que tende a aumentar a diversidade da populacao

depois de um intervalo sem progresso da aptidao media da populacao. Herrera e Lozano

basearam no princıpio em que o intervalo de mutacao, δ, pode ser:

1. muito grande, diminuindo as chances de convergencia para o otimo global, ou

2. muito pequeno, induzindo a convergencia prematura em um otimo local.

Herrera e Lozano criaram dois lacos: um interno para adaptar o passo de um operador

de mutacao; e um externo para adaptar o passo de um operador de mutacao usado para

re-iniciar um operador.

O laco interno executa o processo evolucionario usual (selecao, cruzamento e mutacao)

em um determinado numero de geracoes, Go, chamado tempo entre observacoes. Assim,

dependendo do progresso da aptidao media da populacao nessas Go geracoes, ajusta-

se o passo do operador de mutacao e calcula-se o novo valor de Go. O operador de

mutacao, denominado Mutacao(δ), executa a heurıstica: se x ∈ [a, b] for um gene a ser

mutado, entao o gene resultante da mutacao, x′, sera um numero aleatorio do intervalo

[x−δ(x−a), x+δ(b−x)]. Assim, quanto maior δ, maior podera ser a variacao produzida

em x.

Depois de Go geracoes, o parametro δ e adaptado pela seguinte heurıstica: “aumente

δ se houver progresso de f (aptidao media da populacao); ou diminua, caso contrario”.

O intervalo δ ∈ [δmin,∆], sendo δ calculado pelo laco externo. O laco interno termina

quando δ alcanca δmin, supondo que um otimo local ou o global foi alcancado (MAZA;

YURET, 1994). Para a adaptacao de δ, sao utilizadas duas variaveis, yes and no. Se

houver um progresso ou estabilidade no processo evolucionario (fold ≥ f , sendofold a

aptidao media da populacao na geracao anterior), entao for δ e multiplicada por 2yes; caso

contrario, δ e dividido por 2no. Assim, quando o processo de busca estiver estacionado

em um otimo local e evolucoes nao forem esperadas pela reducao do δ, a duracao do laco

interno nao sera longa. A Figura 2.2 mostra o pseudo-codigo do laco interno do algoritmo

TRAM.

O laco externo executa um operador de inicializacao, chamado Reinicializar(∆), que

executa o operador Mutacao(∆) em todos os genes dos indivıduos da populacao. O

24

Figura 2.2 Pseudo-codigo do laco interno do TRAM.

25

objetivo e manter um nıvel contınuo de exploracao no espaco de solucoes. Essa acao

tenta assegurar que um material genetico novo e promissor esteja disponıvel na populacao

para ser tratado pelo laco interno. O laco externo adapta o parametro ∆, utilizando

informacoes obtidas depois da execucao do laco interno, pela heurıstica: “diminuir ∆

dividindo-o por 2 se for observado um progresso em f+ (melhor aptidao da populacao);

ou aumentar ∆ multiplicando-o por 2; caso contrario”. O novo valor de ∆ sera o primeiro

valor de δ no proximo laco interno. A Figura 2.3 mostra o pseudo-codigo do laco externo

do algoritmo TRAM.

Figura 2.3 Pseudo-codigo do laco externo do TRAM.

Ajustando constantemente o intervalo de mutacao, o algoritmo TRAM procura au-

mentar o nıvel da diversidade quando um estado estacionario de evolucao e atingido.

Assim, a diversidade da populacao tende a diminuir ate um nıvel mınimo, aumentando

depois de um intervalo sem evolucao do ponto de vista da aptidao media da populacao.

Grefenstette (1992) propos uma abordagem inspirada no fluxo de imigrantes de uma

populacao em geracoes sucessivas, denominada random immigrants genetic algorithm

(RIGA). Essa abordagem mantem um determinado nıvel de diversidade da populacao

substituindo uma porcao de indivıduos da populacao atual por indivıduos gerados ale-

atoriamente, chamados imigrantes aleatorios, a cada geracao. Existem duas estrategias

que definem como os indivıduos sao substituıdos: substituir indivıduos aleatoriamente

26

ou substituir os piores (VAVAK; FOGARTY, 1996). Para que os imigrantes aleatorios nao

prejudiquem a busca, especialmente durante o perıodo em que o ambiente nao varia, o

numero de imigrantes aleatorios, ni, e usualmente ajustado para um valor pequeno. A

Figura 2.4 mostra o pseudo-codigo do algoritmo RIGA.

Figura 2.4 Pseudo-codigo do RIGA

O RIGA insere indivıduos aleatorios na populacao, uma estrategia que pode aumentar

a diversidade da populacao e beneficiar o desempenho de AGs em ambientes dinamicos.

Todavia, em ambientes com pequenas variacoes, a introducao de imigrantes aleatorios

pode desviar a busca do AG no ambiente antes das mudancas, degradando o desempenho

do AG. Por outro lado, se o ambiente nao varia severamente, os imigrantes aleatorios po-

dem nao ter efeito positivo mesmo quando ocorre uma mudanca, pois os piores indivıduos

anteriores as mudancas podem ainda ser melhores do que os imigrantes aleatorios apos

as mudancas. Considerando essas colocacoes, uma abordagem baseada em imigrantes

elitistas, denominada elitism-based immigrants genetic algorithm (EIGA), foi proposta

para AGs em ambientes dinamicos (YANG, 2007).

No EIGA, antes das operacoes geneticas, uma sub-populacao, Sei(k), de nei indivıduos

elitistas e usada para criar imigrantes a cada geracao. Em seguida, Sei(k) e mutada com

probabilidade pim. Finalmente, a sub-populacao Sei(k) substitui os piores indivıduos da

populacao atual, P (k). A abordagem baseada nos imigrantes elitistas combina a ideia do

27

elitismo com a abordagem tradicional dos imigrantes aleatorios. A abordagem baseada

nos imigrantes elitistas tem apresentado resultados importantes em ambientes dinamicos,

especialmente quando este apresenta baixo grau de variacao (YANG, 2007).

Figura 2.5 Pseudo-codigo do ERIGA

Com o objetivo de alcancar um grau de variacao de diversidade adequado, as abor-

dagens baseadas em imigrantes elitistas e aleatorios podem ser combinadas. O pseudo-

codigo dessa nova abordagem, denominada elitism-based and random immigrants genetic

algorithm (ERIGA), e apresentado na Figura 2.5.

No ERIGA, os nei(k) imigrantes elitistas, da sub-populacao Sei(k), sao adicionados

aos nri(k) imigrantes aleatorios, da sub-populacao Sri(k), formando uma unica populacao

de imigrantes. Essas duas sub-populacoes de imigrantes substituem os piores indivıduos

da populacao atual, P (k), a cada geracao k. No ERIGA, para proporcionar um melhor

desempenho, os tamanhos das duas sub-populacoes de imigrantes sao ajustadas adap-

tativamente de acordo com seus respectivos desempenhos, no intervalo [nmin, ni − nmin],

sendo nmin o numero mınimo de imigrantes e ni o numero total fixo de imigrantes por

28

geracao, i.e., ni = nei(k) + nri(k). Se uma sub-populacao de imigrantes tem desempenho

pior que outra, seu numero de imigrantes nxi(k) (i.e., nei(k) ou nri(k)) sera reduzido,

como nxi(k) − max{nmin, nxi(k) − α}, sendo α uma constante; enquanto o numero de

imigrantes da abordagem com melhor desempenho aumenta na proporcao inversa. Se os

desempenhos forem iguais, nao havera mudancas nos tamanhos das sub-populacoes.

A ideia basica da abordagem baseada em imigrantes hıbrida e inserir diferentes graus

de diversidade ao ambiente dinamico. O EIGA tem como objetivo inserir suaves mudancas

entre as variacoes do ambiente. O RIGA insere medio grau de mudanca. Justas, essas

duas abordagens podem melhorar o desempenho de AGs em ambientes com diferentes

dinamicas.

2.5.2 Controle da Diversidade

Os metodos de controle da diversidade precisam ter, alem de um valor de referencia, uma

forma de medir a diversidade da populacao. Assim, e possıvel definir uma estrategia de

controle explıcita, baseada em um valor ou faixa de diversidade desejada. A diversidade

da populacao pode mostrar as semelhancas entre os indivıduos e suas distribuicoes no

espaco de solucoes. Na computacao evolucionaria, os metodos que mensuram a diversi-

dade da populacao utilizam dois modelos distintos, o primeiro em funcao das distancias

entre os indivıduos (WINEBERG; OPPACHER, 2003) e o segundo em funcao das distancias

dos indivıduos a um ponto de referencia (URSEM et al., 2002; MEIYI et al., 2004) — nor-

malmente o ponto medio da populacao.

A diversidade em funcao das distancias entre todos os indivıduos pode ser medida

pela expressao

Γ =

N∑

i=1

√√√√i−1∑

j=1

d(gi, gj), (2.14)sendo d(gi, gj) a distancia (e.g., Euclidiana ou de Hamming) entre os indivıduos gi e gj. A

diversidade da Equacao 2.14, com complexidade O(LN2), tem um custo computacional

elevado, o que representa uma desvantagem significante.

Wineberg e Oppacher (2003) propuseram uma medida de menor custo computacional

do que a Equacao 2.14, com complexidade O(LN), baseada na frequencia de ocorrencia

dos alelos, expressa por

29

Γ =N2

2L

L∑

i=1

∑

∀α∈A

fi(α)(1− fi(α)), (2.15)sendo A o conjunto de alelos,

fi(α) =ci(α)

N(2.16)

a frequencia que o alelo α ocorre no i-esimo gene dos indivıduos da populacao,

ci(α) =N∑

j=1

δji(α) (2.17)o numero de ocorrencias de α e δji(α) o delta de Kronecker, que torna-se 1 se o gene no

locus i no cromossomo j for igual a α; ou 0, caso contrario. A diversidade de Wineberg

e Oppacher fica praticamente limitada as implementacoes binarias. Na representacao

inteira6, pode-se ter muitos valores de α, tornando o calculo praticamente inviavel. Na

representacao real7, a diversidade expressa pela Equacao 2.15 nao e viavel porque existem

infinitos α, a nao ser que se considere subintervalos, resultando o mesmo problema da

representacao inteira.

A segunda forma de calcular a diversidade, em funcao de um ponto de referencia no

espaco de solucoes, tem um custo computacional menor, complexidade O(LN), mas nao

mede com tanta precisao a similaridade entre os indivıduos. A diversidade e, normal-

mente, calculada em funcao das distancias dos indivıduos ao ponto medio da populacao.

Este modelo de diversidade fornece uma ideia da dispersao da populacao em torno do seu

ponto medio. Ursem et al. (2002) calcula a diversidade como segue

Γ =1

DN

N∑

i=1

√√√√L∑

j=1

(gij − gj)2, (2.18)sendo D a diagonal do espaco de solucoes, D ⊂ ℜL, gij o j-esimo gene do i-esimo

indivıduo, gj o j-esimo elemento do ponto medio da populacao, g, onde

gj =1

N

N∑

i=1

gij. (2.19)6Na representacao inteira, as variaveis de decisao do problema sao codificadas no genotipo do indivıduo

por numeros inteiros7Na representacao real, as variaveis de decisao do problema sao codificadas no genotipo do indivıduo

por numeros reais

30

Meiyi et al. (2004) calcularam a diversidade pela expressao

Γ = 1 +1

L

L∑

j=1

p(j) ln p(j), (2.20)sendo

p(j) =1

DN

√√√√N∑

i=1

(gij − gj)2. (2.21)As diversidades de Ursem et al. (2002) e Meiyi et al. (2004), Equacoes 2.18 e 2.20,

sao analiticamente distintas, mas ambas sao baseadas em desvios quadraticos em relacao

ao ponto medio. A diferenca fundamental entre essas diversidades e a nao linearidade

presente na Equacao 2.20, que penaliza as medias quadraticas p(j) mais acentuadamente

a medida que se aproximam do ponto medio do eixo cartesiano j.

A preservacao da diversidade da populacao se torna mais importante em problemas

complexos — multiobjetivos e dinamicos. Em problemas dinamicos, um valor adequado

de diversidade aumenta a chance de alcancar o otimo global depois da mudanca do ambi-

ente, pois a populacao estara melhor distribuıda na superfıcie de solucoes. Os algoritmos

para otimizacao multiobjetivo buscam balancear objetivos conflitantes. Assim, uma di-

versidade adequada permite que o AE pesquise uma regiao maior da fronteira de Pareto

e encontre balancos entre os objetivos.

Ursem et al. (2002) criaram um metodo, denominado diversity-guided evolutionary

algorithm (DGEA), com dois modos de evolucao: explotativo e explorativo. No primeiro,

a populacao passa pelos processos de selecao e recombinacao — sem mutacao –, tendendo

a diminuir a diversidade. No modo explorativo, a populacao atual sofre apenas mutacao,

tendendo a aumentar a diversidade. Os modos de evolucao se alternam em funcao de uma

faixa estabelecida de diversidade desejada. O processo evolucionario se inicia pelo modo

explotativo ate que a diversidade atinja um valor mınimo, previamente estabelecido; em

seguida, muda-se o modo de evolucao para o explorativo ate que a diversidade atinja um

valor maximo, previamente estabelecido. Esse processo se repete durante todo o processo

evolucionario. Assim, a diversidade da populacao oscila dentro de uma faixa previamente

estabelecida.

Ursem et al. determinaram valores mınimos e maximos para a diversidade da po-

pulacao iguais a 5 × 10−6 e 0.25, respectivamente, e valores das taxas de cruzamento e

mutacao iguais a 0.9 e 0.75, respectivamente. A desvantagem do metodo de Ursem et

31

al. e nao utilizar conjuntamente selecao, cruzamento e mutacao, que juntos sao a base

dos AEs. O modo explotativo nao possui mutacao e o modo explorativo simplesmente

espalha a populacao na superfıcie do espaco de solucoes por meio de grandes variacoes

no genotipo dos indivıduos — o que pode retira-los de regioes promissoras.

Nguyen e Wong (2003), a partir do trabalho de Beyer e Rudolph (1997)8, utilizaram

a teoria de controle para ajustar a taxa de mutacao em espacos unimodais. Entretanto,

o metodo de Nguyen e Wong pode ser aplicado em espacos multimodais utilizando sub-

populacoes. Os resultados do trabalho de Beyer e Rudolph (1997) estabelecem analiti-

camente que os algoritmos evolucionarios podem ser induzidos a uma convergencia de

ordem linear em espacos unimodais se a diversidade da populacao tiver um decaimento

exponencial em funcao do tempo. No trabalho de Beyer e Rudolph (1997), a diversidade

desejada na geracao k e expressa por

Γd(k) = Γ(k0) exp(−k/τ), (2.22)sendo Γ(k0) a diversidade inicial e τ > 0 uma constante. Essa heurıstica e motivada

pela observacao que, em espacos unimodais, a convergencia implica em uma correspon-

dente reducao na diversidade e que uma taxa de convergencia exponencial necessitara ser

acompanhada por uma reducao exponencial da diversidade.

O metodo de Nguyen e Wong (2003) compara a diversidade atual com a desejada Γd;

quando a diferenca for maior que a tolerancia, a taxa de mutacao e corrigida por um

metodo de controle (OGATA, 1998). O ajuste da taxa de mutacao procede-se como segue

pm(k + 1) = pm(k) exp

(e(k)

e(k)

), (2.23)

sendo e o desvio ou erro entre a diversidade atual e a desejada e e(k) o erro quadratico

medio expresso por

e(k) =√

[e(1)]2 + [e(2)]2 + · · ·+ [e(k)]2, (2.24)O desempenho do metodo de Nguyen e Wong (2003) e comparado com um metodo auto-

adaptativo em varios experimentos, onde obteve resultados melhores.

8O trabalho de Beyer e Rudolph (1997) estabelece analiticamente que os algoritmos evolucionarios

podem ter uma convergencia de ordem linear em espacos unimodais se os parametros geneticos forem

otimizados.

32

2.6 DISCUSSOES FINAIS

Este capıtulo apresentou os principais metodos de controle de parametros da computacao

evolucionaria divididos de acordo com seus mecanismos de adaptacao. O controle de

parametros e um problema complexo, em aberto, que depende nao so do problema em

questao mas tambem do estado atual da busca. Dentre os principais metodos de con-

trole de parametros, foram apresentados metodos determinısticos, adaptativos e auto-

adaptativos.

Um problema tıpico com relacao aos metodos de adaptacao e a dificuldade em en-

contrar problemas gerais que possam avaliar corretamente o desempenho de diferentes

metodos de adaptacao. Alguns trabalhos mostram que valores otimos para as taxas de

operadores de variacao dependem da natureza do espaco da funcao de aptidao e do estado

atual da busca (SMITH; FOGARTY, 1996).

Richter e Paxton (2005) apresentaram um estudo de casos onde foram testados dois

metodos determinısticos e quatro adaptativos. Os resultados mostraram grandes dife-

rencas nos resultados nas varias funcoes de aptidao utilizadas. Alguns metodos que

obtiveram os melhores resultados com uma determinada funcao de aptidao nem sequer

convergiram em outra. Os resultados do trabalho de Richter e Paxton (2005) podem ser

usados como um guia de uso de metodos adaptativos para situacoes especıficas.

A grande maioria dos metodos de controle de parametros mostra resultados melhores

do que processos com parametros fixos. Alguns metodos obtem bons resultados obser-

vando o desempenho de diferentes estrategias (SMITH; FOGARTY, 1997). No entanto, e

importante ressaltar que em alguns problemas, como nos trabalhos de Back (1992), Ri-

chter e Paxton (2005), os metodos que utilizaram parametros fixos obtiveram resultados

melhores do que aqueles com controle de parametros. Smith e Fogarty (1997) levantaram

mais tres questoes importantes, a saber, (i) a necessidade de se manter um nıvel adequado

de diversidade, (ii) a adaptacao a um nıvel apropriado e (iii) a natureza da adaptacao

como uma busca em um espaco de possıveis configuracoes.

Os metodos de auto-adaptacao sinalizam como os mais promissores segundo alguns

pesquisadores (SMITH; FOGARTY, 1997). Tais metodos estao aptos a modificar implici-

tamente os parametros dos operadores. No entanto, essas adaptacoes sao aleatorias, nao

analisam explicitamente direcoes e/ou sensibilidades, mas apenas algumas tendencias. E

possıvel que modificacoes baseadas em direcoes promissoras ou sensibilidade da aptidao

do indivıduo em relacao aos seus componentes possam ser mais adaptaveis ao processo

33

evolucionario e menos parametrizadas.

Dentre os modelos que tratam a diversidade da populacao, os metodos de manutencao

da diversidade tem a desvantagem de nao ajustar os parametros em funcao de um valor

especıfico de diversidade. Por outro lado, esse paradigma pode causar ajustes super ou

subdimensionados, prejudicando a evolucao da populacao. Os modelos de controle da di-

versidade ajustam os parametros em funcao de um valor ou faixa de diversidade desejada.

Entretanto, esses modelos nao formalizaram estudos sobre a diversidade desejada, que

poderiam garantir um melhor desempenho do AE. O modelo de Nguyen e Wong (2003),

dentre os apresentados neste capıtulo, e o que mais se aproxima da proposta deste tra-

balho. No entanto, esse modelo nao pode garantir a convergencia de ordem linear em

espacos multimodais, limitando-o a problemas unimodais, contınuos e estaticos. A pro-

posta de controle de parametros fundamentada por um estudo de modelos e metricas de

diversidade, Capıtulo 3, pode indicar perfis de diversidade adequados as caracterısticas

dos problemas, alem de melhorar a compreensao da dinamica do processo evolucionario.

Esta tese adota a abordagem adaptativa, ao nıvel da populacao, para o controle de

parametros de AEs. Essa escolha se deve a possibilidade da interacao com o processo

evolucionario e a um custo computacional aceitavel. Essa interacao com o processo de

busca pode ser realizada em relacao ao desvio entre as diversidades da populacao e a

determinada e, tambem, em relacao ao desempenho do AE. O emprego do controle adap-

tativo pode contribuir significativamente, possibilitando que os parametros do AE sejam

ajustados durante o processo evolucionario em funcao de objetivos especıficos, Capıtulo

6, possibilitando adequa-los as condicoes do ambiente de busca.

34

CAPITULO 3

GENETICA DE POPULACOES E BIODIVERSIDADE

3.1 INTRODUCAO

A diversidade e uma grandeza que determina o grau de semelhanca entre objetos ou

indivıduos de um conjunto ou populacao de qualquer natureza. Normalmente, busca-

se conservar ou maximizar a diversidade — qualquer que seja a area. Na natureza,

a perda da diversidade, causada pela extincao de algumas especies, pode causar serios

desequilıbrios ecologicos com consequencias irreversıveis ao ecossistema. A preservacao

da diversidade — diversidade biologica ou biodiversidade — e um problema que vem

sendo tratado ha algumas decadas (RAO, 1982; WEITZMAN, 1992; SOLOW et al., 1993;

ONAL, 2003).

Elevados nıveis de diversidade conferem habilidades para que indivıduos, populacoes

ou especies respondam a adversidades, como doencas, parasitas e predadores e se adaptem

ao meio. Por outro lado, baixos nıveis de diversidade tendem a limitar essas habilidades

a curto e longo prazo (AMOS; HARWOOD, 1998; AMOS; BALMFORD, 2001). A diversidade

biologica ou biodiversidade engloba todas as especies de plantas, animais e microorganis-

mos, assim como os ecossistemas e os processos ecologicos dos quais estas especies fazem

parte. A biodiversidade e considerada em tres nıveis (GOEDERT, 2002):

1. Diversidade genetica, que representa a soma total da informacao genetica contida

nos genes de indivıduos de plantas, animais e de microrganismos que habitam a

Terra;

2. Diversidade das especies, que se refere a variedade de organismos vivos na Terra,

que estima-se estar entre 5 e 30 milhoes ou mais; e

3. Diversidade de ecossistemas, que se refere a variedade de habitats, comunidades

biologicas e processos ecologicos na biosfera.

Este capıtulo aborda a diversidade genetica de populacoes, suas caracterısticas e fa-

tores que contribuem para sua variacao ao longo das geracoes. O restante deste capıtulo

35

esta organizado como segue. A Secao 3.2 introduz o conceito de genetica de populacoes.

A Secao 3.3 apresenta as principais metricas de diversidade de especies apresentadas na

literatura. A Secao 3.4 descreve o equilıbrio de Hardy-Weinberg (EHW), a lei que deter-

mina a constancia da distribuicao alelica de uma populacao ideal. A Secao 3.5 expoe os

principais fatores que afetam o equilıbrio da distribuicao alelica de uma populacao real.

A Secao 3.6 apresenta um dos parametros mais utilizados na avaliacao da diversidade de

populacoes, o tamanho efetivo da populacao. A Secao 3.6.1 descreve a populacao ideal

idealizada pelos cientistas Sewall Wright (1931) e Ronald Fisher (1930). A Secao 3.7

apresenta variantes do tamanho efetivo da populacao encontrados na literatura. A Secao

3.8 apresenta as discussoes finais.

3.2 GENETICA DE POPULACOES

O processo evolucionario e sua diversidade genetica podem ser estudados em relacao a

genetica de populacoes (BEIGUELMAN, 2005; CROW; KIMURA, 1970). A populacao e a

unidade evolucionaria, considerando que exista evolucao sempre que a frequencia genica

na populacao se altere significativamente. A frequencia genica e o numero de alelos de

um determinado tipo dividido pelo numero total de alelos.

No entanto, do ponto de vista ecologico, uma populacao corresponde apenas a um

conjunto de indivıduos que ocupa uma dada area geografica em um dado momento. Esse

tipo de definicao nao e adequado como unidade evolucionaria pois nao implica que os

seres se reproduzam, condicao fundamental para a mudanca genetica.

Os genes que constituem o fundo genetico — conjunto de todos os genes presentes

numa populacao num dado momento — sao transmitidos de geracao em geracao, ale-

atoriamente, em novas combinacoes de alelos. Quanto maior o numero de genes que

constituem o fundo genetico da populacao, maior a probabilidade de existir variacao na

geracao seguinte. A determinacao das frequencias genicas de uma populacao em geracoes

sucessivas indica se existe ou nao manutencao do fundo genetico, e se atuam fatores de

evolucao.

3.3 METRICAS DE DIVERSIDADE

A medida de diversidade deve refletir o grau de semelhanca de objetos de um conjunto

particular. A base para a medida de diversidade pode ser atribuıda a diferenca entre pares

36

de objetos. Essa diferenca ou distancia entre pares de objetos, indivıduos ou especies,

(si, sj), e representada por d(si, sj). O metodo que define a distancia entre os pares de

objetos depende do problema em questao. Por exemplo, no trabalho de Champely e

Chessel (2002), a distancia e baseada na pilhagem de substratos. A distancia entre pares

de especies deve satisfazer as seguintes propriedades:

d(si, sj) ≥ 0, (3.1)d(si, si) = 0 (3.2)

e

d(si, sj) = d(sj, si). (3.3)Neste momento, nao e definido o modo de calcular d(·, ·), pois o procedimento esta

ligado a natureza do problema em questao (WEITZMAN, 1992). Por exemplo, pode-se

considerar d(·, ·) como diferencas entre as polıticas de taxas, educacao, ambiental, de

defesa, na diversidade polıtica; diferencas geneticas baseadas em propriedades molecula-

res, na biodiversidade; distancia Euclidiana dos vetores de solucoes, em um problema de

otimizacao ou tomada de decisao.

Outra metrica importante no calculo da diversidade e a distancia entre um objeto si

e um conjunto S, para si /∈ S, definida por

d(si, S) = minsj∈S

d(si, sj), (3.4)sendo d(si, S) a distancia entre o objeto de S mais proximo de si (WEITZMAN, 1992).

Quando d(si, S) e pequeno, uma pequena diversidade e adicionada quando si e introduzido

em S, e vice-versa.

A distancia d(si, S) pode ser aproximada como a derivada da funcao diversidade Γ(·)

em relacao ao objeto si (WEITZMAN, 1992). Essa aproximacao pode ser formalizada pela

analogia da equacao da derivada ou primeira-diferenca, como segue

d(si, S) = Γ(S ∪ si)− Γ(S). (3.5)E desejavel, portanto, que a funcao diversidade Γ(·) satisfaca as seguintes propriedades

matematicas (SOLOW et al., 1993; WEITZMAN, 1992):

37

1. Monotonicidade em relacao a um objeto: se um objeto si e adicionado ao conjunto

S, entao Γ(S + si) ≥ Γ(S) + d(si, S). Esta propriedade expressa a ideia que adicio-

nando um novo objeto ao conjunto S, a diversidade desse conjunto aumentara em,

no mınimo, a distancia entre o objeto de S mais proximo de si.

2. Equivalencia: para um conjunto S, N ≥ 2, existe no mınimo um objeto si que

satisfaz a condicao Γ(S) = d(si, S − si) + Γ(S − si).

3. Igualdade: supondo existir si ∈ S e sj /∈ S, tal que d(si, sj) = 0 e d(si, sk) =

d(sj, sk), ∀sk ∈ S. Assim, se sj for adicionado a S, entao Γ(S + sj) = Γ(S) (i.e.,

d(sj, S) = 0).

4. Continuidade em relacao a distancia: dados dois conjuntos S e Q, de tamanhos

iguais, e φ uma funcao um-para-um que mapeia S para Q. Entao, ∀κ > 0, ∃δ > 0

tal que

∑

si∈S

∑

sj∈S

|d(si, sj)− d(φ(si), φ(sj))| < δ,

si 6= sj , implica que

|Γ(S)− Γ(Q)| < κ.

5. Monotonicidade em relacao a distancia: dado dois conjuntos S e Q, de tamanhos

iguais, e φ uma funcao um-para-um que mapeia S para Q. Supondo que

d(φ(si), φ(sj)) > d(si, sj),

∀si, sj ∈ S, si 6= sj. Entao,

Γ(Q) > Γ(S).

6. Maxima diversidade que pode ser adicionada por uma especie: se uma especie si

for adicionada a S, entao

Γ(S + si) ≤ Γ(S) +D(si, S),

∀si /∈ S, sendo D(si, S) a maxima distancia de si ao conjunto S,

38

D(si, S) = maxsj∈S

d(si, sj).

A medida de diversidade de um conjunto de objetos ou especies pode ser calculada de

varias formas (WEITZMAN, 1992; SOLOW et al., 1993; CHAMPELY; CHESSEL, 2002; ONAL,

2003; WEIKARD et al., 2006). Essas formas sao baseadas nas distancias entre objetos

(Equacao 3.4).Rao (1982) criou uma funcao de diversidade baseada em uma distribuicao de proba-

bilidade de um conjunto finito de especies. A diversidade de Rao emprega a distancia

d(s1, s2) entre duas especies X = s1 e X = s2, sendo X uma variavel aleatoria com

distribuicao de probabilidade conhecida, definida sobre um conjunto finito de especies. A

funcao de diversidade de Rao e definida como a distancia media entre pares de especies,

isto e,

Γ =ns∑

i=1

ns∑

j=1

pi pj d(si, sj), (3.6)sendo ns o numero de especies e pi = P (X = si).

Weitzman (1992) elaborou um metodo de conservacao da diversidade, cujo valor e

calculado recursivamente pela expressao

Γ(S) = maxsi∈S

Γ(S − si) + d(si, S), ∀si ∈ S (3.7)que tem uma solucao unica se a condicao Γ(si) = d0, e definida, sendo d0 ≥ 0 uma

constante.

Solow et al. (1993) elaboraram uma funcao, denominada medida de preservacao, que

representa a perda da diversidade quando uma especie si e extinta, isto e, mostra o

impacto causado na diversidade pela extincao de si. A funcao perda de diversidade e

expressa por

∆Γ = −∑

si /∈S

d(si, S). (3.8)A partir do trabalho de Rao (1982), Champely e Chessel (2002) criaram uma funcao

de diversidade utilizando a distancia Euclidiana entre as especies, definida como

Γ =1

2

ns∑

i=1

ns∑

j=1

pi pj [d(si, sj)]2. (3.9)

39

Shannon (1948) derivou uma funcao de diversidade da teoria da informacao, descrita

como

SH = −

ns∑

i=1

pi log2 pi, (3.10)sendo pi a taxa de ocorrencia do i-esimo alelo, indivıduo ou especie no conjunto S.

A funcao de diversidade de Simpson (MAGURRAN, 2004) e expressa de quatro formas:1S =

∑ns

i=1 pi log2 pi,2S = 1− 1S, 3S = 1/1S e 4S = (3S − 1)/2. O ındice 2S e a chance

da escolha aleatoria de duas entidades diferentes, tambem chamado de heterozigosidade

(He), tal que

He = 1−ns∑

i=1

p2i , (3.11)

A diversidade entre especies tem caracterısticas diferentes da diversidade de uma

populacao. No primeiro caso, as especies sao sempre diferentes umas das outras. Em uma

populacao, ainda que improvavel, dois indivıduos podem ser geneticamente identicos. Na

diversidade de especies, a entrada de uma especie ao conjunto S causa, obrigatoriamente,

aumento da diversidade, e vice-versa. Em populacoes, a entrada de um indivıduo ao

conjunto S pode causar aumento ou diminuicao da diversidade.

Portanto, as funcoes de diversidade 3.6, 3.7, 3.8 e 3.9 devem ser utilizadas, preferenci-

almente, em problemas de diversidade de especies. Ademais, essas funcoes satisfazem as

propriedades definidas por Weitzman (1992). As funcoes de diversidade 3.10 e 3.11 sao

mais flexıveis por tratarem proporcoes de objetos ao inves de distancias entre os mesmos.

Assim, e possıvel quantificar a diversidade tanto de especies quanto de populacoes.

3.4 EQUILIBRIO DE HARDY-WEINBERG

O ramo da genetica destinado ao estudo da dinamica dos genes nas populacoes naturais

e denominado genetica das populacoes, cuja base se estabelece no equilıbrio de Hardy-

Weinberg (LI, 1988; BEIGUELMAN, 2005; STARK, 2005). Este princıpio, descoberto in-

dependentemente pelo matematico ingles Godfrey Hardy (1908) e pelo medico alemao

Wilhelm Weinberg (1908), determina que se nao existem fatores evolutivos atuando so-

bre uma populacao, as frequencias genicas permanecerao inalteradas e as proporcoes

genotıpicas atingiriam um estado de equilıbrio.

40

A importancia do teorema de Hardy-Weinberg esta no fato de se estabelecer um

modelo para a dinamica dos genes. Assim, e possıvel estimar as frequencias genicas e

genotıpicas em geracoes sucessivas e compara-las com valores obtidos na pratica. Se

houver um desvio entre os valores do modelo de Hardy-Weinberg e os reais, conclui-se

que fatores evolutivos estao atuando sobre essa populacao e que ela esta evoluindo. Caso

contrario, a populacao esta em equilıbrio.

O equilıbrio de Hardy-Weinberg foi provado, de forma irrefutavel, em uma populacao

teorica, que nao esteja sujeita aos fatores evolutivos, que obedeca as seguintes premissas:

1. A populacao e infinita, eliminando, portanto, a deriva genetica.

2. Existe o mesmo numero de generos masculinos e femininos.

3. Os cruzamentos ocorrem aleatoriamente, permitindo os consanguıneos desde que

ocorram aleatoriamente.

4. Todos os pares tem o mesmo grau de fertilidade e geram o mesmo numero de filhos.

5. Nao existe mutacao.

6. Nao existe pressao de selecao natural, nao existindo fatores que aumentem ou di-

minuam a sobrevivencia de indivıduos com determinado genotipo.

7. Nao existe migracao.

A partir das premissas supracitadas, considerando uma populacao panmıtica1 com N

indivıduos diploides, N →∞, que se reproduz por fecundacao cruzada, apenas um locus

genico e dois alelos tipo A e a, as frequencias genotıpicas dos indivıduos com genotipos

AA, Aa e aa sao, respectivamente, definidas como

f(AA) =nAAN

= r, (3.12)f(Aa) =

nAaN

= s, (3.13)e

f(aa) =naaN

= t, (3.14)1Em uma populacao panmıtica os cruzamentos sao realizados ao acaso.

41

sendo nAA, nAa e naa o numero de indivıduos com genotipos do tipo AA, Aa e aa,

respectivamente. Os valores nAA, nAa e naa sao chamados frequencias absolutas. As

frequencias genicas ou alelicas sao definidas como segue

p =nA2N

=2nAA + nAa

2N= r +

1

2s (3.15)

e

q =na2N

=2naa + nAa

2N= t+

1

2s, (3.16)

sendo nA e na o numero de alelos A e a, respectivamente. Os valores nA e na sao

frequencias absolutas e as frequencias genotıpicas e genicas sao relativas. As frequencias

genotıpicas, em populacoes muito grandes, podem ser consideradas probabilidades, isto

e, r e a probabilidade de se tomar, ao acaso, um indivıduo AA dessa populacao. Consi-

derando que r + s+ t = 1 e p+ q = 1, isto e

nAA + nAa + naaN

= 1 (3.17)e

nA + na2N

= 1. (3.18)Assim, o binomio (p+ q)2 = 1 proporciona a seguinte distribuicao genica

p2 + 2pq + q2 = (r +1

2s)2 + 2(r +

1

2s)(t+

1

2s) + (t+

1

2s)2 = 1. (3.19)

O equilıbrio de Hardy-Weinberg, definido pela Equacao 3.19, estabelece que as frequencias

genicas se mantem constantes ao longo das geracoes.

Considerando as frequencias genotıpicas, a probabilidade de dois indivıduos AA, com

frequencias genotıpicas r, cruzarem e r × r = r2. Assim, e possıvel montar um quadro

de probabilidades de ocorrencias de cruzamentos ao acaso entre os tipos de genotipos,

Tabela 3.1.

Para provar o equilıbrio de Hardy-Weinberg, a Tabela 3.2 mostra as possıveis com-

binacoes de casais (pares de genotipos), suas respectivas probabilidades de ocorrencias e

as frequencias genotıpicas na geracao dos descendentes. Para verificar a descendencia dei-

xada por cada casal, supoe-se que este numero nao depende dos genotipos dos indivıduos

que formam o casal e que o numero de descendentes por casal e o mesmo. Assim, e

42

Tabela 3.1 Probabilidades de cruzamento ao acaso.

possıvel calcular a frequencia de descendentes de cada classe de casal pelas suas respecti-

vas frequencias de cruzamentos. A partir da frequencia genotıpica da populacao inicial, e

possıvel observar que esta distribuicao se mantem na primeira geracao de filhos — como

preve o equilıbrio de Hardy-Weinberg.

Tabela 3.2 Distribuicoes genotıpicas em uma geracao de descendentes.

Nas frequencias genotıpicas resultantes da primeira geracao de descendentes, ultima

linha da Tabela 3.2, considerando as relacoes estabelecidas pelas Equacoes 3.15 e 3.16,observa-se a mesma distribuicao inicial estabelecida pela lei do equilıbrio de Hardy-

Weinberg, Equacao 3.19.3.5 FATORES QUE AFETAM O EQUILIBRIO DE HARDY-WEINBERG

Quando os fatores estabilizadores, citados na secao anterior, nao ocorrem na populacao, as

frequencias genicas tendem a variar, prevalecendo um ou um numero limitado de alelos.

A seguir sao apresentados os fatores que acabam com o equilıbrio de Hardy-Weinberg

43

(EHW) em uma populacao (CROW; KIMURA, 1970; LEBERG, 1992; AMOS; HARWOOD,

1998; FRANKHAM et al., 2002; DARWIN, 2004; BEIGUELMAN, 2005).

3.5.1 Mutacao

O efeito da mutacao na frequencia genica depende da adaptabilidade que os indivıduos

mutados apresentem, tanto para reproducao como para sobrevivencia. Pode-se considerar

que a diversidade genica e consequencia de mutacoes sucessivas, pois estas sao a unica

fonte de variabilidade conhecida no conjunto de todos genes de um determinado tipo —

fundo genico. Contudo, a mutacao nao consegue alterar o sentido da evolucao pois ocorre,

espontaneamente, com taxas da ordem de 10−6. A mutacao apenas cria diversidade

(RIDLEY, 2004).

3.5.2 Cruzamentos Nao-Aleatorios

Nas populacoes naturais, os cruzamentos podem ocorrer ao acaso, situacao em que as

frequencias genicas, em media, nao se alteram. No entanto, em populacoes reais, geral-

mente, isso nao acontece, pois a manutencao do fundo genetico implicaria ausencia de

evolucao.

Em uma populacao tıpica, apenas alguns indivıduos se reproduzem, geralmente os

indivıduos mais virtuosos ou melhor adaptados ao meio. Os indivıduos selecionam os

seus parceiros, privilegiando os seus semelhantes e proximos, aumentando a homozigotia2

e fazendo surgir anomalias geneticas.

Em uma populacao real, a probabilidade de um indivıduo reproduzir esta, normal-

mente, relacionada a sua aptidao ou sucesso reprodutivo, que depende da capacidade de

sobrevivencia ate a idade reprodutiva.

3.5.3 Deriva Genetica

A deriva genetica e um processo estocastico, temporario, que modifica as frequencias

genicas das especies ao longo do tempo. A deriva genetica e mais frequente em populacoes

com tamanhos efetivos reduzidos, sendo que as alteracoes induzidas poderao nao ser

adaptativas.

2Situacao em que a maioria ou totalidade de uma populacao e constituıda de indivıduos com genotipos

AA ou aa.

44

Geralmente, a deriva genetica ocorre em populacoes cujo efetivo reprodutor e inferior

a 100 indivıduos. Conclui-se que o efetivo reprodutor nao possui uma amostra total do

fundo genetico da populacao original. Esses desvios podem, aleatoriamente, levar ao

desaparecimento de certos alelos e fixacao de outros, independentemente do seu valor

adaptativo.

A diminuicao da frequencia de determinados alelos em populacoes pequenas reduz a

capacidade de adaptacao as alteracoes ambientais, o que pode levar ao declınio da especie,

por fixacao de alelos menos favoraveis.

3.5.4 Selecao Natural

A selecao natural pode ser definida como uma diferenca na viabilidade e fertilidade dos in-

divıduos. Algumas mutacoes sao desfavoraveis ou mesmo letais, mas seu acumulo devera

ser descartado pela selecao pois o mutante com caracterısticas desfavoraveis provavel-

mente sera eliminado.

A teoria de Darwin considera que so parte da descendencia sobrevive e se reproduz

e diferentes casais produzem diferentes numeros de descendentes viaveis. Assim, os por-

tadores de caracterısticas com maior capacidade adaptativa constituem a maioria dos

sobreviventes e, nas geracoes seguintes, tenderao a aumentar.

A selecao natural e um dos fatores mais importantes no controle da microevolucao

— alteracoes simples na frequencia genica em populacoes locais. A selecao e responsavel

pelas alteracoes de maiores dimensoes e pela aparicao de novos grupos taxonomicos — ma-

croevolucao. Tais alteracoes sao o resultado de centenas ou milhares de microevolucoes,

unidas e ampliadas pela pressao seletiva do ambiente.

3.5.5 Efeito Gargalo

O efeito de gargalo e um evento evolucionario em que, por um motivo qualquer, uma

porcentagem significativa de uma populacao morre ou e impedida de se reproduzir. Este

efeito faz aumentar a deriva genetica em uma populacao, que e inversamente proporcional

ao tamanho efetivo da populacao.

Uma consequencia natural do efeito gargalo e a perda da diversidade. Mesmo com a

retomada do tamanho inicial da populacao, a reducao do fundo genetico nao permite que

a diversidade original seja alcancada.

A perda da diversidade tende a ser um indicador de gargalo mais sensıvel que outros

45

indicadores, como a reducao da heterozigosidade (BROOKES et al., 1997). Esse fenomeno

pode ser observado na cadeia de DNA, onde cada locus genico pode ter 100 ou mais alelos

e a reducao de apenas quatro desses alelos pode ser claramente visualizado (GILBERT et

al., 1990).

3.5.6 Tamanho da Populacao

Variacoes das frequencias genotıpicas e genicas ocorrem em grandes populacoes, embora

estes efeitos sejam mais significativos em populacoes menores equivalentes3. Fatores como

o efeito gargalo e a migracao unidirecional reduzem o tamanho da populacao acentuando

a acao de mecanismos como deriva genetica e selecao nas frequencias genotıpicas e genicas

(RAIJMANN et al., 1994; SHAW et al., 1994).

3.6 TAMANHO EFETIVO DA POPULACAO

Quando os efeitos da mutacao, selecao e migracao nao estao presentes, algumas propri-

edades geneticas, tais como heterozigosidade, frequencia genica e genotıpica, se mantem

constantes em uma populacao infinitamente grande. Em uma populacao finita, no en-

tanto, essas propriedades se modificam de geracao para geracao como consequencia de

um processo estocastico — deriva genetica —, resultado da amostragem de um numero

finito de gametas durante a reproducao e sobrevivencia (WANG, 2005). Fisher (1930)

e Wright (1931), ao estudarem o efeito da deriva genetica sobre populacoes pequenas,

criaram o conceito e a teoria matematica do tamanho efetivo da populacao (Ne).

O tamanho efetivo da populacao (Ne) e definido como o tamanho de uma populacao

ideal de Wright-Fisher (FISHER, 1930; WRIGHT, 1931) tal que algumas propriedades

geneticas, tais como heterozigosidade, frequencia genica e genotıpica, tenham as mesmas

caracterısticas comportamentais da populacao real em questao (WRIGHT, 1931; CROW;

KIMURA, 1970; CABALLERO, 1994; FRANKHAM et al., 2002; HANSEN et al., 2006).

Existe um forte interesse em conhecer o tamanho efetivo de populacoes naturais e

artificiais em estudos de diversas areas, como genetica de populacoes, evolucao e con-

servacao das especies (WANG, 2005). Em situacoes que o tamanho efetivo Ne e pequeno,

a populacao pode rapidamente perder a diversidade genetica (CROW; DENNISTON, 1988;

FRANKHAM, 1995; SCHWARTZ et al., 1998). O conhecimento do tamanho efetivo Ne e

3As populacoes sao equivalentes em frequencia genica, porem, com tamanhos diferentes.

46

uma informacao importante porque pode prever a perda da diversidade genetica de uma

populacao ou probabilidade de extincao de uma especie (LEBERG, 2005).

3.6.1 Modelo de Wright-Fisher

O modelo de Wright-Fisher (WRIGHT, 1931; FISHER, 1930) (MWF) representa um modelo

de populacao ideal, composta de N indivıduos diploides ou 2N indivıduos haploides, onde

cada descendente tem apenas um ascendente.

O modelo de Wright-Fisher possui as seguintes caracterısticas:

1. O tamanho da populacao e constante, portanto, as geracoes nao se sobrepoem.

2. Os descendentes sao gerados por cruzamentos aleatorios.

3. Cada descendente herda as informacoes geneticas do seu ascendente.

4. O numero de filhos gerado por cada indivıduo segue uma distribuicao de Poisson.

5. Nao ha selecao.

Em uma populacao ideal de Wright-Fisher, todos os indivıduos tem igual probabi-

lidade de serem geradores de descendentes. No entanto, em populacoes reais, apenas

uma parte dos indivıduos produz descendentes. Portanto, apenas essa parcela de gera-

dores influenciara a estrutura genetica da geracao descendente e o tamanho efetivo da

populacao.

O tamanho efetivo da populacao depende de varios fatores demograficos e ecologicos

(NUNNEY, 1993; NOMURA, 2005b). Na ausencia de selecao e com a distribuicao de Poisson

para o numero de filhos por casal, o tamanho efetivo da populacao e diretamente ligado

ao numero de pais (WRIGHT, 1931) e pode ser definido como segue

Ne =4NmNf

Nm +Nf, (3.20)

sendo Nm e Nf o numero de generos masculinos e femininos, respectivamente.

Em uma populacao ideal, existem Ne indivıduos reprodutores, com o mesmo numero

de generos masculinos e femininos que se cruzam de forma aleatoria e a queda da va-

riabilidade genetica e 1/(2Ne). O tamanho efetivo da populacao define o tamanho de

uma populacao ideal cujo efeito da deriva genetica sobre a frequencia genica ou a taxa

de decaimento da heterozigosidade e a mesma na populacao atual. O tamanho efetivo

47

da populacao pode ser visto como uma medida de representatividade genetica de uma

amostra de indivıduos e e um importante parametro na genetica de populacoes, pois

mede a taxa de deriva genetica e cruzamento consanguıneo (WANG, 1997; SANTIAGO;

CABALLERO, 1998; VENCOVSKY; CROSSA, 1999).

3.6.2 Tipos de Tamanho Efetivo

Existem varios fatores que afetam o tamanho efetivo da populacao, a saber, o numero

de descendentes viaveis, o numero de filhos gerados por par de indivıduos, a variacao no

numero de indivıduos por geracao, a desigualdade de sexos na populacao, dentre outros.

Por consequencia, existem muitas formas de encontrar o tamanho efetivo da populacao,

dependendo da propriedade genetica de interesse. Por exemplo, o tamanho efetivo da po-

pulacao pode ser calculado em funcao da variancia das frequencias genotıpicas ou genicas,

do grau de cruzamentos consanguıneo, da mutacao ou da deriva genetica (CROW; KIMURA,

1970; EWENS, 1982; GREGORIOUS, 1991; CABALLERO, 1994; CROSSA; VENCOVSKY, 1994;

CHARLESWORTH et al., 2003).

Os conceitos de tamanho efetivo da populacao mais utilizados sao o tamanho efetivo

por consanguinidade ou perda de heterozigosidade (em ingles, inbreeding effective popu-

lation size) e o tamanho efetivo por variancia (em ingles, variance effective population

size). O tamanho efetivo por perda de heterozigosidade (Ne(h)) preve a taxa de perda de

heterozigosidade. O tamanho efetivo por variancia (Ne(v)) mede a variancia da mudanca

da frequencia genica. Em situacoes complexas, onde a demografia das populacoes varia

ou nao existe um estado de equilıbrio, essas duas medidas de tamanho efetivo Ne podem

ser muito diferentes (CHESSER et al., 1993; WANG, 1997). Todavia, Ne(h) e Ne(v) podem

ser aproximadamente iguais em populacoes em equilıbrio ou assintoticamente iguais em

populacoes em desequilıbrio quando a media harmonica e utilizada no calculo do tamanho

efetivo (POLLAK, 2002).

A partir dos modelos basicos de tamanho efetivo por perda de heterozigosidade e

por variancia, muitos modelos foram derivados (ROBERTSON, 1961; CROW; KIMURA,

1970; GREGORIUS, 1991; CABALLERO, 1994; LEBERG, 2005; WANG, 2005). As proximas

subsecoes apresentam alguns modelos basicos do tamanho efetivos da populacao, a saber,

por perda de heterozigosidade, por variancia, com tamanho da populacao variavel e com

selecao.

48

3.6.3 Tamanho Efetivo por Perda de Heterozigosidade

A heterozigosidade, He, de uma populacao pode ser definida como a probabilidade de dois

alelos quaisquer serem diferentes em um fundo genetico. Em uma populacao de Wright-

Fisher sem mutacao com tamanho 2N , a probabilidade de dois indivıduos na geracao

1 terem um mesmo ascendente da geracao 0 e 1/(2N). Esses mesmos dois indivıduos

tem, obviamente, uma probabilidade 1 − 1/(2N) de terem ascendentes diferentes, que

por sua vez tem probabilidade He(0) de serem diferentes entre si. Assim, na geracao 1, a

probabilidade de dois indivıduos serem diferentes e definida por

He(1) =1

2N· 0 + (1−

1

2N) ·He(0)

= (1−1

2N)He(0). (3.21)

Conclui-se, pois, que a perda de heterozigosidade a cada geracao em uma populacao ideal

de Wright-Fisher pode ser definida como

∆He =He(k)

He(k − 1)= 1−

1

2N. (3.22)

Assim, a dinamica da heterozigosidade, considerando duas geracoes sucessivas, pode

ser descrita como

He(k + 1) = He(k)

(1−

1

2N

). (3.23)

Generalizando, a heterozigosidade de uma populacao de tamanho fixo N na geracao

k pode ser expressa em funcao da sua heterozigosidade inicial, como segue

He(k) = He(0) (1−1

2N)k. (3.24)

Considerando N , Equacao 3.22, o tamanho efetivo da populacao por perda de hete-

rozigosidade, Ne(∆He), pode-se defini-lo como

Ne(∆He) =1

2(1−∆He), (3.25)

tambem chamado de tamanho efetivo da populacao por cruzamento consanguıneo (do

ingles, inbreeding effective population size).

49

3.6.4 Tamanho Efetivo por Variancia

Em uma populacao ideal, a amostra de gametas e binomial e a variancia da mudanca da

frequencia genica pode ser expressa como

σ2∆p =

p(1− p)

2N, (3.26)

sendo p a frequencia genica de um dado alelo em uma populacao ideal infinita. Assim,

em uma populacao ideal de Wright-Fisher, pode-se definir, a partir da Equacao 3.26, o

tamanho efetivo da populacao por variancia como

Ne(σ2) =

p(1− p)

2 σ2∆p

. (3.27)3.6.5 Tamanho Efetivo com N Variavel

Em uma populacao nao ideal com tamanho variavel ao longo das geracoes, a perda de

heterozigosidade na geracao k pode ser expressa como

He(k) = He(0)(1−1

2N(0))× · · · × (1−

1

2N(k − 1)). (3.28)

Considerando a populacao ideal de Wright-Fisher equivalente, que possui a mesma taxa

de perda de heterozigosidade, tem-se

(1−2

2Ne)k = (1−

1

2N(0))× · · · × (1−

1

2N(k − 1)) (3.29)

e, portanto,

1−2

2Ne=

((1−

1

2N(0))× · · · × (1−

1

2N(k − 1))

)1/k

. (3.30)Aproximando

1−2

2Ne

≈1

2k

((1−

1

2N(0)) + · · ·+ (1−

1

2N(k − 1))

), (3.31)

obtem-se

Ne ≈t

1N(0)

+ · · ·+ 1N(k−1)

, (3.32)que corresponde a media harmonica da sequencia N(0), · · · , N(k − 1).

50

3.6.6 Tamanho Efetivo com Selecao

Dentre os fatores que influenciam o tamanho efetivo da populacao, a variacao do numero

de descendentes gerado por indivıduo e um dos que provocam maior efeito (CROW; DEN-

NISTON, 1988; CABALLERO, 1994; NOMURA, 2005b). O problema do efeito da selecao

sobre o tamanho efetivo da populacao foi tratado pela primeira vez por Robertson (1961),

que introduziu a ideia do efeito acumulativo da selecao ao longo das geracoes. Sobre o

efeito da selecao, o tamanho Ne pode ser obtido pela formula desenvolvida por Wright

(1938), como segue

Ne =4N

2 + Vk, (3.33)

sendo Vk a variancia do numero de descendentes gerado por indivıduo. Sobre o efeito da

selecao, a variancia Vk se torna

Vk = S2k + 4C2, (3.34)

sendo S2k o componente amostral da variancia (que e igual a variancia Vk na selecao

aleatoria) e 4C2 o componente resultante de fatores nao-aleatorios (e.g., aptidao e selecao

natural). O tamanho efetivo da populacao apos uma geracao se torna

Ne =4N

2 + S2k + 4C2

. (3.35)A Equacao 3.35 nao considera o efeito acumulativo da selecao. Quando a selecao e

contınua, geracao a geracao, o tamanho efetivo da populacao decai com as geracoes e se

aproxima de um valor assintotico (NOMURA, 2005a). Para incorporar o efeito acumula-

tivo, Robertson (1961) introduziu o efeito acumulativo da selecao ao longo das geracoes.

Nesse modelo, espera-se que a vantagem seletiva de um indivıduo sobre seus descendentes

seja de 50% por geracao. A vantagem seletiva total ao longo das geracoes torna-se

Q = 1 +1

2+ (

1

2)2 + (

1

2)3 + · · · = 2, (3.36)

o que significa que o componente seletivo 4C2 da variancia Vk deve ser multiplicado por

Q2 para se obter a previsao assintotica. Portanto, o tamanho efetivo assintotico e definido

por

Ne =4N

2 + S2k + 4Q2C2

. (3.37)51

Detalhes heurısticos e teoricos da serie da Equacao 3.36 sao apresentados por Robertson

(1961), Wray e Thompson (1990) e Santiago e Caballero (1995).

3.6.7 Desvio do Equilıbrio de Hardy-Weinberg

Na ausencia de selecao, mutacao e migracao, uma populacao infinita em geracoes discretas

e com cruzamentos aleatorios atende o equilıbrio de Hardy-Weinberg (EHW). Em uma

populacao finita, a deriva genetica produz desvios tanto na frequencia genica quanto

na heterozigosidade (KIMURA; CROW, 1963). O desvio em relacao ao EHW para uma

populacao de Wright-Fisher de tamanho N , segundo Crow e Kimura (1970), pode ser

calculado pela expressao

α = −1

2N − 1. (3.38)

Esse desvio pode ser atribuıdo a amostra estatıstica aleatoria de um numero finito de

descendentes.

A variacao do desvio do EHW em relacao ao tamanho da populacao e dado pela

derivada

dα

dN=

2

(2N − 1)2. (3.39)

Para uma populacao muito grande tem-se

dα

dN≈

1

2N2,

e para uma populacao ideal de Hardy-Weinberg, N → ∞, tem-se dα/dN = 0, isto e, α

nao varia e nao ha desvio do EHW.

Pode-se verificar, pela Equacao 3.39, que quanto maior o tamanho da populacao,

menor a sensibilidade do desvio α as variacoes de N .

O desvio α tem influencia direta no tamanho efetivo da populacao, que tende a dimi-

nuir a medida que o desvio do EHW aumenta, pois em uma populacao ideal de Wright-

Fisher tem-se

Ne =1

2(1− α). (3.40)

52

3.7 OUTROS TAMANHOS EFETIVOS DA POPULACAO

Existem varios outros metodos para calcular o tamanho efetivo da populacao. Por exem-

plo, Crow e Kimura (1970) definiram Ne baseado na variancia do numero de descendentes

por indivıduo, como segue

Ne =2N(k + 1)

σ2

µ(1 + αk) + (1− αk))

, (3.41)sendo µ a media de descendentes por indivıduo, σ2 a variancia e Nk+1 o numero de

descendentes na geracao k + 1. Em uma populacao com cruzamento aleatorio, segundo

Crow e Kimura, espera-se

αk =−1

2N(k)− 1. (3.42)

Quando 2N(k) e muito grande, considerando αk = 0 em uma populacao panmıtica, nao

ocorrera um desvio significativo em Ne. Assim, a variancia do tamanho efetivo torna-se

Ne =2N(k − 1)

σ2

µ+ 1

. (3.43)Pudovkin et al. (1996) determinou o tamanho efetivo da populacao para indivıduos

bialelicos como segue

Ne =1

2D+

1

2(D + 1), (3.44)

sendo D = He/(He − H ′e), He = 2p(1 − p) e H ′

e a heterozigosidade esperada. Para

loci/indivıduos multialelicos, D e definido pela Equacao 3.11.Alguns modelos estimam o tamanho efetivo da populacao de forma temporal, com

amostras de duas ou mais geracoes. Em um modelo basico, amostras de alelos em duas

geracoes subsequentes sao colhidas e analisadas. O objetivo e estimar a variancia tem-

poral da frequencia genica, F , refletindo a magnitude da deriva genetica. Existem varios

estimadores de F , por exemplo, Nei e Tajima (1981) o definiu como

F =1

na

na∑

i=1

(pi − qi)2

12(pi + qi) + pi qi

, (3.45)sendo pi e qi as frequencias genicas do alelo i em um locus com na alelos na primeira e

segunda amostras de geracoes nao necessariamente subsequentes, respectivamente. Com

o valor estimado, F , encontra-se o tamanho efetivo da populacao como

53

Ne =k − 2

2(F − 1

2A(0)− 1

2A(k)

) , (3.46)sendo A(0) e A(k) o numero de amostras nas geracoes 0 e k, respectivamente.


Este capıtulo introduziu conceitos importantes da biodiversidade, em especial na diver-

sidade genetica de populacoes. Uma das metricas mais importante para determinar a

diversidade de especies e populacoes foi apresentada e analisada. A enfase deste capıtulo

foi apresentar conceitos que descrevem a representatividade e a dinamica da diversidade

genetica de populacoes.

Pode ser destacado o equilıbrio de Hardy-Weinberg como um dos conceitos mais

importantes do tema em questao, pois mostra a perda da diversidade como uma con-

sequencia da evolucao das especies ou populacoes. O desvio desse equilıbrio, Secao 3.6.7,

mostra a sensibilidade da diversidade em relacao ao tamanho da populacao. O desvio do

EHW, alem de um importante indicador de perda de diversidade, pode ser utilizado para

auxiliar o calculo da diversidade de populacoes.

O tamanho efetivo da populacao, apresentado na Secao 3.6, e outro importante con-

ceito porque pode quantificar a deriva genetica, um fenomeno aleatorio que contribui

de forma significante para o decaimento da diversidade. Alem dos conceitos basicos, fo-

ram apresentados modelos derivados, encontrados na literatura, que podem ser utilizados

como modelos de referencia de diversidade, ou como pontos de partida para estes.

54

CAPITULO 4

CONTROLE ADAPTATIVO E DE FUNCAO DE

DISTRIBUICAO DE PROBABILIDADE

4.1 INTRODUCAO

O objetivo do controle e direcionar o comportamento de sistemas dinamicos. Isso sig-

nifica manter a saıda do processo em valores constantes (regulacao) ou forca-la a seguir

uma funcao do tempo (rastreamento). Este capıtulo apresenta duas abordagens diferen-

tes de sistemas de controle, o controle adaptativo (NARENDRA; ANNASWAMY, 2005) e o

controle de funcao de distribuicao de probabilidade (WANG, 2000a). A primeira aborda-

gem, apresentada na Secao 4.4, se aplica a sistemas onde existem incertezas em relacao

aos parametros do processo. A segunda abordagem, apresentada na Secao 4.5, se aplica

a sistemas estocasticos, onde, normalmente, o objetivo e controlar a saıda media ou a

variancia da saıda.

Narendra (1996) classificou em tres nıveis as dificuldades encontradas em sistemas de

controle: (i) complexidade, (ii) nao linearidade e (iii) incerteza. Na grande maioria dos

problemas de controle, existe um certo grau de incerteza em relacao ao processo a ser

controlado. A estrutura e/ou os parametros do processo podem variar de maneira des-

conhecida. Uma das formas de tratar as incertezas e utilizar o controle adaptativo, que

identifica ou estima os parametros nao conhecidos do processo ou ajusta os parametros

do controlador (ASTROM; WITTENMARK, 1995; WITTENMARK, 2002; NARENDRA; AN-

NASWAMY, 2005).

O controle adaptativo e um sistema de controle que adapta a propria estrutura em

funcao das condicoes do ambiente. Em outras palavras, o controle adaptativo ajusta a

estrategia de controle de acordo com as mudancas na dinamica do processo. Assim, o

controle adaptativo pode ser definido como um controle com parametros ajustaveis e um

mecanismo para ajustar estes parametros (ASTROM; WITTENMARK, 1995).

Nao existe uma definicao formal totalmente aceita sobre o que e o controle adaptativo.

No entanto, ha um consenso que um sistema de controle de ganho constante nao e um

55

sistema adaptativo. Em decorrencia da existencia do mecanismo de ajuste dos parametros

do controlador, o controle em geral torna-se nao-linear, aumentando a complexidade do

seu projeto. O esquema de controle adaptativo generico, apresentado na Figura 4.1, possui

dois lacos, o primeiro — presente em todo sistema de controle realimentado — fornece

a resposta do processo aos ajustes do controlador, o segundo laco — presente apenas

no controle adaptativo — fornece a resposta do mecanismo de ajuste de parametros do

controlador considerando a saıda do processo.

Figura 4.1 Diagrama de blocos de um sistema de controle adaptativo.

Existem quatro abordagens de controle adaptativo (ASTROM; WITTENMARK, 1995),

a saber, (i) agendamento de ganho (ADG), onde as variaveis correlacionam o compor-

tamento dinamico do processo aos valores dos parametros do controlador; (ii) sistema

adaptativo por modelo de referencia (SAMR), que utiliza um modelo como referencia

que determina como a saıda do processo deve responder ao sinal de controle; (iii) regula-

dor auto-ajustavel (RAA), onde o controlador automaticamente ajusta seus parametros

para obter as propriedades do sistema de malha fechada; e (iv) sistema de controle dual

(SCD), que utiliza o controle adaptativo estocastico, empregando criterios da teoria de

otimizacao, onde existem incertezas sobre os parametros do controlador.

O controle de funcao de distribuicao de probabilidade da saıda de um processo es-

tocastico em vez de sua media e variancia tem sido cada vez mais utilizado em processos

como polimerizacao (Doyle III et al., 2003; CROWLEY et al., 2000), cristalizacao (BRAATZ,

2002; MA et al., 2002), processos alimentıcios (EEK; BOSGRA, 2000; GOMMEREN et al.,

56

2000) e fabricacao de papeis (YUE et al., 2001, 2002).

Este metodo de controle estocastico, denominado controle da distribuicao estocastica

limitada (do ingles, bounded stochastic distribution control) (WANG, 2000a), tem como

objetivo controlar a PDF da saıda de um dado processo. A ideia principal e desenvolver

uma estrategia de controle que aproxime a PDF da saıda do processo de uma PDF

desejada. Embora modelos matematicos possam ser utilizados para obter a PDF da

saıda, estes modelos sao, normalmente, complicados e demandam um elevado esforco

computacional. Com o objetivo de elaborar um controle de PDF adequado e de baixo

custo computacional, redes neurais (HAYKIN, 2001) tem sido utilizadas para aproximar

estatıstica e dinamicamente a PDF da saıda de processos estocasticos (WANG, 2000a,

1999, 2000b). Uma rede neural pode ser aplicada apenas se um conjunto de dados de

entrada de controle e PDF da saıda estiver disponıvel.

Este capıtulo apresenta os principais conceitos dos metodos de controle adaptativo por

modelo de referencia e de funcao de distribuicao de probabilidade. Esses metodos sao

utilizados como bases das estrategias de ajuste de dois modelos de controle de parametros

de algoritmos evolucionarios, apresentados no Capıtulo 6. O objetivo dos dois modelos

propostos e controlar a diversidade da populacao, impedindo a convergencia prematura

e adaptando-se as mudancas de um ambiente dinamico. O restante deste capıtulo esta

organizado como segue. A Secao 4.2 descreve as caracterısticas de um sistema dinamico

nao-linear. A Secao 4.3 apresenta alguns problemas de controle nao-linear. A Secao 4.4

descreve os conceitos gerais de sistemas adaptativos. A Secao 4.4 fornece uma visao geral

dos metodos de controle adaptativo e a Subsecao 4.4.1 descreve, em detalhes, o sistema

adaptativo por modelo de referencia. Nas Subsecoes 4.4.1.1 e 4.4.1.2 sao apresentados

dois dos principais metodos de controle adaptativo por modelo de referencia, o metodo

MIT e metodo de Lyapunov, assim como os criterios empregados para se alcancar a

estabilidade de Lyapunov. A Secao 4.5 descreve a modelagem de um sistema estocastico

via redes neurais B-spline (WANG, 2000a) e a estrategia utilizada pelo controle de funcao

de distribuicao de probabilidade da saıda de um processo estocastico. Na Secao 4.6, sao

feitas as consideracoes finais.

4.2 SISTEMA DINAMICO NAO-LINEAR

Um sistema dinamico nao-linear, discreto, a ser controlado pode ser descrito pelas se-

guintes equacoes de estado

57

x(k + 1) = f(x(k), u(k))

y(k) = g(x(k)), (4.1)sendo u(k) ∈ ℜr, y(k) ∈ ℜm e x(k) ∈ ℜn os vetores das variaveis de entrada, saıda e

estado no tempo discreto k, respectivamente. As funcoes f : ℜn×ℜr → ℜn e g : ℜn → ℜm

sao nao-lineares. O objetivo e elaborar uma estrategia que encontre um vetor de entrada

u(k) que produza saıdas y(k) que se comportem da maneira deseja. Se r = 1 e m = 1,

o sistema sera chamado de SISO (do ingles, single input and single output). Se r > 1 e

m > 1, o sistema sera chamado de MIMO (do ingles, multiple input and multiple output).

4.3 PROBLEMAS DE CONTROLE NAO-LINEAR

No sistema da Figura 4.1, se as funcoes f e g sao conhecidas, tem-se um problema

de controle nao-linear. Se as funcoes f e g sao parcialmente conhecidas ou nao sao

conhecidas, trata-se de um problema de controle adaptativo nao-linear. Os diferentes

tipos de problemas de controle podem ser classificados como segue (NARENDRA, 1996):� Problemas de controle nao-linear (f e g conhecidas) e controle adaptativo nao-linear

(f e g nao conhecidas).� Controle baseado em vetor de estado e controle baseado em entradas e saıdas.� Parametros do controlador determinados previamente (off-line) e ajustados em

tempo real (on-line).� Processos invariantes no tempo e processos variantes no tempo.

Os problemas supracitados, de regulacao ou rastreamento, podem ser formulados como

segue (NARENDRA, 1996): dado um sistema, e.g., Figura 4.1, em equilıbrio na origem (i.e.,

f(0, 0) = 0), determine o sinal de controle tal que:

1. O estado de equilıbrio x = 0 seja assintoticamente estavel.

2. A saıda y seja mantida em um valor constante y∗ (referencia), i.e., limk→∞ y(k) = y∗.

3. A saıda siga o valor desejado y∗(k), que seja uma saıda limitada de um sistema

nao-linear.

58

4. A saıda y(k) siga um sinal limitado y∗(k), tal que limk→∞ |y(k)− y∗(k)| = 0.

Os problemas de controle dos itens 1-3 sao conhecidos como regulacao e os problemas

do item 4 sao conhecidos como rastreamento. Os problemas de controle do Item 4 podem

ser tratados por dois caminhos diferentes. No primeiro, conhecido como rastreamento

assintotico, y(k) se aproxima de y∗(k) assintoticamente. No segundo, conhecido como

rastreamento exato, y(k) se aproxima de y∗(k) exatamente apos um numero exato n de

passos, isto e, y(k) = y∗(k), ∀k ≥ n.

4.4 SISTEMAS ADAPTATIVOS

No agendamento de ganho (ADG) e possıvel ajustar os parametros do controlador pelo

monitoramento das condicoes de operacao do processo. No ADG, encontram-se variaveis

auxiliares, de agendamento, que estao correlacionadas as mudancas na dinamica do pro-

cesso. Assim, e possıvel responder aos efeitos das variacoes dos parametros do processo

por ajustes nos parametros do controlador. Uma das dificuldades na elaboracao do pro-

jeto do ADG e encontrar as variaveis de agendamento. Quando as variaveis de agen-

damento sao determinadas, o controle de parametros e calculado sobre um numero de

condicoes de operacao utilizando um metodo adequado. Em seguida, o controlador e

ajustado para cada uma das condicoes de operacao. A estabilidade e o desempenho do

sistema sao, normalmente, avaliados por simulacao, com especial atencao nas transicoes

entre as diferentes condicoes de operacao. Existem duas desvantagens do ADG: a ine-

xistencia de um retorno sobre os ajustes feitos nos parametros do controlador que possa

corrigir agendamentos equivocados e o significativo tempo gasto com o projeto do sis-

tema. A vantagem do ADG e a rapidez com que os parametros do controlador podem

responder as mudancas do processo.

O regulador auto-ajustavel (RAA) pertence a classe dos metodos de ajuste indireto,

que estimam os parametros do processo e ajustam os parametros do controlador baseado

nessa estimativa. O RAA e composto de dois lacos, o laco interno constituıdo pelo

processo e do retorno para o controlador e o laco externo constituıdo pelo estimador de

parametros do processo e pelo mecanismo de ajuste dos parametros do controlador. O

RAA e considerado um sistema automatico de modelagem e projeto, onde os parametros

do processo e do controlador sao atualizados a cada perıodo de amostragem, em tempo

real.

O sistema de controle dual (SCD) e tambem um sistema de controle indireto que

59

leva em consideracao a incerteza na estimativa dos parametros do processo. Nos demais

metodos de controle adaptativo citados neste capıtulo, supoem-se que os parametros do

processo — estimados em tempo real — nao sao conhecidos, mas sao constantes. Quando

os parametros do processo sao constantes, as incertezas decrescem depois que a estimativa

se inicia. Mas as incertezas podem ser grandes no inıcio ou os parametros podem variar

com o tempo. Nesse caso, e importante que a estrategia de controle seja uma funcao dos

parametros estimados e de suas incertezas nessa estimativa. O SCD utiliza a teoria do

controle estocastico em que o processo, seus parametros e o ambiente sao descritos por

um modelo estocastico. O controlador e composto por duas partes: um estimador, que

gera uma distribuicao de probabilidade condicional do estado do processo — chamado de

hiperestado –, e um regulador, que corresponde a uma funcao que mapeia o espaco do

hiperestado para o espaco das variaveis de controle.

O sistema adaptativo por modelo de referencia (SAMR) e um metodo baseado em um

modelo que descreve o comportamento do processo. O objetivo e ajustar os parametros

do controlador de forma que o processo siga o comportamento do modelo de referencia. As

proximas subsecoes apresentam em detalhes dois dos mais utilizados metodos de controle

adaptativo por modelo de referencia, os metodos MIT e de Lyapunov.

4.4.1 Sistema Adaptativo por Modelo de Referencia

O sistema adaptativo por modelo de referencia (SAMR) e um controlador adaptativo

cuja resposta de desempenho e fornecida por um modelo de referencia (ASTROM; WIT-

TENMARK, 1995; NARENDRA; ANNASWAMY, 2005). O SAMR possui dois lacos, um tıpico

dos sistemas de controle composto pelo controlador e o processo, laco interno, e outro laco

que ajusta o parametro do controlador, denominado laco externo. A Figura 4.2 apresenta

o diagrama de blocos do SAMR.

O laco interno relaciona o sinal de referencia uc com a saıda do processo y. O laco

externo relaciona o sinal de controle u, as saıdas do processo y e do modelo de referencia

ym com o parametro do controlador θ. O sinal de controle u e gerado em funcao do sinal

de referencia uc, do parametro θ (ja ajustado) e da saıda atual do processo y(t). O sinal

de controle produz a nova saıda do processo y(t + 1). O modelo de referencia pode ser

linear ou nao-linear e nao ter entrada (i.e., ym e simplesmente uma funcao do tempo)

(NARENDRA; ANNASWAMY, 2005). Nesse caso, nao existe a entrada uc no diagrama de

blocos da Figura 4.2.

60

Figura 4.2 Diagrama de blocos do sistema adaptativo por modelo de referencia.

O mecanismo para ajustar os parametros do controlador no SAMR pode ser ob-

tido de duas formas (ASTROM; WITTENMARK, 1995): utilizando o metodo do gradiente,

pelo metodo MIT, ou a teoria da estabilidade, pelo metodo de Lyapunov. As proximas

subsecoes apresentam esses dois metodos de ajuste parametrico.

4.4.1.1 Metodo MIT A regra ou metodo MIT foi a abordagem original do sistema

adaptativo por modelo de referencia, desenvolvido pelo laboratorio de instrumentacao

do Instituto de Tecnologia de Massachusetts (MIT, do ingles Massachusetts Institute of

Technology).

No metodo do MIT, o controlador responde em funcao da saıda do modelo de re-

ferencia, ym, com o objetivo de minimizar a funcao custo

J(θ) =1

2e2, (4.2)

sendo θ o parametro do controlador e

e = ym − y. (4.3)Tendo como objetivo minimizar J(θ), o ajuste de θ e realizado no sentido contrario

do gradiente, isto e,

61

dθ

dt= −η

∂J

∂θ= −ηe

∂e

∂θ, (4.4)

sendo η ∈ (0, 1] o tamanho do passo do ajuste de θ sobre a superfıcie de J(θ). Em um

sistema discreto,

θ(k + 1) = θ(k)− η e(k)∂e(k)

∂θ, (4.5)

Quando existem varios parametros ajustaveis, θ e um vetor.

Na regra do MIT, a funcao custo J(θ) deve ser contınua e diferenciavel, visto que

seu gradiente e utilizado no ajuste dos parametros do controlador. Por utilizar o metodo

do gradiente, de busca local, o metodo MIT pode ter seu desempenho degradado pela

presenca de mınimos locais em funcoes custo J(θ) multimodais.

A derivada parcial ∂e/∂θ, chamada derivada de sensibilidade, fornece a influencia do

erro e sobre os ajustes de θ. Existem outras alternativas para a funcao custo da Equacao4.2, como, por exemplo,

J(θ) = |e|, (4.6)sendo o gradiente definido por

dθ

dt= −η

∂e

∂θsign(e) (4.7)

ou

dθ

dt= −η sign

(∂e

∂θ

)sign(e). (4.8)

4.4.1.2 Teoria de Lyapunov O matematico russo Alekdandr Lyapunov (1857-1918)

investigou equacoes diferenciais nao lineares do tipo

dx

dt= f(x), f(0) = 0. (4.9)

Considerando que f(0) = 0, a equacao tem a solucao x(t) = 0. Para garantir que a

solucao exista e seja unica, e preciso supor que f(x) e localmente Lipschitz, isto e,

‖f(x)− f(y)‖ ≤ L ‖x− y‖ (4.10)62

na vizinhanca da origem, sendo L > 0 uma constante. Lyapunov investigou se a solucao

para 4.9 e estavel em relacao as perturbacoes.

A estabilidade de Lyapunov define que a solucao x(t) = 0 para a Equacao 4.9 e estavel

se para um dado ǫ > 0 existe um numero δ(ǫ) > 0 tal que todas as solucoes com condicoes

iniciais

‖x(0)‖ < δ (4.11)tem a propriedade

‖x(t)‖ < ǫ, 0 ≤ t <∞. (4.12)Outras propriedade importantes da estabilidade de Lyapunov sao:� A solucao e instavel se ela nao for estavel.� A solucao e assintoticamente estavel se ela for estavel e puder ser encontrado um

valor de δ tal que todas as solucoes com ||x(0)|| < δ tem a propriedade que ||x(t)|| →

0 quando t→∞.� Se a solucao for assintoticamente estavel para qualquer valor, entao ela e global-

mente assintoticamente estavel.� A estabilidade de Lyapunov refere-se a estabilidade de uma solucao particular, e

nao para a equacao diferencial.

Lyapunov desenvolveu um metodo para investigar a estabilidade baseado em uma

funcao com propriedades especiais.

4.4.1.2.1 Teorema da Estabilidade de Lyapunov Uma funcao V : ℜn → ℜ e positiva

definida na regiao U ⊂ ℜn se

1. V (0) = 0

2. V (x) > 0, x ∈ U e x 6= 0.

A funcao V e positiva semi-definida se a Condicao 2 e substituıda por V (x) ≥ 0.

Se existe uma funcao V : ℜn → ℜ positiva definida tal que sua derivada ao longo da

solucao da equacao diferencial 4.9, isto e,

63

dV

dt=

∂V T

∂x

dx

dt

=∂V T

∂xf(x) = −W (x) (4.13)

seja negativa semi-definida, entao a solucao x(t) = 0 para a Equacao 4.9 e estavel. Se

a derivada dV/dt for negativa definida, entao a solucao e assintoticamente estavel. Se

dV/dt < 0 e V (x) → ∞ quando ||x|| → ∞, entao a solucao e globalmente assinto-

ticamente estavel. A funcao V e chamada funcao de Lyapunov do sistema 4.9. A

prova do teorema de Lyapunov pode ser encontrada em (ASTROM; WITTENMARK, 1995;

NARENDRA; ANNASWAMY, 2005).

4.5 CONTROLE DE PDF DA SAIDA DE SISTEMAS ESTOCASTICOS

Em um processo estocastico sujeito a um ruıdo nao-Gaussiano, a funcao de distribuicao

de probabilidade da saıda y, γ(y, u), definida no intervalo [a, b], e controlada pela entrada

u ∈ ℜ. Assumindo que o intervalo [a, b] e conhecido e γ(y, u) e contınua e limitada, o

modelo da PDF da saıda pode ser estabelecido pela seguinte aproximacao (WANG, 2000a)

γ(y, u) =

n∑

i=1

wi(u)Bi(y), (4.14)sendo wi o peso da i-esima funcao de base radial Bi, ∀i = 1, . . . , n. Sendo γ(y, u) uma

funcao de distribuicao de probabilidade definida em [a, b], a seguinte restricao deve ser

satisfeita

∫ b

a

γ(y, u) dy =n∑

i=1

wi(u) bi = 1, (4.15)sendo

bi =

∫ b

a

Bi(y) dy (4.16)uma constante positiva.

4.5.1 Modelo Dinamico

Quando o processo estocastico e dinamico, existe uma relacao dinamica entre wi e u

(WANG, 1999). Em uma relacao linear dinamica, um modelo discreto pode ser formulado

64

como segue

W (k + 1) = AW (k) +B u(k), (4.17)sendo A ∈ ℜn×n e B ∈ ℜn×1 matrizes que caracterizam a natureza dinamica do sistema,

W (k) = [w1(k), w2(k), . . . , wn(k)]T ∈ ℜn (4.18)

o vetor de estado do sistema amostrado em t = kT , u(kT ) a amostra de u(t) no tempo

t = kT e T o intervalo de amostra.

Assumindo que o vetor inicial W (0) e conhecido, entao a partir da Equacao 4.17observa-se que W (k) depende de

U(k − 1) = u(k − 1), u(k − 2), . . . , u(0), (4.19)o que significa que a PDF correspondente a W (k) tambem depende de U(k−1) e torna-se

γ(y, U(k − 1)) = γ(k, y) = [C1(y), Bn(y)]W (k), (4.20)sendo

C1(y) = [B1(y), B2(y), . . . , Bn−1(y)] ∈ ℜ1×(n−1). (4.21)

Mesmo u e W sendo obtidas por meio discreto, a saıda y e ainda contınua e a funcao

γ(y, U(k − 1)) e contınua em relacao a y.

Como a restricao da Equacao 4.15 deve ser satisfeita, apenas n− 1 variaveis do vetor

W (k) sao independentes. Assim, a dimensao da equacao de estado 4.17 deve ser reduzida

para n − 1 para representar o sistema estocastico. A partir da Equacao 4.15, pode ser

obtido

wn(k) =1

bn(1− bT V (k)), (4.22)

sendo

bT = [b1, b2, . . . , bn−1] ∈ ℜn−1 (4.23)

bi =

∫ b

a

Bi(y) dy (4.24)V (k) = [w1(k), w2(k), . . . , wn−1(k)]

T ∈ ℜn−1 (4.25)(4.26)

65

Particionando as matrizes A e B como

A =

(A′

1 A′2

A′3 A′

4

)(4.27)

e

B =

(B′

1

B′2

), (4.28)

sendo A′1 ∈ ℜ

(n−1)×(n−1), A′2 ∈ ℜ

(n−1)×1, A′3 ∈ ℜ

1×(n−1), A′4 ∈ ℜ, B′

1 ∈ ℜ(n−1)×1 e B′

2 ∈ ℜ.

Substituindo wn, Equacao 4.22, na saıda γ, Equacao 4.20, obtem-se uma nova expressao

para a saıda, como segue

γ(k, y) = γ(y, U(k − 1)) = [C1(y)−Bn(y)

bnbT ]V (k) +

Bn(y)

bn. (4.29)

Estabelecendo

G = A′

1 −A′

2

bT

bn∈ ℜ(n−1)×(n−1) (4.30)

H = B′

1 ∈ ℜ(n−1)×1 (4.31)

E =A′

2

bn∈ ℜ(n−1)×1 (4.32)

L(y) =Bn(y)

bn,∈ ℜ (4.33)

C(y) = C1(y)−Bn(y)

bnbT ∈ ℜ1×(n−1), (4.34)

(4.35)o modelo de espaco de estado, Equacoes 4.17 e 4.20, pode, entao, ser reduzido a

V (k + 1) = GV (k) +H u(k) + E

γ(y, u(k)) = C(y)V (k) + L(y) (4.36)Assim, a Equacao 4.36 representa o espaco de estados para um sistema dinamico. Pode

ser verificado, tambem, que para qualquer {V(k), G,H,E}, a restricao 4.15 e satisfeita.

Ademais, para um sistema conhecido ou nao, L(y) e sempre conhecido para uma funcao

de base Bn(y) selecionada.

66

4.5.2 Modelagem de Sistemas Dinamicos Lineares

A partir do modelo da Equacao 4.36, o sistema e identificado determinando-se as matrizes

G, H e E. Cada sequencia de {u(k)} gera uma sequencia de {V (k)} e cada vetor V (k)

corresponde a uma funcao de densidade de probabilidade γ(y, U(k−1)) dada pela Equacao4.36. A cada amostra de tempo k, a PDF γ(y, U(k−1)) deve ser medida com um numero

de amostras de saıda na amostra de tempo k como segue

γ(y, U(k − 1))← {y1(k), y2(k), . . . , yN(k)} (4.37)sendo yi(k) a i-esima amostra da saıda e N e o numero de amostras. Assim, a funcao de

distribuicao acumulativa no tempo k pode ser calculada como

F (y, U(k − 1)) =1

N(numero de {yi(k) ≤ y}) ∀y ∈ [a, b] (4.38)

Portanto, a PDF no tempo k pode ser obtida como

γ(y, U(k − 1)) =∆F (y, U(k − 1))

∆y, (4.39)

sendo ∆F (y, U(k−1)) e ∆y os valores incrementais de F (y, U(k−1)) e y, respectivamente.

Considerando o operador de atraso z−1, i.e., z−1u(k) = u(k − 1), e

f(k, y) = γ(y, U(k − 1))− L(y) = C(y)V (k)

= C(y) (I − z−1 G)−1(H u(k − 1) + E) (4.40)De acordo com a teoria das matrizes (WANG, 2000a), f(k, y) pode ser expandida para a

forma parametrizada

f(k, y) = a1 f(k − 1, y) + . . .+ an−1 f(k − n+ 1, y) +

C(y)D0 u(k − 1) + . . .+ C(y)Dn−2 u(k − n+ 1)

=n−1∑

i=1

ai f(k − i, y) +n−2∑

j=0

C(y)Dj u(k − 1− j) (4.41)Para qualquer y ∈ [a, b], o termo C(y)Dju(k−1−j), j = 0, . . . , n − 2, pode ser expresso

como

67

C(y)Dj u(k−1−j) =

n−1∑

i=1

dji u(k−1−j)Bi(y) (4.42)sendo dji o i-esimo componente do vetor Dj, j = 0, . . . , n− 2. Denotando

θ = [a1, . . . , an, d01, d02, . . . , d0(n−1),

d11, d12, . . . , d1(n−1), . . . ,

d(n−2)1, d(n−2)2, . . . , d(n−2)(n−1)]T ∈ ℜ(n−1)2+n (4.43)

φ(y, k) = [f(k − 1, y), f(k − 2, y), . . . , f(k − n + 1, y),

u(k − 1)B1(y), u(k − 1)B2(y), . . . , u(k − 1)Bn−1(y), . . .

u(k − n+ 1)B1(y), u(k − n + 1)B2(y), . . . , (4.44)u(k − n+ 1)Bn−1(y), C(y)]T ∈ ℜ(n−1)2+n,

Assim, a Equacao 4.41 pode ser expressa como

f(k, y) = θT φ(y, k). (4.45)Para identificar o sistema da Equacao 4.45, assume-se que f(y, uk) pode ser represen-

tada por N amostras a cada instante k, isto e, f(yl, uk), ∀l = 1, . . . , N . Assim, o seguinte

metodo de identificacao dos quadrados mınimos (AGUIRRE, 2000; LJUNG, 1987) pode ser

formulado para estimar o vetor θ:

1. A cada tempo k, coletar u(k) e um conjunto de {yki}, i = 1, . . . , N ;

2. Utilizar as Equacoes 4.38 e 4.39 e {yki}, para formular f(k, y);

3. Selecionar um conjunto arbitrario Yls = {yi}, i = 1, . . . ,M , do intervalo [a, b];

4. Utilizar o algoritmo dos quadrados mınimos

θ(l + 1) = θ(l) +P (l) ΦT (yl, uk) ǫ(l)

1 + Φ(yl, uk)P (l) ΦT (yl, uk)(4.46)

ǫ(l) = f(yl, uk) Φ(yl, uk) θ(l) (4.47)P (l + 1) =

(I −

P (l) ΦT (yl, uk) Φ(yl, uk)

1 + Φ(yl, uk)P (l) ΦT (yl, uk)

)P (l), (4.48)

em relacao a i para calcular θ(M) como uma estimativa de θ na amostra de tempo

k, sendo I uma matriz identidade e P (1) = 106I(n−1)m e θ(0) = θ0.

68

5. Incrementar 1 em k e voltar ao Passo 1 ate o termino dos dados amostrais.

Neste algoritmo, proposto por Wang (2000a), o conjunto de dados coletados {yki} e

utilizado para formar a PDF γ(y, U(k−1)) para calcular f(k)(y). Portanto, o conjunto de

dados Yls e diferente de {yki}, o que representa a maior diferenca deste algoritmo e dos

algoritmos de identificacao de sistemas (AGUIRRE, 2000; LJUNG, 1987) que usam {yki}

para estimar os parametros do sistema. Assim como todos os algoritmos de estimacao,

a convergencia do algoritmo de Wang (2000a) depende do numero de condicoes, sendo,

portanto, difıcil de garantir a convergencia (AGUIRRE, 2000; LJUNG, 1987).

4.5.3 Estrategia de Controle de PDF

Depois de estabelecido o modelo do sistema, a proxima fase e projetar a estrategia de

controle. Os metodos existentes podem ser classificados em algoritmos de controle fixos

para sistemas conhecidos ou algoritmos de controle adaptativo para sistemas nao conhe-

cidos. A seguir apresenta-se uma estrategia de controle para sistemas conhecidos, isto e,

para sistemas dinamicos lineares cujas matrizes G, H e E sao conhecidas.

O objetivo do algoritmo de controle e encontrar uma sequencia {u(k)} tal que a

funcao de densidade de probabilidade da saıda do processo aproxima-se ao maximo de

uma funcao de densidade de probabilidade pre-definida, g(y), que e independente de

{u(k)}.

No algoritmo de controle, {u(k)} deve ser selecionado tal que o criterio de desempenho

J =

∫ b

a

(γ(y, U(k))− g(y))2 dy. (4.49)seja minimizado. Considerando f(k + 1, y) = γ(y, U(k))− L(y), para todo y ∈ [a, b], de

forma analoga a Equacao 4.40, obtem-se

f(k + 1, y) = a1 f(k, y) + . . .+ an−1 f(k − n+ 2, y) +

C(y)D0 u(k) + . . .+ C(y)Dn−2 u(k − n + 2) (4.50)Substituindo a Equacao 4.50 na Equacao 4.49, o criterio de desempenho torna-se

J =

∫ b

a

(n−1∑

i=2

ai f(k − i+ 1, y) + C(y)Di−1 u(k − i+ 1) + L(y)

−g(y) + a1 f(k, y) + C(y)D0 u(k))2 dy. (4.51)

69

Assumindo

g(y) = −

(n−1∑

i=2

ai f(k − i+ 1, y) + C(y)Di−1 u(k − i+ 1)

)− L(y) +

g(y)− a1 f(k, y), (4.52)obtem-se

J =

∫ b

a

(C(y)D0 u(k)− g(y))2 dy. (4.53)

Sendo f(k − i, y) = C(y)V (k − i) e u(k − i) conhecidos para i = 0, 1, 2, . . ., quando o

tempo amostral e k, g(y) e uma funcao conhecida em relacao a y. Assim, o criterio J

resulta

J =

(∫ b

a

(C(y)D0)2 dy

)u(k)2

−2

(∫ b

a

(C(y)D0g(y))2 dy

)u(k) +

∫ b

a

g(y)2 dy. (4.54)Para minimizar J , a entrada de controle u(k) pode ser obtida resolvendo

∂J

∂u(k)= 0. (4.55)

Considerando que a integral∫ bag(y)2dy e independente da entrada de controle u(k), esta

ultima pode ser obtida por

u(k) =

∫ baC(y)D0g(y)dy∫ ba(C(y)D0)2dy

(4.56)O algoritmo de controle para sistemas dinamicos lineares e apresentado a seguir:

1. No tempo amostral k, coletar u(k) e um conjunto {yki};

2. Utilizar as Equacoes 4.38 e 4.39, L(y), e {yki} para formular f(k, y);

3. Para j = 1, 2, . . . , n − 1, usar f(k − j, y), {u(k − 1), u(k − 2), . . . , u(k − n + 2)},

todos os parametros conhecidos na Equacao 4.50 e uma dada distribuicao desejada

g(y) para calcular g(y);

70

4. Calcular as integrais∫ baC(y)D0g(y)dy e

∫ ba(C(y)D0)

2dy;

5. Calcular u(k), usando a Equacao 4.56, e aplicar no sistema;

6. Incrementar k em uma unidade e voltar ao Passo 1.

Esta estrategia de controle e executada com u(k) como uma funcao de entradas pas-

sadas e um numero finito de PDFs atual e passadas da saıda do sistema.


Este capıtulo apresentou duas abordagens de controle de sistemas, o controle adaptativo

e o controle de PDF. A principal vantagem do SAMR e a utilizacao de um modelo de

referencia como exemplo de comportamento para o processo. Os ajustes dos parametros

do controlador e do sinal de controle sao baseados nesse modelo de referencia.

O controle de PDF, aplicado a sistemas estocasticos, tem como objetivo controlar a

PDF da saıda do processo ao inves de sua media ou variancia. Essa diferenca em relacao

aos metodos classicos de controle estocasticos pode ser vantajosa porque controlando

a PDF se esta tambem controlando, indiretamente, a media e variancia da saıda do

processo. O controle de PDF realiza, primeiramente, a identificacao da PDF da saıda

utilizando redes neurais. Em seguida, o metodo do gradiente descendente e utilizado para

ajustar a entrada do processo de modo a minimizar o erro entre as PDFs da saıda do

processo e a desejada.

Os dois modelos de controle aplicados aos algoritmos evolucionarios possuem vanta-

gens e desvantagens. O SAMR com o metodo MIT e um modelo de implementacao mais

simples, pode utilizar o modelo de dinamica de populacoes apresentado no Capıtulo 5

e o modelo de referencia segue premissas baseadas em modelos de populacoes reais. O

metodo MIT tem as desvantagens de nao garantir a convergencia, entre as diversidades

da populacao e do modelo de referencia, e nao controlar direta ou indiretamente a distri-

buicao dos indivıduos no espaco de solucoes. Uma determinada diversidade, ainda que

proxima ao modelo de referencia, nao garante uma distribuicao ideal dos indivıduos no

espaco de solucoes.

O controle de PDF aplicado aos algoritmos evolucionarios tem como vantagens o

controle da diversidade esperada na geracao subsequente e tambem, indiretamente, a

distribuicao dos indivıduos no espaco de solucoes. As desvantagens desse modelo sao a

71

sua complexidade de implementacao, necessitando modelar o processo evolucionario, e o

custo computacional elevado das acoes de controle.

Apesar das desvantagens, presentes em qualquer modelo de controle ou otimizacao,

ambos os modelos tem vantagens que os tornam promissores em diversas aplicacoes com-

plexas, com ambientes dinamicos, multimodalidade e multiobjetivos.

72

CAPITULO 5

MODELO DE DINAMICA DE POPULACOES

5.1 INTRODUCAO

Para melhorar o desempenho de um algoritmo evolucionario (AE) e importante entender a

sua dinamica. Por exemplo, os metodos de controle da diversidade normalmente nao tem

informacoes precisas do processo evolucionario, apenas o erro entre as diversidades atual e

desejada e conhecido (WONG et al., 2003; URSEM et al., 2002; DIVERSITY-BASED. . . , 2007).

Alguns modelos de AEs ja foram propostos, como Goldberg (1989) e Radcliffe (1991).

No entanto, esses modelos nao tratam a dinamica do AE em relacao a diversidade da

populacao. Alternativamente, existem algumas formulacoes que tratam a dinamica dos

AEs, como Vose e Liepins (1991), Stark e Spall (2003), Bethke (1981) e P.-Bennett et

al. (1994). Muitos desses modelos nao podem ser utilizados na analise da dinamica dos

AEs porque eles precisam de um conhecimento previo da probabilidade de transicao de

estados.

O objetivo deste capıtulo e apresentar um novo modelo de dinamica da frequencia

genica que reflete o comportamento da diversidade da populacao em relacao a um de-

terminado gene. Este modelo leva em consideracao os principais fatores que compoem

a dinamica de populacoes, a saber, selecao, pressao de selecao e taxa de mutacao. Por-

tanto, e possıvel analisar o impacto que tais fatores causam na variacao da diversidade

da populacao. A partir da abordagem proposta, um modelo de processo evolucionario e

formalizado, abrindo possibilidades de se estabelecer estrategias de controle que minimi-

zem o desvio entre a diversidade da populacao e do seu modelo de referencia. Portanto,

e possıvel analisar a variacao da diversidade em relacao a tais parametros.

O restante deste capıtulo e organizado como segue. A Secao 5.2 mostra o metodo

de calculo da diversidade de populacoes utilizado. Na Secao 5.3, o modelo de dinamica

de populacoes e apresentado em detalhes. A Secao 5.4 descreve a analise de sensibi-

lidade da diversidade de populacoes em relacao aos parametros geneticos utilizados no

modelo proposto. Na Secao 5.5, os experimentos que consolidam o modelo de dinamica

de populacoes sao reportados. A Secao 5.6 apresenta as discussoes finais.

73

5.2 CALCULANDO A DIVERSIDADE DA POPULACAO

Como apresentado no Capıtulo 3, existem varias formas de calcular a diversidade de uma

populacao (MAGURRAN, 2004; URSEM et al., 2002). O modelo de dinamica de populacoes

proposto calcula a diversidade pela funcao da heterozigosidade de Simpson (MAGURRAN,

2004), substituindo He por Γ, como segue

Γ = 1−

na∑

i=1

(pi)2, (5.1)

sendo na o numero de alelos e pi a taxa de ocorrencia do i-esimo alelo.

O numero de alelos, na, depende da representacao do problema. Para genotipos com

codificacao binaria e inteira, na e mensuravel, pois os valores dos genes sao discretos.

Por exemplo, na representacao binaria, na = 2; na representacao inteira, na e igual ao

numeros de inteiros utilizados na representacao do problema; por exemplo, no problema

do caixeiro viajante com 10 cidades, na = 10.

Para genotipos com codificacao real, na nao e mensuravel, pois os intervalos dos genes

sao contınuos. Portanto, o numero de alelos e calculado dividindo o domınio do gene em

subintervalos, isto e, na e igual ao numero de subintervalos. Assim, o gene com valor

pertencente ao subintervalo j e definido como o alelo gij, isto e, um alelo do tipo j do

gene i. O tamanho do subintervalo, que define um tipo de alelo, e calculado como segue

∆g =gmax − gmin

na, (5.2)

sendo gmin e gmax os limites mınimo e maximo que definem o intervalo do gene. Assim,

o primeiro e o na-esimo tipo de alelo estao contidos nos subintervalos [gmin, gmin + ∆g)

e [gmax −∆g, gmax], respectivamente. Por exemplo, se um gene for definido no intervalo

[−10, 10] e na = 10, o tamanho dos subintervalos sera 2.0 e os tipos de alelos serao

definidos nos subintervalos

Alelo tipo 1: [−10,−8),

Alelo tipo 2: [−8,−6),...

Alelo tipo (na − 1): [6, 8),

Alelo tipo na: [8, 10].

74

Para indivıduos com mais de um gene, espera-se que a diversidade da populacao seja

representada pela heterozigosidade de um unico gene, Equacao 5.1. Por exemplo, em um

problema de maximizacao, definido pela funcao quadratica

f = 100−10∑

i=1

x2i , (5.3)

uma populacao com 100 indivıduos, cada um com 10 genes, e criada para encontrar o

ponto otimo localizado na origem, X∗ = [0, 0, . . . , 0]T . A Tabela 5.1 mostra os parametros

do AE utilizado para essa tarefa de maximizacao da funcao quadratica, Equacao 5.3. O

objetivo deste exemplo e analisar o comportamento da diversidade da populacao em

relacao a diferentes genes.

Tabela 5.1 Parametros do problema de otimizacao de uma funcao quadratica f (Equacao 5.3).Parametros Valor

Tamanho da populacao 100

Numero de genes 10

Intervalo dos genes [-10, 10]

Numero de alelos 10

Taxa de selecao de pais 1.0

Metodo de cruzamento 2 pontos

Taxa de cruzamento 0.7

Metodo de mutacao Uniforme

Taxa de mutacao 0.05

Metodo de selecao Roleta

Pressao de selecao 0.08

Numero de geracoes 100

Modelo de populacao Generacional

A Tabela 5.2 mostra a diversidade da populacao calculada apos 100 geracoes por um

metodo baseado na distancia Euclideana (MAGURRAN, 2004; URSEM et al., 2002) e pela

Equacao 5.1, baseada na heterozigosidade, He. Para esse ultimo, tres genes, escolhidos

aleatoriamente, foram utilizados para calcular a diversidade da populacao. Em todos os

experimentos, ha uma tendencia de queda da diversidade da populacao.

A Figura 5.1 mostra os histogramas as distribuicoes inicial e final dos alelos para os

75

−10 −5 0 5 100

5

10

15(a) Distribuição alélica inicial do gene 1

Oco

rrên

cia

−10 −5 0 5 100

50

100

Oco

rrên

cia

(b) Distribuição alélica final do gene 1

−10 −5 0 5 100

5

10

15(c) Distribuição alélica inicial do gene 4

Oco

rrên

cia

−10 −5 0 5 100

50

100(d) Distribuição alélica final do gene 4

Oco

rrên

cia

−10 −5 0 5 100

5

10

15(e) Distribuição alélica inicial do gene 9

Tipo de alelo

Oco

rrên

cia

−10 −5 0 5 100

50

100

Oco

rrên

cia

(f) Distribuição alélica final do gene 9

Tipo de alelo

Figura 5.1 Distribuicoes genicas iniciais e finais dos genes 1, 4 e 9.

76

Tabela 5.2 Diversidades inicial e final nos experimentos da funcao quadratica f , Equacao 5.3.Metodo Γ(0) Γ(100)

Euclideano 17.7073 2.5888

Eq. 5.1 (Gene #1) 0.8736 0.0810

Eq. 5.1 (Gene #4) 0.8858 0.0787

Eq. 5.1 (Gene #9) 0.8930 0.0895

genes 1, 4 e 9. As distribuicoes iniciais sao aproximadamente uniformes. Depois de 100

geracoes, as distribuicoes dos tres genes mostram tendencias de queda da diversidade da

populacao.

Tabela 5.3 Estatıstica para os metodos baseados na heterozigosidade, He.

Min Max

Metodo Inicial Final Inicial Final

Eq. 5.1 (Gene #1) 5 0 14 95

Eq. 5.1 (Gene #4) 5 0 14 96

Eq. 5.1 (Gene #9) 7 0 13 97

A Tabela 5.3 mostra as ocorrencias mınima (Min) e maxima (Max) dos alelos para

o metodo baseado na funcao da heterozigosidade, no inıcio (Inicial) e apos 100 geracoes

(Final). Os valores mınimos e maximos iniciais mostram distribuicoes que tendem a

uniforme. Os valores das ocorrencias finais mostram a tendencia de queda da diversidade

para todos os genes analisados.

As simulacoes mostraram que genes diferentes produzem semelhantes dinamicas da

diversidade da populacao, Figura 5.1 e Tabelas 5.2 e 5.3. Nos experimentos com os genes

1, 4 e 9, as diversidades e as distribuicoes genicas iniciais e finais foram aproximadamente

iguais. Assim, sugere-se que qualquer gene utilizado pode representar o comportamento

da distribuicao genica e da diversidade da populacao. Portanto, o calculo da diversidade

em funcao de um gene pode ser tao representativo quanto a diversidade medida pela

distancia Euclideana ou pela media das distribuicoes de todos os genes.

77

5.3 MODELO DE DINAMICA DE POPULACOES

Esta secao apresenta um novo modelo de dinamica de populacoes que descreve o compor-

tamento da frequencia genica e da diversidade da populacao. A partir das justificativas

apresentadas na Secao 5.2, o modelo proposto descreve a diversidade da populacao em

relacao a um unico gene com na alelos, denominado gene de referencia, considerando a

pressao de selecao e a taxa de mutacao como parametros de fatores evolutivos. Neste

modelo de dinamica de populacoes, a recombinacao nao e considerada por nao influen-

ciar a frequencia genica, pois quando um indivıduo e selecionado para o cruzamento o seu

alelo do gene de referencia ja esta garantido na proxima geracao no modelo de populacao

generacional. O modelo de dinamica de populacoes proposto tem, portanto, as seguintes

caracterısticas gerais:� genotipo com codificacao real;� gene de referencia definido no intervalo [gmin, gmax], com na alelos, isto e, com na

sub-intervalos;� todos os indivıduos sao candidatos a pais;� modelo de populacao e generacional;� nao ha migracao;� populacao e infinita; e� selecao proporcional a aptidao ou por torneio.

O modelo e formulado em dois estagios, a selecao de pais para cruzamento e a mutacao.

Na selecao de pais para cruzamento, a probabilidade de selecao dos indivıduos e uma

funcao da pressao de selecao, β. As frequencias genicas depois dos cruzamentos sao

modificadas em funcao da taxa de mutacao, pm. Este modelo utiliza mutacao uniforme;

entretanto, qualquer metodo de mutacao pode ser utilizado para descrever a dinamica de

populacoes.

A frequencia genica de um determinado tipo de alelo na proxima geracao depende

do numero de indivıduos selecionados cujo alelo e deste mesmo tipo. Isso ocorre porque

quando um indivıduo e selecionado para o cruzamento, o alelo do seu gene de referencia

ja esta garantido na proxima geracao.

78

A selecao de pais para cruzamento e efetuada em duas selecoes: na primeira, todos

os indivıduos participam; na segunda, o indivıduo selecionado na primeira selecao nao e

considerado. Assim, a selecao para cruzamento garante que o alelo do gene de referencia

de um indivıduo esteja garantido na proxima geracao. Como esses dois eventos sao

excludentes, a probabilidade do alelo do gene de referencia de um indivıduo estar na

proxima geracao e a soma das probabilidades deste indivıduo ser selecionado na primeira

e segunda selecao de pais para cruzamento.

A probabilidade de selecao de um indivıduo depende do metodo de selecao. Na selecao

proporcional a aptidao, ou roleta, a probabilidade do i-esimo indivıduo ser selecionado

para cruzamento na primeira selecao pode ser definida como

ps1(i) =wi∑Nj=1wj

, (5.4)sendo wi = w(fi) uma funcao da aptidao, fi, tipicamente expressa como

wi = fi, (5.5)ou

wi = exp(β fi), (5.6)sendo β a pressao de selecao, que determina o impacto da aptidao sobre a probabilidade

de selecao. Assim, e possıvel controlar a pressao de selecao quando utilizada a Equacao5.6. Por exemplo, para β = 0, a selecao sera aleatoria (wi = 1, ∀i = 1, . . . , N); a medida

que β aumenta, a pressao de selecao torna-se cada vez mais alta — tendendo a elitista.

A Figura 5.2 mostra a influencia da pressao de selecao sobre a probabilidade de selecao

de um indivıduo, para wi da Equacao 5.6, em funcao de diferentes pressoes de selecao em

duas populacoes com 3 e 100 indivıduos, N = {3, 100}. Nas duas populacoes, o melhor

indivıduo tem aptidao igual a 200. Na populacao com tres indivıduos, os outros dois

indivıduos tem aptidoes iguais a 100 e 50. Na populacao com 100 indivıduos, o pior

indivıduo tem aptidao igual a 50 e os demais indivıduos tem aptidoes que variam entre

51 e 199.

Na populacao menor, N = 3, e possıvel observar grandes variacoes na probabilidade

de selecao do indivıduos com pior e melhor aptidoes — para diferentes pressoes de selecao.

Para a pressao de selecao mais baixa, β = 0.01, as probabilidades de selecao do melhor

e pior indivıduos sao, aproximadamente, 0.6 e 0.14; para a pressao de selecao mais alta,

β = 0.1, as probabilidades de selecao do melhor e pior indivıduos sao proximas de 0.99

79

e zero. Na populacao maior, N = 100, a probabilidade de selecao e quase uniforme em

relacao a pressao de selecao. Para a pressao de selecao mais baixa, as probabilidades de

selecao sao, aproximadamente, iguais. Para a pressao de selecao mais alta, a probabilidade

de selecao do melhor indivıduo e proxima de 0.17, pouco elitista se comparada a populacao

menor, com tres indivıduos — a probabilidade de selecao e aproximadamente igual a 1

para o melhor indivıduo. Ja em relacao ao pior indivıduo, a probabilidade de selecao e,

tambem, proxima de zero. A medida que uma populacao cresce, a selecao proporcional a

aptidao tende a ser menos elitista e a sensibilidade da probabilidade de selecao em relacao

a pressao de selecao tende a ser menor.

0.02 0.04 0.06 0.08 0.10

0.2

0.4

0.6

0.8

1(a) Probabilidade de seleção do melhor indivíduo

Pressao de seleção (β)

Pro

babi

lidad

e de

sel

eção

0.02 0.04 0.06 0.08 0.10

0.05

0.1

0.15

0.2(b) Probabilidade de seleção do pior indivíduo

Pressao de seleção (β)

Pro

babi

lidad

e de

sel

eção

N = 3N = 100

N = 3N = 100

Figura 5.2 Probabilidade de selecao do i-esimo indivıduo em funcao da pressao de selecao, β.

Na selecao por torneio, a probabilidade de selecao depende do tamanho do grupo do

torneio, G, e da posicao do indivıduo no ranking das melhores aptidoes. Na selecao por

torneio, a probabilidade de selecao e definida como segue

ps1(i) = 1−

(N − 1−Ns

G

)

(N

G

) , (5.7)sendo Ns o numero de indivıduos com melhor aptidao do que o i-esimo indivıduo. Para

o melhor indivıduo, Ns = 0; para o pior, Ns = N − 1. Nesse tipo de selecao, a pressao de

selecao pode ser definida como

β =G

N, (5.8)

80

para β ∈ [1/N, 1]. Por exemplo, para G = N , i.e., β = 1, a pressao de selecao e maxima,

elitista, garantindo que o melhor indivıduo seja selecionado; para G = 1, i.e., β = 1/N ,

nao ha pressao, a selecao e aleatoria.

Na segunda selecao de pais para cruzamento, as probabilidades de selecao modificam-

se proporcionalmente a probabilidade de selecao do primeiro indivıduo selecionado. As-

sim, quanto maior ps1(·) do primeiro indivıduo selecionado, maiores as variacoes das pro-

babilidades de selecao dos demais indivıduos da populacao. Por outro lado, quanto

maior a populacao, menores as variacoes das probabilidades de selecao dos indivıduos

nao selecionados na primeira selecao de pais para cruzamento. Na segunda selecao para

cruzamento, a probabilidade de selecao do i-esimo indivıduo ser selecionado quando o

j-esimo indivıduo foi selecionado na primeira selecao e definida como

ps(i,j) = p(−j)s(i) ps(j), (5.9)

sendo p(−j)s(i) a probabilidade de selecao do i-esimo indivıduo da populacao sem o j-esimo

indivıduo. As probabilidades ps(i,j), ∀j = 1, . . . , N , sao oriundas de eventos excludentes;

assim, a probabilidade de selecao do i-esimo individuo na segunda selecao para cruza-

mento e definida como

ps2(i) =

N∑

j=1

ps(i,j), i 6= j. (5.10)Finalmente, a probabilidade do i-esimo indivıduo ser selecionado para cruzamento, na

primeira ou segunda selecao, resulta em

ps(i) = ps1(i) + ps2(i). (5.11)O numero de descendentes de um indivıduo, Nd(·), dentre os λ descendentes na

proxima geracao, produzidos por λ/2 cruzamentos ou ensaios de Bernoulli e uma variavel

aleatoria com distribuicao binomial B(λ/2, ps(·)), definida pela funcao de distribuicao de

probabilidade (FARIAS et al., 1998)

f(x) = P [Nd(i) = x] =

(λ/2

x

)pxs(i) (1− ps(i))

λ/2−x. (5.12)Portanto, o valor esperado de descendentes do i-esimo indivıduo, isto e, a media de

Nd(i), e determinado pela media

81

E[Nd(i)] =

λ/2∑

j=0

j × P [Nd(i) = j]

=

λ/2∑

j=0

j

(λ/2

j

)pjs(i) (1− ps(i))

λ/2−j

=

λ/2∑

j=1

λ

2

(λ/2− 1

j − 1

)pj−1s(i) ps(i) (1− ps(i))

(λ/2−1)−(j−1)

=λ

2ps(i)

λ/2−1∑

j=1

(λ/2− 1

v

)pvs(i) (1− ps(i))

λ/2−1−v

=λ

2ps(i), (5.13)

sendo j(λ/2j

)= λ/2

(λ/2−1j−1

)uma identidade, 0 ≤ j ≤ λ/2, e v = j − 1.

O numero de ocorrencias do q-esimo alelo, Na(q), na proxima geracao e igual a soma

de todos os descendentes cujo alelo e do tipo q. Assim, o numero esperado de alelos do

tipo q e definido como

E[Na(q)] =∑

i∈Sq

E[Nd(i)], (5.14)sendo Sq o conjunto dos indivıduos cujo gene de referencia e do alelo tipo q.

Apos o cruzamento, a distribuicao genica da populacao pode ser alterada pela mutacao.

Os genes com alelos do tipo q podem ser modificados, assim como genes com alelos dife-

rentes do tipo q podem se transformar em tipo q. Pela mutacao, a probabilidade de um

gene com alelo do tipo q mutar para outro tipo de alelo e

pm(q) = pm

(1−

1

na

), (5.15)

sendo (1− 1/na) a probabilidade de um indivıduo mutar para um alelo diferente do tipo

q, considerando que a mutacao e realizada em funcao de uma distribuicao uniforme no

intervalo [gmin, gmax]. A probabilidade pm(q) considera que, ao ser mutado, um gene pode

assumir o mesmo alelo anterior a mutacao. Isso ocorre porque na mutacao uniforme uti-

lizada todo o domınio do gene e considerado — incluindo o seu valor anterior a mutacao.

Assim, apesar de mutado, o gene pode continuar possuindo um alelo do tipo q.

82

Dentre os E[Na(q)] alelos tipo q, o numero de alelos mutados que tornam-se tipo nao-q,

Ma(q), e uma variavel aleatoria com distribuicao binomial B(E[Na(q)], pm(q)), definida pela

funcao de distribuicao de probabilidade

f(x) = P [Ma(q) = x]

=

(E[Na(q)]

x

)pxm(q) (1− pm(q))

E[Na(q)]−x. (5.16)Assim, a partir dos E[Na(q)] descendentes com genes tipo q, o valor esperado de indivıduos

que sao mutados e tornam-se alelos tipo nao-q e

E[Ma(q)] = E[Na(q)] pm(q). (5.17)A mutacao pode, tambem, contribuir para a criacao de indivıduos com alelos tipo

q quando os N − E[Na(q)] descendentes com alelos tipo nao-q sao mutados e tornam-

se indivıduos com alelo tipo q. A probabilidade de um descendente mutar e seu gene

tornar-se um alelo tipo q e

pm(q) = pm1

na. (5.18)

O numero de descendentes mutados que tornam-se alelos tipo q, Ma(q), e, tambem,

uma variavel aleatoria com distribuicao binomial B(N − E[Na(q)], pm(q)). Assim, o valor

esperado de descendentes com alelos tipo nao-q, N −E[Na(q)], que sao mutados para tipo

q e

E[Ma(q)] = (N −E[Na(q)]) pm(q). (5.19)Portanto, o numero esperado de descendentes com alelos tipo q e definido pelas con-

tribuicoes da selecao de pais e mutacao, como segue

E[Ra(q)] = E[Na(q)]− E[Ma(q)] + E[Ma(q)]

= E[Na(q)]− E[Na(q)] pm(q) + (N − E[Na(q)]) pm(q), (5.20)sendo Ra(q) uma variavel aleatoria e E[Ra(q)] o numero esperado de descendentes com

alelo tipo q. Substituindo as Equacoes 5.15 e 5.18 na Equacao 5.20 tem-se

83

E[Ra(q)] = E[Na(q)]−E[Na(q)] pm

(1−

1

na

)+(N − E[Na(q)]

)pm

1

na

= E[Na(q)]

[1− pm

(1−

1

na

)− pm

1

na

]+N pm

1

na

= E[Na(q)] (1− pm) +N pm1

na. (5.21)

As frequencias genicas na geracao subsequente pode, portanto, ser aproximada pela

razao entre o numero esperado de alelos e o tamanho da populacao, isto e

ψi(k + 1) =E[Ra(i)]

N(k + 1), ∀i = 1, . . . , na, (5.22)

sendo N(k + 1) = N para uma populacao de tamanho fixo. Agora, a partir da Equacao5.1, e possıvel estimar a diversidade da populacao substituindo pi por ψi(k + 1), da

Equacao 5.22, como segue

Γ(k + 1) = 1−

na∑

i=1

[ψi(k + 1)]2. (5.23)A Equacao 5.21 mostra que as frequencias genicas, ψq(k + 1), na proxima geracao,

k+1, e influenciada pelo numero esperado de indivıduos, E[Ra(q)], que e funcao da pressao

de selecao, β, e pela taxa de mutacao, pm. A pressao de selecao afeta diretamente a

probabilidade de selecao, privilegiando os indivıduos com melhor aptidao a medida que

β cresce. Assim, a partir da pressao de selecao e possıvel controlar o numero esperado

de descendentes, E[Ra(i)], ∀i = 1, . . . , N . Aumentando a taxa de mutacao, o numero

esperado de descendentes com alelo tipo q, E[Ra(q)], tende a diminuir, favorecendo a

diversidade.

O modelo proposto nesta secao descreve a dinamica da frequencia genica em funcao

de dois parametros de fatores evolutivos, β e pm. Esse modelo de dinamica de populacoes

formaliza, atraves das Equacoes 5.22 e 5.23, um modelo de processo evolucionario. Alem

da dinamica da diversidade, a Equacao 5.22 contribuira para a elaboracao da estrategia

de controle da diversidade.

5.4 GRADIENTE ESTOCASTICO E ANALISE DE SENSIBILIDADE

Seja uma distribuicao de probabilidade Gu, de uma variavel aleatoria z dependente de

uma variavel de controle u, para toda Funcao H , Gu integravel, Y = H(z) pode ser

84

estimada como segue

F (u) = Eu(Y ) =

∫H(z) dGu(z). (5.24)

Se existir uma estimativa Yu da derivada ∇F (u), isto e, um vetor Yu com a propriedade

E(Yu) = ∇F (u), (5.25)Yu e chamado o gradiente estocastico de Y .

A constante ∇F (u) e um gradiente estocastico, que, normalmente, nao esta disponıvel

(WU; CAO, 1997). A estimativa do gradiente estocastico pode, usualmente, ser obtida uti-

lizando diferencas finitas. Ainda, se o sistema e analisado por simulacoes, o gradiente

estocastico estimado pode ser obtido pelo metodo da taxa de probabilidade (do ingles,

likelihood ratio method) (ANDRADOTTIR et al., 1993) ou analise de perturbacao (HO; CAO,

1983). O metodo das diferencas finitas, proposto por Kiefer e Wolfowitz (1952), assu-

mindo apenas uma variavel de controle, estima o gradiente estocastico como

Y =Y (1) − Y (2)

2c, (5.26)

sendo que Y (1) tem a distribuicao Gu+c, Y(2) a distribuicao Gu−c e c uma constante

positiva muito pequena (c → 0+). A estimativa Y , Equacao 5.26, e denominada quasi-

gradiente.

No modelo de dinamica de populacoes proposto, a analise de sensibilidade apresenta

a variacao da saıda do processo evolucionario, diversidade da populacao, em relacao as

variaveis de controle.

A diversidade da populacao e uma variavel aleatoria influenciada por muitos fatores,

a saber, as taxas de selecao de pais e reproducao, as probabilidades de cruzamento e

mutacao, a pressao de selecao, dentre outros.

No modelo de populacao generacional, adotado neste modelo de dinamica de po-

pulacoes, as taxas de selecao de pais e reproducao sao iguais a 1.0, isto e, todos os

indivıduos sao candidatos a pais e o numero de filhos gerados, por geracao, e igual ao

tamanho da populacao. A probabilidade de cruzamento tambem nao influencia a diver-

sidade, pois quando um indivıduo e selecionado o alelo do seu gene ja esta garantido

na proxima geracao. Portanto, apenas a probabilidade de mutacao, pm, e a pressao de

selecao, β, exercem influencia sobre a variacao da diversidade da populacao do modelo

proposto.

85

Neste modelo, as diversidades atual e estimada substituem, respectivamente, as variaveis

Y 1 e Y 2 do gradiente estocastico, Equacao 5.26, as frequencias genicas ψi, i = 1, . . . , na,

substituem a variavel aleatoria z e a variavel de controle u pode ser representada por pm

ou β. Assim, pelo quasi-gradiente (KIEFER; WOLFOWITZ, 1952), Equacao 5.26, e possıvel

estimar a sensibilidade da diversidade da populacao em relacao as variaveis de controle.

5.5 TESTES PARA VALIDACAO DO MODELO

O modelo de dinamica de populacoes foi testado em varios experimentos com diferentes

tamanhos de populacao e numeros de alelos. A analise foi baseada no erro em relacao ao

valor encontrado em um algoritmo evolucionario padrao. Todos os experimentos utiliza-

ram genotipos com codificacao real para a funcao quadratica

f = a− b

L∑

i=1

x2i , (5.27)

sendo a = 100, b = 10−5, e L = 10 o numero de genes. A funcao de aptidao, Equacao5.27, tem valor otimo, X∗, na origem, sendo f(X∗) = 100.

A Tabela 5.4 mostra os valores dos parametros utilizados nos experimentos. O tama-

nho da populacao variou de 10 a 400 indivıduos e a taxa de selecao de pais foi 1.0, isto

e, toda a populacao pode ser selecionada para o cruzamento. Para cada experimento,

foram feitas 30 execucoes.

A analise do desempenho foi baseada nas seguintes estatısticas alcancadas durante o

processo evolucionario para os resultados medios de 30 execucoes:� Mın. e Max.: erros mınimo e maximo.� EM: erro medio.� DP: desvio padrao.� EPM: erro percentual medio, isto e, |Γ(k) − Γ(k)|/Γ(k), sendo Γ(k) a diversidade

estimada pelo modelo proposto na geracao k.

O modelo de dinamica de populacoes foi criado para uma populacao infinita onde

as frequencias genicas esperadas nao tem erros. Dois tipos de implementacoes foram

executadas, a primeira com 10 alelos e a segunda com 100 alelos. O objetivo foi analisar

o impacto de diferentes numeros de alelos sobre a previsao da diversidade de populacoes

86

Tabela 5.4 Parametros utilizados nos experimentos.

Parametros Valor

Tamanho da populacao 10,20,50,100,200 e 400

Numero de genes 10

Numero de alelos { 10, 100 }


Metodo de cruzamento 2-pontos

Taxa de cruzamento 0.7

Metodo de mutacao Uniforme

Taxa de mutacao 0.05

Metodo de selecao Roleta

Pressao de selecao 0.01

Numero de geracoes 100

Modelo de populacao Generacional

finitas em genotipos com codificacao real. A Figura 5.3 mostra as barras de erro da

previsao da diversidade da populacao para as populacoes de 10, 100 e 400 indivıduos.

Como esperado, o erro de previsao tende a diminuir quando o tamanho da populacao

aumenta.

A Tabela 5.5 mostra as estatısticas das previsoes em todos os experimentos com

na = 10. Os EPMs para 10 e 20 indivıduos foram elevados, no entanto, este modelo

de dinamica de populacoes pode ser utilizado para esses tamanhos de populacao quando

uma alta precisao de previsao nao e requerida, e.g., para analise de tendencia.

Para as populacoes maiores, 100 e 400 indivıduos, os erros de previsao foram muito

menores do que nas demais populacoes. Os desvios padrao para estes tamanhos de

populacao tambem foram baixos, sugerindo robustez na previsao pois as variacoes do

erro foram baixas.

Os experimentos com 100 alelos alcancaram resultados similares aos casos de 10 ale-

los, com as mesmas tendencias. Isto e, baixo erro de previsao para populacoes de 100

indivıduos ou mais e baixo desvio padrao para todos os tamanhos de populacao. As

Figuras 5.3(b), 5.3(d) e 5.3(f) mostram as barras de erro das previsoes de diversidade

para 100 alelos nas populacoes de 10, 100 e 400 indivıduos, respectivamente. Todos os

erros de previsao para 100 alelos podem ser vistos na Tabela 5.5.

87

0

0.5

1

(a) Populaçao com 10 indivíduos e na = 10

Div

ersi

dade

0

0.5

1

(b) Populaçao com 10 indivíduos e na = 100

Div

ersi

dade

0

0.5

1

(c) Populaçao com 100 indivíduos e na = 10

Div

ersi

dade

0

0.5

1

(d) Populaçao com 100 indivíduos e na = 100

Div

ersi

dade

0 20 40 60 80 1000

0.5

1

(e) Populaçao com 400 indivíduos e na = 10

Geraçoes

Div

ersi

dade

0 20 40 60 80 1000

0.5

1

(f) Populaçao com 400 indivíduos e na = 100

Geraçoes

Div

ersi

dade

Figura 5.3 Barras de erros de previsao de diversidade para as populacao de 10, 100 e 400

indivıduos.

88

Tabela 5.5 Erros de previsao de diversidade com na = 10.

10 alelos 100 alelos

Pop. Mın. Max. EM DP EPM Mın. Max. EM DP EPM

10 0.0770 0.1497 0.1156 0.0154 30.96 0.0743 0.1462 0.1103 0.0149 30.00

20 0.0604 0.1285 0.0946 0.0146 20.31 0.0482 0.1118 0.0764 0.0152 14.06

50 0.0500 0.1134 0.0764 0.0145 12.57 0.0299 0.0675 0.0443 0.0071 06.59

100 0.0445 0.0955 0.0652 0.0116 09.77 0.0164 0.0432 0.0277 0.0051 03.54

200 0.0380 0.0776 0.0586 0.0096 07.29 0.0876 0.0287 0.0193 0.0042 02.61

400 0.0144 0.0388 0.0252 0.0048 03.43 0.0072 0.0194 0.0130 0.0021 01.43

Os resultados estatısticos para 10 e 100 alelos foram muito semelhantes, com erros

menores na implementacao com 100 alelos. Para populacoes com 100 indivıduos ou mais,

os erros podem ser considerados aceitaveis para alguns problemas. Por exemplo, no

controle da diversidade de populacoes proposto por Diversity-Based. . . (2007), a variacao

da diversidade em relacao ao sinal de controle, dΓ/du, foi considerada constante por nao

ter sido formulado um modelo de processo evolucionario. Com o modelo de dinamica

de populacoes proposto, e possıvel aproximar essa derivada. Os erros apresentados para

populacoes maiores podem ser considerados aceitaveis considerando que sem o modelo de

dinamica de populacoes a derivada dΓ/du e constante, cujo erro nao e mensuravel. Na

analise da evolucao utilizando o equilıbrio de Hardy-Weinberg (HARDY, 1908; WEINBERG,

1908), os erros apresentados nas populacoes com 100 indivıduos ou mais sao proximos

dos erros amostrais de populacoes biologicas (LOPES, 1999; RIDLEY, 2004).

Em todos as populacao, as implementacoes com 10 e 100 alelos tiveram baixos desvios

padrao, o que tambem pode ser observado na Figura 5.3. Esses resultados mostram a

robustez do modelo de dinamica de populacoes, pois. As variacoes do erro de previsao

para 10 e 100 alelos estao plotadas nas Figuras 5.4 e 5.5, para populacoes de 10 e 400

indivıduos. Tanto para populacao de 10 indivıduos quanto para 400 indivıduos, a variacao

do erro e maior nos experimentos com 10 alelos.

A Figura 5.6 mostra o erro percentual medio para populacoes com 10 e 100 alelos.

Para ambos os casos, o perfil das curvas foram semelhantes, isto e, o erro percentual

medio tende a decair com o aumento da populacao a uma taxa semelhante. A partir

da populacao de 100 indivıduos, o EPM e baixo se comparado a menor populacao, em

torno de 5%. A partir dessa populacao de 100 indivıduos, o erro continua decrescendo,

mas a uma taxa pequena. Isso mostra que, mesmo o modelo de dinamica de populacoes

89

0 20 40 60 80 100 1200

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

Gerações

Err

o de

pre

visã

o

N = 10N = 400

Figura 5.4 Variacao do erro nas populacoes com 10 e 400 indivıduos com na = 10.

0 20 40 60 80 100 1200

0.05

0.1

0.15

0.2

0.25

Gerações

Err

o de

pre

visã

o

N = 10N = 400

Figura 5.5 Variacao do erro nas populacoes com 10 e 400 indivıduos com na = 100.

tendo sido elaborado para populacoes infinitas, a partir de populacoes de 100 indivıduos

os erros de previsao sao reduzidos.


Este capıtulo apresentou um novo modelo de dinamica de populacoes que descreve o

comportamento da frequencia genica e da diversidade da populacao. O modelo foi ide-

alizado para uma populacao generacional infinita. Para aplicacoes com genotipos com

codificacao real, o calculo da diversidade da populacao e feito dividindo o domınio do

gene em sub-intervalos que representam os tipos de alelos. O modelo proposto e baseado

90

0 50 100 150 200 250 300 350 4000

5

10

15

20

25

30

35

Tamanho da população

Err

o pe

rcen

tual

méd

io

10 alelos100 alelos

Figura 5.6 Erro medio para 10 e 100 alelos.

na frequencia genica, uma variavel aleatoria dependente de dois parametros: a taxa de

mutacao e a pressao de selecao.

No modelo de dinamica de populacoes proposto, a complexidade computacional e

maior na selecao para cruzamento. Nessa fase, o calculo da probabilidade de selecao

demanda um esforco computacional mais significativo, em especial no segundo sorteio

de pais para cruzamento, onde as probabilidades de selecao devem ser re-calculadas.

Entretanto, para populacoes maiores, com 100 indivıduos ou mais, pode-se considerar

a probabilidade de selecao do segundo sorteio de pais igual a do primeiro sorteio —

como mostrou o exemplo da Secao 5.3. Na segunda fase do calculo da frequencia genica,

envolvendo a mutacao, ha um baixo esforco computacional, sem atraso significativo do

processo evolucionario, pois executa-se apenas dois calculos de produto para cada tipo

de alelo.

Como mostra a Figura 5.6, o erro medio tende a decrescer a medida que a populacao

aumenta. Os resultados com gene de 10 e 100 alelos foram semelhantes em todos os indica-

dores, mostrando independencia em relacao ao numero de alelos. Para as populacoes com

10, 20 e 50 indivıduos, os erros de previsao da diversidade foram mais elevados se com-

parados as demais populacoes, especialmente para as populacoes de 10 indivıduos onde

os erros foram de 30.96% and 30.00% para 10 e 100 alelos, respectivamente. Entretanto,

em problemas com populacoes menores, e.g., 10 indivıduos, se nao for necessaria precisao

elevada, o modelo proposto pode ser utilizado para sinalizar tendencias de variacao ou

evolucao.

O modelo de dinamica de populacoes proposto formaliza o modelo do processo evo-

91

lucionario, viabilizando sua aplicacao no controle de parametros de fatores evolutivos,

controle de diversidade e analise de convergencia e sensibilidade em algoritmos evolu-

cionarios. O quasi-gradiente, Equacao 5.26, pode ser utilizado para ajustar um parametro

genetico em um problema de controle de diversidade (DIVERSITY-BASED. . . , 2007). Nes-

sas aplicacoes, um modelo de processo evolucionario e importante nao so para entender

a sua dinamica, mas tambem para definir estrategias de adaptacao.

Adicionalmente, este modelo de dinamica de populacoes pode ser utilizado para es-

tudo de biodiversidade e evolucao em populacoes naturais, principalmente porque estas

populacoes sao, normalmente, elevadas, tornando as previsoes mais confiaveis. Por exem-

plo, o modelo pode ser utilizado para comparar a frequencia genica prevista com o modelo

de Hardy-Weimberg. Assim, e possıvel estimar se os fatores evolutivos estao atuando e a

populacao esta evoluindo ou esta em equilıbrio.

92

CAPITULO 6

MODELOS DE CONTROLE DE PARAMETROS

6.1 INTRODUCAO

Este capıtulo apresenta dois modelos para controle da diversidade em algoritmos evolu-

cionarios, o controle adaptativo, apresentado da Secao 6.2 ate a Secao 6.5, e o controle

da PDF da diversidade, apresentado da Secao 6.6 ate a Subsecao 6.6.3. As propostas

incluem um modelo de referencia, um modelo de processo evolucionario e estrategias de

controle. No controle adaptativo, a pressao de selecao ou a taxa de mutacao e utilizada

como sinal de controle e a estrategia de controle visa ajustar a entrada do processo e

os parametros do controlador com o objetivo de aproximar a diversidade da populacao

da diversidade do modelo de referencia. No controle da PDF da diversidade, a taxa de

mutacao e a entrada do processo e a estrategia de controle visa ajustar esta entrada com

o objetivo de aproximar a PDF da diversidade de uma PDF de referencia.

O modelo de controle adaptativo, denominado Controle Adaptativo por Diversidade

de Referencia (DRAC, do ingles, Diversity-Reference Adaptive Control), cria uma nova

concepcao de controle de diversidade em AEs. O controle e baseado em um modelo de

referencia com premissas gerais fundamentadas a partir do Capıtulo 3. O objetivo e

encontrar parametros que permitam que o processo evolucionario siga o comportamento

do modelo de referencia — do ponto de vista da diversidade. A vantagem deste metodo

e possibilitar a elaboracao, teorica ou empiricamente, de um modelo de referencia que

permita ao processo evolucionario o melhor desempenho possıvel.

O modelo de controle de PDF, denominado Algoritmo Evolucionario Adaptativo Ba-

seado na Funcao de Distribuicao de Probabilidade de Diversidade (PDFEA, do ingles,

Probability Density Function Based Evolutionary Algorithm), adota uma concepcao dife-

rente. No PDFEA, o objetivo e controlar a PDF da diversidade do processo evolucionario,

ao inves do valor da diversidade. Adicionalmente, neste tipo de controle se esta tambem

controlando a diversidade esperada — media. Ao se controlar a PDF da saıda do processo

evolucionario, se esta automaticamente controlando o seu valor medio, considerando que

o valor medio da PDF da saıda do processo e a diversidade esperada na proxima geracao.

93

O controle de PDF tem, ainda, a possibilidade de um controle indireto da distribuicao

dos indivıduos no espaco de solucoes. A PDF da diversidade nao e um histograma

da distribuicao dos indivıduos no espaco de solucoes. Portanto, uma PDF com menor

variancia, mais estreita, significa que a diversidade esta menos sujeita as variacoes na

proxima geracao. Isso ocorre exatamente quando os indivıduos estao mais distribuıdos

no espaco de solucoes ou existem muitos tipos de alelos presentes em um determinado

gene. Assim, em uma geracao nao havera grande variacao de diversidade, como mostra

a Figura 6.4(a). No inıcio, a diversidade esperada para a proxima geracao e alta e

sua variancia e baixa. Por outro lado, uma PDF com maior variancia significa pouca

distribuicao dos indivıduos no espaco de solucoes ou a existencia de poucos tipos de

alelos em um determinado gene. Assim, em uma geracao, podera ocorrer grande variacao

da diversidade com o espalhamento de um grupo de indivıduos ou com o surgimento

ou aumento de um tipo de alelo. Portanto, ao se controlar a PDF, a distribuicao dos

indivıduos no espaco de solucoes esta, indiretamente, sendo controlada.

O restante deste capıtulo esta organizado como segue. A Secao 6.2 apresenta dois

modelos de referencia de diversidade propostos. A Secao 6.3 descreve dois modelos de

processo evolucionario. A Secao 6.4 apresenta a proposta de processo evolucionario como

um sistema de controle. A Secao 6.5 apresenta a estrategia de controle para ajustes

do sinal de controle e dos parametros do controlador, nas Subsecoes 6.5.1 e 6.5.2, e um

mecanismo de selecao proposto, na Subsecao 6.5.3. A Secao 6.6 apresenta o controle de

PDF aplicado aos AEs. A Subsecao 6.6.1 demonstra como calcular a PDF da diversidade

de populacoes de AEs. A Subsecao 6.6.2 descreve como gerar amostras para identificar

o modelo do processo evolucionario. A Subsecao 6.6.3 apresenta a estrategia de controle

de diversidade em AEs. A Secao 6.7 apresenta as discussoes finais sobre os modelos de

controle propostos.

6.2 MODELO DE REFERENCIA DE DIVERSIDADE

O modelo de referencia apresenta um comportamento da diversidade que deve ser se-

guido pelo processo evolucionario. Enquanto o processo evolucionario tem como objetivo

encontrar a solucao otima, o sistema de controle ajusta os parametros do controlador

a fim de que a diversidade da populacao se aproxime o maximo possıvel da diversidade

determinada pelo modelo de referencia. O modelo de referencia pode ser genericamente

expresso como

94

Γm(k + 1) = Φ(Γm(k), uc(k), k), (6.1)sendo Φ(·) uma funcao nao-linear, Γm a saıda do modelo de referencia, uc o sinal de

comando (i.e., a entrada do modelo) e k o instante discreto de tempo (geracao).

A partir do modelo de Hardy-Wimberg (HARDY, 1908; WEINBERG, 1908), apresentado

na Secao 3.4, e possıvel concluir que nao existe evolucao sem variacao genica. Conside-

rando essa premissa, um modelo geral de diversidade e criado com base em duas hipoteses:

1. Durante o processo evolucionario, e necessario que a diversidade da populacao de-

cresca para haver evolucao; e

2. A diversidade possua um valor mınimo para manter um equilıbrio entre exploracao

e explotacao.

Adicionalmente, a cada mudanca do ambiente, a diversidade do modelo de referencia

salta do seu valor atual, Γm(k), para o valor da diversidade inicial, Γm(0), aumentando

de forma induzida a diversidade da populacao. Portanto, propoe-se um modelo geral de

diversidade que decai do seu valor inicial ate um mınimo pre-determinado. Propoe-se,

tambem, um aumento da diversidade apos as mudancas do ambiente, detectadas pela

variacao negativa da aptidao do melhor indivıduo.

Nesta tese, sao propostos tres diferentes modelos de referencia com as caracterısticas

supracitadas. O primeiro modelo, denominado modelo de referencia exponencial, possui

decaimento exponencial no tempo, como

Γm(k) = exp(−uc (k − kl)), (6.2)sendo kl a geracao que ocorreu a ultima mudanca do ambiente. O modelo de referencia

exponencial tem seu decaimento controlado pelo sinal de comando uc, que e alterado por

decisao do projetista, condicoes do ambiente ou desempenho do AE.

O segundo modelo, denominado modelo de referencia linear, possui decaimento linear,

definido pela expressao

Γm(k) =

{Γ(0)−A k−kl

K, se k − kl < K

Γmin, caso contrario,(6.3)

sendo A uma constante e K o numero de geracoes da fase de decaimento de diversidade,

depois da qual a diversidade e fixada em um valor mınimo, Γmin, pre-determinado. Assim,

quanto menor K, mais rapido sera o decaimento da diversidade.

95

O terceiro modelo de diversidade e baseado na dinamica da heterozigosidade, Equacao3.23, no qual o sinal de comando, uc, e o tamanho efetivo da populacao, Ne, e a hetero-

zigosidade, He, substituıda pela diversidade do modelo de referencia. Para todos os tres

modelos de referencia propostos, Γm(k) = Γmin, se Γm(k) for menor que Γmin, sendo Γmin

a diversidade mınima do modelo de referencia e Γm(0) = Γ(0).

6.3 MODELO DO PROCESSO EVOLUCIONARIO

O comportamento do processo evolucionario e descrito pelo modelo de dinamica de po-

pulacoes apresentado no Capıtulo 5, resultando o sistema

ψi(k + 1) = hψ(ψi(k), u(k)), ∀i = 1, . . . , na, (6.4)Γ(k) = 1−

na∑

i=1

[ψi(k)]2, (6.5)

sendo ψi a frequencia genica do i-esimo alelo, u o sinal de controle (variavel de entrada),

hψ(·) uma funcao estocastica nao-linear, Equacao 5.22, que descreve a frequencia genica

da populacao, Γ(k) a diversidade da populacao no tempo discreto k (geracao) e na o

numero de tipos de alelos, calculado conforme a implementacao, Secao 5.2.

A pressao de selecao, β, e a taxa de mutacao, pm, sao os parametros dos fatores

evolutivos escolhidos como sinal de controle. A pressao de selecao regula o peso da

aptidao sobre o processo de selecao, influenciando a variacao da diversidade da populacao.

A mutacao, naturalmente, tende a aumentar a diversidade ou minimizar a sua perda. Se a

acao da mutacao for maior que os efeitos multi-fatoriais que causam a perda da diversidade

em geracoes sucessivas, a diversidade aumentara; caso contrario, apenas minimizara a sua

perda. Para esses dois parametros, sao definidas estrategias de controle que mantenham

a diversidade da populacao nos nıveis determinados.

Este modelo de processo evolucionario calcula a frequencia genica e a diversidade de

um gene especıfico do indivıduo. A dinamica da funcao hψ(·) em relacao a diversidade e,

aproximadamente, a mesma para todos os genes do indivıduo, como mostram os testes

apresentados na Secao 5.2. No entanto, e possıvel utilizar mais de um gene na ava-

liacao da diversidade da populacao, aplicando, por exemplo, a media de um conjunto de

diversidades genicas calculadas pela Equacao 6.5.96

6.4 CONTROLE ADAPTATIVO DO PROCESSO EVOLUCIONARIO

A Figura 6.1 mostra o diagrama de blocos do sistema de controle por modelo de referencia

aplicado ao controle de parametros dos algoritmos evolucionarios. O sistema de controle

possui dois lacos, o interno, envolvendo o processo evolucionario e o controlador, que

retorna a saıda do processo, e o externo, composto pelo processo e mecanismo de ajuste,

o qual e responsavel pelas mudancas dos parametros do controlador.

O mecanismo de ajuste parametrico utiliza o desvio entre a saıda desejada, Γm(k),

e a saıda do processo evolucionario, Γ(k), na geracao k, para atualizar os parametros

do controlador. O controlador tem como entradas o sinal de comando, uc, o retorno

do processo evolucionario, atraves da diversidade Γ, e os parametros do controlador,

θ1, . . . , θnp, sendo np o numero de parametros do controlador. A saıda do controlador e o

sinal de controle, u, que neste caso e a pressao de selecao, β, ou a taxa de mutacao, pm.

Figura 6.1 Controle de parametros pelo SAMR.

6.5 ESTRATEGIA DE CONTROLE ADAPTATIVO

A estrategia de controle adaptativo proposta baseia-se nos ajustes da entrada de controle

e dos parametros do controlador. Tais ajustes sao realizados em funcao do desvio da

saıda do modelo de referencia e da diversidade da populacao. O objetivo da estrategia

97

de controle e estabelecer

limk→∞

|Γm(k)− Γ(k)| = 0. (6.6)Esta secao apresenta duas estrategia de controle, uma baseada apenas no sinal de

comando e no parametro do controlador e outra baseada no sinal de comando, na saıda

do processo evolucionario e nos parametros do controlador. As proximas subsecoes apre-

sentam essas estrategias de controle.

6.5.1 Estrategia Baseada no Sinal de Comando

Nesta estrategia, o sinal de controle e uma funcao do sinal de comando, uc, e do parametro

do controlador, θ. A lei de controle e, portanto, definida como

u(k) = θ(k) uc(k). (6.7)O metodo MIT e empregado para ajustar o parametro θ, que tem como objetivo

minimizar a funcao custo

J(θ) =1

2e2, (6.8)

sendo

e(k) = Γm(k)− Γ(k) (6.9)o erro ou desvio entre a saıda do modelo de referencia, Γm, e a diversidade da populacao,

Γ, na geracao k. O ajuste de θ, Secao 4.4.1.1, e realizado no sentido contrario do gradiente

de J , isto e,

dθ

dt= −η e

de

dθ

= η edΓ

dθ. (6.10)

sendo η uma constante que define o tamanho do passo sobre a superfıcie de J . Utilizando

a regra da cadeia em dΓ/dθ, o ajuste de θ torna-se

dθ

dt= η e

dΓ

du

du

dθ. (6.11)

98

A partir da Equacao 6.7, chega-se a du/dθ = uc, transformando o ajuste de θ em

dθ

dt= η e

dΓ

duuc. (6.12)

A derivada dΓ/du e aproximada pelo quasi-gradiente estocastico, Equacao 5.26, para

u = {β, pm}. O sistema de controle apresentado nesta subsecao e equivalente ao da

Figura 6.1, sem o laco usual que liga a saıda do processo evolucionario a entrada do

controlador.

6.5.2 Estrategia Baseada no Sinal de Comando e na Saıda do Processo

Esta estrategia de controle e baseada em dois lacos, o interno retorna ao controlador a

saıda do processo evolucionario e o externo ajusta os parametros do controlador atraves

do desvio entre as saıdas do processo e a desejada. Portanto, o sinal de controle e definido

como

u(k) = θ1(k) uc(k)− θ2(k) Γ(k), (6.13)sendo θ = [θ1 θ2]

T o vetor de parametros do controlador.

Pelo metodo MIT, os ajustes dos parametros do controlador, θi, i = 1, 2, sao realizados

como segue

dθidt

= −η e∂e

∂θi, i = 1, 2. (6.14)

Aplicando a regra da cadeia em dΓ/dθi, i = 1, 2, e utilizando a Equacao 6.13 para

encontrar ∂u/∂θi, i = 1, 2, tem-se

∂e

∂θ1= −

∂Γ

∂u

∂u

∂θ1

= −∂Γ

∂uuc (6.15)

e

∂e

∂θ2= −

∂Γ

∂u

∂u

∂θ2

=∂Γ

∂uΓ. (6.16)

99

A derivada parcial ∂Γ/∂u e, assim como na subsecao anterior, aproximada pelo quasi-

gradiente estocastico, Equacao 5.26. O sistema de controle apresentado nesta subsecao e

equivalente ao da Figura 6.1.

6.5.3 Mecanismo de Selecao

A partir do equilıbrio de Hardy-Weinberg, Secao 3.4, conclui-se que nao ha evolucao

sem variacao genica. Por esse motivo, e importante que o controle da diversidade seja

tal que a evolucao da populacao, do ponto de vista da aptidao media da populacao,

nao seja prejudicada. Contudo, mesmo em uma populacao ideal de Wright-Fisher, com

selecao aleatoria e sem migracao, ocorre perda de diversidade em consequencia da de-

riva genetica. A perda da diversidade e, pois, inerente em populacoes naturais ou de

algoritmos evolucionarios com baixas taxas de mutacao.

Pelas razoes supracitadas, o mecanismo de selecao proposto determina que parte da

populacao seja selecionada de modo a preservar a diversidade. A outra parte da po-

pulacao e selecionada por um metodo padrao (e.g., torneio ou roleta), tendendo a evoluir

a populacao do ponto de vista da sua aptidao media. Ademais, para garantir que a

melhor solucao sempre prevaleca e possibilitar a deteccao de variacoes do ambiente, o

melhor indivıduo sempre e selecionado para a proxima geracao.

O mecanismo de selecao proposto e executado em tres estagios, a saber:

1. Selecao do melhor indivıduo para assegurar a permanencia da melhor solucao na

proxima geracao;

2. Selecao de αN indivıduos por selecao padrao (e.g., torneio ou roleta). Este estagio

tende a selecionar os indivıduos mais aptos, provavelmente, proximos do melhor

indivıduo, que criarao nichos propiciando a explotacao nesta regiao; e

3. Selecao dos (1 − α)N − 1 indivıduos restantes em funcao das suas distancias ao

ponto medio geometrico da populacao utilizando a Equacao 5.6, substituindo fi por

di.

Quando nao ha pressao de selecao, i.e., β = 0, os metodos padroes de selecao tornam-

se aleatorios. No entanto, como descrito no Capıtulo 3, mesmo com selecao aleatoria ha

perda de diversidade. Isso so nao ocorre se a taxa de mutacao for alta, o que inevitavel-

mente causa instabilidade no processo de busca por aumento da aleatoriedade. Mesmo

100

sem pressao de selecao havera perda de diversidade. Por essa razao, o Estagio 3 tem forte

enfase no controle da diversidade, pois a selecao e efetuada em funcao das distancias dos

(1 − α)N − 1 indivıduos restantes ao ponto medio geometrico da populacao. Portanto,

quanto maior di de um indivıduo, maior wi e sua probabilidade de selecao. Como descrito

na Secao 5.3, aumentando a pressao de selecao, as probabilidades de selecao de indivıduos

mais aptos sao elevadas.

A Figura 6.2 mostra o pseudo-codigo do modelo de controle adaptativo de diversidade

proposto, sendo, P (k) a populacao na geracao k, Q(k) uma sub-populacao de P (k) com

indivıduos candidatos a pais, F (k) uma populacao de filhos de Q(k), F ′(k) a populacao

F (k) apos a mutacao e S(k) a populacao de selecionados para a proxima geracao, k + 1.

Figura 6.2 Pseudo-codigo do metodo de controle de diversidade proposto — DRAC

6.6 CONTROLE DE PDF APLICADO AOS AES

Nesta abordagem, a PDF da diversidade da populacao de AEs e controlada ao inves da

propria diversidade. O controle da diversidade da populacao fornece uma indicacao global

101

da diversidade, sem uma indicacao da distribuicao dos indivıduos no espaco de solucoes.

No processo evolucionario, quando apenas a diversidade for controlada pode-se conseguir

que seu nıvel seja o desejavel sem que a distribuicao dos indivıduos no espaco de solucoes

seja adequado. Por exemplo, mesmo se a maioria da populacao estiver muito proxima do

melhor indivıduo, a diversidade pode se aproximar do valor desejado se alguns indivıduos

estiverem afastados do ponto medio da populacao. Entretanto, essa proximidade excessiva

da maioria da populacao ao melhor indivıduo pode prejudicar a busca global.

Se a PDF da diversidade for controlada, estara sendo controlada a diversidade espe-

rada para a proxima geracao e, indiretamente, a distribuicao dos indivıduos no espaco de

solucoes. Por exemplo, a Figura 6.3 mostra as PDFs de duas populacoes, ambas com a

mesma diversidade media. Na Figura 6.3(a), a PDF tem pouca variancia, o que significa

que provavelmente havera pouca variacao da diversidade na proxima geracao. Isso pode

ocorrer porque a maioria dos indivıduos esta concentrada na vizinhanca do ponto medio

da populacao. Assim, os descendentes tendem a surgir nessa mesma vizinhanca, variando

pouco a diversidade se a taxa de mutacao for baixa. Nesse caso, um aumento da taxa

de mutacao poderia dissipar um pouco mais a populacao, aumentando a variancia da

PDF da diversidade. Na Figura 6.3(b), a PDF tem maior variancia, o que significa uma

populacao mais distribuıda no espaco de solucoes. Logo, a diversidade podera assumir

um intervalo de valores maior na proxima geracao. No controle da diversidade, e.g.,

por modelo de referencia, essa identificacao da distribuicao dos indivıduos no espaco de

solucoes nao pode ser feita apenas pelo valor da diversidade.

0 0.2 0.4 0.6 0.8 10

0.2

0.4

0.6

0.8

1(a)

Γ(k+1)

PD

F

0 0.2 0.4 0.6 0.8 10

0.2

0.4

0.6

0.8

1(b)

Γ(k+1)

PD

F

Figura 6.3 PDFs de duas populacoes com mesma diversidade media.

O controle da PDF da diversidade da populacao pode equilibrar melhor a distribuicao

102

dos indivıduos no espaco de solucoes, permitindo maior equilıbrio entre explotacao e

exploracao. Ademais, o controle da PDF e, tambem, um controle indireto da diversidade,

pois ao se ajustar a PDF da diversidade aproxima-se o seu valor medio do valor medio

da PDF desejada.

O metodo de controle da PDF (WANG, 2000a) aplicado aos algoritmos evolucionarios

e implementado em tres fases:

1. geracao de amostras da diversidade da populacao;

2. identificacao do modelo do processo evolucionario via rede neural B-Spline; e

3. execucao do processo evolucionario utilizando a estrategia de controle de PDF.

As proximas subsecoes apresentam em detalhes as tres fases supracitadas.

6.6.1 Calculo da PDF da Diversidade

No inıcio do processo evolucionario, a diversidade da populacao e normalmente alta,

pois os indivıduos estao distribuıdos em grande parte do espaco de solucoes, resultando

uma PDF da diversidade com media alta e variancia baixa. Assim, a diversidade da

populacao tem pouca sensibilidade aos parametros do processo evolucionario. Ao longo

das geracoes, a diversidade tende a diminuir e a PDF torna-se mais sensıvel as variacoes

dos parametros. Essa particularidade pode ser observada na Figura 6.4, para o espaco

de solucoes da funcao de Ackley (EIBEN; SMITH, 2003), onde a taxa de mutacao foi

utilizada como sinal de controle, u. A Figura 6.4(a) mostra a PDF da populacao inicial,

as Figuras 6.4(b) e (c), depois de 100 e 200 geracoes, mostram PDFs similares, pois nao

ha grande variacao da diversidade desde a geracao inicial. A Figura 6.4(d) mostra a PDF

da populacao na geracao 500, que apresenta significativa sensibilidade as variacoes da

taxa de mutacao.

A justificativa para tal sensibilidade esta na distribuicao dos indivıduos no espaco

de solucoes. Quanto mais distribuıdos menor e a sensibilidade da diversidade, pois e ne-

cessario que muitos indivıduos sejam modificados para que haja uma variacao significativa

da diversidade, e vice-versa. O aumento da taxa de mutacao tende a aumentar a diversi-

dade, qualquer que seja seu nıvel. Entretanto, para uma mesma taxa de mutacao, quanto

menor a diversidade de uma populacao maior a variacao da diversidade em geracoes su-

cessivas. Por essa razao, a PDF tem maior variancia ao longo de centenas de geracoes,

devido a tendencia natural de queda da diversidade.

103

00.33

0.671.0

0

10

200

0.5

1

Γ

(a) PDF na populaçao inicial

u

PD

F

00.33

0.671.0

0

10

200

0.2

0.4

Γ

(b) PDF na geraçao 100

u

PD

F

00.33

0.671.0

0

10

200

0.2

0.4

Γ

(c) PDF na geraçao 200

u

PD

F

00.33

0.671.0

0

10

200

0.1

0.2

Γ

(d) PDF na geraçao 500

u

PD

F

Figura 6.4 PDF de uma populacao da geracao inicial ate a geracao 500.

104

Seja uma configuracao de parametros do processo evolucionario em uma geracao k, a

diversidade da populacao na proxima geracao, k + 1, pode assumir um valor dentro de

um intervalo em decorrencia da natureza estocastica do processo evolucionario. A PDF

da diversidade, γ(·, ·), em uma dada geracao k, e calculada considerando esse intervalo,

que tem uma distribuicao de probabilidade que corresponde a PDF da diversidade da

populacao na proxima geracao, k + 1.

6.6.2 Geracao de Amostras e Identificacao do Modelo do Processo Evolucionario

A geracao das amostras para identificacao da PDF da diversidade da populacao e feita

simulando o processo evolucionario. A identificacao do modelo, apresentada na Subsecao

4.5.2, considera o processo evolucionario como um sistema estocastico dinamico linear.

No modelo proposto, o processo evolucionario possui uma entrada de controle, a taxa

de mutacao, pm, porque sensibiliza significativamente a diversidade da populacao. Na

aproximacao do modelo estocastico, Secao 4.5.2, o processo e dinamico e linear, isto

e, a relacao entre wi e u (u = pm), i = 1, . . . , n, varia linearmente em funcao do

tempo. Portanto, a partir de uma determinada geracao, encontram-se os pesos vi,j ,

i = 1, . . . , n, j = 1, . . . , m, das funcoes de base radial.

A identificacao do modelo da PDF depende de varios fatores, como o espaco de

solucoes, que possui suas proprias particularidades, como a incidencia de platos, numero

de picos e suas inclinacoes. Por essas razoes, e necessario identificar um modelo de PDF

para cada espaco de solucoes.

A identificacao do modelo da PDF e realizado com o auxılio de uma populacao P (k),

colhendo amostras de diversidade da populacao descendente P (k+ 1) dada uma taxa de

mutacao, pm(k). Assim, cada valor de pm(k), para uma populacao P (k), produzira uma

PDF γ(Γ, pm) a partir de NΓ amostras, isto e,

γ(Γ, pm)← {Γ1, . . . ,ΓNΓ}, (6.17)

sendo Γi a i-esima amostra de diversidade. Com essas amostras de diversidade, e possıvel

calcular a funcao de distribuicao acumulativa, como segue

F (Γ, pm) =1

NΓ

(numero de Γi ≤ Γ), ∀Γ ∈ [a, b], i = 1, . . . , NΓ. (6.18)Portanto, a PDF da diversidade para uma dada taxa de mutacao, pm, pode ser obtida

como

105

γ(Γ, pm) =∆F (Γ, pm)

∆Γ, (6.19)

sendo ∆F (Γ, pm) e ∆Γ valores incrementais de F (Γ, pm) e Γ, respectivamente. Para se

construir o modelo de PDF, repete-se o procedimento anterior para todos os valores de

pm desejados, estabelecidos em um intervalo discreto.

A PDF desejada pode ser determinada de varias formas diferentes, pode ser fixa

durante todo o processo evolucionario ou pode variar em intervalos pre-determinados ou

de acordo com um retorno de desempenho do processo.

0 2 4 6 8 100

0.2

0.4

0.6

0.8(a)

Diversidade desejada (Γd)

γ(Γd, u

k)

0 2 4 6 8 100.18

0.2

0.22

0.24

0.26

0.28

0.3(b)

Diversidade desejada (Γd)

γ(Γd, u

k)

Figura 6.5 PDF desejada: (a) concentrada no melhor indivıduo ou gene e (b) distribuıda em

tres nichos no espaco de solucoes.

A Figura 6.5(a) mostra duas PDFs desejadas com distribuicao normal N(µ, σ2), sendo

µ a diversidade media e σ2 a variancia. Na Figura 6.5(b), a PDF desejada possui uma

distribuicao particular com tres picos de maior probabilidade de ocorrencia, sendo o maior

deles na diversidade media.

6.6.3 Estrategia de Controle de PDF

Esta secao apresenta o metodo de controle de PDF da diversidade a partir do algoritmo

apresentado na Secao 4.5.3. Como um sistema dinamico, que pode ser expresso um passo

a frente, tem-se

f(k + 1,Γ) = a1 f(k,Γ) + . . .+ an−1 f(k − n+ 2,Γ) +

C(Γ)D0 u(k) + . . .+ C(Γ)Dn−2 u(k − n + 2), (6.20)106

para todo Γ ∈ [a, b], sendo f(k,Γ) = γ(Γ, U(k)) − L(Γ). O objetivo do sistema de

controle e encontrar uma sequencia {pm(k)}, tal que a PDF da diversidade da populacao

se aproxime ao maximo de uma funcao de distribuicao de probabilidade pre-definida.

No algoritmo de controle, {pm(k)} deve ser selecionado de tal forma a minimizar o

seguinte criterio de desempenho

J =

∫ b

a

(γ(y, U(k))− g(y))2 dy. (6.21)

Substituindo a Equacao 6.20 na Equacao 6.21, o criterio J torna-se

J =

∫ b

a

(

n−1∑

i=2

ai f(k − i+ 1,Γ) + C(Γ)Di−1 u(k − i+ 1) + L(Γ)

−g(Γ) + a1 f(k,Γ) + C(Γ)D0 u(k))2 dΓ. (6.22)

Assumindo

g(Γ) = −

(n−1∑

i=2

ai f(k − i+ 1,Γ) + C(Γ)Di−1 u(k−i+1)

)− L(Γ) +

g(Γ)− a1 f(k,Γ), (6.23)sendo g(Γ) a PDF desejada, obtem-se

J =

∫ b

a

(C(Γ)D0 u(k)− g(Γ))2 dΓ. (6.24)Sendo f(k − i,Γ) = C(Γ)V (k − i) e u(k − i) conhecidos para i = 0, 1, 2, . . ., quando o

tempo amostral e k, g(Γ) e uma funcao conhecida em relacao a Γ. Assim, o criterio J

resulta

J =

(∫ b

a

(C(Γ)D0)2 dΓ

)u(k)2

−2

(∫ b

a

(C(Γ)D0g(Γ))2 dΓ

)u(k) +

∫ b

a

g(Γ)2 dΓ. (6.25)Para minimizar J , a entrada de controle u(k) pode ser obtida resolvendo

∂J

∂u(k)= 0. (6.26)

107

Considerando que a integral∫ bag(Γ)2dΓ e independente da entrada de controle u(k), esta

ultima pode ser obtida por

u(k) =

∫ baC(y)D0g(y)dy∫ ba(C(y)D0)2dy

(6.27)O algoritmo de controle de PDF da diversidade de algoritmos evolucionario e apre-

sentado a seguir:

1. Na geracao k, coletar pm(k) e um conjunto {Γki};

2. Utilizar as Equacoes 6.18 e 6.19, L(Γ), e {Γki} para formular f(k,Γ);

3. Para j = 1, 2, . . . , n− 1, usar f(k− j,Γ), {pm(k− 1), pm(k− 2), . . . , pm(k−n+2)},

todos os parametros conhecidos na Equacao 6.20 e uma dada distribuicao desejada

g(Γ) para calcular g(Γ);

4. Calcular as integrais∫ baC(Γ)D0k(Γ)dΓ e

∫ ba(C(Γ)D0)

2dΓ;

5. Calcular pm(k), usando a Equacao 6.27, e aplicar no processo evolucionario;

6. k = k + 1 e voltar ao passo 1 se o criterio de parada nao for atendido.

Figura 6.6 Diagrama de blocos do metodo de controle de PDF de diversidade.

No passo 1, o conjunto {Γki} e gerado a partir do proprio processo evolucionario,

como descrito na Subsecao 6.6.2. No passo 2, as amostras {Γki} geram γ(Γ, Uk−1), via

Equacoes 6.18 e 6.19, que subtraıdo em L(Γ) gera f(k,Γ). No passo 3, valores passados

108

de f(·, ·) e u, e uma PDF desejada, g(Γ), sao utilizados para encontrar g(Γ). Finalmente,

depois de calculadas as integrais do passo 4, o sinal de controle u = pm e encontrado

e aplicado no passo 4. A Figura 6.6 mostra o diagrama de blocos do metodo de con-

trole de PDF aplicado a AEs proposto. Todo o algoritmo descrito anteriormente esta

contido no bloco Controlador (RN B-spline), que tem como entrada a diversidade

da populacao na geracao k, a PDF desejada, PDFd, e os parametros do processo evolu-

cionario, {P (k), ψ(k)}, isto e, toda a populacao e os parametros dos fatores evolutivos

(e.g., pm(k), pc, β). Esse ultimo, {P (k), ψ(k)}, utilizado para simular o processo evolu-

cionario e gerar {Γki}. A saıda do controlador e o sinal de controle, pm, que e aplicado

no processo evolucionario.


Este capıtulo apresentou duas abordagens de controle de parametros em algoritmos evo-

lucionarios, os controles adaptativo e de PDF. A primeira abordagem, utilizando controle

adaptativo (NARENDRA; ANNASWAMY, 2005), visa controlar a diversidade da populacao

segundo um modelo de referencia. A segunda abordagem, utilizando controle de PDF

(WANG, 2000a), tem como objetivo controlar a funcao de distribuicao de probabilidade

da diversidade da populacao.

Os principais objetivos do controle da diversidade sao aumentar o numero de regioes

exploradas no espaco de busca e evitar a convergencia prematura. O controle adaptativo

trata o processo evolucionario como um processo a ser controlado. Na elaboracao dessa

abordagem, foi proposto um modelo de referencia geral, baseado em hipoteses funda-

mentadas pelo Capıtulo 3. O sistema de controle considera como variavel de entrada do

processo a pressao de selecao e/ou a taxa de mutacao. Para a determinacao do sinal de

controle e dos parametros do controlador, foram propostas duas estrategias de controle

baseadas no metodo MIT.

Os ajustes dos parametros do controlador contribuem para tornar o sistema de controle

mais sensıvel as condicoes do ambiente. A utilizacao de um modelo de referencia, alem

de guiar o mecanismo de ajuste com mais precisao, pode contribuir para se alcancar um

modelo de referencia que proporcione um melhor desempenho do processo evolucionario.

A abordagem de controle de PDF em AEs realiza, primeiramente, a identificacao

da PDF da saıda do processo evolucionario utilizando uma rede neural B-Spline. Apli-

cado aos AEs, esse metodo realiza a identificacao do processo quando a diversidade da

109

populacao atinge a diversidade media da PDF desejada. Em seguida, o metodo do gra-

diente descendente e utilizado para ajustar a entrada do processo — a taxa de mutacao.

A principal vantagem do controle de PDF em AEs e poder, tambem, controlar a

diversidade media esperada para a proxima geracao, a variancia e, indiretamente, a dis-

tribuicao dos indivıduos no espaco de solucoes, como descrito na Secao 6.6. Assim, e

possıvel testar diferentes PDFs desejadas para cada tipo de problema e tentar encontrar

um padrao de distribuicao dos indivıduos que alcance melhores resultados.

110

CAPITULO 7

ESTUDO DE CASOS

7.1 INTRODUCAO

Os metodos propostos, DRAC e PDFEA, foram testados e analisados em 26 experimen-

tos, onde investigou-se o comportamento do modelo de referencia, o rastreamento do

sistema de controle e o desempenho em relacao ao AGP e seis algoritmos evolucionarios

adaptativos, a saber, diversity control-oriented genetic algorithm (DCGA) (SHIMODAIRA,

2001), Subsecao 2.5.1, diversity-guided evolutionary algorithm (DGEA) (URSEM et al.,

2002), Subsecao 2.5.2, elitism-based and random immigrants genetic algorithm (ERIGA)

(YANG; TINOS, 2007), Subsecao 2.5.1, random immigrants genetic algorithm (RIGA)

(GREFENSTETTE, 1992), Subsecao 2.5.1, trigged hypermutation (THM) (COBB, 1990),

Subsecao 2.5.1, e two-loop real-coded genetic algorithm (TRAM) (HERRERA; LOZANO,

2000), Subsecao 2.5.1. Os parametros utilizados por esses metodos foram os mesmos

sugeridos por seus autores nos respectivos trabalhos.

O metodo DRAC, Secao 6.5, foi implementado em tres versoes ao longo desta tese

de doutorado. A primeira versao, DRAC v1 (GOUVEA JR.; ARAUJO, 2008a), nao utiliza

o modelo de dinamica de populacoes (GOUVEA JR.; ARAUJO, 2008b), Capıtulo 5, tem a

pressao de selecao, β, como sinal de controle e o mecanismo de selecao proposto, Secao

6.5.3. A segunda versao utiliza o modelo de dinamica de populacoes e duas abordagens,

DRAC v2, que utiliza a pressao de selecao como sinal de controle, e DRAC v2.a, que

adota a taxa de mutacao, pm, como sinal de controle.

O modelo de referencia de diversidade foi analisado em 4 experimentos comparando

o desempenho dos tres modelos apresentados na Secao 6.2. O objetivo foi reforcar a

hipotese, apresentada na mesma secao, que define um modelo de referencia geral inde-

pendente de um modelo analıtico. O rastreamento do sistema de controle foi investigado

em 6 experimentos com dois ambientes distintos utilizando as tres versoes do metodo

DRAC. Finalmente, os metodos DRAC v2, DRAC v2.a e PDFEA foram testados em 16

experimentos com seis ambientes com caracterısticas distintas, apresentados no Apendice

A, comparando seus desempenhos com um AGP e os seis AEs adaptativos supracitados.

111

O restante deste capıtulo esta organizado como segue. A Secao 7.2 apresenta o pla-

nejamento dos experimentos. A Secao 7.3 descreve o metodo utilizado para simular

ambientes dinamicos. A Secao 7.4 investiga o rastreamento realizado pelo sistema de

controle. Na Secao 7.5, sao realizados experimentos com diferentes modelos de referencia

de diversidade com o objetivo de mostrar que a hipotese apresentada na Secao 6.2 nao

depende de um modelo analıtico. A Secao 7.6 apresenta os experimentos com dois ambi-

entes contınuos, a funcao de Ackley (EIBEN; SMITH, 2003), na Subsecao 7.6.1, e a funcao

de Schwefel (SCHWEFEL, 1995), na Subsecao 7.6.2. A Secao 7.7 apresenta os experimen-

tos com a funcao nao-contınua do gerador moving peaks (MORRISON, 2004). Nas Secoes

7.8 e 7.9, sao apresentados experimentos com dois problemas NP-completo de otimizacao

combinatoria, a saber, o problema da mochila e o projeto de rede de radio-transmissores.

A Secao 7.10 apresenta experimentos com um problema de roteamento. Na Secao 7.12,

sao feitas as discussoes finais.

7.2 PLANEJAMENTO DOS EXPERIMENTOS

Esta secao apresenta os parametros gerais utilizados por todos os algoritmos evolu-

cionarios utilizados, assim como os parametros individuais caracterısticos de cada al-

goritmo. A maioria desses parametros utilizou os valores recomendados pelos respectivos

autores, e em alguns casos valores que alcancaram os melhores desempenhos nos expe-

rimentos. Os experimentos utilizaram problemas teste apresentados no Apendice A, a

saber, as funcoes contınuas de Ackley (EIBEN; SMITH, 2003) e Schwefel (1995), Secao

A.2, o gerador de ambiente nao-contınuo moving peaks (MORRISON, 2004), Secao A.3, e

os problemas combinatorios da mochila (SMITH; GOLDBERG, 1992), Secao 7.8, o projeto

de rede de radio-transmissores, Secao 7.9, e o roteamento de redes, Secao 7.10. Com

excecao do roteamento de redes, em todos os experimentos foram simulados ambientes

dinamicos com variacoes cıclicas de 40 geracoes, que mudavam a localizacao do otimo

global, os parametros estruturais ou as restricoes do problema. No roteamento de redes,

as variacoes ocorreram a ciclos de 100 geracoes, um numero constatado, empiricamente,

como mınimo para construcao de caminhos validos.

A seguir sao apresentados os parametros individuais, caracterısticos de cada algoritmo

evolucionario:� No DCGA, a probabilidade de selecao, Equacao 2.13, foi adaptada para genotipos

com codificacao real, substituindo a distancia de Hamming, Hi, pela distancia Eu-

112

clidiana. Para os coeficientes c e α foram utilizados os valores 0.01 e 0.19, respec-

tivamente;� No DGEA, Γmin = 0.02 e Γmax = 0.2;� No DRAC, Γmin = 0.1 e Γm(k) = 0.5Γ(0) apos as mudancas do ambiente;� No RIGA, o numero de imigrantes aleatorios, ni, foi de 30 indivıduos;� No ERIGA, o numero de imigrantes, composto por duas sub-populacoes de imigran-

tes elitistas e aleatorios, ni = nei+nri, foi de 30 indivıduos, sendo o numero mınimo

de imigrantes de cada sub-populacao igual a 4 indivıduos e a taxa de decrescimento,

α, igual a 2 indivıduos;� No THM, foi utilizado uma taxa de hiper-mutacao igual a 0.5 por duas geracoes

consecutivas apos as mudancas do ambiente;� No TRAM, δmin foi 1.0e-100, ∆0 foi 1, G0 foi 100 geracoes e Gmin foi 5 geracoes.

A metrica de diversidade da populacao foi baseada na Equacao 3.11 e o modelo de

referencia foi definido em funcao da dinamica da heterozigosidade, Equacao 3.23, sendo

Γmin = 0.1Γ(0) e Ne = 10. No modelo de referencia, a diversidade decresce ate um

valor mınimo pre-determinado. A Tabela 7.1 mostra os valores dos parametros comuns

utilizados por todos os AEs. A taxa de mutacao igual a 0.05 foi atribuıda aos AEs

que fixam este parametro, como, por exemplo, o AGP. Para cada experimento, foram

realizadas 30 execucoes com um conjunto de sementes comum para todos os AEs. A

analise de desempenho, baseada nos valores medios das 30 execucoes, considerou:� MMA: media das melhores aptidoes (MORRISON, 2004) por geracao, definida como

FT =1

G

G∑

g=1

(1

M

M∑

m=1

Fm,g

), (7.1)

sendo Fm,g a melhor aptidao da g-esima geracao na m-esima execucao, M o numero

de execucoes, e G o numero de geracoes. Se G→∞, o efeito da variacao da melhor

aptidao causado sobre FT em qualquer geracao e reduzido.� DP: desvio padrao de MMA, que pode refletir a variacao da melhor aptidao depois

das mudancas do ambiente.

113

� P(·): os resultados apresentaram distribuicao normal; portanto, foi aplicado o teste

de hipotese, pelo metodo t-test, para nıvel de significancia de 0.05, em relacao ao

MMA de um dos metodos propostos comparado aos demais AEs. Os resultados sao

apresentados com as seguintes notacoes: sinal de adicao (+), se o metodo proposto

for superior; sinal de subtracao (–), se o metodo proposto for inferior; ou sinal

aproximado (≈), se os resultados forem estatisticamente iguais.

Tabela 7.1 Parametros fixos comuns utilizados nos experimentos.

Parametro Valor

Tamanho da populacao 120

Dimensao (# de genes) 30


Probabilidade de cruzamento 0.6

Metodo de cruzamento 2-pontos

Probabilidade de mutacao 0.05

Metodo de selecao Torneio

Tamanho do grupo do torneio 10

Modelo de sel. de sobreviventes Generacional

Numero de geracoes 1 mil

7.3 DINAMICA DOS AMBIENTES

Para simular um ambiente dinamico, com variacoes discretas, utilizou-se para todos os

ambientes o metodo implementado no gerador moving peaks, que utiliza uma funcao nao-

linear de uma dimensao com passo de transicao simples, que tende a aumentar sua com-

plexidade progressivamente. Uma funcao que atende esses requisitos e a funcao logıstica,

descrita como segue

Y (k + 1) = AY (k) (1− Y (k)), (7.2)sendo A uma constante e Y (k) o valor da funcao na geracao k. A constante A determina

a complexidade da dinamica do ambiente. Por exemplo, se A = 2.9, Y converge para um

valor estavel; a medida que A cresce, surgem dinamicas mais complexas. Valores de A

maiores que 3.5 geram uma sequencia caotica de Y . A Figura 7.1 mostra duas sequencias

114

de Y , Y (0) = 0.5, para A = 2.9, que gera valores sempre iguais a 0.6552 depois de,

aproximadamente, 56 iteracoes, e A = 3.8, que gera uma sequencia caotica.

0 20 40 60 800

0.2

0.4

0.6

0.8

1(a) Sequencia de Y para A = 2.9.

Iteraçoes

Y(k

)

0 20 40 60 800

0.2

0.4

0.6

0.8

1(b) Sequencia de Y para A = 3.8.

Iteraçoes

Y(k

)

Figura 7.1 Sequencias geradas pela funcao logıstica para diferentes valores de A.

Nos experimentos realizados, consideram-se tres tipos de comportamentos dinamicos,

dois lineares e um caotico. O comportamento dinamico linear pode ter variacoes peque-

nas, A = 1.05, ou grandes, A = 1.95. O comportamento dinamico caotico tem variacoes

aleatorias, A = 3.9. Os valores de Y determinam o tamanho do intervalo de variacao do

ambiente. Por exemplo, em um problema onde a variacao do ambiente e determinada

pela mudanca da coordenada do otimo no espaco de solucoes, sua dinamica e definida

pela expressao

X∗

i (k + 1) = X∗

i (k) + Y (k) ·Xr, i = 1, . . . , Nd, (7.3)sendo X∗

i o otimo da i-esima variavel de decisao, Xr = Xmax − Xmin e Nd o numero de

variaveis de decisao. Para variacoes pequenas, Y (k) = 0.0476 e produzido, i.e., quando o

ambiente varia, o otimo move-se 4.76% de Xr. Para variacoes grande, Y (k) = 0.4872, i.e.,

o otimo move-se 48.72% de Xr, e para variacoes caoticas, o otimo move-se aleatoriamente.

Na simulacao de um ambiente dinamico, X∗ pode ser substituido por uma restricao, como

o peso limite, C, no problema da mochila, ou um parametro estrutural, como o valor da

conexao entre dois nos no roteamento de redes.

7.4 ANALISE DE RASTREAMENTO

O objetivo do metodo de controle de diversidade proposto e alcancar a estabilidade as-

sintotica

115

limk→∞

e = Γm(k)− Γ(k) = 0. (7.4)Entretanto, a estrategia de controle com o metodo MIT nao garante a convergencia

e = 0, para k → ∞. Porem, a estrategia elaborada pode alcancar uma convergencia

com margem de erro aceitavel, considerando a natureza do processo evolucionario. Em

decorrencia da deriva genetica somada a uma baixa taxa de mutacao, mesmo sem pressao

de selecao, a diversidade da populacao tende a decair. Com uma taxa de mutacao elevada,

a diversidade tende a aumentar. O equilıbrio entre a deriva genetica, somada a selecao, e

a taxa de mutacao pode levar a saıda do processo evolucionario a convergir com a saıda

do modelo de referencia com uma margem de erro aceitavel. Portanto, e possıvel que o

modelo de referencia seja rastreado pelo processo evolucionario.

Na primeira versao do DRAC (DIVERSITY-BASED. . . , 2007; GOUVEA JR.; ARAUJO,

2008a), nao foi utilizado o modelo de dinamica de populacoes (GOUVEA JR.; ARAUJO,

2008b), Capıtulo 5. Assim, no metodo DRAC v1, a derivada dΓ/du, Equacao 6.12, e es-

tabelecida como uma constante. Com isso, o sistema de controle fica mais parametrizado

e nao tem a sensibilidade do erro em relacao ao sinal de controle.

Com a utilizacao do modelo de dinamica de populacoes, foi possıvel calcular a derivada

dΓ/du, pelo quasi-gradiente de Γ, Equacao 5.26. Assim, foi possıvel criar um modelo de

controle menos parametrizado, que ajusta o sinal de controle conforme sua sensibilidade

sobre o erro, e.

Esta secao apresenta 6 experimentos com todas as versoes do DRAC com dois ambi-

entes com diferentes dinamicas. O objetivo destes experimentos e analisar a convergencia

do sistema de controle de diversidade proposto. Foram utilizados o gerador moving peaks,

MP, e o problema da mochila, PM. Para cada ambiente, utilizou-se um comportamento

estatico e dois dinamicos com variacoes grandes e caoticas.

7.4.1 Analise de Rastreamento em Ambientes Estaticos

Os Experimentos 7.4.1.a, moving peaks, e 7.4.1.b, problema da mochila, utilizaram ambi-

entes estaticos. Desse modo, pode-se analisar a tendencia de convergencia quando a di-

versidade do modelo de referencia for fixa, apos atingir um valor mınimo pre-estabelecido.

DRAC v1 utilizou dΓ/du = {0.1, 10} nos Experimentos 7.4.1.a e 7.4.1.b, respectivamente.

Esses valores, obtidos empiricamente, foram os que alcancaram os melhores resultados

em relacao ao erro medio, e, em cada experimento.

116

A Figura 7.2 mostra as diversidades do modelo de referencia e da populacao, e o erro,

e = Γm − Γ, em uma simulacao no gerador moving peaks. Em todos os experimentos,

observa-se, pela diversidade e, mais claramente, pelo erro uma tendencia de rastreamento

ao longo das geracoes. Os saltos do erro, ocorridos em alguns instantes, sao decorrentes

da natureza estocastica do processo evolucionario que eleva a diversidade da populacao

em algumas geracoes. Entretanto, apos tais picos, o erro tende a decair, aproximando a

diversidade da populacao da saıda do modelo de referencia.

0 200 400 600 800 10000

0.5

1(a) Estabilidade no DRAC v1

Div

ersi

dade

0 200 400 600 800 1000−0.5

0

0.5

1

(b) Erro, e = Γm

− Γ, no DRAC v1

Err

o

0 200 400 600 800 10000

0.5

1(c) Estabilidade no DRAC v2

Div

ersi

dade

0 200 400 600 800 1000−0.5

0

0.5

1

(d) Erro, e = Γm

− Γ, no DRAC v2

Err

o

0 200 400 600 800 10000

0.5

1(e) Estabilidade no DRAC v2.a

Div

ersi

dade

Geraçoes0 200 400 600 800 1000

−0.5

0

0.5

1

(f) Erro, e = Γm

− Γ, no DRAC v2.a

Err

o

Geraçoes

Figura 7.2 Analise de rastreamento no moving peaks em ambiente estatico.

A Figura 7.3 mostra as diversidades e os erros no problema da mochila — Experimento

7.4.1.b. Nas duas versoes do DRAC onde o sinal de controle e a pressao de selecao, Figuras

7.3(a)-(d), observa-se a dificuldade do sistema de controle de aproximar a diversidade

da populacao da saıda do modelo de referencia. Essa dificuldade vem da natureza do

117

ambiente, onde indivıduos geneticamente distintos podem ter aptidoes muito diferentes.

Assim, a selecao nao favorece a criacao de nichos de indivıduos geneticamente similares, o

que tende a diminuir a diversidade. Por essa razao, ha forte variabilidade da diversidade

e o sistema de controle com a pressao de selecao, mesmo utilizando o mecanismo proposto

na Secao 6.5.3, nao tem grande efeito sobre a diversidade.

No experimento com o DRAC v2.a, Figuras 7.3(e)-(f), onde o sinal de controle e a

taxa de mutacao, observa-se que a diversidade da populacao fica proxima da saıda do

modelo de referencia, ainda que existam picos do erro. Ao contrario da pressao de selecao,

a taxa de mutacao tem forte efeito sobre a diversidade, pois a mutacao, quando elevada,

provoca grande variacao genetica. Outro fator importante e a utilizacao do modelo de

dinamica de populacoes, que auxilia o sistema de controle ao considerar a sensibilidade

da diversidade em relacao ao sinal de controle.

A Tabela 7.2 mostra o erro medio, e, e o desvio padrao do erro, DP(e), nos dois

ambientes estaticos — Experimentos 7.4.1.a e 7.4.1.b. Nos experimentos com o moving

peaks, os erros medios e os desvios padrao foram muito menores do que nos experimentos

com o problema da mochila, especialmente nas versoes DRAC v1 e v2. O ambiente

moving peaks, ainda que nao-contınuo, proporcional aptidoes semelhantes aos indivıduos

situados nas vizinhancas dos picos. Essa caracterıstica, em ambientes estaticos, favorece

o controle da diversidade.

Nos experimentos com o problema da mochila, os erros medios e os desvios padrao

foram mais significativos nas versoes DRAC v1 e v2 se comparados com a versao DRAC

v2.a. No problema da mochila, as versoes baseadas na pressao de selecao, DRAC v1 e

v2, obtiveram e e DP(e) semelhantes. Na versao DRAC v2.a, e foi baixo, assim como o

DP(e), ambos comparaveis aos valores que esta versao obteve no ambiente moving peaks.

Tabela 7.2 Resultados da analise de rastreamento em ambientes estaticos: Experimentos

7.4.1.a e 7.4.1.b.

Problema Metodo e DP(e)

DRAC v1 0.0402 0.0622

M.Peaks DRAC v2 0.0530 0.0948

DRAC v2.a 0.0451 0.0714

DRAC v1 0.1862 0.1502

Mochila DRAC v2 0.1882 0.1964

DRAC v2.a 0.0752 0.1085

118

0 200 400 600 800 10000

0.5

1(a) Estabilidade no DRAC v1

Div

ersi

dade

0 200 400 600 800 1000−1

−0.5

0

0.5

(b) Erro, e = Γm

− Γ, no DRAC v1

Err

o

0 200 400 600 800 1000

−0.5

0

0.5

(d) Erro, e = Γm

− Γ, DRAC v2

Err

o

0 200 400 600 800 10000

0.5

1

Geraçoes

Div

ersi

dade

(e) Estabilidade no DRAC v2.a0 200 400 600 800 1000

0

0.5

1(c) Estabilidade no DRAC v2

Div

ersi

dade

0 200 400 600 800 1000

−0.5

0

0.5

(f) Erro, e = Γm

− Γ, DRAC v2.a

Geraçoes

Err

o

ΓΓ

m

ΓΓ

m

ΓΓ

m

Figura 7.3 Analise de rastreamento no problema da mochila em ambiente estatico.

119

7.4.2 Analise de Rastreamento em Ambientes Dinamicos Cıclicos: 200 Geracoes

Os Experimentos 7.4.2.a, com o moving peaks, e 7.4.2.b, com o problema da mochila,

utilizaram ambientes dinamicos com variacoes grandes a ciclos de 200 geracoes. Para

alcancar o melhor resultado em relacao ao erro medio, e, DRAC v1 utilizou dΓ/du =

{0.5, 12} nos Experimentos 7.4.2.a e 7.4.2.b, respectivamente.

As Figuras 7.4(a)-(d) mostram as diversidades e o erro no moving peaks em experimen-

tos com as versoes DRAC v1 e v2, baseadas na pressao de selecao. Nestes experimentos,

observa-se a tendencia de a diversidade da populacao acompanhar a diversidade do mo-

delo de referencia. Porem, observa-se tambem a dificuldade de elevar-se a diversidade

da populacao nos picos de crescimento do modelo de referencia — em decorrencia das

variacoes do ambiente. Dentre as versoes DRAC v1 e v2, a primeira, sem a dinamica de

populacoes, teve mais facilidade de elevar a diversidade por ter utilizado dΓ/du elevado,

mas o erro nos intervalos de Γm constante e menor.

As Figuras 7.4(e)-(f) mostram a diversidade e o erro no moving peaks para a versao

DRAC v2.a, baseada na taxa de mutacao. O erro de rastreamento da versao DRAC

v2.a, Figura 7.4(f), e menor do que os erros das versoes baseadas na pressao de selecao.

Isso ocorreu porque nos picos do modelo de referencia a diversidade da populacao e

rapidamente elevada na versao DRAC v2.a. Mais uma vez observa-se a dificuldade de se

aumentar a diversidade quando o sinal de controle e a pressao de selecao. Nos intervalos

de Γm fixa, assim como nos experimentos com ambientes estaticos, o erro tende a ser

reduzido em todas as versoes do DRAC.

As Figuras 7.5(a)-(d) mostram as diversidades e os erros no problema da mochila,

para as versoes DRAC v1 e v2. Assim como nos experimentos com ambiente estatico,

as versoes baseadas na pressao de selecao tem dificuldade de acompanhar o modelo de

referencia. Mesmo nos intervalos de Γm fixa, ha pouca tendencia de reducao do erro. As

Figuras 7.5(e)-(f) mostram a convergencia e o erro do DRAC v2.a no problema da mochila.

Neste experimento, observa-se o rastreamento produzido pelo sistema de controle mesmo

nos picos do modelo de referencia.

A Tabela 7.3 mostra os resultados dos Experimentos 7.4.2.a e 7.4.2.b. No Experimento

7.4.2.a, moving peaks, diferentemente do experimento com ambiente estatico, e e DP(e)

do DRAC v2.a, baseada na taxa de mutacao, sao significativamente menores do que os

valores das versoes DRAC v1 e v2, baseadas na pressao de selecao.

No problema da mochila, e e DP(e) foram maiores do que nos experimentos do moving

120

0 200 400 600 800 10000

0.5

1

Div

ersi

dade

(a) Estabilidade no DRAC v1

0 200 400 600 800 1000−0.5

0

0.5

1

Err

o

(b) Erro, e = Γm

− Γ, no DRAC v1

0 200 400 600 800 10000

0.5

1

Div

ersi

dade

(c) Estabilidade no DRAC v2

0 200 400 600 800 1000−0.5

0

0.5

1

Err

o

(d) Erro, e = Γm

− Γ, no DRAC v2

ΓΓ

m

ΓΓ

m

0 200 400 600 800 10000

0.5

1

Div

ersi

dade

Geraçoes

(e) Estabilidade no DRAC v2.a

0 200 400 600 800 1000−1

−0.5

0

0.5

1

(f) Erro, e = Γm


Geraçoes

Err

o

ΓΓ

m

Figura 7.4 Analise de rastreamento no moving peaks em ambiente dinamico com variacoes

cıclicas de 200 geracoes.

121

0 200 400 600 800 10000

0.5

1

Div

ersi

dade


0 200 400 600 800 1000−1

−0.5

0

0.5

1

Err

o

(b) Erro, e = Γm

− Γ, no DRAC v1

0 200 400 600 800 10000

0.5

1

Div

ersi

dade


0 200 400 600 800 1000−1

−0.5

0

0.5

Err

o

(d) Erro, e = Γm

− Γ, no DRAC v2

0 200 400 600 800 10000

0.5

1

Div

ersi

dade

Geraçoes


0 200 400 600 800 1000−1

−0.5

0

0.5

1

Err

o

Geraçoes

(f) Erro, Γm


ΓΓ

m

ΓΓ

m

ΓΓ

m

Figura 7.5 Analise de rastreamento no problema da mochila em ambiente dinamico com va-

riacoes cıclicas de 200 geracoes.

122

peaks, assim como ocorreu nos experimentos com ambientes estaticos. O DRAC v2.a

obteve melhores resultados do que as versoes DRAC v1 e v2, o que reforca a maior

eficiencia do sistema de controle baseado na taxa de mutacao em rastrear o modelo de

referencia.

Tabela 7.3 Resultados da analise de rastreamento em ambientes dinamicos com variacoes

cıclicas de 200 geracoes: Experimentos 7.4.2.a e 7.4.2.b.


DRAC v1 0.1245 0.1826

M.Peaks DRAC v2 0.1392 0.2041

DRAC v2.a 0.0885 0.1277

DRAC v1 0.1960 0.1765


DRAC v2.a 0.1236 0.1609

7.4.3 Analise de Rastreamento em Ambientes Dinamicos Cıclicos: 40 Geracoes

Os Experimentos 7.4.3.a e 7.4.3.b utilizaram ambientes dinamicos com variacoes caoticas

a ciclos de 40 geracoes. A Figura 7.6 mostra as diversidades e o erro em uma simulacao

no gerador moving peaks. Neste experimentos, a frequencia de variacao menor dificulta

o rastreamento, resultando erros maiores em relacao aos experimentos anteriores. Entre-

tanto, todas as versoes do DRAC tenderam a rastrear o modelo de referencia, o que pode

ser observado principalmente nas Figuras 7.6(b), (d) e (f). Os picos de variacao, mais

acentuados do que nos experimentos anteriores, sao consequencia de um ambiente que

varia com maior frequencia. Assim como nos experimentos anteriores, a versao DRAC

v2.a, Figuras 7.6(e)-(f), apresentou melhor rastreamento.

A Figura 7.7 mostra as diversidades e o erro no problema da mochila. Neste ambiente,

a diversidade media da populacao tende a ser maior do que no moving peaks, como pode

ser observado tambem nos experimentos anteriores. A natureza do ambiente somada

a maior frequencia de variacoes e sua caracterıstica caotica dificulta o rastreamento do

modelo de referencia. A versao DRAC v2.a, assim como nos experimentos anteriores,

obteve melhor rastreamento.

A Tabela 7.4 mostra os resultados dos Experimentos 7.4.3.a e 7.4.3.b. Como esperado

em razao da maior variacao do ambiente, os erros medios e os desvios padrao no moving

123

0 200 400 600 800 10000

0.5

1

Div

ersi

dade


0 200 400 600 800 1000−0.5

0

0.5

1

Err

o

(b) Erro, Γm

− Γ, no DRAC v1

0 200 400 600 800 10000

0.5

1

Div

ersi

dade


0 200 400 600 800 1000−0.5

0

0.5

1

Err

o

(d) Erro, Γm

− Γ, no DRAC v2

0 200 400 600 800 10000

0.5

1

Div

ersi

dade

Geraçoes


0 200 400 600 800 1000−0.5

0

0.5

1

Err

o

Geraçoes

(f) Erro, Γm


ΓΓ

m

ΓΓ

m

ΓΓ

m

Figura 7.6 Analise de rastreamento no moving peaks em ambiente dinamico com variacoes

cıclicas de 40 geracoes.

124

0 200 400 600 800 10000

0.5

1

Div

ersi

dade


0 200 400 600 800 1000−1

−0.5

0

0.5

1

Err

o

(b) Erro, Γm

− Γ, no DRAC v1

0 200 400 600 800 10000

0.5

1

Div

ersi

dade


0 200 400 600 800 1000−1

−0.5

0

0.5

1

Err

o

(d) Erro, Γm

− Γ, no DRAC v2

0 200 400 600 800 10000

0.5

1

Geraçoes

Div

ersi

dade


0 200 400 600 800 1000−0.5

0

0.5

1

Geraçoes

Err

o

(f) Erro, Γm


ΓΓ

m

ΓΓ

m

ΓΓ

m

Figura 7.7 Analise de rastreamento no problema da mochila em ambiente dinamico com va-

riacoes cıclicas de 40 geracoes.

125

peaks foram maiores do que nos experimentos anteriores. Ja no problema da mochila,

com excecao da versao DRAC v2.a, os erros foram similares aos ocorridos no Experimento

7.4.2.b — ciclos de 200 geracoes. Esses resultados podem ser explicados pela dificuldade

de rastreamento do sistema de controle baseado na pressao de selecao. Assim, a maior

frequencia de variacao do ambiente nao influenciou o desempenho do sistema de controle.

O desempenho do DRAC v2.a foi superior as versoes baseadas na pressao de selecao, mas

foi inferior ao proprio desempenho nos experimentos anteriores — com menor variacao

do ambiente. Dessa vez, o DRAC v2.a, que tem melhor capacidade de rastreamento que

as versoes baseadas na pressao de selecao, teve seu desempenho degradado pela maior

variacao do ambiente.

Tabela 7.4 Resultados da analise de rastreamento em ambientes dinamicos com variacoes

cıclicas de geracoes: Experimentos 7.4.3.a e 7.4.3.b.


DRAC v1 0.1876 0.1440

M.Peaks DRAC v2 0.1632 0.1515

DRAC v2.a 0.1372 0.1114

DRAC v1 0.2090 0.1750


DRAC v2.a 0.1653 0.1560

7.4.4 Discussoes Finais Sobre o Rastreamento

Os experimentos realizados nesta secao apresentaram dois ambientes distintos, a funcao

nao-linear do moving peaks e o problema combinatorio da mochila. No primeiro ambiente,

o controle da diversidade da populacao, e consequente tendencia a diminuicao do erro, e

uma tarefa nao muito complexa, pois a selecao favorece indivıduos geneticamente seme-

lhantes. Por exemplo, indivıduos geneticamente semelhantes ao melhor indivıduo terao

mais chance de sobrevivencia ou de gerarem mais descendentes se a pressao de selecao

for alta. Assim, podera haver decaimento da diversidade. No problema da mochila, essa

caracterıstica nao e tao marcante, pois indivıduos geneticamente semelhantes podem ter

aptidoes completamente diferentes e, consequentemente, aumento da pressao de selecao

pode nao decair a diversidade.

Nas versoes DRAC v1 e v2, baseadas na pressao de selecao, foi possıvel rastrear o

126

sistema com uma margem de erro aceitavel em todos os experimentos com o moving

peaks. Ja no problema da mochila, as caracterısticas citadas no paragrafo anterior impe-

dem um controle efetivo da diversidade pela pressao de selecao. Ainda assim, o modelo

de referencia tem uma importante funcao, a de indicar o sentido de crescimento da di-

versidade. Em ambientes com alta frequencia de variacao, essa caracterıstica pode ser

importante, pois a diversidade media do modelo de referencia tende a ser maior.

Na versao DRAC v2.a, baseada na taxa de mutacao, houve rastreamento com margem

de erro baixa em todos os experimentos. A taxa de mutacao, como sinal de controle, e

a razao para esses resultados. Em um processo evolucionario com taxa de mutacao

elevada, inevitavelmente havera aumento da diversidade da populacao. Ao contrario,

uma taxa de mutacao reduzida somada a deriva genetica e a pressao de selecao tende

a decair a diversidade. O equilıbrio entre esses fatores, decorrente principalmente do

modelo de dinamica de populacoes (GOUVEA JR.; ARAUJO, 2008b), tende a reduzir o erro

principalmente quando a taxa de mutacao e utilizada como sinal de controle.

7.5 EXPERIMENTOS COM MODELOS DE REFERENCIA

Esta secao apresenta os resultados dos experimentos realizados com os tres modelos de

referencia de diversidade apresentados na Subsecao 6.2. O objetivo e mostrar que a partir

de propriedades gerais, a funcao que implementa o modelo de referencia nao influencia o

desempenho do sistema de controle proposto.

Foram realizados quatro experimentos com dois ambientes com caracterısticas dis-

tintas, o gerador moving peaks e o problema de otimizacao combinatoria da mochila.

Para cada ambiente, foram testadas as seguintes configuracoes: mudancas cıclicas de

40 geracoes e dinamica com variacoes pequenas e mudancas cıclicas de 200 geracoes e

dinamica com variacoes grandes.

Os seguintes parametros foram utilizados para os modelos de referencia: no modelo

exponencial (Exp), Equacao 6.2, uc = 0.008; no modelo linear (Lin), Equacao 6.3, K =

150; e no modelo baseado na dinamica da heterozigosidade (Het), Equacao 3.23, Ne = 50.

Em todos os modelos de referencia, a diversidade mınima foi 0.1 Γ(0). Esses valores foram

obtidos empiricamente, em testes preliminares.

A Tabela 7.5 mostra os resultados do Experimento 7.5.a, moving peaks, onde foram

estabelecidas mudancas cıclicas de 40 geracoes e dinamica com variacoes pequenas. Com

mudancas a intervalos curtos e deslocamento pequeno do otimo global, todos os tres

127

modelos de referencia alcancaram resultados semelhantes, muito abaixo do valor do otimo

global. Os DPs tambem foram semelhantes, o que sinaliza que todos os modelos de

referencia proporcionaram evolucoes equivalentes apos as mudancas do ambiente. As

diversidades medias tambem foram similares, pois as curvas dos modelos de referencia

foram equivalentes, isto e, os decaimentos das diversidades foram, aproximadamente,

iguais e os valores mınimos das diversidades foram os mesmos.

Tabela 7.5 Experimento 7.5.a: moving peaks, ciclos de 40 geracoes e dinamica com variacoes

pequenas.

Metodo MMA DP Γ

Lin 111.1646 49.5744 0.2485

Exp 107.4242 52.0324 0.2446

Het 110.3487 50.0194 0.2495

A Tabela 7.6 mostra os resultados do Experimento 7.5.b, moving peaks, onde foram

estabelecidas mudancas cıclicas de 200 geracoes e dinamica com variacoes grandes. Nova-

mente, os tres modelos de referencia alcancam resultados semelhantes nos tres indicadores

— MMA, DP e Γ. Apesar da dinamica deste experimento possuir variacoes grandes, o ci-

clo de variacao maior permitiu aos tres modelos de referencia maior tempo para evolucao

e MMAs muito superiores aos seus equivalentes no experimento anterior. Os DPs neste

experimento foram maiores que no experimento anterior. Essa diferenca nao significa um

pior desempenho no Experimento 7.5.b, mas que houve maior evolucao em decorrencia

do maior ciclo de variacao.

Tabela 7.6 Experimento 7.5.b: moving peaks, ciclos de 200 geracoes e dinamica com variacoes

grandes.

Metodo MMA DP Γ

Lin 209.3086 66.1312 0.1771

Exp 211.0457 63.2844 0.1883

Het 209.9314 64.6761 0.1896

A Tabela 7.7 mostra os resultados do Experimento 7.5.c, problema da mochila, onde

foram estabelecidas mudancas cıclicas de 40 geracoes e dinamica com variacoes peque-

nas. Neste problema, o otimo nao e modificado por sua localizacao espacial, mas por

uma mudanca do valor da restricao (peso maximo permitido, C). Seguindo a tendencia

128

dos experimentos anteriores, os resultados dos tres modelos de referencia foram, aproxi-

madamente, iguais. As diversidades medias foram significativamente maiores do que nos

experimentos anteriores, em razao do tipo de problema que proporciona menor perda de

diversidade — como ja comentado na Secao 7.4.

Tabela 7.7 Experimento 7.5.c: Problema da Mochila, ciclos de 40 geracoes e dinamica com

variacoes pequenas.

Metodo MMA DP Γ

Lin 11318 88.5006 0.6868

Exp 11299 88.4346 0.6839

Het 11295 89.8067 0.6906

A Tabela 7.8 mostra os resultados do Experimento 7.5.d., problema da mochila, onde

foram estabelecidas mudancas cıclicas de 200 geracoes e dinamica com variacoes grandes.

Neste experimento, os resultados dos tres modelos de referencia foram, novamente, muito

proximos. As diversidades medias foram similares as suas equivalentes no Experimento

7.5.c.

Tabela 7.8 Experimento 7.5.d: Problema da Mochila, ciclos de 200 geracoes e dinamica com

variacoes grandes.

Metodo MMA DP Γ

Lin 11639 111.0548 0.6415

Exp 11625 111.7521 0.6394

Het 11640 111.8992 0.6333

7.5.1 Discussoes Finais Sobre os Modelos de Referencia

Os quatro experimentos com dois ambientes diferentes, cada um com dois ciclos de va-

riacao, mostraram resultados semelhantes em todos os aspectos, i.e., os valores medios das

melhores aptidoes medias, dos desvios padroes e das diversidades. Os resultados mostram

que o algoritmo evolucionario proposto baseado nas hipoteses de modelos de referencia

apresentadas na Secao 6.2 nao depende de um modelo matematico especıfico, mas em um

modelo que atenda as especificacoes gerais do modelo de referencia de diversidade.

Os resultados dos experimentos foram alcancados com parametros do modelo de re-

ferencia escolhidos empiricamente. No entanto, esses parametros, qualquer que seja o

129

modelo de referencia, podem ser ajustados adaptativamente, baseados em algum criterio

de desempenho do AE. Por exemplo, o valor da diversidade do modelo de referencia apos

a mudanca do ambiente pode ser ajustado conforme a dinamica do ambiente. Em uma

dinamica com variacoes pequenas, pode ser mais apropriado que a diversidade do mo-

delo de referencia seja ajustada para um valor apenas um pouco superior ao atual ou em

funcao de algum indicador do processo evolucionario — em vez do valor da diversidade

inicial.

7.6 EXPERIMENTOS COM FUNCOES CONTINUAS

Seis experimentos foram realizados com funcoes contınuas, tres com a funcao de Ackley

(EIBEN; SMITH, 2003), Experimentos 7.6.1.a-c, e tres com a funcao de Schwefel (1995),

Experimentos 7.6.2.a-c, sendo a, b e c as dinamicas com variacoes pequenas, grandes e

caoticas.

7.6.1 Experimentos com a Funcao de Ackley

As Tabelas 7.9, 7.10 e 7.11 mostram os resultados dos experimentos com a funcao de

Ackley (EIBEN; SMITH, 2003). No Experimento 7.6.1.a, Tabela 7.9, dinamica linear com

variacoes pequenas, as duas versoes do DRAC foram superadas pelos metodos ERIGA

e TRAM, obtiveram resultados similares ao RIGA e AGP, e superaram os demais AEs.

Neste tipo de dinamica, um pico elevado de diversidade do modelo de referencia apos a

mudanca do ambiente pode ser prejudicial, pois o otimo global desloca-se para regioes

proximas a sua localizacao atual. Assim, o pico de diversidade do modelo de referencia

pode causar muito espalhamento da populacao na superfıcie de solucoes.

Como esperado, devido ao deslocamento elevado do otimo global, os resultados gerais

de todos os algoritmos no Experimento 7.6.1.b foram inferiores aos alcancados no Ex-

perimento 7.6.1.a. No Experimento 7.6.1.b, Tabela 7.10, DRAC v2, seguido do DRAC

v2.a, obtiveram os melhores resultados. Neste caso, o impulso do modelo de referencia

seguido de um decaimento controlado da diversidade da populacao beneficiou os modelos

propostos.

No Experimento 7.6.1.c, Tabela 7.11, dinamica caotica, DRAC v2 foi superado pelos

metodos ERIGA e DRAC v2.a, e obteve resultado equivalente a maioria dos AEs, su-

perando apenas os metodos DGEA e THM. A razao para esta diferenca, em relacao ao

Experimento 7.6.1.b, pode ser atribuıda aos instantes em que a variacao do ambiente e

130

Tabela 7.9 Resultados do Experimento 7.6.1.a: funcao de Ackley, variacoes pequenas.

Metodo MMA DP Γ P(v2) P(v2.a)

DCGA 34.7832 1.0850 0.2968 + –

DGEA 35.7829 1.6741 0.1439 + –

DRAC v2 36.9183 2.0969 0.2320 –

DRAC v2.a 33.3686 0.8000 0.1513 +

ERIGA 37.9404 2.3606 0.1000 – –

RIGA 36.8968 2.0625 0.1016 ≈ –

AGP 36.9357 2.0935 0.1011 ≈ –

THM 36.6597 2.0076 0.1040 + –

TRAM 37.7313 2.4205 0.0908 – –

pequena. O metodo DRAC v2.a obteve resultados semelhantes ao ERIGA.

Na dinamica com variacoes pequenas, Experimento 7.6.1.a, ERIGA alcancou os me-

lhores resultados. Nessa dinamica, os imigrantes elitistas beneficiaram-se do deslocamento

do otimo para uma regiao muito proxima do seu valor atual, pois o ERIGA tem uma

taxa de mutacao constante e baixa.

Na dinamica com variacoes grandes, Experimento 7.6.1.b, a diversidade elevada apos

as mudancas do ambiente, estabelecida pelo modelo de referencia, proporcionou as duas

versoes do DRAC os melhores resultados. Nesse tipo de dinamica, um grande espalha-

mento da populacao no espaco de solucoes apos as mudancas do ambiente mostra-se

determinante.

Na dinamica caotica, Experimento 7.6.1.c, ERIGA e DRAC v2.a obtiveram os melho-

res resultados. Novamente, os impulsos da diversidade do modelo de referencia, acom-

panhados pela diversidade da populacao, beneficiaram o DRAC v2.a. No entanto, esse

impulso de diversidade nao beneficiou o DRAC v2, pois este metodo nao rastreia o modelo

de referencia tao eficientemente quanto o DRAC v2.a. O bom desempenho do ERIGA

nessa dinamica pode ser atribuıdo as ocorrencias de variacoes pequenas do ambiente.

7.6.2 Experimentos com a Funcao de Schwefel

As Tabelas 7.12, 7.13 e 7.14 mostram os resultados dos experimentos com a funcao de

Schwefel. No Experimento 7.6.2.a, Tabela 7.12, os melhores resultados foram alcancados

pelos metodos ERIGA e TRAM. Novamente, a dinamica com variacoes pequenas beneficia

131

Tabela 7.10 Resultados do Experimento 7.6.1.b: funcao de Ackley, variacoes grandes.


DCGA 33.3073 0.5732 0.2442 + +

DGEA 32.9274 0.3392 0.1374 + +

DRAC v2 33.5875 0.7776 0.2334 –

DRAC v2.a 33.3982 0.9068 0.1540 +

ERIGA 33.3299 0.7389 0.0965 + +

RIGA 33.3042 0.7077 0.0965 + +

AGP 33.3356 0.7981 0.0875 + +

THM 33.3884 0.8437 0.0954 + ≈

TRAM 33.4159 0.8406 0.0809 + ≈

os AEs que nao espalham demasiadamente a populacao apos as mudancas do ambiente.

Nos Experimentos 7.6.2.b e 7.6.2.c, Tabelas 7.13 e 7.14, DRAC v2 e v2.a superaram os

demais AEs. No Experimento 7.6.2.b, o modelo de referencia, seguido pelas diversidades

das populacoes dos metodos DRAC v2 e v2.a, beneficiou o processo de busca. Tambem no

Experimento 7.6.2.c, dinamica caotica, DRAC v2 e v2.a obtiveram resultados similares e

superiores aos demais AEs.

Nos Experimentos 7.6.2.b e 7.6.2.c, e importante observar o baixo desvio padrao

obtido pelo DRAC v2 e v2.a em relacao aos demais AEs. Esses valores mostram que

esses metodos reaproximam de regioes promissoras apos as mudancas do ambiente mais

rapido do que os demais AEs. Os benefıcios dos baixos DPs podem ser observados na

Figura 7.9, variacoes grandes, onde a curva do melhor indivıduo do DRAC v2 cresce mais

rapido do que dos demais AEs. Na Figura 7.10, dinamica caotica, DRAC v2.a tem uma

curva sempre superior aos demais AEs. Entretanto, apesar de DRAC v2 e v2.a terem

alcancados resultados estatisticamente iguais, DRAC v2 teve MMA superior. Isso se deve

a capacidade do DRAC v2 se aproximar de uma regiao promissora mais rapido do que o

DRAC v2.a. Essa capacidade foi refletiva no DP do DRAC v2, aproximadamente, 50%

menor do que no DRAC v2.a.

7.7 EXPERIMENTOS COM O GERADOR MOVING PEAKS

Os metodos propostos foram testados em tres experimentos com o gerador moving peaks.

Para estes experimentos, Hi ∈ [0, 100], Ri ∈ [2, 7] e xij ∈ [−100, 100], ∀i = 1, . . . , Np, e

132

−15000

−10000

−5000

(a)

Me

lho

r a

ptid

ao

−12000

−10000

−8000

−6000

−4000(b)

Me

lho

r a

ptid

ao

−1.5

−1

−0.5x 10

4 (c)

Me

lho

r a

ptid

ao

0 100 200 300 400 500 600 700 800 900 1000−2

−1.5

−1

−0.5

x 104 (d)

Me

lho

r a

ptid

ao

Geraçoes

DRAC v2DRAC v2.aTHMTRAM

DRAC v2DRAC v2.aSGA

DRAC v2DRAC v2.aERIGARIGA

DRAC v2DRAC v2.aDCGADGEA

Figura 7.8 Melhores aptidoes no Experimento 7.6.2.a: funcao de Schwefel, variacoes pequenas.

133

−5−4−3−2−1

x 104 (a)

Me

lho

r a

ptid

ao

−8

−6

−4

−2

0x 10

4 (b)

Me

lho

r a

ptid

ao

−10−8−6−4−2

x 104 (c)

Me

lho

r a

ptid

ao

100 200 300 400 500 600 700 800 900 1000

−4

−3

−2

−1

x 104 (d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.9 Melhores aptidoes no Experimento 7.6.2.b: funcao de Schwefel, variacoes grandes.

134

−2.5

−2

−1.5

−1x 10

4 (a)

Me

lho

r a

ptid

ao

−4

−2

0x 10

4 (b)

Me

lho

r a

ptid

ao

−6

−4

−2

0x 10

4 (c)

Me

lho

r a

ptid

ao

100 200 300 400 500 600 700 800 900 1000

−3

−2

−1x 10

4 (d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.10 Melhores aptidoes no Experimento 7.6.2.c: funcao de Schwefel, variacoes caoticas.

135

Tabela 7.11 Resultados do Experimento 7.6.1.c: funcao de Ackley, variacoes caoticas.


DCGA 32.7134 0.1207 0.2541 ≈ +

DGEA 32.6899 0.1113 0.1237 + +

DRAC v2 32.7168 0.1206 0.1822 +

DRAC v2.a 32.7389 0.1352 0.1504 –

ERIGA 32.7436 0.1411 0.0667 – ≈

RIGA 32.7105 0.1161 0.0629 ≈ +

AGP 32.7142 0.1209 0.0561 ≈ +

THM 32.7063 0.1164 0.0612 + +

TRAM 32.7175 0.1175 0.0504 ≈ +

∀j = 1, . . . , n, sendo Np = 50.

No Experimento 7.7.a, Tabela 7.15, dinamica com variacoes pequenas, o melhor re-

sultado foi alcancado pelo ERIGA, estatisticamente igual aos metodos RIGA e DRAC

v2.a. DRAC v2 foi superado pelos metodos ERIGA, RIGA e THM. Neste experimento,

mesmo com variacoes pequenas, o impulso de diversidade apos a mudanca do ambiente foi

satisfatorio. A prova disso sao os desempenhos dos metodos DRAC v2 e v2.a, o primeiro

que tem dificuldade de acompanhar o modelo de referencia e o segundo que acompanha

com boa precisao. A Figura 7.11 mostra as melhores aptidoes de todos os AEs no Expe-

rimento 7.7.a. Observa-se, claramente, que o DRAC v2.a teve os maiores picos de melhor

aptidao na maioria do processo evolucionario. O MMA do DRAC v2.a so e pouco infe-

rior em relacao aos metodos baseados em imigrantes, apesar de estatisticamente igual,

porque sua melhor aptidao sempre decai mais apos as mudancas do ambiente, em razao

do espelhamento da populacao. Entretanto, seu retorno a uma regiao promissora e mais

rapido do que os demais AEs. Essas colocacoes podem ser reforcadas pelo DP do DRAC

v2.a, que e superior ao dos metodos ERIGA e RIGA.

No Experimento 7.7.b, Tabela 7.16, dinamica com variacoes grandes, as duas versoes

do DRAC obtiveram os melhores resultados. Alem de um MMA significativamente su-

perior, o DP do DRAC v2 tambem foi menor, mostrando maior estabilidade e retorno

mais rapido a vizinhanca do otimo apos as mudancas do ambiente. A Figura 7.12 mostra

os desempenhos dos AEs no Experimento 7.7.b. DRAC v2 teve maior aptidao antes da

mudanca do ambiente e sempre retornou a uma regiao promissora mais rapido do que os

136

Tabela 7.12 Resultados do Experimento 7.6.2.a: funcao de Schwefel com variacoes pequenas.

Metodo MMA DP Γ P(v2) P(v2.a) P(PDF)

DCGA -9502.0825 5336.6701 0.2928 + – ≈

DGEA -9764.3638 5685.8565 0.1417 + – ≈

DRAC -9050.4756 5347.2403 0.1945 – ≈

DRAC v2.a -43552.8191 101881.9885 0.1714 + +

PDFEA -9562.8191 5678.9885 0.1365 + –

ERIGA -7339.6891 5689.3941 0.0628 – – –

RIGA -8920.1792 5522.4429 0.0733 ≈ – ≈

AGP -9525.6640 6440.1422 0.0722 + – ≈

THM -9925.5109 6464.1826 0.0757 + – ≈

TRAM -7935.5391 6850.5871 0.0670 – – –

demais AEs.

No Experimento 7.7.c, Tabela 7.17, dinamica caotica, os melhores resultados foram

alcancados pelos metodos ERIGA e DRAC v2.a — com os indicadores MMA e DP muito

semelhantes. Novamente, DRAC v2.a foi comparavel ao ERIGA em um ambiente com

dinamica caotica. A Figura 7.13 mostra os desempenhos dos AEs nestes experimen-

tos. DRAC v2.a e sempre superior aos demais AEs antes das mudancas do ambiente.

Entretanto, os perfis de crescimento das melhores aptidoes de todos os AEs sao, aproxi-

madamente, iguais.

A Figura 7.14 mostra as melhores aptidoes dos metodos propostos, DRAC v2, DRAC

v2.a e PDFEA, em todos os experimentos com o moving peaks. No Experimento 7.7.a,

variacoes pequenas, Figura 7.14(a), DRAC v2.a e claramente superior aos demais AEs

propostos, sempre alcancando aproximadamente a mesma aptidao uma geracao antes da

variacao do ambiente. No Experimento 7.7.b, variacoes grandes, Figura 7.14(b), DRAC

v2 sempre retoma seu valor anterior a mudanca do ambiente mais rapido do que os demais

AEs propostos. No Experimento 7.7.c, variacoes caoticas, Figura 7.14(c), a diferenca entre

as melhores aptidoes e pouco visıvel, mas pode-se observar picos maiores no DRAC v2.a.

Nos experimentos com o moving peaks, e possıvel concluir que o DRAC v2.a obteve o

melhor desempenho geral. Esse metodo alcancou os melhores resultados, estatisticamente

iguais ao ERIGA, nas dinamicas com variacoes pequenas e caotica; entretanto com melhor

aptidao superior antes das mudancas do ambiente. No experimento com dinamica com

137

−200

0

200

400(a)

Me

lho

r a

ptid

ao

−200

0

200

400(b)

Me

lho

r a

ptid

ao

−200

0

200

400(c)

Me

lho

r a

ptid

ao

0 100 200 300 400 500 600 700 800 900 1000−200

0

200

400(d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.11 Melhor aptidao no Experimento 7.7.a.: moving peaks com dinamica com variacoes

pequenas.

138

−200

0

200

400(a)

Me

lho

r a

ptid

ao

−200

0

200

400(b)

Me

lho

r a

ptid

ao

−200

0

200

400(c)

Me

lho

r a

ptid

ao

0 100 200 300 400 500 600 700 800 900 1000−200

0

200

400(d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.12 Melhor aptidao no Experimento 7.7.b: moving peaks com dinamica com variacoes

grandes.

139

−200

0

200

400(a)

Me

lho

r a

ptid

ao

−200

0

200

400(b)

Me

lho

r a

ptid

ao

−200

0

200

400(c)

Me

lho

r a

ptid

ao

0 100 200 300 400 500 600 700 800 900 1000−200

0

200

400(d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.13 Melhor aptidao no Experimento 7.7.c: moving peaks com dinamica caotica.

140

0 100 200 300 400 500 600 700 800 900 1000−200

0

200

400(a) MP com variaçoes pequenas

Div

ers

ida

de

0 100 200 300 400 500 600 700 800 900 1000−200

0

200

400

Div

ers

ida

de

(b) MP com variaçoes grandes

0 100 200 300 400 500 600 700 800 900 1000−200

0

200

400

Div

ers

ida

de

Geraçoes

(c) MP com variaçoes caoticas

DRAC v2DRAC v2.aPDFEA



Figura 7.14 Melhor aptidao dos metodos propostos no moving peaks.

141

Tabela 7.13 Resultados do Experimento 7.6.2.b: funcao de Schwefel com variacoes grandes.

Metodo MMA (×104) DP (×104) Γ P(v2) P(v2.a) P(PDF)

DCGA -9.1070 22.0591 0.2818 + + +

DGEA -8.7506 20.6198 0.1839 + + +

DRAC v2 -2.7022 5.3540 0.3048 – –

DRAC v2.a -4.4616 10.1056 0.1725 + –

PDFEA -7.4346 16.2316 0.1528 + +

ERIGA -6.1802 21.5019 0.1446 + + –

RIGA -5.5126 19.4660 0.1885 + ≈ –

AGP -9.7644 24.7750 0.1495 + + +

THM -7.9949 24.3469 0.1958 + + ≈

TRAM -12.4897 26.0835 0.1433 + + +

variacoes grandes, DRAC v2.a obteve o segundo melhor desempenho. Como o DRAC

v2.a e o metodo proposto que melhor acompanha o modelo de referencia, os impulsos

de diversidade apos as mudancas do ambiente, podem ter sido determinantes em um

ambiente nao-contınuo.

Paradoxalmente, no experimento com dinamica com variacao grande, o metodo que

obteve o melhor desempenho foi aquele, dos metodos propostos, que tem maior dificuldade

de acompanhar o modelo de referencia, o DRAC v2. As conclusoes nao sao definitivas,

mas o que pode ter contribuıdo para esse resultado e que no DRAC v2 apenas parte de

sua populacao e atribuıda ao controle da diversidade. Assim, o seu aumento de diver-

sidade nao acompanhou o modelo de referencia, contribuindo positivamente para o seu

desempenho. Nos experimentos com dinamicas com variacoes pequenas e caotica, a dimi-

nuicao da pressao de selecao, no metodo DRAC v2, na tentativa de elevar a diversidade

apos as mudancas do ambiente, pode ter prejudicado a selecao dos melhores indivıduos,

comprometendo o desempenho deste metodo.

7.8 EXPERIMENTOS COM O PROBLEMA DA MOCHILA

Os Experimentos 7.8.a-c utilizaram o problema da mochila, Secao A.4, sendo xi ∈

{0, 1, 2, 3, 4}, wi = vi = i, i = 1, . . . , n, e C ∈ [200, 1500]. As Tabelas 7.18, 7.19 e

7.20 mostram os resultados medios dos experimentos com o problema da mochila, para

dinamicas com variacoes pequenas, grandes e caoticas, respectivamente. Nestes experi-

142

Tabela 7.14 Resultados do Experimento 7.6.2.c: funcao de Schwefel com variacoes caoticas.

Metodo MMA (×104) DP (×104) Γ P(v2) P(v2.a) P(PDF)

DCGA -7.5294 17.6572 0.2762 + + ≈

DGEA -7.3022 16.9183 0.1817 + + ≈

DRAC v2 -3.7500 4.7851 0.3208 ≈ –

DRAC v2.a -3.7234 8.1519 0.1707 ≈ –

PDFEA -6.4356 13.3459 0.1451 + +

ERIGA -5.5521 17.8669 0.1424 + + –

RIGA -4.9537 15.7939 0.1842 + + –

AGP -8.1793 20.3450 0.1397 + + +

THM -6.8412 20.1313 0.1899 + + +

TRAM -10.2825 22.1347 0.1316 + + +

mentos, DGEA utilizou Γmin = 0.5 e Γmax = 0.75; e DRAC v2.a utilizou Γmin = 0.5 e

Γm(k) = 0.75Γ(0) apos a mudanca do ambiente.

DRAC v2 obteve o melhor desempenho no Experimento 7.8.a — dinamica com va-

riacoes pequenas. A Tabela 7.18 mostra os principais indicadores deste experimento, onde

todos os AEs obtiveram resultados melhores em relacao aos seus proprios desempenhos

nos demais experimentos. Essa diferenca pode ser atribuıda a pequena variacao do peso

maximo, C. DRAC v2 obteve o menor desvio padrao, DP, mostrando maior estabilidade

ao recuperar o valor da melhor aptidao, anterior a variacao do ambiente, mais rapido do

que os demais AEs.

A Figura 7.15 mostra as melhores aptidoes no Experimento 7.8.a — dinamica com

variacoes pequenas. Apenas os AEs baseados em imigrantes, Figura 7.15(b), em alguns

intervalos, tiveram seus desempenhos equivalentes ao DRAC v2. Em relacao aos de-

mais AEs, DRAC v2 teve desempenho visivelmente superior, com trajetoria do melhor

indivıduo mais alta e estavel do que nos demais AEs.

DRAC v2.a obteve o melhor desempenho no Experimento 7.8.b, dinamica com va-

riacoes grandes, seguido pelo DRAC v2, estatisticamente inferior, mas com MMA proximo,

Tabela 7.19. DRAC v2 e DRAC v2.a obtiveram o menor e o maior DP, respectivamente,

o que mostra que a melhor aptidao do metodo baseado na taxa de mutacao, DRAC v2.a,

teve maior oscilacao — a sua melhor aptidao decresceu mais em razao do seu maior va-

lor, mas recuperava-se quase sempre alcancando o valor anterior a mudanca do ambiente.

143

0

500

1000(a)

Me

lho

r a

ptid

ao


0

500

1000

1500(b)

Me

lho

r a

ptid

ao


0

500

1000(c)

Me

lho

r a

ptid

ao

DRAC v2DRAC v2.aSGA

0 100 200 300 400 500 600 700 800 900 10000

500

1000(d)

Me

lho

r a

ptid

ao

Geraçoes


Figura 7.15 Melhor aptidao no Experimento 7.8.a: problema da mochila com variacoes pe-

quenas.

144

Tabela 7.15 Resultados do Experimento 7.7.a: moving peaks com variacoes pequenas.


DCGA 89.7986 46.4868 0.3244 + + +

DGEA 102.8617 49.7650 0.1488 + + ≈

DRAC v2 107.5770 51.4211 0.2475 + –

DRAC v2.a 125.5015 84.5042 0.1929 – –

PDFEA 103.6478 44.5476 0.2264 + +

ERIGA 128.2046 47.6416 0.1019 – ≈ –

RIGA 126.6664 39.9665 0.1135 – ≈ –

AGP 105.6296 50.5478 0.1083 ≈ + ≈

THM 115.7410 48.7583 0.1107 – + –

TRAM 108.1533 56.7968 0.1005 ≈ + –

Esse comportamento pode ser observado na Figura 7.16, que mostra que os valores dos

metodos DRAC v2 e v2.a foram quase sempre superiores aos demais AEs.

No Experimento 7.8.c, variacoes caoticas, DRAC v2.a obteve novamente o melhor

resultado, maior MMA e menor DP, mostrando maior estabilidade, Tabela 7.20. Na

Figura 7.17, observa-se que a melhor aptidao do DRAC v2.a mantem-se superior aos

demais AEs na maioria das geracoes e e a que menos oscila.

A Figura 7.18 mostra as aptidoes dos metodos propostos — DRAC v2, DRAC v2.a

e PDFEA. Apenas no primeiro experimento, variacoes pequenas, PDFEA supera DRAC

v2.a e em nenhum experimento supera DRAC v2. No Experimento 7.8.a, Figura 7.18(a),

DRAC v2 e o mais estavel, com aptidao mais elevada e menor oscilacao. Nos Experi-

mentos 7.8.b e 7.8.c, Figuras 7.18(b) e 7.18(c), o comportamento do ambiente torna as

melhores aptidoes muito oscilantes. Nesses dois experimentos, DRAC v2.a comporta-se

de uma maneira mais estavel. No Experimento 7.8.c, Figura 7.18(c), houveram alguns

intervalos onde os picos de melhor aptidao do DRAC v2 foram maiores do que no DRAC

v2.a. Entretanto, o comportamento mais estavel do DRAC v2.a proporcionou-lhe um

MMA maior, Tabela 7.20. No problema da mochila, os metodos propostos, DRAC v2 e

v2.a, obtiveram os melhores resultados em todos os experimentos. Diferentemente dos

experimentos com funcoes contınuas e nao-contınua, no problema da mochila, o metodo

proposto DRAC v2 superou os demais AEs no experimento com dinamica com variacoes

pequenas.

145

400

600

800(a)

Me

lho

r a

ptid

ao


200

400

600

800(b)

Me

lho

r a

ptid

ao


400

600

800(c)

Me

lho

r a

ptid

ao

DRAC v2DRAC v2.aSGA

0 100 200 300 400 500 600 700 800 900 1000400

600

800(d)

Me

lho

r a

ptid

ao

Geraçoes


Figura 7.16 Melhor aptidao no Experimento 7.8.b: problema da mochila com variacoes gran-

des.

146

0

500

1000(a)

Me

lho

r a

ptid

ao


0

500

1000(b)

Me

lho

r a

ptid

ao


0

500

1000(c)

Me

lho

r a

ptid

ao

DRAC v2DRAC v2.aSGA

0 100 200 300 400 500 600 700 800 900 10000

500

1000(d)

Me

lho

r a

ptid

ao

Geraçoes


Figura 7.17 Melhor aptidao no Experimento 7.8.c: problema da mochila com variacoes

caoticas.

147

0 100 200 300 400 500 600 700 800 900 1000200

400

600

800

1000

Me

lho

r a

ptid

ao

(a) Problema da mochila com variaçoes pequenas


0 100 200 300 400 500 600 700 800 900 1000200

400

600

800

Me

lho

r a

ptid

ao

(b) Problema da mochila com variaçoes grandes


0 100 200 300 400 500 600 700 800 900 10000

500

1000

Me

lho

r a

ptid

ao

Geraçoes

(c) Problema da mochila com variaçoes caoticas


Figura 7.18 Melhor aptidao nos metodos propostos: problema da mochila.

148

Tabela 7.16 Resultados do Experimento 7.7.b: moving peaks com variacoes grandes.


DCGA 82.0944 77.4021 0.3072 + + +

DGEA 91.8578 84.8899 0.2054 + + +

DRAC v2 164.7222 67.1858 0.3209 – –

DRAC v2.a 125.3414 85.0542 0.1947 + –

PDFEA 105.4356 75.0354 0.2175 + +

ERIGA 123.2319 87.3126 0.1943 + ≈ –

RIGA 113.3119 79.5980 0.2297 + + –

AGP 91.8599 87.9963 0.1860 + + +

THM 101.8531 86.6538 0.2330 + + ≈

TRAM 94.7369 89.1211 0.1645 + + +

A Figura 7.19 mostra as diversidades dos metodos DGEA, DRAC v2, ERIGA, RIGA

e THM no Experimento 7.8.a — variacoes pequenas. Observa-se que a diversidade do

DRAC v2, Figura 7.19(b), e uma das mais elevadas e a que menos oscila. Entretanto,

esse perfil de diversidade do DRAC v2 pode nao ser a principal razao para seu melhor

desempenho, mas sim sua forma de controle de diversidade baseada na pressao de selecao

e distancia do melhor indivıduo. Os demais AEs descreveram diversidades elevadas, o

que pode prejudicar a explotacao. No DRAC v2, a diversidade tambem e elevada, mas

como uma parte da populacao e selecionada em funcao da distancia do melhor indivıduo,

indivıduos proximos deste sao selecionados independentemente das suas aptidoes, o que

pode manter uma explotacao satisfatoria.

A Figura 7.20 mostra as diversidades dos AEs que obtiveram os melhores desempenhos

no Experimento 7.8.c — dinamica caotica. Com excecao do DRAC v2.a, Figura 7.20(c), os

demais AEs descreveram perfis de diversidade semelhantes, com valores elevados e pouca

oscilacao. Desta vez, o melhor desempenho do DRAC v2.a pode ser atribuıdo ao seu perfil

de diversidade, que forca o seu decaimento beneficiando a explotacao e elevando-a apenas

quando ocorre uma mudanca do ambiente. O segundo melhor desempenho do DRAC v2

pode ser atribuıdo ao mesmo motivo descrito no paragrafo anterior, na dinamica com

variacoes pequenas, a variacao da pressao de selecao e a selecao de parte da populacao

em funcao da distancia ao melhor indivıduo.

Os metodos propostos DRAC v2 e v2.a alcancaram os melhores resultados. Neste tipo

149

0

0.5

1

Div

ers

ida

de

(a) DGEA

0

0.5

1

Div

ers

ida

de

(b) DRAC v2

0

0.5

1

Div

ers

ida

de

(c) ERIGA

0

0.5

1

Div

ers

ida

de

(d) RIGA

0 100 200 300 400 500 600 700 800 900 10000

0.5

1

Div

ers

ida

de

(e) THM

Geraçoes

Figura 7.19 Diversidades no Experimento 7.8.a: problema da mochila com variacoes pequenas.

150

0

0.5

1(a) DGEA

Div

ers

ida

de

0

0.5

1(b) DRAC v2

Div

ers

ida

de

0

0.5

1

Div

ers

ida

de

(c) DRAC v2.a

0

0.5

1

Div

ers

ida

de

(d) RIGA

0 100 200 300 400 500 600 700 800 900 10000

0.5

1

Div

ers

ida

de

Geraçoes

(e) THM

Figura 7.20 Diversidades no Experimento 7.8.c: problema da mochila com variacoes caoticas.

151

Tabela 7.17 Resultados do Experimento 7.7.c: moving peaks com variacoes caoticas.


DCGA 77.3741 84.2767 0.3163 + + +

DGEA 87.9430 91.4246 0.2134 + + +

DRAC v2 105.6635 83.1811 0.3767 + –

DRAC v2.a 127.4921 90.4937 0.1933 – –

PDFEA 101.3245 88.3276 0.1919 ≈ +

ERIGA 128.6350 92.1129 0.2064 – ≈ –

RIGA 115.4404 82.8222 0.2313 – + –

AGP 88.6695 94.2602 0.1935 + + +

THM 103.6392 91.6389 0.2365 ≈ + ≈

TRAM 91.6162 94.5133 0.1708 + + +

de problema, mesmo no experimento com variacoes pequenas o DRAC v2 obteve o melhor

resultado. Esses resultados mais uma vez sinalizam que grandes impulsos de diversidade

apos variacoes pequenas do ambiente sao pouco recomendadas. Essa suposicao e reforcada

pelo resultado inferior do DRAC v2.a, que acompanha o modelo de referencia de forma

satisfatoria. Por outro lado, o DRAC v2, que nao acompanha adequadamente o modelo

de referencia, alcancou os melhores resultados. Os fatores que podem ter proporcionado

tal desempenho do DRAC v2 sao o controle da diversidade utilizando apenas parte da

populacao e a variacao da pressao de selecao. Essa ultima proporcionando apenas um

pequeno aumento da diversidade pela diminuicao da pressao de selecao quando ocorrem

variacoes do ambiente.

7.9 EXPERIMENTOS COM O PROJETO DE REDE DE RADIO-TRANSMISSORES

Os metodos propostos foram testados em dois experimentos com projeto de rede de radio-

transmissores, apresentado na Secao A.5. Nestes experimentos, a area total de cobertura

foi de 16384 um2 (unidades de medida) com 30 radio-transmissores, Nt, cada um com

cobertura de 400 um2. Para simular um problema dinamico, a cada variacao do ambiente

0 a 10 radio-transmissores podem sair de operacao.

A Figura 7.21 e a Tabela 7.21 mostram os resultados do Experimento 7.9.b — dinamica

com variacoes grandes. O melhor resultado foi obtido pelo ERIGA seguido pelo DRAC

v2.a; entretanto, os resultados desses dois metodos foram proximos — o MMA do ERIGA

152

Tabela 7.18 Resultados do Experimento 7.8.a: problema da mochila com variacoes pequenas.


DCGA 758.2990 97.4729 0.4735 + – –

DGEA 637.0294 82.8003 0.6388 + + +

DRAC v2 823.4922 62.4434 0.6739 – –

DRAC v2.a 709.6787 72.9952 0.4620 + +

PDFEA 731.5467 71.4562 0.3174 + –

ERIGA 760.8411 75.9367 0.5233 + – –

RIGA 739.0867 72.7542 0.7386 + – –

AGP 740.2996 95.1760 0.3478 + – –

THM 787.1178 70.3255 0.6303 + – –

TRAM 593.5792 88.4583 0.2921 + + +

foi apenas 0.74% superior ao do DRAC v2.a. Mesmo com variacoes grandes do ambiente,

os resultados gerais nao foram muito divergentes. O melhor MMA foi 10.80% superior ao

pior, obtido pelo TRAM. Entre os melhores resultados, ERIGA e DRAC v2.a, tambem

nao houve diferenca significativa dos DPs, o que mostra que as oscilacoes causadas pelas

variacoes do ambiente afetaram de forma similar esses dois metodos.

A Figura 7.22 e a Tabela 7.22 mostram os resultados do Experimento 7.9.c — dinamica

com variacoes caoticas. Neste experimento, os metodos baseados em imigrantes e o AGP

foram superiores aos metodos propostos DRAC v2 e v2.a. Entretanto, assim como no

Experimento 7.9.b, as diferencas dos MMAs e DPs entre os AEs que alcancaram os

melhores e os metodos propostos tambem nao foram muito significativas.

7.10 EXPERIMENTOS COM O ROTEAMENTO DE REDES

No problema do roteamento de redes, foi utilizada uma rede com 40 nos e em media 10

conexoes por no. O valor das arestas, pesos das conexoes, variou entre 50 e 100. Nenhuma

heurıstica foi implantada para estabelecer conexoes validas entre nos, estabeleceu-se uma

penalidade de 10 vezes o valor da maior conexao da rede para um caminho invalido, isto e,

entre nos nao conectados. Para simular um ambiente dinamico, os pesos das conexoes sao

alterados de acordo com um intervalo e cada par de nos pode perder ou estabelecer uma

conexao a uma probabilidade de 0.05. Neste experimento, ocorreram variacoes cıclicas

de 100 geracoes.

153

200

400

600

800(a)

Me

lho

r a

ptid

ao

200

400

600

800(b)

Me

lho

r a

ptid

ao

200

400

600

800(c)

Me

lho

r a

ptid

ao

0 100 200 300 400 500 600 700 800 900 1000200

400

600

800(d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.21 Melhor aptidao no Experimento 7.9.b: problema RND com variacoes grandes.

154

200

400

600

800(a)

Me

lho

r a

ptid

ao

200

400

600

800(b)

Me

lho

r a

ptid

ao

200

400

600

800(c)

Me

lho

r a

ptid

ao

0 100 200 300 400 500 600 700 800 900 1000200

400

600

800(d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.22 Melhor aptidao no Experimento 7.9.c: problema RND com variacoes caoticas.

155

Tabela 7.19 Resultados do Experimento 7.8.b: problema da mochila com variacoes grandes.


DCGA 579.2853 27.3861 0.6471 + + ≈

DGEA 593.6173 35.5919 0.6437 + + –

DRAC v2 683.8334 21.1139 0.7118 + –

DRAC v2.a 695.2540 51.0121 0.4623 – –

PDFEA 577.3245 41.3267 0.3136 + +

ERIGA 580.8886 38.5311 0.6893 + + ≈

RIGA 577.6567 33.2258 0.7954 + + ≈

AGP 579.5936 29.2703 0.2767 + + ≈

THM 579.6192 28.0350 0.6376 + + ≈

TRAM 579.3441 28.0489 0.3071 + + ≈

A Tabela 7.23 mostra os resultados do Experimento 7.10.b — dinamica com variacoes

grandes. Os melhores resultados foram obtidos pelos metodos DRAC v2.a, TRAM e

DRAC v2. Os menores DPs foram obtidos pelos metodos THM, AGP e RIGA. Nesse caso,

dados os seus MMAs, menores DPs nao significam maior rapidez para retomar caminhos

perdidos ou menor decaimento da melhor aptidao apos as mudancas do ambiente. A

Figura 7.23 mostra que sao necessarias aproximadamente 300 geracoes para a construcao

dos caminhos validos. Apos esse perıodo, ha uma queda da melhor aptidao apos as

mudancas do ambiente, mas nos metodos DRAC v2.a, v2 e TRAM ha rapida reconstrucao

de caminhos validos. Pela Figura 7.23, fica evidente nos metodos baseados em imigrantes,

no AGP e no THM a dificuldade de encontrar caminhos validos em todo o processo

evolucionario.

A Tabela 7.23 mostra os resultados do Experimento 7.10.c — dinamica caotica. No-

vamente, os melhores resultados foram alcancados pelos metodos DRAC v2.a, TRAM e

DRAC v2. Como mostra a Figura 7.24, os perfis das melhores aptidoes de todos os AEs

foram semelhantes ao Experimento 7.10.b. Entretanto, como esperado, todos os AEs ob-

tiveram resultados superiores em relacao aos seus proprios desempenhos no Experimento

7.10.b, visto que na dinamica caotica algumas variacoes do ambiente podem ser pequenas

— o que pode produzir menor variacao da melhor aptidao.

A vantagem de um AE sobre um metodo de busca heurıstica, como o A∗ (RUSSELL;

NORVIG, 2002), e que o primeiro, apos uma mudanca do ambiente, nao precisa refazer a

156

0

0.2

0.4(a)

Me

lho

r a

ptid

ao

0

0.2

0.4(b)

Me

lho

r a

ptid

ao

0

0.2

0.4(c)

Me

lho

r a

ptid

ao

0 100 200 300 400 500 600 700 800 900 10000

0.2

0.4(d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.23 Melhor aptidao no Experimento 7.10.b: roteamento de redes com variacoes gran-

des.

157

0

0.2

0.4(a)

Me

lho

r a

ptid

ao

0

0.2

0.4(b)

Me

lho

r a

ptid

ao

0

0.2

0.4(c)

Me

lho

r a

ptid

ao

0 100 200 300 400 500 600 700 800 900 10000

0.2

0.4(d)

Me

lho

r a

ptid

ao

Geraçoes


DRAC v2DRAC v2.aSGA



Figura 7.24 Melhor aptidao no Experimento 7.10.c: roteamento de redes com variacoes

caoticas.

158

Tabela 7.20 Resultados do Experimento 7.8.c: problema da mochila com variacoes caoticas.


DCGA 478.1139 163.3025 0.5645 + + +

DGEA 691.4971 87.3743 0.6358 + + –

DRAC v2 708.6517 98.4109 0.7220 + –

DRAC v2.a 745.3781 92.5337 0.4621 – –

PDFEA 563.6782 137.1536 0.3254 + +

ERIGA 568.6066 126.0794 0.6765 + + –

RIGA 607.0150 108.8241 0.8607 + + –

AGP 447.4142 172.4034 0.4401 + + +

THM 572.4740 119.7634 0.8116 + + –

TRAM 317.8635 161.6541 0.3021 + + +

busca desde o no inicial. O controle da diversidade pode restabeler um caminho valido

em um tempo relativamente curto, pois permite criar nichos promissores de indivıduos

semelhantes ao melhor indivıduo. Por exemplo, um indivıduo, constituıdo de um caminho

invalido, geneticamente semelhante ao melhor indivıduo pode tornar-se a melhor solucao

apos uma variacao do ambiente. Isso nao ocorre em uma busca heurıstica, que so fornece

um caminho como solucao. Assim, apos uma variacao do ambiente, a busca heurıstica

deve ser reiniciada.

Nos experimentos com o roteamento de redes, os metodos propostos DRAC v2 e

v2.a obtiveram os melhores resultados, estatisticamente similar ao TRAM. Entretanto,

nos dois experimentos com este ambiente, o DRAC v2.a obteve o maior MMA. Esses

resultados evidenciam a pertinencia do controle da diversidade; primeiro, porque impulsos

de diversidade apos as mudancas do ambiente e uma diversidade mınima podem ser

beneficos ao processo de busca, como ja colocado; e segundo, porque o DRAC v2.a e,

dentre os metodos propostos, o que melhor acompanha o modelo de referencia.

7.11 ANALISE DE DESEMPENHO

Esta secao apresenta uma analise geral do desempenho dos AEs nos experimentos apre-

sentados nas Secoes 7.6-7.10. A Tabela 7.25 mostra os AEs que alcancaram os melhores

resultados por ambiente.

Nos ambientes contınuos e nao-contınuos, Ackley, Schwefel e moving peaks, com

159

Tabela 7.21 Resultados do Experimento 7.9.b: problema RND com variacoes grandes.


DCGA 578.3851 27.3905 0.3232 ≈ +

DGEA 557.1768 30.0620 0.2287 + +

DRAC v2 579.3893 28.1078 0.3415 +

DRAC v2.a 581.2514 27.3502 0.1727 –

ERIGA 585.5472 26.7146 0.1759 – –

RIGA 576.1863 27.2945 0.1726 + +

AGP 578.1888 25.5665 0.1640 ≈ +

THM 538.2718 26.4928 0.3680 + +

TRAM 529.5377 35.5996 0.2057 + +

dinamicas com variacoes pequenas, o ERIGA obteve os melhores resultados — esta-

tisticamente equivalente ao TRAM nos ambientes contınuos. Esses resultados indicam

que o impulso de diversidade de todas as versoes do DRAC deve ser compatıvel com o

comportamento do ambiente. Nesses ambientes, com dinamicas com variacoes pequenas,

os metodos propostos sempre foram superados pelo ERIGA. Em decorrencia da pequena

variacao da localizacao do otimo, fica sinalizado que a diversidade nao pode ter grande im-

pulso. Por outro lado, na dinamica com variacoes grandes, DRAC v2 foi sempre superior,

mostrando a importancia do impulso de diversidade. Nas variacoes caoticas, ERIGA teve

o melhor na funcao de Ackley e no moving peaks ; na funcao de Schwefel, as duas versoes

do DRAC obtiveram os melhores resultados. Em ambientes com dinamica conhecida,

pode-se, inicialmente, ajustar o impulso de diversidade proporcional ao comportamento.

A dificuldade da dinamica caotica e a impossibilidade de prever a magnitude da variacao

do ambiente, necessitando um ajuste em tempo real.

Nos problemas combinatorios, mochila, RND e roteamento, DRAC v2.a obteve o

melhor desempenho na maioria dos experimentos — quatro em sete realizados. Nos

tres experimentos com dinamicas caoticas, onde nao e possıvel prever a magnitude da

variacao, DRAC v2.a obteve melhor resultado em dois deles. Os resultados mostram,

pois, a importancia do controle da diversidade nesse tipo de problema, onde indivıduos

geneticamente semelhantes ao melhor indivıduo podem ter aptidoes completamente di-

ferentes. Como os melhores resultados foram alcancados pelo AE que melhor rastreia o

modelo de referencia, fica sinalizado que o controle da diversidade pode beneficiar o pro-

160

Tabela 7.22 Resultados do Experimento 7.9.c: problema RND com variacoes caoticas.


DCGA 575.7083 29.5403 0.3362 – ≈

DGEA 553.7130 27.9893 0.2330 + +

DRAC v2 572.2024 28.5650 0.2898 +

DRAC v2.a 575.8723 27.3103 0.1789 –

ERIGA 578.6673 23.8050 0.1788 – –

RIGA 578.7508 30.4068 0.1637 – –

AGP 577.8629 30.7522 0.1732 – –

THM 534.4965 27.7028 0.3690 + +

TRAM 539.4918 35.1445 0.2364 + +

cesso evolucionario em ambientes combinatorios dinamicos. Nesses problemas, indivıduos

geneticamente semelhantes ao melhor indivıduo, mas com baixa aptidao, podem ser pro-

missores apos uma mudanca do ambiente. Entretanto, esses indivıduos, pelas suas baixas

aptidoes, tendem a serem excluıdos em um AE padrao. Com o controle da diversidade,

esses indivıduos podem prevalecer, pois um nıvel mınimo de diversidade e estabelecido.

Outra analise importante e sobre os tempos de execucao, a Tabela 7.26 mostra os tem-

pos medios, em segundos, e seus desvios padroes (DP) em todos os ambientes. Os tempos

do PDFEA nao sao apresentados porque este metodo foi implementado no Matlab(R), em

linguagem interpretada cujos tempos de execucao sao muito superiores, impossibilitando

uma comparacao direta com os demais AEs.

O AE que teve o menor tempo de execucao foi o DGEA por realizar um numero

menor de operacoes — apenas cruzamentos no modo explotacao e apenas mutacao no

modo exploracao. O AE com maior tempo de execucao foi o DCGA em decorrencia do

seu modo de selecao oneroso computacionalmente. Os metodos propostos, DRAC v2 e

v2.a, obtiveram tempos aproximadamente iguais a maioria dos AEs. Em relacao ao AGP,

com excecao do DRAC v2 nos ambientes moving peaks e RND, os tempos dos metodos

propostos foram aproximadamente iguais.

Em relacao aos metodos propostos, o DRAC v2, com seu modelo de populacao per-

manente, so nao teve tempo de execucao menor que o DRAC v2.a nos ambientes moving

peaks e RND. Esses resultados se devem ao menor numero de operacoes de cruzamento

e mutacao executadas nesse modelo de populacao — 50% do modelo de populacao gene-

161

Tabela 7.23 Resultados do Experimento 7.10.b: roteamento de redes com variacoes grandes.


DCGA 0.1671 0.0465 0.1821 ≈ +

DGEA 0.1447 0.0385 0.1502 + +

DRAC v2 0.1671 0.0458 0.1945 +

DRAC v2.a 0.1726 0.0456 0.1401 –

ERIGA 0.1342 0.0280 0.1662 + +

RIGA 0.1257 0.0276 0.1656 + +

AGP 0.1256 0.0275 0.1686 + +

THM 0.0507 0.0082 0.3498 + +

TRAM 0.1710 0.0486 0.0721 – ≈

racional do DRAC v2.a. Por outro lado, nos ambientes moving peaks e RND, cujo custo

computacional para o calculo da aptidao e muito maior do que nos demais ambientes,

DRAC v2 teve tempo medio maior do que o DRAC v2.a — 36% maior no moving peaks e

74% maior no RND. Uma das razoes para esses tempos superiores e o metodo de selecao

do DRAC v2, que recalcula as aptidoes de parte da populacao a cada geracao.


Este capıtulo investigou o comportamento dos metodos de controle de diversidade propos-

tos, DRAC e PDFEA, em 26 experimentos, onde foram analisados o modelo de referencia,

a capacidade de rastreamento do sistema de controle e o desempenho em diferentes am-

bientes dinamicos. Os metodos foram comparados com o AGP e seis algoritmos evolu-

cionarios adaptativos.

Na Secao 7.4, o desempenho do rastreamento do sistema de controle foi analisado

em dois ambientes distintos com diferentes dinamicas. A meta dos metodos propostos e

equilibrar a deriva genetica somada a selecao com ajustes na taxa de mutacao, pm, ou na

pressao de selecao, β, aproximando a diversidade da populacao da saıda do modelo de

referencia. As versoes DRAC v2 e v2.a, que utilizam o modelo de dinamica de populacoes,

Capıtulo 5, tem a vantagem de diminuir a parametrizacao do sistema de controle, visto

que a derivada dΓ/dθ e calculada em tempo real.

Os experimentos com o ambiente moving peaks mostraram que o DRAC, em todas as

suas versoes, pode rastrear a saıda do modelo de referencia, minimizando o erro e = Γm−

162

Tabela 7.24 Resultados do Experimento 7.10.c: roteamento de redes com variacoes caoticas.


DCGA 0.1699 0.0464 0.1921 ≈ +

DGEA 0.1433 0.0388 0.1452 + +

DRAC v2 0.1709 0.0474 0.1300 +

DRAC v2.a 0.1758 0.0461 0.1444 –

ERIGA 0.1329 0.0275 0.1659 + +

RIGA 0.1271 0.0285 0.1657 + +

AGP 0.1245 0.0271 0.1664 + +

THM 0.0511 0.0085 0.3412 + +

TRAM 0.1744 0.0501 0.0684 – ≈

Γ, em ambientes contınuos ou nao-contınuos, onde nas vizinhancas dos otimos as aptidoes

dos indivıduos sao aproximadamente iguais. Nesses ambientes, os sinais de controle

sao mais efetivos, pois indivıduos geneticamente semelhantes ao melhor indivıduo tem

aptidoes aproximadamente iguais, potencializando a selecao. Assim, essa caracterıstica

somada a uma pressao de selecao maior, nas versoes DRAC v1 e v2, ou a uma taxa de

mutacao menor, DRAC v2.a, tende a decair a diversidade com maior intensidade. Em

oposicao ao decaimento da diversidade, uma pressao de selecao menor ou uma taxa de

mutacao maior tende a aumentar a diversidade. Nesses ambientes, e mais facil rastrear

a diversidade do modelo de referencia.

Os experimentos com o problema da mochila mostraram que as versoes DRAC v1 e v2

nao sao eficientes para rastrear a diversidade do modelo de referencia neste tipo de ambi-

ente — mesmo com comportamento estatico. Em problemas combinatorios, a selecao nao

contribui efetivamente para o decaimento da diversidade como em ambientes contınuos,

pois indivıduos geneticamente semelhantes podem ter aptidoes muito diferentes, e vice-

versa. Assim, de um grupo de indivıduos semelhantes, aqueles com pior aptidao tendem a

ser extintos, o que nao contribui para a reducao da diversidade. DRAC v2.a rastreou me-

lhor o modelo de referencia do que DRAC v2 em todos os experimentos com o problema

da mochila. Ao contrario da pressao de selecao, a taxa de mutacao tem forte influencia

sobre a diversidade. Com o auxılio do modelo de dinamica de populacoes, Capıtulo 5, que

fornece a sensibilidade da diversidade em relacao aos parametros evolucionarios, dΓ/du,

foi possıvel rastrear o modelo de referencia com margem de erro baixa quando utilizado

163

Tabela 7.25 Analise geral de desempenho.

Tabela 7.26 Tempos medios de execucao dos AEs.

164

o DRAC v2.a.

Na Secao 7.5, a hipotese do modelo de referencia, Secao 6.2, foi reforcada quando

modelos analıticos distintos proporcionaram o mesmo desempenho do metodo DRAC.

Os experimentos com dois tipos de ambientes com diferentes ciclos de variacao mostra-

ram resultados semelhantes em relacao aos indicadores MMA, DP e Γ. Os parametros

do modelo de referencia foram escolhidos empiricamente. No entanto, tais parametros,

qualquer que seja o modelo analıtico, podem ser ajustados adaptativamente em funcao de

algum criterio de desempenho do AE. Por exemplo, o impulso de diversidade do modelo

de referencia apos a mudanca do ambiente pode ser ajustado conforme a dinamica do

ambiente — por exemplo, em funcao da variacao da melhor aptidao ou da frequencia da

mudanca. A partir dos resultados dos experimentos, conclui-se que o DRAC pode ser

implementado apenas em funcao de especificacoes gerais do modelo de referencia, como

a diversidade mınima, Γmin, ou o pico de diversidade apos a mudanca do ambiente.

A Secao 7.6 apresentou os experimentos com as funcoes contınuas de Ackley e Schwefel.

Em uma analise geral, os metodos propostos DRAC v2, DRAC V2.a e PDFEA obtiveram

resultados inferiores aos metodos ERIGA e TRAM nos experimentos com dinamica com

variacoes pequenas. Os parametros do modelo de referencia, Γmin e Γm apos as mudancas

do ambiente, foram os mesmos para todos os experimentos. Assim, os valores elevados de

Γm apos as mudancas do ambiente podem ter dispersado demasiadamente a populacao,

em especial nos metodos DRAC v2.a e PDFEA cujas diversidades sao mais sensıveis ao

sinal de controle — a taxa de mutacao.

Nos experimentos com dinamicas com variacoes grandes e caoticas, o perfil do mo-

delo de referencia favoreceu os metodos DRAC v2 e v2.a, em especial nos experimentos

com variacoes grandes, onde estes metodos alcancaram os melhores desempenhos. No

experimento com a funcao de Schwefel, os melhores resultados alcancados pelos metodos

DRAC v2 e v2.a podem ser observados nos seus menores DPs, Tabelas 7.13 e 7.14, que

indicam menores variacoes dos seus MMAs, e pela Figura 7.10, que mostra que as melho-

res aptidoes destes metodos recuperam seus valores anteriores as mudancas do ambiente

mais rapido do que os demais AEs.

Nos experimentos com o moving peaks, Secao 7.7, com dinamica com variacoes pe-

quenas, ERIGA, RIGA e DRAC v2.a obtiveram os melhores resultados. DRAC v2 e

PDFEA nao obtiveram resultados satisfatorios. Nos experimentos com variacoes gran-

des, DRAC v2 e v2.a obtiveram os melhores resultados. Nos experimentos com variacoes

caoticas, ERIGA e DRAC v2.a obtiveram os melhores resultados. Em ambientes como o

165

moving peaks, indivıduos tem aptidoes semelhantes nas vizinhancas de otimos. Portanto,

nessas regioes ocorrem-se os mesmos efeitos de ambientes contınuos em relacao ao com-

portamento da diversidade. Por essa razao, atribui-se um resultado nao satisfatorio aos

metodos propostos em dinamicas com variacoes pequenas. Ao contrario, em dinamicas

com variacoes grandes e caoticas, DRAC v2 e v2.a alcancaram os melhores resultados,

o que pode ser atribuıdo ao modelo de referencia que impulsiona a diversidade apos as

mudancas do ambiente.

No problema combinatorio da mochila, DRAC v2 e v2.a obtiveram resultados sig-

nificativamente superiores aos demais AEs. Normalmente, a diversidade nao decai com

muita intensidade em razao da selecao em problemas combinatorios, Figuras 7.19 e 7.20.

Isso ocorre porque indivıduos geneticamente semelhantes podem ter aptidoes muito dife-

rentes, e vice-versa, impedindo a criacao de nichos em torno do melhor indivıduo. Assim,

um indivıduo sem boa aptidao, geneticamente semelhante ao melhor indivıduo, apos a

variacao do ambiente pode ter sua aptidao melhorada. Isso so ocorrera se houver di-

minuicao da diversidade, por alta pressao de selecao, no DRAC v2, ou baixa taxa de

mutacao, no DRAC v2.a. Por controlarem a diversidade, decaindo-a ate Γm, DRAC v2

e v2.a obtiveram resultados muito satisfatorios nos problema combinatorios da mochila.

No roteamento de redes, DRAC v2.a obteve o melhor resultado, estatisticamente igual

ao TRAM, seguido do DRAC v2 e DCGA nos experimentos com dinamicas com variacoes

grandes e caoticas. Os algoritmos baseados em imigrantes, ERIGA e RIGA, obtiveram os

piores resultados. O mesmo fenomeno ocorrido no problema da mochila, caracterıstico de

problemas combinatorios, aconteceu no roteamento de redes. Neste caso, um indivıduo

geneticamente semelhante ao melhor indivıduo que forma um caminho invalido pode

tornar-se valido apos a mudanca do ambiente. Isso so ocorrera se houver um nicho em

torno do melhor indivıduo, que por sua vez causara uma diminuicao da diversidade da

populacao. Metodos que nao diminuem a diversidade de forma controlada, como os

baseados em imigrantes, tem dificuldades de criar tais nichos. Portanto, essas colocacoes

justificam o melhor desempenho do DRAC v2.a, que dos metodos propostos e o que

melhor controla a diversidade da populacao.

Tendo como objetivo atuar em ambientes dinamicos, recuperando a melhor aptidao

anterior a variacao do ambiente o mais rapido possıvel, o objetivo dos metodos propostos,

em especial as versoes do DRAC, foi alcancado. Nesta analise de desempenho, foram

utilizados varios ambientes com caracterısticas distintas. Todos os metodos propostos,

DRAC v2, DRAC v2.a e PDFEA, obtiveram resultados inferiores, principalmente em

166

relacao aos AEs baseados em imigrantes, na maioria dos experimentos com dinamicas

com variacoes pequenas. Esses resultados sinalizam a necessidade de um modelo de

referencia que interaja com o ambiente, principalmente em relacao a sua dinamica. Ao

contrario, os metodos propostos DRAC v2 e v2.a mostraram-se superiores aos demais AEs

na maioria dos experimentos com dinamicas com variacoes grandes e caoticas. Quando

isso nao ocorreu, pelo menos um desses metodos foram equivalentes aos metodos ERIGA

ou TRAM.

167

CAPITULO 8

CONCLUSOES E TRABALHOS FUTUROS

Os algoritmos evolucionarios (AEs) possuem parametros cujos valores tem influencia

direta no desempenho do processo evolucionario. A determinacao dos valores desses

parametros, na maioria das vezes realizada durante o processo evolucionario, pode melho-

rar o desempenho de AEs em problemas de otimizacao, busca, modelagem ou simulacao.

Este trabalho apresentou dois metodos de controle de parametros de algoritmos evo-

lucionarios cujo principal objetivo e controlar a diversidade da populacao. O primeiro,

DRAC, baseia-se no sistema adaptativo por modelo de referencia (ASTROM; WITTEN-

MARK, 1995) e o segundo, PDFEA, e fundamentado no controle de funcao de distribuicao

de probabilidade (WANG, 2000a). O PDFEA pode ser considerado um novo paradigma

de controle de diversidade em algoritmos evolucionarios. A partir de um novo modelo de

dinamica de populacoes, o processo evolucionario foi formalizado analiticamente. Esse

modelo foi, tambem, utilizado no sistema de controle do DRAC.

O modelo de dinamica de populacoes proposto formalizou um modelo de processo evo-

lucionario e atuou no ajuste do parametro do controlador, por meio de sua aproximacao

da derivada dΓ/dθ. Esse modelo, apesar de idealizado para populacoes infinitas, mostrou

que realiza previsoes de diversidade que tendem a serem mais precisas para populacoes

maiores que 50 indivıduos. Esses resultados sao importantes porque as populacoes reais

ou de AEs sao, normalmente, maiores que 100 indivıduos.

O modelo de controle adaptativo, DRAC, criou uma nova concepcao de controle de

diversidade em AEs. Foi criado um modelo de referencia com caracterısticas gerais,

independente de funcoes analıticas, a partir das fundamentacoes teoricas apresentadas no

Capıtulo 3. Alguns experimentos, Secao 7.5, mostraram que modelos analıticos distintos

podem proporcionar ao DRAC o mesmo desempenho em ambientes e ciclos de variacao

distintos.

Apesar de o metodo MIT nao garantir a convergencia para uma estabilidade as-

sintotica, e = 0, para k →∞, os experimentos apresentados na Secao 7.4 mostraram que

o sistema de controle pode rastrear o modelo de referencia de forma satisfatoria quando

168

utilizada a taxa de mutacao como sinal de controle, DRAC v2.a. Esses resultados mostra-

ram que e possıvel contrapor os fenomenos que causam a perda da diversidade — deriva

genetica e selecao. Nesse contexto, a dinamica de populacoes, ao fornecer a variacao

da diversidade em relacao ao sinal de controle, teve grande importancia, pois diminui a

parametrizacao do sistema de controle ao calcular dΓ/dθ em tempo real.

O modelo de controle de parametros baseado no controle de PDF, apresentado na

Secao 6.6 e implementado em carater inicial, representa um importante topico de pesquisa

na computacao evolucionaria, pois abre duas possibilidades:

1. Controle da diversidade da populacao; e

2. Controle da distribuicao dos indivıduos no espaco de solucoes.

Ao longo deste doutorado, os modelos e resultados obtidos foram reportados e publi-

cados em varios congressos, a saber� Population dynamic model for gene frequency prediction in evolutionary algorithms

(GOUVEA JR.; ARAUJO, 2008b).� Diversity control based on population heterozygosity dynamic (GOUVEA JR.; ARAUJO,

2008a).� Diversity-based model reference for genetic algorithms in dynamic environment (DIVERSITY-

BASED. . . , 2007).� Multicast routing using genetic algorithm seen as a permutation problem (ARAUJO

et al., 2006).� Roteamento de redes multicast utilizando computacao evolucionaria (GOUVEA JR.

et al., 2005).

A elaboracao desses artigos, suas revisoes e crıticas da comunidade cientıfica tiveram

grande importancia no desenvolvimento desta tese.

Os experimentos do Capıtulo 7, que compararam os metodos propostos, DRAC e

PDFEA, com um AGP e seis AEs adaptativos, mostrou que as versoes DRAC podem

ter melhor desempenho em ambientes com dinamicas com grandes variacoes ou com

comportamento caotico. Em ambientes com variacoes pequenas, na maioria dos casos,

os metodos propostos obtiveram desempenho inferior aos metodos ERIGA e TRAM. A

169

principal causa pode ser atribuıda ao elevado impulso de diversidade apos as mudancas

do ambiente, definida pelo modelo de referencia, que pode ter espalhado demasiadamente

a populacao em relacao a pequena variacao do ambiente. Assim, indivıduos proximos do

melhor indivıduo, que poderiam ser promissores apos a mudanca do ambiente, afastaram-

se do novo otimo.

Nos problemas combinatorios, o metodo DRAC obteve resultado superior na maioria

dos experimentos, mesmo com dinamicas com variacoes pequenas, o que pode estar rela-

cionado a diversidade elevada de alguns AEs. Em problemas combinatorios, indivıduos

proximos do melhor indivıduo podem ter baixa aptidao, reduzindo suas chances de so-

brevivencia ou de gerar descendentes. Assim, nao havera nichos em torno do melhor

indivıduo — como acontece em ambientes contınuos onde indivıduos na vizinhanca do

otimo tem aptidoes semelhantes. Portanto, nao havera grande reducao da diversidade

em decorrencia da selecao. No DRAC, ao reduzir a diversidade, guiada pelo modelo de

referencia, indivıduos proximos do melhor indivıduo tem mais chances de sobreviver ou

gerar descendentes. Esses indivıduos, que a princıpio tem baixa aptidao, podem tornar-se

promissores apos as mudancas do ambiente. Por exemplo, um indivıduo geneticamente se-

melhante ao melhor indivıduo, mas que apresenta um caminho invalido em um problema

de roteamento, pode tornar-se um caminho valido apos uma mudanca do ambiente. Com

uma diversidade elevada, essa situacao tende a nao ocorrer, pois normalmente nao ha

nichos em torno do otimo.

O objetivo principal dos metodos propostos, principalmente as versoes duas DRAC,

foi alcancado, visto que os metodos propostos foram projetados para ambientes comple-

xos — multimodais e dinamicos. Foram utilizados varios ambientes com caracterısticas

distintas em relacao a dinamica e aos ciclos de variacao. O metodo proposto PDFEA,

implementado em carater inicial, foi inferior a maioria dos demais AEs nos experimen-

tos realizados. Os modelos DRAC v2 e v2.a mostraram-se superiores aos demais AEs

na maioria dos experimentos com dinamicas com variacoes grandes e caoticas. Quando

isso nao ocorreu, pelo menos um desses metodos foi equivalente aos metodos ERIGA ou

TRAM.

8.1 TRABALHOS FUTUROS

Este trabalho abre varias possibilidade de pesquisa e investigacao. O modelo de dinamica

de populacoes, apesar de idealizado para AEs, pode tambem ser utilizado em populacoes

170

biologicas. Na computacao evolucionaria, outros modelos de controle de parametros de

fatores evolutivos podem ser elaborados; por exemplo, no controle da distribuicao alelica

de um determinado gene. Assim, a partir do alelo do melhor indivıduo, pode-se controlar

a distribuicao de indivıduos na vizinhanca deste alelo, otimizando a explotacao.

Em populacoes biologicas, o modelo de dinamica de populacoes pode ser utilizado

na previsao da perda de diversidade, principalmente porque estas populacoes sao, nor-

malmente, elevadas, tornando as previsoes mais precisas. Pode-se estimar as frequencias

genicas ou genotıpicas de uma populacao ou especie, compara-las com as previsoes do

modelo de Hardy-Weimberg, prever evolucoes e quais os fatores evolutivos mais atuaram.

Assim, nao seria necessario esperar a proxima geracao para analisar a evolucao de uma

populacao.

Outra possibilidade de trabalho futuro e o aprimoramento do modelo de referencia

de diversidade, utilizado no controle adaptativo. Como identificado nos experimentos, o

modelo de referencia tem parametros que influenciam o desempenho do AE. No modelo

baseado na dinamica da heterozigosidade, Equacao 3.23, esses parametros sao o tamanho

efetivo da populacao, a diversidade mınima e a magnitude do impulso de diversidade

apos as mudancas do ambiente. O tamanho efetivo da populacao influencia o decaimento

da diversidade e pode ser ajustado para variar conforme a evolucao media da populacao.

A diversidade mınima tem influencia tanto na explotacao, como na manutencao de al-

guns indivıduos com baixas aptidoes, mas que apos uma mudanca do ambiente podem

tornar-se indivıduos promissores. Finalmente, um dos parametros que demostrou maior

influencia no desempenho das versoes DRAC foi a magnitude do impulso de diversidade

do modelo de referencia apos as mudancas do ambiente. Em alguns experimentos com

dinamicas com variacoes pequenas, a saıda do modelo de referencia apos as mudancas

do ambiente influenciou negativamente o desempenho das versoes DRAC. Portanto, as

seguintes propostas podem ser testadas e analisadas:

1. Elaborar uma estrategia que ajuste um ou todos os parametros do modelo de re-

ferencia durante o processo evolucionario; e

2. Identificar uma configuracao parametrica do modelo de referencia que melhor se

adeque ao tipo de problema (e.g., contınuo, combinacional, multiobjetivo).

O controle de PDF aplicado aos algoritmos evolucionarios tambem abre varias possibi-

lidades, tanto de pesquisa quanto de aplicacoes, principalmente em ambientes dinamicos

171

e multiobjetivos. Alguns caminhos incluem a analise do comportamento da PDF ao longo

das geracoes e apos as mudancas do ambiente. Uma area de aplicacao que pode ser pro-

missora e a dos problemas multiobjetivos, onde o controle da distribuicao dos indivıduos

no espaco de solucoes pode posicionar um grupo de indivıduos na regiao de Paretto.

Encontrar uma PDF desejada que proporcione o melhor desempenho do AE e outra

questao importante a ser tratada. Da mesma forma proposta em relacao ao modelo de

referencia, e possıvel propor uma PDF ajustavel ao longo do processo evolucionario ou

uma PDF pre-ajustada em funcao do tipo de problema. Entretanto, o maior desafio do

controle de PDF e torna-lo menos oneroso computacionalmente. Algumas medidas podem

ser feitas com o intuito de amenizar o esforco computacional. Tais medidas incluem o

ajuste do sinal de controle em intervalos onde o processo evolucionario e, por aproximacao,

tratado como um sistema estatico.

Esta tese de doutorado tambem abre outras possibilidades de controle de parametros.

Outros parametros de fatores evolutivos podem ser utilizados pelos metodos de controle

propostos, como, por exemplo, o intervalo de mutacao (para implementacoes de genotipos

com valores reais), taxa de cruzamento, o tipo de cruzamento, numero de indivıduos

selecionados no estagio 3 do mecanismo de selecao, Secao 6.5.3, e o tamanho da populacao.

Esses parametros tem influencia tanto na variacao da diversidade da populacao quanto no

desempenho do algoritmo evolucionario do ponto de vista da aptidao media da populacao.

Finalmente, um topico que tambem pode ser considerado e a relacao dos parametros

do sistema de controle com o desempenho do AE ao longo das geracoes. Dentre esses

parametros, destacam-se a diversidade mınima do modelo de referencia, que pode variar

conforme o crescimento da aptidao media da populacao, e a diversidade apos a mudanca

do ambiente, que pode variar conforme o decaimento da melhor aptidao apos as mudancas

do ambiente.

172

APENDICE A

FUNCOES PADRONIZADAS PARA TESTE

A.1 INTRODUCAO

Este apendice apresenta problemas teste (benchmarks) que sao utilizados para analises e

comparacoes do metodo proposto com outros algoritmos adaptaveis presentes na litera-

tura dos AEs, alem do algoritmo genetico padrao (AGP).

Sao apresentados seis benchmarks divididos em tres classes de problemas, a saber,

funcoes contınuas e nao-contınuas multimodais, e problemas combinatorios. Na Secao

A.2, duas funcoes contınuas multimodais; na Secao A.3, o gerador moving peaks de su-

perfıcies nao-contınuas multimodais, cujo comportamento pode ser estatico ou variar de

levemente dinamico, com mudancas suaves, ate caotico; na Secao A.4, o problema da mo-

chila, um problema de otimizacao combinacional NP-completo que pode ser aplicado em

muitos problema praticos; na Secao A.5, o problema de alocacao de radio-transmissores

de telecomunicacoes; e, finalmente, na Secao A.6, um problema de roteamento de redes

de transportes.

A.2 FUNCOES CONTINUAS

Todas as funcoes objetivo apresentadas nesta secao sao contınuas, utilizadas em pro-

blemas de minimizacao; isto e, no ponto otimo, f(X) possui o menor valor de toda a

superfıcie, sendo

f(X∗) = 0.

Portanto, para utilizacao destas funcoes em problemas de maximizacao, faz-se

f(X) = −f(X).

A funcao de Ackley (1987) e altamente multimodal com centenas de otimos locais e

apenas um otimo global. A superfıcie da funcao de Ackley e descrita no intervalo

173

xi ∈ [−60, 60],

∀i = 1, . . . , n. O modelo analıtico da funcao de Ackley e descrito por

fAck = 20− 20 exp

−0.2

√√√√ 1

n

n∑

i=1

(xi − φ)2

− exp

(1

n

n∑

i=1

cos(2π(xi − φ))

), (A.1)

sendo φ a coordenada do otimo global (i.e., X∗ = [φ, . . . , φ]T ).

A funcao de Schwefel (1995) e, tambem, altamente multimodal. Sua taxa de con-

vergencia ao longo dos eixos cartesianos e baixa, pois seu gradiente nao e orientado ao

longo dos eixos. A superfıcie da funcao de Schwefel e descrita no intervalo

xj ∈ [−65, 65],

∀j = 1, . . . , n. O modelo analıtico da funcao de Schwefel e descrito como segue

fSch = 418.98276n−

n∑

i=1

(i∑

j=1

(xj − φ)

)2

. (A.2)Os problemas desta secao podem se tornar dinamicos substituindo xi por xi + ϕi em

todas as equacoes, sendo [ϕ1, . . . , ϕn]T a coordenada do otimo global na superfıcie de

busca.

A.3 GERADOR MOVING PEAKS

O gerador moving peaks (MORRISON; JONG, 1999) produz uma superfıcie descontınua,

composta de Np picos (otimos). A seguir sao apresentados as principais caracterısticas

do gerador moving peaks, no sentido morfologico e dinamico.

A.3.1 Morfologia

Para especificar a morfologia basica da superfıcie gerada por moving peaks, utiliza-se um

“campo de cones” com diferentes alturas e declives aleatoriamente criados. O modelo

estatico do gerador moving peaks pode ser especificado para qualquer dimensao, como

segue

174

fMP(X) = maxi=1,...,Np

[Hi −Ri

√(x1 − x1i)2 + · · ·+ (xn − xni)2

], (A.3)

sendo cada cone i especificado por sua localizacao (x1i, . . . , xni), sua altura Hi e seu

declive Ri. Os cones sao combinados na funcao fMP pelo operador max.

A morfologia aleatoria produzida pelo gerador moving peaks e baseada nos intervalos

dos parametros dos cones, definidos como segue

Hi ∈ [Hmin, Hmax],

Ri ∈ [Rmin, Rmax]

e

xji ∈ [−1, 1],

∀i = 1, . . . , Np e ∀j = 1, . . . , n.

Existem varias vantagens de se utilizar a funcao da Equacao A.3 como base estatica

para ambientes dinamicos, a saber (MORRISON; JONG, 1999):

1. a habilidade de representar uma grande quantidade de superfıcies complexas;

2. a superfıcie contem regioes nao-diferenciaveis;

3. as caracterısticas da superfıcie sao parametrizadas;

4. a funcao da Equacao A.3 pode e facilmente estendida para dimensoes elevadas;

5. a funcao da Equacao A.3 oferece tres caracterısticas (Hi, Ri e xji, ∀i = 1, . . . , Np; ∀j =

1, . . . , n) que podem ser dinamicas.

A Figura A.1 mostra dois exemplos de superfıcies produzidas aleatoriamente pelo

gerador moving peaks, para (a) 5 e (b) 100 picos.

A.3.2 Dinamica

A dinamica do ambiente criado pelo gerador moving peaks e definida em tempo dis-

creto. O metodo utilizado por Morrison e Jong (1999) para criar muitas caracterısticas

dinamicas para a superfıcie gerada pela Equacao A.3 aplica a funcao logıstica. Essa

funcao e unidimensional, nao-linear e pode gerar comportamentos progressivos variando

do simples ate o complexo. A funcao logıstica e descrita como segue

175

050

100

0

50

100−500

0

500

(a) Np = 5

050

100

0

50

100−200

−100

0

100

(b) Np = 100

Figura A.1 Superfıcies produzidas aleatoriamente pelo gerador moving peaks para (a) 5 e (b)

100 picos.

y(t+ 1) = Ay(t) (1− y(t)), (A.4)sendo A uma constante e y(t) o valor da funcao logıstica na iteracao t (y(0) 6= 0). A

medida que A cresce, o comportamento dinamico se torna mais complexo. Por exemplo,

para A = 2.2, y tende para o valor de 0.5455; para A = 3.3, y entra em bifurcacao,

atingindo o par de valores {0.8236, 0.4794}; para A = 3.5, o comportamento se torna

mais complexos, y gerando os valores do conjunto {0.3828, 0.5009, 0.8269, 0.8750}; para

valor ainda maiores de A, y gera uma sequencia caotica.

Morrison e Jong utilizaram o valor de y, produzido em cada iteracao, para determinar

a magnitude das mudancas morfologicas e dinamicas do ambiente. O valor de A determina

a caracterıstica dinamica do ambiente. O procedimento para se obter uma dinamica

complexa e descrito pelas seguintes especificacoes:

1. o numero de picos da superfıcie que serao dinamicos;

2. a dinamica sera aplicada a altura Hi do pico , ao seu declive Ri, a sua coordenada

(x1i, . . . , xni) ou a qualquer combinacao desses parametros.

A escolha de A determina a caracterıstica das mudancas — passos pequenos e iguais,

grandes e iguais, de diferentes tamanhos ou caoticos. As mudancas na superfıcie da

funcao da Equacao A.3 sao efetuadas em funcao do valor de y, a cada ciclo.

176

A.4 PROBLEMA COMBINATORIO DA MOCHILA

O problema da mochila e um problema de otimizacao combinatoria NP-completo limitado

(SMITH; GOLDBERG, 1992). O objetivo e encontrar a melhor escolha de um conjunto de

objetos a ser colocado em uma mochila para uma viagem. Dado um conjunto de n tipos

de objetos, cada um com um peso proprio, wi, e um valor ou importancia, vi, determine

a quantidade de cada tipo de objeto, xi, tal que o peso total,

n∑

i=1

xi wi, (A.5)seja menor que um limite estabelecido, C, e o valor total,

n∑

i=1

xi vi, (A.6)seja o maior possıvel. Para simular um ambiente dinamico, o peso total, C, pode ser

modificado.

A.5 PROJETO DE REDE DE RADIO-TRANSMISSORES

O projeto de rede de radio-transmissao (RND, do ingles Radio Network Design) e um

problema de otimizacao NP-completo importante em tecnologias moveis cujo objetivo e

cobrir a maior area possıvel com o menor numero de estacoes base transceptoras (BTS,

do ingles Base Transceiver Station).

As informacoes armazenadas em cada posicao da grade operacional deve considerar:� o grau de cobertura;� se e uma posicao disponıvel para transmissao;� se uma BTS esta alocada ou nao;� o tipo de transmissor.

A funcao objetivo de um problema RND pode ser definida como segue

fRND =(CT )2

Nt, (A.7)

177

sendo CT a taxa de cobertura e Nt o numero de radio-transmissores (BTSs) utilizados.

A taxa CT corresponde a soma das coberturas das BTSs dividido pela area geografica

tratada pelo problema. A funcao objetivo da Equacao A.7 esta sujeita as seguintes

restricoes:� conjunto de localizacoes disponıveis para as BTSs e pre-definida;� as BTSs sao do tipo omnidirecional ou quadrada;� cobertura associada: raio × (20 ou 30).

A.6 ROTEAMENTO DE REDES DE TRANSPORTES

Um sistema de roteamento e um conjunto de meios cujo objetivo e atender demandas de

uma rede de transportes. Essa rede pode ser representada como um grafo nao-orientado

G(V,A), onde as V vertices sao ligas pelas A arestas. Alem de suprir as demandas, um

sistema de roteamento tem como objetivo alcancar um atendimento otimo do ponto de

vista de uma metrica em questao, como, por exemplo, no menor tempo ou na menor

distancia total percorrida. A Figura A.2 apresenta um grafo nao-orientado com oito

vertices e 14 arestas. Nesse exemplo, os numeros entre parenteses representam os pesos

das arestas, que podem ser as distancias entre as vertices, em um problemas de distri-

buicao de suprimentos, ou os atrasos medios de envios de pacotes, em um problema de

roteamento de redes de computadores.

Figura A.2 Grafo nao-orientado de um problema de roteamento de redes.

Dentre as principais aplicacoes praticas, podem ser destacadas a distribuicao de jor-

nais, manufaturados, bebidas, valores e produtos quımicos; o recolhimento de borracha e

lixo; o roteamento de helicopteros, linhas aereas, robos de manufatura, pacotes de redes

178

de computadores e fluxo de comunicacoes em redes de telecomunicacoes, dentre outros

(GOLDBARG; LUNA, 2000).

179

REFERENCIAS BIBLIOGRAFICAS

ACKLEY, D. H. A connectionist machine for genetic hillclimbing. Boston, MA, USA:

Kluwer Academic Publishers, 1987.

AGUIRRE, L. A. Introducao a identificacao de sistemas: tecnicas lineares e nao-lineares

aplicadas a sistemas reais. Belo Horizonte, MG, Brasil: Ed. UFMG, 2000.

AMOS, W.; BALMFORD, A. When does conservation genetics matter? Heredity, v. 87,

p. 257–265, 2001.

AMOS, W.; HARWOOD, J. Factors affecting levels of genetic diversity in natural

populations. Philosophical Transactions of the Royal Society of London - Series B:

Biological Sciences, v. 353, n. 1366, p. 177–186, 1998.

ANDRADOTTIR, S.; HEVMAN, D. P.; OTT, T. J. Variance reduction through

smoothing and control variates for markov chain simulations. ACM Transactions on

Modeling and Computer Simulation, v. 3, n. 3, p. 167–189, 1993.

ANGELINE, P. J. Adaptive and Self-adaptive Evolutionary Computation. Piscataway,

NJ: IEEE Press, 1995.

ARABAS, J.; MICHALEWICZ, Z.; MULAWKA, J. Gavaps – a genetic algorithm with

varying population size. In: Proceedings of the First IEEE International Conference on

Evolutionary Computing. [S.l.]: IEEE Press, 1994. p. 73–78.

ARAUJO, A. F. R. et al. Multicast routing using genetic algorithm seen as a permutation

problem. In: IEEE 20th International Conference on Advanced Information Networking

and Applications. Viena: [s.n.], 2006.

ASTROM, K. J.; WITTENMARK, B. Adaptive Control. 2. ed. [S.l.]: Addison-Wesley,

1995.

180

BACK, T. Self-adaptation in genetic algorithms. In: VARELA, F.; BOURGINE, P.

(Ed.). Proceedings of the First European Conference on Artificial Life. [S.l.]: MIT Press,

1992. p. 263–271.

BACK, T. Optimal mutation rates in genetic search. In: FORREST, S. (Ed.).

Proceedings of the 5th International Conference on Genetic Algorithms. San Mateo, CA,

USA: Morgan Kaufmann, 1993. p. 2–8. ISBN 1-55860-299-2.

BACK, T. Evolutionary Algorithms in Theory and Practice. New York, NY, USA:

Oxford University Press, 1996.

BACK, T.; SCHUTZ, M. Intelligent mutation rate control in canonical genetic

algorithms. In: International Syposium on Methodologies for Intelligent Systems

(ISMIS’96). [S.l.]: Springer, 1996. p. 158–167.

BEIGUELMAN, B. Genetica de Populacoes Humanas.

http://lineu.icb.usp.br/bbeiguel/Genetica Populacoes, 2005. Disponıvel em:

<http://lineu.icb.usp.br/bbeiguel/Genetica Populacoes>.

BENDTSEN, C. N.; KRINK, T. Dynamic memory model for non-stationary

optimization. In: Proceedings of the Fourth Congress on Evolutionary Computation –

CEC’02. [S.l.: s.n.], 2002. v. 1, p. 145–150.

BETHKE, A. D. Genetic algorithms as function optimizers. Tese (Doutorado), 1981.

BEYER, H. G.; RUDOLPH, G. Local performance measures. In: . Handbook

of Evolutionary Computation. [S.l.]: Oxford University Press, 1997. cap. B.2.4, p.

B2.4:1–B2.4:27.

BRAATZ, R. Advanced control of crystallization pocesses. Annual Reviews in Control,

v. 26, p. 87–99, 2002.

BRANKE, J. Memory enhanced evolutionary algorithms for changing optimization

problems. In: Proceedings of the 1999 Congress on Evolutionary Computation – CEC’99.

[S.l.: s.n.], 1999. v. 3, p. 1875–1882.

BRANKE, J. Evolutionary approaches to dynamic optimization problems: a survey. In:

BRANKE, J.; BACK, T. (Ed.). Evolutionary Algorithms for Dynamic Optimization

Problems. San Francisco, CA, USA: [s.n.], 2001. p. 27–30.

181

BRANKE, J. Evolutionary Optimization in Dynamic Environment. Norwell,

Massachusetts, USA: Kluwer Academic Publishers, 2002.

BROOKES, M. I. et al. Genetic analysis of founder bottlenecks in the rare british

butterfly Plebejus argus. Conservation Biology, v. 11, n. 3, p. 648–661, 1997.

BUI, L. T.; BRANKE, J.; ABBASS, H. Multi-objective optimization for dynamic

environments. In: Proceedings of the Congress on Evolutionary Computation. Edinburgh,

UK: IEEE press, 2005.

CABALLERO, A. Developments in the prediction of effective population size. Heredity,

v. 73, p. 657–679, 1994.

CHAMPELY, S.; CHESSEL, D. Measuring biological diversity using euclidean metrics.

Environmental and Ecological Statistics, Kluwer Academic, v. 9, n. 2, p. 167–177, June

2002.

CHARLESWORTH, B.; CHARLESWORTH, D.; BARTON, N. H. The effects of genetic

and geographic structure on neutral variation. Annual Review of Ecological Systems,

v. 34, p. 99–125, 2003.

CHESSER, R. K. et al. Genetics, 1993.

COBB, H. G. An investigation into the use of hypermutation as an adaptive operator

in genetic algorithms having continuous, time-dependent nonstationary environments.

Washington, 1990.

CORNE, D.; ROSS, P.; FANG, H.-L. Fast practical evolutionary timetabling. [S.l.], 1994.

CROSSA, J.; VENCOVSKY, R. Implications of the variance effective population size on

the genetic conservation of monoecious species. Theorical and Applied Genetics, v. 89,

n. 7, p. 936–942, 1994.

CROW, J. F.; DENNISTON, C. Inbreeding and variance effective population numbers.

Evolution, v. 42, p. 482–495, 1988.

CROW, J. F.; KIMURA, M. An Introduction to Population Genetic Theory. Minnesota:

Burgess Publishing, 1970.

182

CROWLEY, T. et al. Control of particle size distribution described by a population

balance model of semibatch emulsion polymerisation. J. Process Control, v. 10, p.

419–432, 2000.

DARWIN, C. A Origem das Especies. [S.l.]: Ediouro, 2004.

DAVIS, L. Adapting operator probabilities in genetic algorithms. In: Proceedings of

Third Int. Genetic Algorithms. [S.l.: s.n.], 1989. p. 61–69.

DIVERSITY-BASED Model Reference for Genetic Algorithms in Dynamic Environment.

In: 2007 IEEE Congress on Evolutionary Computation, CEC’07. Singapore, South

Korea: IEEE Press, 2007.

Doyle III, F.; HARRISON, C.; CROWLEY, T. Hybrid model-based approach to

batch-to-batch control of particle size distribution in emulsion polymerization. Comp.

Chem. Eng., v. 27, p. 1153–1163, 2003.

DROSTE, S.; JANSEN, T.; WEGENER, I. Dynamic parameter control in simple

evolutionary algorithms. In: Proceedings of the Foundations of Genetic Algorithms. [S.l.:

s.n.], 2001. v. 6, p. 275–294.

EEK, R. A.; BOSGRA, O. H. Controllability of particulate processes in relation to the

sensor characteristics. Powder Technology, v. 108, p. 137–146, 2000.

EIBEN, A. E.; HINTERDING, R.; MICHALEWICZ, Z. Parameter control in

evolutionary algorithms. IEEE Transactions on Evolutionary Computation, v. 3, n. 2, p.

124–141, 1999.

EIBEN, A. E.; SMITH, J. E. Introduction to Evolutionary Computing. Berlin: Springer,

2003.

ELDRIDGE, A. Optimal mutation rates and recombination: the effect of population

size and gene length. In: . [S.l.: s.n.], 2002.

EWENS, W. J. On the concept of effective population size. Theoretical Population

Biology, v. 21, p. 373–378, 1982.

FARIAS, A. A.; SOARES, J. F.; CeSAR, C. C. Introducao a Estatıstica. second. [S.l.]:

LTC, 1998.

183

FISHER, R. A. The Genetical Theory of Natural Selection. [S.l.]: Oxford University

Press, 1930.

FOGEL, D. B. Evolutionary Computation. Piscataway, NJ: IEEE Press, 1995.

FOGEL, D. B.; FOGEL, L. J.; ATMAR, J. W. Meta-evolutionary programming. In:

CHEN, R. (Ed.). Proceedings of the 25th Asilomar Conference on Signals, Systems and

Computers. San Jose, CA: Maple Press, 1991. v. 1, p. 540–545.

FRANKHAM, R. Effective population size/adult population size ratios in wildlife: a

review. Genetical Research, v. 66, p. 95–107, 1995.

FRANKHAM, R.; BALLOU, J. D.; BRISCOE, D. Introduction to Conservation

Genetics. Cambridge: Cambridge University Press, 2002.

GILBERT, D. A. et al. Genetic fingerprinting reflects population differentiation in the

california channel-island fox. Nature, v. 344, n. 6268, p. 764–767, 1990.

GOEDERT, C. Germoplasma: o que e isso? Seed News, v. 6, n. 3, 2002.

GOLDBARG, M. C.; LUNA, H. P. L. Otimizacao Combinatoria e Programacao Linear.

Rio de janeiro: Campus, 2000.

GOLDBERG, D. E. Genetic Algorithms in Search, Optimization and Machine Learning.

Reading, MA: Addison-Wesley, 1989.

GOLDBERG, D. E.; SMITH, R. E. Nonstationary function optimization using genetic

algorithms with dominance and diploidy. In: ICGA. [S.l.: s.n.], 1987. p. 59–68.

GOMMEREN, H. et al. Modelling and control of a jet mill plant. Powder Technology,

v. 108, p. 147–154, 2000.

GOUVEA JR., M. M.; ARAUJO, A. F. R. Diversity control based on population

heterozygosity dynamic. In: 2008 IEEE Congress on Evolutionary Computation,

CEC’08. Hong Kong: [s.n.], 2008.

GOUVEA JR., M. M.; ARAUJO, A. F. R. Population dynamic model for gene

frequency prediction in evolutionary algorithms. In: 2008 IEEE Congress on

Evolutionary Computation, CEC’08. Hong Kong: [s.n.], 2008.

184

GOUVEA JR., M. M.; GARROZI, C.; LEITaO, A. R. Roteamento de redes multicast

utilizando computacao evolucionaria. In: V Encontro Nacional de Inteligencia Artificial,

ENIA’05. Sao Leopoldo, RS, Brasil: [s.n.], 2005.

GREFENSTETTE, J. J. Genetic algorithms for changing environments. In: .

Parallel Problem Solving from Nature. [S.l.]: North-Holland, 1992. v. 2, p. 137–144.

GREGORIOUS, H.-R. On the concept of effective number. Theoretical Population

Biology, v. 40, n. 2, p. 269–283, 1991.

GREGORIUS, H.-R. On the concept of effective number. Theoretical Population

Biology, v. 40, p. 269–283, 1991.

HANSEN, M. M. et al. Loss of genetic variation in hatchery-reared indian major carp,

Catla catla. Journal of Fish Biology – Sup. B, v. 69, p. 229–241, 2006.

HARDY, G. H. Mendelian proportions in a mixed population. Science, v. 78, p. 49–50,

1908.

HAYKIN, S. Redes Neurais: Princıpios e Pratica. Second. Porto Alegre: Bookman,

2001.

HERRERA, F.; LOZANO, M. Two-loop real-coded genetic algorithms with adaptive

control of mutation step sizes. Applied Intelligence, v. 13, n. 3, p. 187–204, nov 2000.

HERRERA, F.; LOZANO, M.; VERDEGAY, J. L. Fuzzy connectives based crossover

operators to model genetic algorithms population diversity. Fuzzy Sets and Systems,

Elsevier, v. 92, n. 1, p. 21–30, 1997.

HINTERDING, R.; MICHALEWICZ, Z.; EIBEN, A. E. Adaptation in evolutionary

computation: a survey. In: Proceeding of the 4th IEEE Conference Evolutionary

Computation. Indianapolis, USA: IEEE Press, 1997. p. 65–69.

HO, Y. C.; CAO, X. Perturbation analysis and optimization of queueing network.

Journal of Optimization Theory and Apphcation, n. 20, p. 559–589, 1983.

JIN, Y.; BRANKE, J. Evolutionary optimization in uncertain environments: a survey.

v. 9, n. 3, p. 303–317, 2005.

185

KIEFER, J.; WOLFOWITZ, J. Stochastic estimation of the maximum of a regression

function. Ann. Math. Stat., n. 23, p. 462–466, 1952.

KIMURA, M.; CROW, J. F. The measurement of effective population numbers.

Evolution, v. 17, p. 279–288, 1963.

KOZA, J. R. Genetic Programming. [S.l.]: MIT Press, 1992.

KUSHNER, H.; CLARK, D. Stochastic Approximation for Constrained and

Unconstrained Systems. [S.l.]: Springer, 1978.

LEBERG, P. Genetic approaches for estimating the effective size of populations. Journal

of Wildlife Management, v. 69, n. 4, p. 1385–1399, 2005.

LEBERG, P. L. Efects of population bottlenecks on genetic diversity as measured by

allozyme electrophoresis. Evolution, v. 46, p. 447–494, 1992.

LEE, M.; TAKAGI, H. Dynamic control of genetic algorithms using fuzzy logic

techniques. In: FORREST, S. (Ed.). Proceedings of the Fifth International Conference

on Genetic Algorithms. [S.l.]: Morgan Kaufmann, 1993. p. 76–83.

LI, C. C. Pseudo-random mating populations. in celebration of the 80th anniversary of

the hardy-weinberg law. Genetics, v. 119, p. 731–737, 1988.

LIS, J. Parallel genetic algorithm with the dynamic control parameter. In: Proceedings

of the 1996 IEEE Conference on Evolutionary Computation. Piscataway, NY: IEEE

Press, 1996. p. 324–329.

LJUNG, L. System identification: theory for the user. Englewood Cliffs, NJ, USA:

Prentice Hall, 1987.

LOPES, S. Bio. fourth. [S.l.]: Saraiva, 1999.

MA, D. L.; TAFTI, D. K.; BRAATZ, R. D. Optimal control and simulation of

multidimensional crystallization processes. Computers and Chemical Engineering, v. 26,

p. 1103–1116, 2002.

MAGURRAN, A. E. Measuring Biological Diversity. Oxford, UK: Blackwell, 2004.

MALEY, C. Mutation rates as adaptations. Journal of Theoretical Biology, v. 186, p.

339–348, 1997. Disponıvel em: <citeseer.ist.psu.edu/maley00mutation.html>.

186

MAZA, M. D. L.; YURET, D. Dynamic hillclimbing. AI Expert, v. 9, n. 3, 1994.

MEIYI, L.; ZIXING, C.; GUOYUN, S. An adaptive genetic algorithm with diversity-

guided mutation and its global convergence property. Journal of Central South

University of Technology, Journal of Central South University of Technology, v. 11, n. 3,

p. 323–327, 2004.

MONSIEURS, P.; FLERACKERS, E. Reducing population size while maintaining

diversity. In: RYAN, C. et al. (Ed.). Genetic Programming, Proceedings of EuroGP’2003.

Essex, UK: Springer Berlin / Heidelberg, 2003. v. 2610, p. 142–152.

MORRISON, R. W. Designing Evolutionary Algorithms for Dynamic Environments.

Berlin: Springer, 2004.

MORRISON, R. W.; JONG, K. A. D. A test problem generator for non-stationary

environments. In: Proceedings of the 1999 Congress on Evolutionary Computation –

CEC’99. [S.l.: s.n.], 1999. p. 2047–2053.

ONAL, H. Preservation of species and genetic diversity. American Journal of Agricultural

Economics, Blackwell Publishers, v. 85, n. 2, p. 437–447, May 2003.

NARENDRA, K. S. Neural networks for control: theory and practice. Proceedings of the

IEEE, v. 84, n. 10, p. 1385–1406, 1996.

NARENDRA, K. S.; ANNASWAMY, A. M. Stable Adaptive Systems. [S.l.]: Dover

Publications, 2005.

NEI, M.; TAJIMA, F. Genetic drift and estimation of effective population size. Genetics,

v. 98, p. 625–640, 1981.

NGUYEN, D. H. M.; WONG, K. P. Controlling diversity of evolutionary algorithms.

In: Proceedings of the Second International Conference on Machine Learning and

Cybernetics. [S.l.: s.n.], 2003. p. 775–780.

NOMURA, T. Developments in prediction theories of the effective size of populations

under selection. Animal Science Journal, v. 76, p. 87–96, 2005.

NOMURA, T. Effective population size under random mating with a finite number of

matings. Genetics, v. 171, p. 1441–1442, 2005.

187

NUNNEY, L. The influence of mating system and overlapping generations on effective

population size. Evolution, v. 47, p. 1349–1341, 1993.

OCHOA, G.; HARVEY, I.; BUXTON, H. Optimal mutation rates and selection pressure

in genetic algorithms. In: Proceedings of the Genetic and Evolutionary Computation

Conference (GECCO’00). [S.l.: s.n.], 2000. p. 315–322.

OGATA, K. Engenharia de Controle Moderno. 3. ed. [S.l.]: Prentice-Hall, 1998.

P.-Bennett, A.; SHAPIRO, J. L.; RATTRAY, M. A statistical mechanics formulation of

the dynamics of genetic algorithms. Lecture notes in Computer Science, Springer-Verlag,

Berlin, v. 865, p. 17–27, 1994.

PIERRE, D. A. Optimization Theory with Applications. Mineola, NY: Dover, 1986.

POLLAK, E. Eigenvalue effective population numbers for populations that vary

cyclically in size. Math. Bioscience, v. 177, p. 11–24, 2002.

PUDOVKIN, A. I.; ZAYKIN, D. V.; HEDGECOCK, D. On the potential for estimating

the effective number of breeders from heterozygote-excess in progeny. Genetics, v. 144,

p. 383–387, 1996.

RADCLIFFE, N. J. Equivalence class analysis of genetic algorithms. Complex Systems,

v. 5, n. 2, p. 183–205, 1991.

RAIJMANN, L. E. L. et al. Genetic variation and outcrossing rate in relation to

population size in Gentiana pneumonanthe l. Conservation Biology, v. 8, p. 1014–1994,

1994.

RAO, C. R. Diversity and dissimilarity coefficients: A unified approach. Theoretical

Population Biology, v. 21, p. 24–43, 1982.

RECHENBERG, R. Evolutionsstrategie: Optimierung technischer Syseme nach

Prinzipien der biologischen Evolution. Stuttgart: Frommann-Holzboog, 1973.

RICHTER, J. N.; PAXTON, J. Adaptive evolutionary algorithms on unitation, Royal

Road and Longpath functions. In: Proceedings of IASTED Computational Intelligence

Conference 2005. Calgary, Alberta: [s.n.], 2005.

RIDLEY, M. Evolution. third. [S.l.]: Wiley-Blackwell, 2004.

188

ROBERTSON, A. Inbreeding in artificial selection programmes. Genetical Research,

v. 2, p. 189–194, 1961.

RUSSELL, S.; NORVIG, P. Artificial Intelligence: A Modern Approach. Second. New

Jersey: Prentice Hall, 2002.

S.-VOOSEN, D.; MUHLENBEIN, H. Strategy adaptation by competing subpopulations.

In: Parallel Problem Solving from Nature (PPSN III). Jerusalem: Springer, 1994. p.

199–208.

S.-VOOSEN, D.; MUHLENBEIN, H. Adaptation of population sizes by competing

subpopulations. In: Proceedings of the 1996 IEEE Conference on Evolutionary

Computation. Piscataway, NY: IEEE Press, 1996. p. 330–335.

SANTIAGO, E.; CABALLERO, A. Effective size of populations under selection.

Genetics, v. 139, p. 1013–1030, 1995.

SANTIAGO, E.; CABALLERO, A. Effective size and polymorphism of linked neutral

loci in populations under directional selection. Genetics, v. 149, p. 2105–2117, 1998.

SCHWARTZ, M. K.; TALLMON, D. A.; LUIKART, G. Review of DNA-based census

and effective population size estimators. Animal Conservation, v. 1, p. 293–299, 1998.

SCHWEFEL, H.-P. Evolution and Optimum Seeking. Chichester, UK: John Wiley, 1995.

SEBAG, M.; SCHOENAUER, M. Controlling crossover through inductive learning. In:

DAVIDOR, Y. (Ed.). Proceeding of the Third Conference on Parallel Problem Solving

from Nature. [S.l.]: Springer-Verlag, 1994. p. 209–218.

SHANNON, C. E. A mathematical theory of communication. The Bell System Technical

Journal, v. 27, p. 379–423, 623–656, 1948.

SHAW, P. W. et al. Factors affecting the distribution of genetic variability in the guppy,

Poecilia reticulata. Journal of Fish Biology, v. 45, n. 5, p. 875–888, 1994.

SHIMODAIRA, H. A diversity control-oriented-genetic algorithm (DCGA): performance

in function optimization. In: 2001 IEEE Congress on Evolutionary Computation. Seoul,

Korea: [s.n.], 2001. p. 44–51.

189

SIMOES, A.; COSTA, E. On biologically inspired genetic operators: transformation

in the standard genetic algorithm. In: SPECTOR, L. et al. (Ed.). 2001 Proceedings of

the Genetic and Evolutionary Computation Conference (GECCO’2001). San Francisco,

USA: Morgan Kaufmann Publishers, 2001. p. 584–591.

SIMOES, A.; COSTA, E. Parametric study to enhance the genetic algorithm’s

performance when using transformation. In: LANGDON, W. B. et al. (Ed.). Proceedings

of the Genetic and Evolutionary Computation Conference – GECCO’02. New York:

Morgan Kaufmann Publishers, 2002. p. 697. ISBN 1-55860-878-8.

SIMOES, A.; COSTA, E. Using genetic algorithms to deal with dynamic environments:

a comparative study of several approaches based on promoting diversity. In: ALII, W.

B. L. et (Ed.). Proceedings of the Genetic and Evolutionary Computation Conference

(GECCO’2002). New York, USA: Morgan Kaufmann Publishers, 2002.

SIMOES, A.; COSTA, E. An immune system-based genetic algorithm to deal with

dynamic environments: diversity and memory. In: PEARSON, D. W.; STEELE, N. C.;

ALBRECHT, R. (Ed.). Proceedings of the Sixth International Conference on Neural

Networks and Genetic Algorithms – ICANNGA’2003. Roanne, France: Springer, 2003.

p. 168–174.

SMITH, J.; FOGARTY, T. C. Recombination strategy adaptation via evolution of gene

linkage. In: Proceedings of the Third IEEE International Conference on Evolutionary

Computing. [S.l.]: IEEE Press, 1996. p. 826–831.

SMITH, J. E.; FOGARTY, T. C. Operator and parameter adaptation in genetic

algorithms. Soft Computing, v. 1, n. 2, p. 81–87, 1997.

SMITH, R. E.; GOLDBERG, D. E. Diploidy and dominance in artificial genetic search.

Complex Systems, v. 6, n. 3, p. 251–285, 1992.

SOLOW, A.; POLASKY, S.; BROADUS, J. On the measurement of biological diversity.

Journal of Environmental Economics and Management, Academic Press, v. 24, n. 1, p.

60–68, January 1993.

SPEARS, W. M. Adapting crossover in a genetic algorithm. In: MCDONNELL, J. R.;

REYNOLDS, R. G.; FOGEL, D. B. (Ed.). Proceedings of the Fourth Annual Conference

on Evolutionary Programming. Cambridge, MA: MIT Press, 1995. p. 367–384.

190

SRINIVAS, M.; PATNAIK, L. M. Adaptive probabilities of crossover and mutation in

genetic algorithms. IEEE Transactions on Systems, Man and Cybernetics, v. 24, n. 4, p.

656–667, Apr 1994.

STARK, A. E. The hardy-weinberg principle. Genetics and Molecular Biology, Scielo,

v. 28, p. 485–485, 09 2005. ISSN 1415-4757.

STARK, D. R.; SPALL, J. C. Rate of convergence in evolutionary computation. In:

2003 IEEE American Control Conference. [S.l.]: IEEE, 2003. p. 1932–1937.

THIERENS, D. Adaptive mutation rate control schemes in genetic algorithms. In:

Proceedings of the 2002 Congress on Evolutionary Computation – CEC’02. [S.l.: s.n.],

2002. v. 1, p. 980–985.

URSEM, R. K. et al. Analysis and modeling of control tasks in dynamic systems. IEEE

Transactions on Evolutionary Computation, v. 6, n. 4, p. 378–389, 2002.

VAVAK, F.; FOGARTY, T. C. A comparative study of steady state and generational

genetic algorithms for use in nonstationary environments. In: AISB Workshop on

Evolutionary Computing, Lecture Notes in Computer Science. Berlin: Springer-Verlag,

1996. v. 1143, p. 297–304.

VENCOVSKY, R.; CROSSA, J. Variance Effective Population Size under Mixed Self

and Random Mating with Applications to Genetic Conservation of Species. Crop

Science, v. 39, n. 5, p. 1282–1294, 1999.

VOSE, M. D.; LIEPINS, G. E. Punctuated equilibria in genetic search. Complex

Systems, v. 5, n. 1, p. 31–44, 1991.

WANG, H. Robust control of the output probability density functions for multivariable

stochastic systems with guaranteed stability. IEEE Transactions on Automatic Control,

v. 44, p. 2103–2107, 1999.

WANG, H. Bounded Dynamic Stochastic Systems: Modelling and Control. London:

Springer-Verlag, 2000.

WANG, H. Control for bounded pseudo armax stochastic systems via linear b-spline

approximations. In: Proceedings of the 39th IEEE Conference on Decision and Control.

Sydney, Australia: [s.n.], 2000. p. 3369–3374.

191

WANG, J. Effective size and f-statistics of subdivided populations. i. monoecious species

with partial selfing. Genetics, v. 146, p. 1453–1463, 1997.

WANG, J. Effective population size under random mating with a finite number of

matings. Philosophical Transactions of the Royal Society - B, v. 360, p. 1395–1409, 2005.

WEIKARD, H.-P.; MAARTEN, P.; JUSTUS, W. Diversity measurement combining

relative abundances and taxonomic distinctiveness of species. Diversity Distributions,

v. 12, p. 215–217, March 2006.

WEINBERG, W. Uber den nachweis der vererbung beim menschen. Jahreshefte Verein

f. vaterl. Naturk. in Wurtemberg, v. 64, p. 368–382, 1908.

WEITZMAN, M. L. On diversity. Quarterly Journal of Economics, MIT Press, v. 107,

n. 2, p. 363–405, May 1992.

WINEBERG, M.; OPPACHER, F. Distances between populations. In: The Proceedings

of the Fifth Genetic and Evolutionary Computation Conference (GECCO’2003).

Chicago, USA: Morgan Kaufmann Publishers, 2003. p. 1481–1492.

WITTENMARK, B. Adaptive dual control. In: UNBEHAUEN, H. (Ed.). Control

Systems, Robotics and Automation, Encyclopedia of Life Support Systems (EOLSS),

Developed under the auspices of the UNESCO. Oxford, UK: Eolss Publishers, 2002.

WONG, Y.-Y. et al. A novel approach in parameter adaptation and diversity

maintenance for genetic algorithms. Soft Computing, Springer-Verlag, v. 7, n. 8, p.

506–515, 2003.

WRAY, N. R.; THOMPSON, R. Predictions of rates of inbreeding in selected

populations. Genetical Research, v. 55, p. 41–54, 1990.

WRIGHT, S. Evolution in mendelian populations. Genetics, v. 16, p. 97–159, 1931.

WRIGHT, S. Size of population and breeding structure in relation to evolution. Science,

v. 87, p. 430–431, 1938.

WU, Q. H.; CAO, Y. J. Stochastic optimization of control parameters in genetic

algorithms. In: Evolutionary Computation, 1997., IEEE International Conference on.

[S.l.: s.n.], 1997. p. 77–80.

192

YANG, S. Genetic algorithms with elitism-based immigrants for changing optimization

problems. Applications of Evolutionary Computing, Lecture Notes in Computer Science,

Springer-Verlag, v. 4448, p. 627–636, 2007.

YANG, S.; TINOS, R. A hybrid immigrants scheme for genetic algorithms in dynamic

environments. International Journal of Automation and Computing, Springer, v. 4, n. 3,

p. 243–254, 2007.

YUE, H. et al. On-line web formation control using stochastic distribution methods. In:

Proc. of 2002 Control Systems. Stockholm, Sweden: [s.n.], 2002. p. 318–322.

YUE, H. et al. Real-time entropy control of stochastic systems for an improved paper

web formation. J. Measu. and Control, v. 34, p. 134–139, 2001.

193

ALGORITMO EVOLUCIONARIO´ ADAPTATIVO EM PROBLEMAS ...

Documents

Transcript of ALGORITMO EVOLUCIONARIO´ ADAPTATIVO EM PROBLEMAS ...