maio de 2015
Universidade do MinhoEscola de Engenharia
Margarida Maria Freitas de Oliveira Gomes
UM
inho
|201
5M
arga
rida
Mar
ia F
reita
s de
Oliv
eira
Gom
es
Deteção e Classificação de Regiões deInteresse em Vídeos de Endoscopia
De
teçã
o e
Cla
ssif
ica
ção
de
Re
giõ
es
de
Inte
ress
e e
m V
íde
os
de
En
do
sco
pia
maio de 2015
Universidade do MinhoEscola de Engenharia
Margarida Maria Freitas de Oliveira Gomes
Deteção e Classificação de Regiões deInteresse em Vídeos de Endoscopia
Dissertação de Mestrado Mestrado Integrado em Engenharia Biomédica Ramo Informática Médica
Trabalho efetuado sob a orientação do Professor Doutor Victor Manuel Rodrigues Alvese da Mestre Isabel Maria Cunha Laranjo
ii
DECLARAÇÃO
Nome: Margarida Maria Freitas de Oliveira Gomes
Título dissertação: Deteção e Classificação de Regiões de Interesse em Vídeos de Endoscopia
Orientador:Professor Doutor Victor Manuel Rodrigues Alves e Mestre Isabel Maria Cunha Laranjo
Ano de conclusão: 2015
Designação do Mestrado:Mestrado Integrado em Engenharia Biomédica
Ramo: Informática Médica
Escola: de Engenharia
Departamento: de Informática
DE ACORDO COM A LEGISLAÇÃO EM VIGOR, NÃO É PERMITIDA A REPRODUÇÃO DE QUALQUER PARTE
DESTA DISSERTAÇÃO
Universidade do Minho, ____/____/________
Assinatura: _____________________________________________________________________
iii
AGRADECIMENTOS
A presente dissertação representa o culminar desta tão desafiante caminhada, que foram os últimos 5 anos
e meio da minha vida. Como tal, ao terminar esta etapa, quero deixar algumas palavras de gratidão às
pessoas que a percorreram comigo.
Dirijo as minha primeiras palavras ao meu orientador, Professor Doutor Victor Alves, por todo o apoio
prestado e pela motivação dada ao longo deste projeto. Agradeço a orientação, a partilha de conhecimento
e a sua total disponibilidade.
Agradeço à Mestre Isabel Laranjo, a quem devo a escolha e o impulso para realização desta dissertação,
pela amizade que mantivemos desde os meus primeiros dias nesta Universidade.
A todas as pessoas que nos últimos dois anos apareceram na minha vida e a tornaram muito feliz, os Tipos
de Braga e as meninas do Acolhimento aos Novos Alunos de 2013.
Aos meus parceiros de curso, Hugo e Marta, agradeço os bons momentos que passamos juntos e a amizade
que partilhamos. E, em especial, à Telma, por ter sido a melhor companheira de casa e de jornada, por
tudo que me ensinou e por ser uma grande amiga. Agradeço ao Simão, parceiro de dissertação, pela
paciência, pela amizade e por toda a motivação que me deu para conseguir terminar esta etapa.
À Sofia Neto, minha confidente e amiga, agradeço os cafés de sexta à tarde e por nunca termos desistido
uma da outra. Deixo, ainda, um abraço apertado aos meus amigos de Espinho, à Sara, ao Cohen, ao Manuel,
ao Antony.
Não podia deixar de agradecer ao António por ter partilhado comigo este último ano, por ter aparecido e por
fazer parte da minha vida.
Finalmente, agradeço à minha família, principalmente, aos meus pais e à minha avó Celeste, por
acreditarem em mim, pelo apoio e incentivo constantes, por toda a paciência e pelo amor e carinho que
sempre me deram.
iv
v
RESUMO
As técnicas de Endoscopia Digestiva Alta e de Colonoscopia são fundamentais na prestação de Cuidados de
Saúde Primários, pois permitem ao profissional de saúde validar o diagnóstico e prescrever o tratamento
mais adequando. Estas técnicas geram vários tipos de resultados, dos quais se destacam os vídeos
endoscópicos, uma vez que desempenham um papel preponderante no rastreio de patologias ou de lesões
que possam estar presentes no Trato Digestivo.
As tarefas de visualização e análise dos vídeos endoscópicos, subsequentes à realização dos exames, podem
variar entre os 2 a 32 minutos para a Endoscopia Digestiva Alta e entre os 20 minutos a 1 hora para a
Colonoscopia, para cada vídeo. Tal implica uma demora significativa na interpretação dos dados, com
consequências ao nível da fadiga e de diagnósticos erróneos por parte do profissional de saúde. Para além
deste problema, identifica-se um outro, relacionado com falta qualidade da imagem captada durante os
exames. Esta pode muitas vezes encontrar-se desfocada, podendo obstar a presença de uma dada patologia
ou lesão.
É com base no panorama descrito previamente que se justifica o desenvolvimento de soluções inovadoras
que permitam colmatar os problemas acima identificados, particularmente, o processamento e a análise de
vídeos endoscópicos de longa duração e identificação de informação não relevante para o diagnóstico.
Uma das soluções engloba a eliminação de frames capturados fora do Trato Digestivo e permitiu obter
vídeos endoscópicos reduzidos e, consequentemente, uma poupança de tempo utilizado nas tarefas de
visualização e análise dos mesmos, na ordem dos 45,6 %, para o caso das Endoscopias Digestivas Altas e
de 56 %, para as Colonoscopias. A solução referente à eliminação de frames desfocados permitiu não só ter
ganhos de tempo, 4,6 %, para Endoscopias Digestivas Altas, e 4,8 %, para Colonoscopias, como de tamanho
de armazenamento dos vídeos endoscópicos reduzidos, de 4,1 %, para Endoscopias Digestivas Altas, e de
4 %, para Colonoscopias. Em ambas as soluções foi identificado um fator limitativo, o aumento do bit rate,
no entanto os valores obtidos não vão influenciar o diagnóstico por parte do profissional de saúde.
vi
vii
ABSTRACT
Both techniques of Upper Gastrointestinal Endoscopy and Colonoscopy are key providers of primary health
care, they allow health professionals to validate the diagnosis and prescribe the appropriate treatment. These
techniques generate various types of results, among which are the endoscopic videos, as they play an
important role in tracking diseases or injuries that may be present in the Digestive Tract.
The visualization and analysis tasks of endoscopic videos, following the exams, can vary between 2 to 32
minutes to Upper Gastrointestinal Endoscopy and between 20 minutes to 1 hour for the Colonoscopy, for
each video. This implies a significant delay in data interpretation, with consequences in terms of fatigue and
misdiagnosis by the health care professional. In addition to this problem, is identified another one related to
image quality lack captured during the exams. The image is often blurred, and may hide the presence of a
given disease or injury.
It is based on the scenario described previously that justifies the development of innovative solutions to
address the problems identified above, particularly, processing and analysis of endoscopic videos with long
duration and the identification of non-relevant information for diagnosis.
One solution involves the removal of captured frames outside the digestive tract and allowed to obtain
reduced endoscopic videos and, therefore, time savings in visualization and analysis tasks in the order of
45.6 % for the Upper Gastrointestinal Endoscopy cases and 56 %, for Colonoscopies. The solution regarding
the removal of unfocused frames allowed not only have time savings, 4.6 %, for Upper Gastrointestinal
Endoscopy, and 4.8 %, for Colonoscopies, as storage size of the reduced endoscopic videos, 4.1 %, for
Upper Gastrointestinal Endoscopies, and 4 %, for Colonoscopies. In both solutions was identified as a limiting
factor, the higher the bit rate, however the values obtained will not influence the diagnosis from the health
care professional.
viii
ix
ÍNDICE
AGRADECIMENTOS ............................................................................................................................... III
RESUMO ............................................................................................................................................. V
ABSTRACT ......................................................................................................................................... VII
LISTA DE FIGURAS .............................................................................................................................. XIII
LISTA DE TABELAS .............................................................................................................................. XV
LISTA DE TABELAS EM APÊNDICE ........................................................................................................... XV
LISTA DE GRÁFICOS ............................................................................................................................ XVII
LISTA DE EQUAÇÕES ........................................................................................................................... XVII
LISTA DE EQUAÇÕES EM APÊNDICE ....................................................................................................... XVII
NOTAÇÃO E ACRÓNIMOS ...................................................................................................................... XIX
CAPÍTULO 1 INTRODUÇÃO ...................................................................................................................... 1
1.1 Enquadramento ........................................................................................................................................................... 2
1.2 Problema..................................................................................................................................................................... 6
1.3 Objetivos ..................................................................................................................................................................... 7
1.4 Metodologia de Investigação ........................................................................................................................................ 7
1.5 Organização do Documento ......................................................................................................................................... 8
CAPÍTULO 2 BASE TECNOLÓGICA .......................................................................................................... 11
2.1 Introdução ................................................................................................................................................................. 12
2.2 Vídeo ......................................................................................................................................................................... 12
2.2.1 Resolução ......................................................................................................................................................... 13
2.2.2 Sistema de Varrimento ...................................................................................................................................... 13
2.2.3 Bit Rate e Largura de Banda.............................................................................................................................. 13
2.2.4 Frame Rate ....................................................................................................................................................... 14
2.2.5 Codificação e Descodificação ............................................................................................................................ 14
2.2.6 Containers ........................................................................................................................................................ 16
2.2.7 Modos de Transmissão ..................................................................................................................................... 18
2.3 Linguagem C++ ......................................................................................................................................................... 18
2.4 OpenCV ..................................................................................................................................................................... 18
2.5 Imagem Digital e Espaço de Cor RGB......................................................................................................................... 19
x
CAPÍTULO 3 ENDOSCOPIA DIGESTIVA ..................................................................................................... 21
3.1 Introdução ..................................................................................................................................................................22
3.2 Endoscopia Digestiva Alta ...........................................................................................................................................25
3.3 Anatomia do Trato Digestivo Alto .................................................................................................................................27
3.3.1 Esófago .............................................................................................................................................................28
3.3.2 Estômago ..........................................................................................................................................................31
3.3.3 Duodeno ............................................................................................................................................................33
3.4 Endoscopia Digestiva Baixa .........................................................................................................................................35
3.5 Anatomia do Trato Digestivo Baixo ..............................................................................................................................37
3.5.1 Cego ..................................................................................................................................................................38
3.5.2 Cólon .................................................................................................................................................................39
3.5.3 Reto ...................................................................................................................................................................40
CAPÍTULO 4 MYENDOSCOPY ................................................................................................................ 43
4.1 Introdução ..................................................................................................................................................................44
4.2 Trabalho Relacionado (Contextualização).....................................................................................................................45
4.3 Soluções Comerciais ..................................................................................................................................................49
4.3.1 DiVAS HD ..........................................................................................................................................................50
4.3.2 VictOR HD..........................................................................................................................................................51
4.3.3 endoPRO IQ .......................................................................................................................................................52
4.3.4 DOCbase Gastrenterologia..................................................................................................................................52
4.3.5 SiiMA Gastro ......................................................................................................................................................53
4.4 Arquitetura do Sistema ...............................................................................................................................................54
4.5 MIVprocessing ............................................................................................................................................................56
CAPÍTULO 5 REDUÇÃO DO VÍDEO ENDOSCÓPICO ....................................................................................... 59
5.1 Introdução ..................................................................................................................................................................60
5.2 Estado da Arte ............................................................................................................................................................61
5.3 Conjunto de Dados .....................................................................................................................................................63
5.4 Remoção de Frames Iniciais, Finais e Pretos ...............................................................................................................67
5.4.1 Enquadramento .................................................................................................................................................67
5.4.2 Estado da Arte ...................................................................................................................................................67
5.4.3 Solução Desenvolvida .........................................................................................................................................68
5.4.4 Resultados da Solução .......................................................................................................................................70
5.5 Remoção de Frames Desfocados ................................................................................................................................74
5.5.1 Enquadramento .................................................................................................................................................74
5.5.2 Estado da Arte ...................................................................................................................................................74
5.5.3 Solução Desenvolvida .........................................................................................................................................75
xi
5.5.4 Resultados da Solução ...................................................................................................................................... 77
CAPÍTULO 6 EXTRAÇÃO E CLASSIFICAÇÃO DE ACHADOS ENDOSCÓPICOS ...................................................... 81
6.1 Introdução ................................................................................................................................................................. 82
6.2 Achados Endoscópicos .............................................................................................................................................. 82
6.3 Pólipos ...................................................................................................................................................................... 83
6.3.1 Enquadramento ................................................................................................................................................ 83
6.3.2 Estado da Arte .................................................................................................................................................. 84
6.4 Sangramento ............................................................................................................................................................. 86
6.4.1 Enquadramento ................................................................................................................................................ 86
6.4.2 Estado da Arte .................................................................................................................................................. 86
CAPÍTULO 7 CONCLUSÕES ................................................................................................................... 89
7.1 Sinopse ..................................................................................................................................................................... 90
7.2 Contribuições ............................................................................................................................................................ 91
7.3 Conclusões e Trabalho Futuro .................................................................................................................................... 92
REFERÊNCIAS ................................................................................................................................... 95
APÊNDICES .................................................................................................................................... 109
xii
xiii
LISTA DE FIGURAS
Figura 2.1 - Representação do espaço de cor RGB (retirado de [56]). ..................................................................................... 20
Figura 3.1 – Exemplos de lesões detetadas por: (A) Endoscopia Virtual do TGI alto – lesão encontrada no Corpo do estômago –
(retirado de [64]) e (B) Colonoscopia Virtual – encontrado um pólipo no cólon transverso – (retirado de [65]). ........................ 23
Figura 3.2 – (A) Esquema de uma WCE intestinal: 1 – Extremidade ótica, 2 – Suporte da lente ótica, 3 – Lente ótica; 4 – LEDs
(do inglês, Light Emitting Diode), 5 – CMOS (do inglês, Complementary Metal Oxide Semiconductor), 6 –Bateria, 7 – Transmissor
ASIC (do inglês, Application-Specific Integrated Circuit), 8 – Antena e (B) Exemplo de uma imagem endoscópica obtida por WCE:
deteção de múltiplos pólipos (retirado de [67]). ...................................................................................................................... 24
Figura 3.3 – Representação de uma EDA e das regiões em que esta se focaliza (adaptado de [76] e de [77]). ........................ 26
Figura 3.4 – Exemplos de diagnósticos do esófago, estômago e duodeno obtidos por EDA (adaptado de [78]). ....................... 26
Figura 3.5 – Anatomia do Trato Digestivo Alto (adaptado de [79]). .......................................................................................... 27
Figura 3.6 – Imagens de Referência, (A) Esófago, (B) Estômago, (C) Duodeno (retirado de [81]). ............................................ 27
Figura 3.7 – Localização e comprimento total do esófago e estruturas envolventes (retirado de [85]). ..................................... 28
Figura 3.8 – Transição do esófago para o estômago, observando-se a junção esofagogástrica (adaptado de [83]). .................. 29
Figura 3.9 – Mucosa do esófago nos segmentos: (A) esófago torácico superior e (B) esófago abdominal, destacando a junção
esofagogástrica (retirado de [80]). .......................................................................................................................................... 30
Figura 3.10 – Orientação do esófago (retirado de [70]). ......................................................................................................... 31
Figura 3.11 – Anatomia interna do estômago e as suas regiões (retirado de [86]). ................................................................. 32
Figura 3.12 – Visualização da mucosa do estômago nas partes: (A) corpo do estômago e (B) antro pilórico (retirado de [80] e de
[81]). ..................................................................................................................................................................................... 33
Figura 3.13 – Orientação do estômago (retirado de [70]). ...................................................................................................... 33
Figura 3.14 – Anatomia do duodeno (retirado de [90]). .......................................................................................................... 34
Figura 3.15 – Mucosa do duodeno em: (A) DI e (B) DII (retirado de [80]). .............................................................................. 35
Figura 3.16 – Representação de uma Colonoscopia (retirado de [94]). ................................................................................... 36
Figura 3.17 – Exemplos de diagnósticos obtidos através de Colonoscopia (retirado de [95]). .................................................. 37
Figura 3.18 – Anatomia geral do intestino grosso e os três segmentos: cego (verde alface), cólon (verde água) e reto (lilás) (retirado
de [96]). ................................................................................................................................................................................ 37
Figura 3.19 – Visão anatómica e do íleo (retirado de [90]). ..................................................................................................... 38
Figura 3.20 – Visualização do cego em diferentes locais: (A) cego, com a visualização de uma pequena fenda, onde se encontra
o apêndice vermicular; (B) lúmen do apêndice vermicular; (C) cego e visualização válvula ileocecal (retirado de [91]). ............ 39
Figura 3.21 – Projeção do intestino grosso no esqueleto e as suas principais divisões anatómicas (retirado de [90]). .............. 40
Figura 3.22 – Visualização de três dos quatro segmentos do cólon: (A) ascendente; (B) transverso; (C) sigmoide (retirado de [91]).
............................................................................................................................................................................................. 40
Figura 3.23 – Anatomia do reto e ânus (retirado de [93]). ...................................................................................................... 41
Figura 3.24 – (A) Visualização da mucosa do reto e (B) do padrão vascular proeminente no mesmo (retirado de [91]). ........... 41
xiv
Figura 4.1 - Fluxo de um sistema de aquisição, pré-processamento, arquivo, processamento e difusão de dados (retirado de [106]).
..............................................................................................................................................................................................46
Figura 4.2 – Visão geral do sistema (retirado de [107]). ..........................................................................................................47
Figura 4.3 – Ilustração do sistema de apoio à decisão e das etapas comuns que podem ser envolvidas, a laranja estão as etapas
opcionais deste sistema (retirado de [100]). ............................................................................................................................48
Figura 4.4 – Fluxo de um sistema tradicional de reconhecimento de padrões (retirado de [109]). ............................................48
Figura 4.5 – Passos fundamentais num módulo de processamento (retirado de [110]). ...........................................................49
Figura 4.6 – Diagrama de blocos de um sistema que trabalha com vídeos e imagens, com exemplos das funções de cada bloco
(retirado de [111]). .................................................................................................................................................................49
Figura 4.7 - Interface da aplicação DiVAS HD (retirado de [112]). ............................................................................................51
Figura 4.8 – Interface da aplicação VictOR HD (retirado de [113]). ..........................................................................................51
Figura 4.9 – Interface da solução endoPRO IQ (retirado de [114]). ..........................................................................................52
Figura 4.10 – Interface principal da aplicação DOCbase Gastrenterologia (retirado de [117]). ..................................................53
Figura 4.11 – Interface principal do SiiMA Gastro (retirado de [118]). ......................................................................................54
Figura 4.12 – Arquitetura geral do sistema MyEndoscopy (adaptado de [15]). .........................................................................55
Figura 4.13 – Fluxo de trabalho de uma consulta de gastrenterologia (retirado de [101]). ........................................................57
Figura 4.14 – Arquitetura do módulo MIVprocessing, integrado na MIVbox (retirado de [101]). ................................................58
Figura 5.1 - Arquitetura do módulo MIVprocessing, integrado na MIVbox, destacando-se os módulos de Redução de Vídeo
abordados nesta dissertação (adaptado de [101]). ..................................................................................................................61
Figura 5.2 – Exemplos de frames captados: (A) fora do TGI, neste caso observa-se a sala de intervenção; e (B) depois de finalizar
o exame com a câmara desligada. ..........................................................................................................................................67
Figura 5.3 – Exemplos de frames captados (A) fora do TGI, ou seja, não relevante, e (B) durante uma EDA, ou seja, relevante.
..............................................................................................................................................................................................69
Figura 5.4 – Esquema da solução de remoção de frames iniciais, finais e pretos. ....................................................................70
Figura 5.5 - Exemplos de frames desfocados (A) devido à aquisição ter sido efetuada demasiado perto e (B) devido à presença de
sucos gastroinstestinais. .........................................................................................................................................................74
Figura 5.6 – Esquema da solução de remoção de frames desfocados. ....................................................................................76
Figura 6.1 – Exemplos de pólipos (A) não-neoplásico e (B) neoplásico. ....................................................................................84
Figura 6.2 – Exemplo de sangramento. ...................................................................................................................................86
xv
LISTA DE TABELAS
Tabela 5.1 – Informação relativa aos vídeos endoscópicos disponibilizados. As células a cor-de-laranja são referentes aos 4 exames
de EDB, as restantes 27 correspondem a EDA. ...................................................................................................................... 64
Tabela 5.2 – Valores totais iniciais relativos ao tamanho de armazenamento, à duração e ao número de frames, dos 23 exames
de EDA e dos 4 exames de EDB e ao seu somatório. ............................................................................................................. 65
Tabela 5.3 - Informação relativa aos vídeos endoscópicos utilizados. As células a cor-de-laranja são referentes aos 4 exames de
EDB, as restantes 27 correspondem a EDA. ........................................................................................................................... 66
Tabela 5.4 – Valores totais de tamanho de armazenamento, duração e número de frames, relativos aos dados convertidos dos
23 exames de EDA e dos 4 exames de EDB e ao seu somatório. ............................................................................................ 67
Tabela 5.5 – Ganhos ou perdas obtidos após aplicação da solução para remoção de frames iniciais, finais e pretos, sendo que
as células a azul são referentes aos valores que sofreram um aumento relativamente aos valores para os vídeos endoscópicos
originais. ............................................................................................................................................................................... 71
Tabela 5.6 – Valores totais de tamanho de armazenamento, duração e frames totais; valores médios de duração relativos aos
ganhos obtidos após aplicação da solução para remoção de frames iniciais, finais e pretos; Variações de tamanho de
armazenamento e de duração................................................................................................................................................ 72
Tabela 5.7 – Ganhos ou perdas obtidos após aplicação da solução para remoção de frames desfocados, sendo que as células a
azul são referentes aos valores que sofreram um aumento relativamente aos valores para os vídeos originais......................... 78
Tabela 5.8 – Valores totais de tamanho de armazenamento, duração e frames totais; valores médios de duração calculados
através dos dados relativos aos ganhos obtidos após aplicação da solução para remoção de frames desfocados; variações de
tamanho de armazenamento e de duração. ........................................................................................................................... 79
LISTA DE TABELAS EM APÊNDICE
Tab. A.1 – Resultados obtidos após aplicação da solução para remoção de frames iniciais, finais e pretos. As células a cor-de-
laranja são referentes aos 4 exames de EDB, as restantes 27 correspondem a EDA. ............................................................ 110
Tab. A.2 – Valores totais de tamanho de armazenamento, duração e número de frames, relativos aos dados resultantes da
aplicação da solução para remoção de frames iniciais, finais e pretos. ................................................................................. 111
Tab. A.3 – Valores iniciais e finais de tamanho de armazenamento e de duração e os seus respetivos valores de variação. ... 111
Tab. B.1 – Resultados obtidos após aplicação da solução para remoção de frames desfocados. As células a cor-de-laranja são
referentes aos 4 exames de EDB, as restantes 27 correspondem a EDA............................................................................... 112
Tab. B.2 – Valores totais de tamanho de armazenamento, duração e número de frames, relativos aos dados resultantes da
aplicação da solução para remoção de frames desfocados. .................................................................................................. 113
Tab. B.3 – Valores iniciais e finais de tamanho de armazenamento e de duração e os seus respetivos valores de variação.... 113
xvi
xvii
LISTA DE GRÁFICOS
Gráfico 1.1 - Frequência relativa (%) por categoria de MCDT efetuados e requisitados na área dos cuidados de saúde primários
em Portugal Continental, no ano de 2010 (fonte de dados [10]). .............................................................................................. 3
Gráfico 1.2 - Endoscopias efetuadas e requisitadas na área dos cuidados de saúde primários em Portugal Continental entre 2000
e 2010 (fonte de dados [10]). .................................................................................................................................................. 4
LISTA DE EQUAÇÕES
Equação 5.1 – Cálculo da diferença entre os valores iniciais e os valores obtidos pela implementação da solução de remoção de
frames iniciais, finais e pretos. ............................................................................................................................................... 70
Equação 5.2 – Cálculo da diferença entre os valores obtidos através da solução de remoção de frames iniciais, finais e pretos e
os obtidos pela solução para remoção de frames desfocados. ................................................................................................ 77
LISTA DE EQUAÇÕES EM APÊNDICE
Eq. A.1 – Variação de tamanho de armazenamento em percentagem................................................................................... 111
Eq. A.2 – Variação da duração em percentagem. ................................................................................................................. 111
xviii
xix
NOTAÇÃO E ACRÓNIMOS
NOTAÇÃO GERAL
A notação ao longo do documento segue a seguinte convenção:
Texto em itálico – utilizado para referir palavras de língua estrangeira (e.g., Inglês, Latim, Grego),
documentação, bem como para destacar um determinado termo, expressão, nomes próprios,
produtos, marcas e entidades.
Texto em negrito – utilizado para realçar um conceito ou palavras.
Texto com o tipo de letra Courier New – utilizado em enxertos e exemplos de código.
A presente dissertação foi elaborada ao abrigo do novo acordo ortográfico.
ACRÓNIMOS
A
ASIC Application-Specific Integrated Circuit
ASP Advanced Simple Profile
AVC Advanced Video Coding
AVI Audio Video Interleave
C
C6 Sexta Vértebra Cervical
CAD Computer-Aided Diagnosis
CADSS Computer-Aided Decision Support Systems
CDD Charged-Coupled Device
CMOS Complementary Metal Oxide Semiconductor
CPRE ColangioPancreatografia Retrógrada Endoscópica
CTC Colonoscopia Virtual
xx
CWC Color Wavelet Covariance
D
DI Parte Superior do Duodeno
DICOM Digital Imaging and Communications in Medicine
DII Segunda Porção ou Parte Descendente do Duodeno
DIII Parte Inferior do Duodeno
DIV Parte Ascendente do Duodeno
DRGE Doença de Refluxo GastroEsofágico
E
EDA Endoscopia Digestiva Alta
EDB Endoscopia Digestiva Baixa
EGD EsofagoGastroDuodenoscopia (do inglês, EsophagoGastroDuodenoscopy)
F
FP Falsos Positivos
fps Frames Per Second
FTP File Transfer Protocol
H
HD High Definition
HSI Hue, Saturation, Intensity
HTTP Hypertext Transfer Protocol
I
i Interlaced
IM Informática Médica
K
kbps KiloBits Per Second
L
L1 Primeira Vértebra Lombar
LED Light Emitting Diode
LBP Local Binary Pattern
M
MB MegaByte
mbps MegaBits Per Second
MCDT Meios Complementares de Diagnóstico e Terapêutica
MKV Matroska
xxi
MP4 MPEG-4 Part 14
MST Minimal Standard Terminology
O
OCDE Organização para a Cooperação e Desenvolvimento Económico
OpenCV Open Source Computer Vision Library
P
p Progressive
PACS Picture Archiving and Communication System
R
RGB Red, Green, Blue
RM Ressonância Magnética
ROC Receiver Operating Characteristics
S
s Segundos
SD Standard Definition
SP Simple Profile
SPED Sociedade Portuguesa de Endoscopia Digestiva
SVM Support Vector Machines
T
T1 Primeira Vértebra Torácica
T10 Décima Vértebra Torácica
T11 Décima Primeira Vértebra Torácica
T12 Décima Segunda Vértebra Torácica
TC Tomografia Computadorizada
TGI Trato GastroIntestinal
TI Tecnologias de Informação
V
VE Virtual Endoscopy
VictOR Video Image Capture Technology in your Operation Room
W
WCE Wireless Capsule Endoscopy
xxii
Capítulo 1
INTRODUÇÃO
CAPÍTULO 1. Introdução
2
1.1 ENQUADRAMENTO
Os anos 40 do século passado marcam o aparecimento dos primeiros computadores digitais. Estes
permitiam executar tarefas de cálculo, tratamento e armazenamento de informação. Nos anos que se
seguiram, tanto médicos como outros profissionais de saúde começaram a perceber que o avanço das
tecnologias iria mudar os cuidados de saúde prestados aos pacientes [1].
Consequentemente, surgiu o conceito de Informática Médica (IM), há cerca de 50 anos, devido à
necessidade de associar as Tecnologias de Informação (TI) com os múltiplos desafios enfrentados pela
prática da Medicina [2]. A IM trata-se de uma disciplina científica de domínio abrangente e multidisciplinar,
pois estuda, desenvolve e otimiza metodologias e sistemas de cooperação global, para adquirir, processar,
analisar e partilhar informação clínica (e.g. diagnósticos computadorizados, sistemas de apoio à decisão
médica, processo clínico eletrónico, sistemas de comunicação e arquivo de imagem (do inglês, Picture
Archiving and Communication System (PACS)), entre outros) [3][4]. O recurso à IM tem como objetivo criar
um maior envolvimento dos pacientes com os cuidados de saúde e melhorar o seu acesso, aumentar a
eficácia dos serviços prestados e tornar os sistemas nacionais de saúde mais eficientes [5].
Contudo, a sinergia das TI e da Medicina tem sido lentamente implementada nos Sistemas de Saúde, devido
à dificuldade de ser incorporada de forma eficaz, de se perceber a sua importância estratégica e as suas
funcionalidades práticas, bem como à sua necessidade de investimento e compromisso [1].
Atualmente, a incorporação da IM nas Unidades de Saúde, em Portugal, já não se encontra num estado
primário de desenvolvimento, mas num estado avançado. Apesar deste progresso, ainda existem muitos
pontos fracos a combater, como a falta de conhecimento dos profissionais de saúde no domínio da IM, o
deficiente sistema de segurança e de proteção de informação, entre outros [6][7]. Existem ainda dados,
relativos aos anos de 1984 a 2006, que permitem concluir que em Portugal registaram-se melhorias
significativas de eficiência, acessibilidade e qualidade no que toca à prestação de cuidados de saúde, ficando
em terceiro lugar entre os países da Organização para a Cooperação e Desenvolvimento Económico (OCDE)
[8].
Os Meios Complementares de Diagnóstico e Terapêutica (MCDT) assumem um papel preponderante no que
toca à prestação de cuidados de saúde, uma vez que são uma ferramenta fundamental para o profissional
de saúde validar sintomas, a existência de patologias ou lesões, realizar intervenções terapêuticas e
prescrever o tratamento mais adequado, dependendo do diagnóstico obtido [9]. Baseado no documento
CAPÍTULO 1. Introdução
3
“Elementos Estatísticos: Informação Geral: Saúde 2009-2010” [10], emitido pela Direção-Geral da Saúde,
as análises clínicas representam cerca de 83,9% do total de MCDT executados em Portugal Continental, em
2010. Os restantes 16,1% são distribuídos pelos restantes MCDT, como é possível observar no Gráfico 1.1.
Para além dos MCDT não especificados, que ocupam 33%, seguem-se as Ecografias com 26,5%, as
Radiografias com 24,8%, o Eletrocardiograma com 8,2%, a Tomografia Computorizada (TC) com 4,2%, as
Endoscopias com 3,1% e, por fim, o Eletroencefalograma com 0,2%.
Gráfico 1.1 - Frequência relativa (%) por categoria de MCDT efetuados e requisitados na área dos cuidados de saúde primários em Portugal Continental, no ano de 2010 (fonte de dados [10]).
No domínio da investigação da IM inclui-se a Imagem Médica, ou Imagiologia, que é seguramente uma das
áreas mais importantes e, por sua vez, um dos ramo dos MCDT.
O aparecimento da Imagem Médica remonta ao ano 1896 e deve-se ao desenvolvimento da Radiologia,
como técnica de obtenção de imagem de raio X - descoberto pelo professor alemão Röentgen, em 1895 -,
que permitiu a evolução de outras técnicas de imagem a funcionar acopladas a diversos equipamentos [11].
Associadas à Imagem Médica estão várias técnicas ou modalidades cujos objetivos envolvem a
representação de partes do corpo humano (e.g. órgãos, tecidos, estruturas, entre outros), possibilitando
quer o diagnóstico de patologias e o seu tratamento, quer a formação e a evolução da investigação científica.
Devido ao exponencial avanço das tecnologias, nomeadamente, nas diferentes técnicas de Imagem Médica
(e.g. TC, Ressonância Magnética (RM)) tem sido possível adquirir conhecimento relevante e relativo a uma
vasta gama de condições médicas, através das quais são explicitadas tanto a funcionalidade como
morfologia e estrutura que advém dessas mesmas condições [11][12][13]. Deve-se ainda referir que, no
domínio da Imagem Médica, os resultados obtidos através das diversas modalidades ou técnicas podem
CAPÍTULO 1. Introdução
4
surgir sob a forma de: um conjunto de imagens (e.g. TC, RM), vídeo e registo pelo profissional de saúde de
observações relevantes (e.g. Ecografia, Endoscopia) [13].
De todas as técnicas já referidas de Imagem Médica é de salientar a Endoscopia, por força da especificidade
dos resultados que se podem obter. Esta técnica enquadra-se nos MCDT usados na prestação de cuidados
de saúde, pois tem como finalidade a obtenção de um diagnóstico e, em simultâneo ou em separado, a
realização de intervenções terapêuticas. E, é utilizada nas mais diversas especialidades da Medicina, como
otorrinolaringologia, pneumologia, urologia, ginecologia, obstetrícia, cirurgia, gastrenterologia, entre outras,
por ter um custo relativamente acessível e pelos resultados obtidos [14][15]. No Gráfico 1.2 pode-se
observar o número de endoscopias efetuadas e requisitadas de 2000 a 2010 [10].
Gráfico 1.2 - Endoscopias efetuadas e requisitadas na área dos cuidados de saúde primários em Portugal Continental entre 2000 e 2010 (fonte de dados [10]).
A Endoscopia Digestiva é utilizada em gastrenterologia, com o intuito de observar o Trato GastroIntestinal
(TGI). Esta técnica evoluiu muito ao longo do tempo e, atualmente, é usada com o objetivo de diagnosticar
e detetar vários tipos de patologias no esófago, estômago e intestinos, e realizar intervenções terapêuticas,
através de tubos flexíveis introduzidos pela cavidade oral ou anal [16][17]. Esta pode surgir com várias
designações, as quais estão relacionadas com a porção do sistema digestivo a ser examinado pelo
profissional de saúde, sendo que as mais comuns são a Endoscopia Digestiva Alta (EDA) e a Endoscopia
Digestiva Baixa (EDB) ou Colonoscopia, possibilitando uma avaliação detalhada e um diagnóstico com maior
grau de confiança [18].
Após a realização de um exame de EDA ou de EDB, os resultados obtidos através dos mesmos encontram-
se sob a forma de anotações médicas, imagens e vídeo, como referido anteriormente. Posteriormente à
realização de qualquer um destes MCDT, prossegue-se com a observação dos dados endoscópicos
resultantes e à sua respetiva interpretação. Estas tarefas devem ser executadas por um profissional de
saúde da especialidade que, posteriormente, emite o diagnóstico [12].
CAPÍTULO 1. Introdução
5
Uma forma de contornar a barreira do tempo de visualização e análise dos resultados é através da utilização
de novos e melhorados sistemas de apoio à decisão (do inglês, Computer-Aided Decision Support Systems
(CADSS)), sistemas de apoio ao diagnóstico (do inglês, Computer-Aided Diagnosis (CAD)) – ambos permitem
a aquisição do vídeo endoscópico, bem como o seu processamento, extração de características
paramétricas e classificação das mesmas –, ou apenas sistemas de suporte – visam melhorar a qualidade
de imagem e detetar informação deteriorada e não relevante. Como tal, pretende-se a deteção de regiões
relevantes, que possam ter passado despercebidas durante o exame (e.g. adenomas, úlceras, sangramento,
bolhas, e outras estruturas relevantes). Desta forma, é possível reduzir o tempo de visualização e
interpretação dos exames endoscópicos, permitindo que o profissional de saúde localize as diferentes
estruturas com maior precisão, reduzindo a subjetividade do diagnóstico. Para além destas vantagens
existem outras como a redução dos custos associados a este tipo de exame, tendo ainda em vista a continua
melhoria dos indicadores de qualidade após a realização dos exames [12][19][20][21].
Para que estes sistemas sejam implementados é necessário conhecer-se duas tecnologias, o
Processamento de Imagem e de Vídeo e a Visão Computacional. O Processamento de Imagem e de Vídeo
é uma área de investigação bastante ampla, engloba técnicas de compressão, filtragem, análise e
melhoramento de conteúdo de informações visuais [22]. A Visão Computacional é ciência que através da
programação de um computador permite simular a visão humana, incluindo aprender e ser capaz de fazer
inferências e tomar decisões baseadas em informações visuais, de imagens e vídeo. As áreas de aplicação
para a tecnologia de Visão Computacional incluem a vídeo vigilância, a biometria, a fotografia, a produção
de filmes, a Medicina, os jogos de realidade aumentada, entre muitas outras [23].
No sentido de aplicar o conhecimento envolvido na área de Visão Computacional foi criada, em 1998 e
lançada em 2000, uma biblioteca com código otimizado e portátil e que pode ser obtida gratuitamente, a
biblioteca OpenCV (do inglês, Open Source Computer Vision Library). A biblioteca OpenCV tem como objetivo
fornecer as ferramentas necessárias para resolver problemas de Visão Computacional, através da
implementação de operações de infraestrutura, de funções de baixo-nível de Processamento de Imagem e
algoritmos de alto-nível, tais como deteção da face e deteção de objetos.
É neste contexto de evolução tecnológica e de melhoria constante da prestação dos cuidados de saúde, que
surge a presente dissertação. Pretende-se apresentar um protótipo orientado para o processamento de
exames de Endoscopia Digestiva.
CAPÍTULO 1. Introdução
6
1.2 PROBLEMA
Nos dias de hoje, os MCDT são fundamentais para os Cuidados de Saúde Primários, pois permitem ao
profissional de saúde validar o diagnóstico e prescrever o tratamento mais adequado, se for caso disso.
A EDA e a EDB são exemplos de MCDT que permitem que inúmeras patologias ou lesões do sistema
digestivo sejam diagnosticadas. As patologias do TGI, por vezes, são incapacitantes e prolongadas, já as
mais graves são assintomáticas. Nos Estados Unidos, aproximadamente 40 milhões de pessoas sofrem de
problemas digestivos, que lhes causam várias limitações como incapacidade de exercer atividades comuns,
como escola ou trabalho. No entanto, algumas patologias são fatais, compreendendo cerca de 9% de todas
as mortes. Já em Portugal, cerca de 35% da população acima dos 18 anos sofre de refluxo gastroesofágico.
A prevalência das doenças inflamatórias do intestino grosso têm vindo a aumentar progressivamente
afetando 56 a cada 100000 habitantes. O cancro digestivo tem uma elevada incidência, sendo o cancro do
cólon e reto a primeira causa de morte por cancro (14,8% das mortes por cancro). A existência de pólipos
funciona como um alerta, pois são precursores de aproximadamente de 90% dos casos de cancro do cólon
[18][24][25].
Mediante este cenário global, em gastrenterologia, os dados resultantes dos exames de EDA e EDB, vídeos
e imagens, assumem um papel muito importante para um diagnóstico correto. Todavia, as tarefas de
visualização e análise, subsequentes à realização dos exames, podem-se tornar morosas para o profissional
de saúde, devido ao elevado número de vídeos que este tem que analisar - cujo tempo de duração varia
entre: os 2 a 32 minutos para a EDA e os 20 minutos e 1 hora para a EDB em cada vídeo - ou de imagens
que o profissional de saúde tem que interpretar [26][27].
Existem muitas condicionantes que podem limitar a interpretação dos dados resultantes dos exames
endoscópicos, entre as quais se pode destacar a falta qualidade da imagem, pois esta pode muitas vezes
encontrar-se desfocada, podendo ser impeditivos de observar a presença de uma dada patologia ou lesão.
Para além da anterior, pode-se ainda mencionar o tempo despendido para visualização e análise de vídeos
e imagens endoscópicos. A fadiga e o cansaço podem estar associados à realização de diagnósticos pouco
precisos, subjetivos ou até mesmo erróneos [28], podendo alguns achados endoscópicos passar
despercebidos (e.g. pólipos, úlceras, sangramento, e outras estruturas relevantes).
É com base no panorama descrito previamente que se justifica o desenvolvimento de uma solução inovadora
que permita colmatar estes problemas, particularmente, o processamento e a análise de vídeos
CAPÍTULO 1. Introdução
7
endoscópicos de longa duração e identificação de informação não relevante para o diagnóstico. Quer-se,
assim, proporcionar uma melhoria na elaboração de um diagnóstico correto.
1.3 OBJETIVOS
Neste contexto propõem-se como objetivos principais do presente trabalho a conceção e desenvolvimento
de soluções computacionais que, quando aplicadas a vídeos de exames de EDA e EDB, resolvam problemas
que lhes estão associados e promovam uma melhoria da qualidade dos mesmos. Como tal, pretende-se a
inclusão de funcionalidades de processamento de vídeo endoscópico, que permitam a redução dos mesmos,
através da deteção e classificação de informação não relevante e desfavorável para o diagnóstico e ao
mesmo tempo a sua eliminação.
Especificamente podem ser considerados os seguintes objetivos:
Analisar o estado da arte referente ao processamento de vídeo endoscópico de modo a obter
informação relevante para o desenvolvimento de metodologias computacionais, que vão constituir
as novas funcionalidades;
Desenvolver funcionalidades que permitam a omissão de informação não relevante e prejudicial ao
diagnóstico, presentes no vídeo endoscópico que, quando aplicadas, dão origem a uma versão
reduzida do mesmo;
Analisar o estado da arte referente ao conjunto de métodos automáticos e robustos orientados à
extração e posterior classificação das regiões de interesse contidas no vídeo endoscópico;
Garantir que as soluções desenvolvidas sejam implementadas numa arquitetura orientada para a
aquisição, arquivo, processamento e difusão de exames de Endoscopia.
1.4 METODOLOGIA DE INVESTIGAÇÃO
O trabalho da presente dissertação foi realizado aquando do quinto ano do Mestrado Integrado em
Engenharia Biomédica do ramo de Informática Médica.
A metodologia de investigação seguida para realização dos objetivos apresentados foi a de Ação-Pesquisa.
Esta metodologia é um processo interativo e cíclico, que combina sinergicamente a teoria e a prática. Envolve
investigadores que atuam em conjunto num determinado ciclo de atividades de forma a testar uma teoria
CAPÍTULO 1. Introdução
8
em situações reais, sendo aquelas o diagnóstico do problema, a intervenção e a aprendizagem reflexiva –
troca de feedbacks, alteração da teoria de acordo com o feedback recebido e, recomeçar as atividades
[29][30].
Esta metodologia de investigação inclui um conjunto de passos que devem ser seguidos [31]:
• Identificação do problema e especificação das suas características;
• Atualização interativa do estado da arte dos objetivos do trabalho;
• Modelação e desenvolvimento de uma solução que satisfaça as especificações;
• Análise de resultados e correção com base nos resultados;
• Validação da solução;
• Publicação do conhecimento e resultados obtidos com a comunidade científica.
1.5 ORGANIZAÇÃO DO DOCUMENTO
A presente dissertação compreenderá, para além do capítulo introdutório, mais seis capítulos estruturados
da seguinte forma:
No Capítulo 2 expõe-se uma revisão dos fundamentos teóricos abordados e das tecnologias que suportam
as soluções propostas. Descrevem-se as características do vídeo, componente essencial para o diagnóstico
médico, e o espaço de cor RGB.
Já no Capítulo 3 é apresentado o conceito de Endoscopia e os diferentes tipos existentes, nas mais variadas
especialidades médicas. Pretende-se, também, dar a conhecer as técnicas de Endoscopia Digestiva Alta e
Baixa, bem como a anatomia, fisiologia e histologia do trato digestivo.
O Capítulo 4 inclui um estudo acerca de sistemas de apoio à decisão existentes e dos módulos que os
compreendem, desde a aquisição, armazenamento, processamento, reconhecimento e interpretação e
partilha de imagens, nos domínios da investigação científica e comercial. Faz-se referência ao sistema
MyEndoscopy e, ainda ao módulo MIVprocessing.
CAPÍTULO 1. Introdução
9
No Capítulo 5 são descritas as soluções propostas para a resolução dos problemas identificados
inicialmente, são também apresentados e interpretados os resultados obtidos através das mesmas.
No Capítulo 6 é apresentada a última etapa do módulo MIVprocessing, e uma revisão da literatura no que
toca a soluções desenvolvidas para deteção e classificação de achados endoscópicos, mais propriamente,
pólipos e sangramento.
Por fim, no Capítulo 7 são apresentadas as principais conclusões e contribuições, bem como a proposta
de trabalho futuro que surge na sequência do trabalho aqui apresentado.
CAPÍTULO 1. Introdução
10
Capítulo 2
BASE TECNOLÓGICA
CAPÍTULO 2. Base Tecnológica
12
2.1 INTRODUÇÃO
O rastreio de patologias ou lesões do sistema digestivo, com recurso às técnicas endoscópicas de EDA e
EDB, é de elevada importância, pois algumas doenças são assintomáticas. Nos casos em que se manifestam
podem ser incapacitantes. Desta forma, tanto a realização de um diagnóstico e prescrição de intervenções
terapêuticas corretos vão ser essenciais para os cuidados de saúde prestados ao paciente [17][18][24][25].
As técnicas de EDA e EDB geram vários tipos de resultados, que podem surgir na forma de vídeo, conjuntos
de imagens e relatório médico final com o respetivo diagnóstico. Os vídeos endoscópicos resultantes dos
procedimentos de EDA e EDB são os que apresentam maior dimensão, a nível do tamanho de
armazenamento e da duração. Contudo, são fundamentais para o rastreio de patologias ou lesões que
possam estar presentes no TGI.
É devido aos factos apresentados anteriormente que surge a necessidade de desenvolver sistemas de
suporte à decisão, CADSS, que permitam o processamento e a análise de vídeos endoscópicos de longa
duração, tendo em vista a redução dos mesmos e a deteção e classificação de achados endoscópicos
presentes ou não nos vídeos de cada exame.
Para o desenvolvimento de soluções, que permitam colmatar os problemas relativos ao tempo despendido,
pelo profissional de saúde, em tarefas de visualização e análise, é necessário conhecerem-se os requisitos
para implementação das mesmas, fazer-se uma revisão dos fundamentos teóricos envolvidos e,
posteriormente, devem ser escolhidas as tecnologias mais apropriadas para a sua implementação. Apesar
de existirem variadas possibilidades para solucionar os problemas referidos, as tecnologias utilizadas foram
escolhidas tendo em conta uma série de critérios e de limitações inerentes às mesmas.
Neste capítulo é apresentada uma revisão dos fundamentos teóricos abordados e das tecnologias utilizadas
nesta dissertação.
2.2 VÍDEO
Após a realização do procedimento endoscópico, o ficheiro de vídeo resultante é armazenado. Uma vez que
este tipo de resultados é de grandes dimensões, deve ser comprimido logo de seguida, através da aplicação
de algoritmos de processamento, e, deste modo, é criada uma versão decorrente da anterior. As versões
obtidas por meio de soluções de Visão Computacional vão ser utilizadas para realização de diagnóstico,
CAPÍTULO 2. Base Tecnológica
13
como tal, é importante que não haja perda de informação clínica nem introdução de artefactos durante o
processo de compressão, que possam levar a diagnósticos errados.
De seguida são explicitadas as principais características associadas a um vídeo, que determinam a sua
qualidade (Resolução, Sistema de Varrimento, Bit Rate e Largura de Banda, Frame Rate, Codificação e
Descodificação, Containers), bem como os modos de transmissão do mesmo.
2.2.1 RESOLUÇÃO
A Resolução de cada imagem, quadro ou frame, de um vídeo é expressa em termos do número de pixéis
nas direções horizontal e vertical [32]. Estes determinam se o vídeo é de Alta Definição (do inglês, High
Definition (HD)) ou Definição Padrão (do inglês, Standard Definition (SD)), sendo as mais comuns de
1920x1080 pixéis e 720x480 pixéis, respetivamente. Isto é, quanto maior é a resolução maior será o
número de pixéis. Desta forma, a imagem torna-se mais clara e percetível e o vídeo terá maior quantidade
de dados [33].
2.2.2 SISTEMA DE VARRIMENTO
O Sistema de Varrimento pode ser de dois tipos, progressivo (do inglês, progressive (p)) ou entrelaçado (do
inglês, interlaced (i)). O tipo progressivo é caracterizado pelo redesenho de todas as linhas de cada novo
frame individual, isto é, exibe todos os frames como imagens únicas, uma após a outra. Já para o tipo
entrelaçado são gerados dois campos de linhas, linhas ímpares e pares. A primeira imagem exibe as linhas
ímpares (metade do frame) e a imagem seguinte as pares (segunda metade do frame) [34][35]. Mais
propriamente, quando é transmitido um frame entrelaçado, apenas metade das linhas de uma imagem é
enviada de cada vez, alternando entre ímpares e pares e, assim, possibilita a redução para metade da
largura de banda necessária para essa mesma transmissão [36].
2.2.3 BIT RATE E LARGURA DE BANDA
O Bit Rate é definido pela quantidade de dados transmitidos por segundo de vídeo, expressando-se em
quilobits ou megabits por segundo (do inglês, kilobits per second ou megabits per second, respetivamente),
kbps ou mbps, respetivamente. É dos componentes mais importantes num ficheiro de vídeo, este dita a
qualidade do vídeo se todos os outros componentes se mantiverem iguais (resolução, codec, frame rate).
No entanto, a título de exemplo, quanto maior for a resolução do vídeo, maior terá de ser o bit rate, de modo
CAPÍTULO 2. Base Tecnológica
14
a manter a qualidade de imagem, uma vez que está envolvido um maior número de pixéis. Um maior valor
de bit rate corresponde a um vídeo com menor compressão e com melhor qualidade [33].
A Largura de Banda corresponde à velocidade da ligação à Internet que um utilizador possui, mais
propriamente, traduz-se pela quantidade de dados que esse mesmo utilizador pode receber por segundo e
é representada em quilobits ou megabits por segundo, kpbs ou mbps, respetivamente. Quando o vídeo for
transmitido na Web deve-se ter em conta a Largura de Banda, assim evita-se que seja enviada para o
utilizador uma quantidade de dados superior à que é recebida, provocando perda de informação.
De forma a garantir uma reprodução fluente do vídeo deve adequar-se o bit rate à largura de banda do
utilizador alvo [33].
2.2.4 FRAME RATE
O Frame Rate é o nome dado ao número de frames individuais que compõem cada segundo de vídeo. O
valor padrão é de 29,97 frames por segundo (do inglês, frames per second (fps)) [37]. Quanto maior o
frame rate, mais frames terão de ser processados, logo mais fluido e suave será o vídeo. Pelo contrário, se
o frame rate for baixo o vídeo é transmitido com pior qualidade, sendo um pouco agitado e não tão fluido.
Tal pode ser observado para valores abaixo de 25 fps. O mais importante é manter um frame rate constante
[33][38].
2.2.5 CODIFICAÇÃO E DESCODIFICAÇÃO
Um Codec é uma tecnologia responsável por comprimir e descomprimir dados, que podem ser do tipo vídeo
e/ou áudio. Para além disto, é o principal determinante da qualidade dos dados. Este permite a codificação
de dados num fluxo de bytes, para arquivo e transporte e a descodificação dos mesmos, para visualização
ou transcodificação. Tanto o codificador como o descodificador têm de ser compatíveis [37].
Os codecs de vídeo podem ser de dois tipos: com perdas, lossy, e sem perdas, lossless, de informação [39].
Os codecs lossy são projetados para obtenção de maiores taxas de compressão, para eliminar informações
não relevantes e reduzir o tamanho total do arquivo. Como tal, geram uma certa perda de qualidade, que
por sua vez tem que ser balanceada com a taxa de compressão para que não sejam criados artefactos
percetíveis. No entanto, sempre que um frame é codificado, descodificado e codificado novamente aumenta-
se a perda de informação, que não é recuperada pelo processo de descodificação.
CAPÍTULO 2. Base Tecnológica
15
Já os codecs lossless têm a capacidade de preservar todos os dados do arquivo original, obtendo-se um
vídeo sem compressão inicial, quando descodificado. Por sua vez, quando codificados geram arquivos com
baixas taxas de compressão e com a qualidade do vídeo original. Contudo, o vídeo original, por norma, é
bastante complexo e de elevado tamanho, por exemplo, o que parece ser de alguns minutos de vídeo pode
preencher gigabytes de espaço numa unidade. Sendo que estes são fatores limitativos para o
armazenamento, distribuição e transmissão do vídeo [40].
Existe uma vasta variedade de codecs disponíveis, cada um com características diferentes e, que ao mesmo
tempo, servem propósitos diferentes. Este é escolhido mediante o que se quer realizar, o que torna a escolha
do codec certo uma tarefa meticulosa. Atualmente, os codecs mais utilizados são: H.264, MPEG-4 Part 2,
Xvid e Theora, explicitados abaixo.
H.264/MPEG-4 AVC: O codec H.264, também designado por MPEG-4 Part 10 Advanced Video
Coding (AVC) ou AVC1, desde que foi desenvolvido, foi reconhecido, universalmente, como um
grande avanço na tecnologia de vídeo, tendo sido adotado em praticamente todas as aplicações de
vídeo digital, visto que proporciona compressão de alta qualidade e resiliência a erros [41]. Desta
forma, a alteração da qualidade do vídeo em relação ao original é mínima, isto é, a representação
do vídeo torna-se muito mais eficiente e robusta, para uma taxa de bit rate relativamente baixa, o
que faz com que seja utilizado na Web, uma vez que a velocidade de transmissão é limitada. É
escalável e flexível. Esta flexibilidade é conseguida pelos diferentes profiles e levels que identificam
diferentes configurações. Os profiles mais altos usam mais características opcionais e apresentam
melhor qualidade para arquivos de tamanhos mais baixos, mas o processo de codificação leva mais
tempo e o de descodificação exige mais poder de CPU para ser executado em tempo real [39][42].
Este codec proporciona ganhos de eficiência de compressão até 50%, para uma vasta gama de
taxas de bit rate e de resoluções de vídeo em comparação com outras normas, como o MPEG-2 e
o MPEG-4 Part 2 Simple Profile (SP) [43].
MPEG-4 Part 2: O MPEG-4 Part 2 é um formato normalizado de compressão de vídeo
desenvolvido pelo MPEG, oficialmente designado por ISO/IEC 14496-2. Proporciona uma
representação de vídeo eficiente, orientada aos objetos, utilizando um esquema de compressão
moderno e de melhor qualidade, em relação aos codecs MPEG-2 e à primeira versão do H.263. É
um codec de vídeo de alto desempenho, escalável e inclui ferramentas de resiliência a erros. Este
define um conjunto de profiles e levels, cada um deles define um conjunto de funcionalidades. O
profile corresponde à qualidade de vídeo e o level corresponde ao frame rate e à resolução do
CAPÍTULO 2. Base Tecnológica
16
mesmo. Para aplicações em que, por exemplo, o custo do hardware dificulta a implementação do
codec H.264, o MPEG-4 Part 2 apresentam várias opções de profiles, sendo os mais utilizados o
SP e Advanced Simple Profile (ASP). Estes proporcionam alto desempenho e arquiteturas de
codificação e descodificação de menor complexidade [41][44].
Xvid: O Xvid é um codec de vídeo que deriva do MPEG-4 Part 2 ASP. Este formato foi criado para
competir com o codec comercial DivX, uma vez que é de código aberto, podendo ser obtido
gratuitamente. Apesar de ser gratuito, a sua qualidade, eficiência e desempenho são notáveis, o
que faz deste uma excelente alternativa aos seus concorrentes. A sua finalidade é a de comprimir
o vídeo, pela remoção da informação não relevante, a fim de alcançar elevadas taxas de compressão,
ao mesmo tempo mantendo muito boa qualidade visual. Assim, permite que este seja transmitido
mais rapidamente e que o seu armazenamento seja eficiente. Este codec proporciona uma
qualidade de vídeo superior em arquivos de menor tamanho. Em relação a normas menos recentes,
como o MPEG-2, o tempo gasto no seu processo de codificação é menor [39][40].
Theora: O Theora é um codec que foi lançado para o domínio público, está disponível
gratuitamente e é livre de patentes. Este pode ser incorporado em qualquer container, embora seja
frequentemente utilizado no container Ogg. Foi projetado para fazer concorrência ao MPEG-4 e a
outras técnicas semelhantes de compressão de vídeo com taxas de bit rate baixas. Foi projetado
para ser transmitido na Web a taxas de bit rate relativamente baixas. É suportado nativamente nas
principais distribuições Linux e, quando incorporado no container Ogg, no Mozilla Firefox [39].
Para o desenvolvimento desta dissertação o codec selecionado para trabalhar foi o Xivd, pela qualidade que
este proporciona aos vídeos, quando aplicadas as técnicas de compressão e de descompressão.
2.2.6 CONTAINERS
Um Container é um tipo de formato de arquivo que contém vários tipos de dados (e.g. vídeo, áudio e
metadados), previamente, comprimidos por codecs, com as características pretendidas (e.g. bit rate, frame
rate, resolução), permitindo o seu transporte e transmissão. Para além disso, um container pode ser
identificado por uma extensão de arquivo. Este descreve a estrutura de um ficheiro: desde o local onde as
várias partes são armazenadas, a forma como elas intercalam e quais os codecs usados pelas diferentes
partes. Um bom container permite que ficheiros comprimidos tenham diferentes tipos de codecs, sendo que
cada container tem compatibilidade limitada apenas para um conjunto de codecs [37][42].
CAPÍTULO 2. Base Tecnológica
17
Os containers mais utilizados, atualmente, são os seguintes:
AVI: O container Audio Video Interleave (AVI) foi desenvolvido pela Microsoft e divulgado em 1992
e, é um dos mais antigos formatos de vídeo. Os seus ficheiros apenas podem conter vídeo e/ou
áudio, uma vez que este não suporta a incorporação de metadados. No entanto, a sua arquitetura
é simples e possibilita a utilização de uma moderada gama de codecs, como por exemplo Xvid e
DivX, embora não suporte os mais recentes. Para além das limitações referidas ainda se podem
considerar a codificação de tempo e a relação de aspeto de um vídeo, pois não são suportadas
devidamente. Normalmente, encontra-se com a extensão .avi [47][48].
MP4: O container MP4, termo abreviado de MPEG-4 Part 14, é um formato normalizado,
desenvolvido pela Motion Pictures Expert Group. Geralmente, são ficheiros de pequeno tamanho,
mas de elevada qualidade após a compressão, e são usados para partilha de arquivos de vídeo na
Web. Por norma, é identificado pelas extensões .mp4 ou .m4v. Este container é compatível com os
codecs H.264 (para vídeo) e ACC (para áudio) [39][42][48].
QuickTime: O container QuickTime foi desenvolvido pela Apple. Inc e o suporte dos codecs é
limitado apenas ao que a Apple Inc. suporta, sendo o H.264 o mais defendido pela mesma. É um
formato comum de visualização e de partilha de vídeo, e é frequentemente usado na Web. Pode ser
encontrado pela extensão .mov. Por norma, os arquivos são de alta qualidade, mas grandes no seu
tamanho [42][48].
Matroska: O container Matroska (MKV) é um formato normalizado inteiramente livre. Permite a
inclusão de vídeo, áudio, bem como legendas e metadados, num mesmo ficheiro. E, suporta a
transmissão em tempo real, distribuição de dados, por HTTP (do inglês, Hypertext Transfer Protocol)
e FTP (do inglês, File Transfer Protocol), entre outros [49].
OGG: É um formato normalizado de código aberto e livre de quaisquer patentes conhecidos. Pode
ter várias extensões, mas normalmente encontra-se com a extensão .ovg. É suportado, nativamente,
pelos browsers: Firefox, Chrome e Opera. É compatível com os codecs Theora (para vídeo) e Vorbis
(para áudio) [39].
Pela análise feita aos principais containers e pelas limitações de suporte da biblioteca OpenCV, para este
projeto foi escolhido o AVI.
CAPÍTULO 2. Base Tecnológica
18
2.2.7 MODOS DE TRANSMISSÃO
Uma vez que o sistema, no qual está inserido o módulo desenvolvido, permite fazer transmissão de vídeo
na Internet, deve-se também referir os tipos diferentes de transmissão possíveis. Os modos de transmissão
podem ser: em tempo real ou em diferido [50].
A transmissão em tempo real, também designada como streaming, permite que o vídeo, enviado pelo
servidor, seja acedido ao mesmo tempo que é recebido no cliente. A transmissão do conteúdo do vídeo não
precisa ser realizada na íntegra numa só vez, o conteúdo do vídeo é descodificado à medida que este é
recebido. O bit rate do vídeo deve ser inferior ao valor da largura de banda do cliente, garantindo a qualidade
da ligação e a visualização do conteúdo do vídeo sem perdas [33]. Em situações em que a largura de banda
é baixa, deve ser garantido que o conteúdo do vídeo seja transmitido ainda que com baixa qualidade [50].
A transmissão de vídeo em diferido corresponde à descarga do mesmo, por parte do cliente, sendo que este
pode ser visualizado num reprodutor de vídeo após a total descarga ou, caso o formato do vídeo o permita,
à medida que vai sendo recebido aquando do descarregamento [33].
2.3 LINGUAGEM C++
A linguagem de programação utilizada para implementação das soluções propostas foi a C++. Esta foi
desenvolvida em 1983 e é uma linguagem de programação multiparadigma, orientada a objetos e de uso
geral. Para além disso, é uma extensão da linguagem C. É particularmente adequada para aplicações nas
quais os recursos são limitados, tais como aqueles encontrados em infraestruturas de software [51].
Esta é uma das possíveis linguagens aplicadas em algoritmos de Visão Computacional, sendo que permite
obter resultados rápidos e desempenhos elevados.
2.4 OPENCV
A biblioteca OpenCV foi criada, em 1998 e lançada em 2000, uma biblioteca com código otimizado e portátil
e que pode ser obtida gratuitamente.
A biblioteca encontra-se dividida em diferentes módulos, em que cada um deles fornece as ferramentas
necessárias para resolver um conjunto de problemas de Visão Computacional, por exemplo através da
CAPÍTULO 2. Base Tecnológica
19
implementação de operações de infraestrutura, de funções de baixo-nível de Processamento de Imagem e
algoritmos de alto-nível. Dispõe de mais de 2500 algoritmos otimizados que podem ser usados no
processamento de imagens e vídeos (e.g. para deteção e reconhecimento de rostos, de objetos, extração
de modelos de objetos em 3D, entre outros).
Desde o ano 2000 sofreu grandes alterações, alguns exemplos são a transição de uma interface em C para
C++ e o desenvolvimento do módulo GPU. Podendo ainda ser utilizadas interfaces Java, Python e MATLAB,
nos sistemas operativos Windows, Linux, Mac OS X. Esta biblioteca proporciona grande eficiência
computacional [23][52]. Atualmente, tem uma comunidade de mais de 47 mil utilizadores e um número
estimado de downloads superior a 7 milhões. A biblioteca é amplamente utilizada em empresas, grupos de
investigação e organismos governamentais [53].
2.5 IMAGEM DIGITAL E ESPAÇO DE COR RGB
Uma imagem digital é considerada uma matriz finita de elementos, estes são designados por pixéis. Para
análise dos frames presentes nos vídeos endoscópicos é necessário ter em conta que estes se encontram
codificados num determinado espaço de cor [54].
A cor, por norma, é identificada através de parâmetros específicos ou de três coordenadas diferentes, que
definem a posição da cor dentro do respetivo espaço de cor utilizado. No caso do espaço de cor RGB (do
inglês, red, green and blue, ou seja, vermelho, verde e azul), uma imagem RGB é uma matriz de duas
dimensões de pixéis de cor, em que cada pixel é representado por um conjunto de três coordenadas. Esta
imagem RGB é obtida pela sobreposição de três imagens na escala de cinzento, que quando são unidas
origina a imagem a cores. Cada uma das cores é representada por 8 bits, o que implica que cada cor pode
assumir até 256 tons diferentes. Este espaço é baseado num referencial cartesiano, cuja representação é
um cubo de cor (Figura 2.1). Nos vértices encontram-se as cores RGB e as cores secundárias (magenta,
amarelo e ciano) [55].
CAPÍTULO 2. Base Tecnológica
20
Figura 2.1 - Representação do espaço de cor RGB (retirado de [56]).
Este é o espaço de cor mais utilizado na captação de imagens digitais, no entanto detém algumas limitações
ao nível do processamento de imagem.
Capítulo 3
ENDOSCOPIA DIGESTIVA
CAPÍTULO 3. Endoscopia Digestiva
22
3.1 INTRODUÇÃO
O conceito de Endoscopia, bem como as suas aplicações, foi descrito pela primeira vez por Hipócrates - o
pai da Medicina, na Grécia (460-377 a.C.) -, por volta do ano 400 a.C. [57].
A curiosidade de investigar os órgãos internos do corpo humano trouxe um dos maiores desafios para a
medicina. O primeiro instrumento utilizado para observação de cavidades mais profundas do corpo humano
foi um espéculo. Este instrumento permitiu a observação e análise do reto, tendo sido mencionado nas
obras On Hemorroids e On Fistulae, de Hipócrates [57][58]. Ao mesmo tempo, surgiu o primeiro espéculo
para Endoscopia ginecológica.
A Endoscopia (de endo– do grego, skopéin,“observar”– ia), de modo generalizado, é o termo médico dado
aos métodos de visualização direta de cavidades e órgãos internos do corpo humano [59]. Essa visualização
é feita através de um instrumento denominado de endoscópio. Até à década de 60, do século XX, os
endoscópios existentes eram rígidos e, posteriormente, semirrígidos. Desde então, surgiram endoscópios
de fibra ótica, flexíveis, altamente manobráveis, duráveis, seguros e relativamente confortáveis, podendo
aceder a locais a que os instrumentos mais antigos não acediam de todo ou podiam aceder, causando
grande desconforto para o paciente [14][17].
Tendo em conta os avanços tecnológicos, hoje em dia existem várias técnicas e tipos de endoscópios que
permitem uma investigação de rotina do interior do corpo humano. Através de estudos endoscópicos podem
ser diagnosticadas anormalidades, bem como realizadas intervenções terapêuticas [14].
A Endoscopia é, então, utilizada nas mais diversas especialidades da Medicina, como otorrinolaringologia,
pneumologia, urologia, ginecologia, obstetrícia, cirurgia, gastrenterologia, entre outras. A cada área Médica
estão associados diferentes tipos de Endoscopia, bem como instrumentos distintos utilizados para
observação.
A gastrenterologia é a especialidade da Medicina que abrange a anatomia, fisiologia e patologias do sistema
digestivo [60]. De entre vários MCDT, em gastrenterologia, recorre-se à Endoscopia Digestiva para
observação do TGI. Esta tem um papel muito importante no que toca à deteção de patologias ou lesões e
ao tratamento das mesmas. Para além destes fatores permite ao profissional de saúde estudar a área
examinada, colher pequenas amostras da mesma (biópsia e citologia), registar informação relativa ao
CAPÍTULO 3. Endoscopia Digestiva
23
procedimento, extrair pólipos ou corpos estranhos, aspirar líquidos, colocar drenos, entre outros, sendo
estes alguns exemplos de diagnósticos e de intervenções terapêuticas [17][16].
A Endoscopia Digestiva tem associadas várias técnicas que permitem investigar diferentes porções do TGI.
As técnicas requeridas com maior frequência são a EDA, que permite observar o TGI alto, e a EDB ou
Colonoscopia, que permite examinar a totalidade do intestino grosso [18]. Estas duas técnicas vão ser
exploradas em maior detalhe nas próximas secções. Para observação das restantes áreas do TGI existe a
Enteroscopia, para examinar o intestino delgado, e a ColangioPancreatografia Retrógrada Endoscópica
(CPRE), para examinar o pâncreas e as vias biliares [16]. Dado que, a Endoscopia Digestiva é primeiramente
utilizada para visualização em tempo real, é de extrema importância registar os achados diagnosticados e
as intervenções terapêuticas através de uma terminologia passível de ser compreendida entre profissionais
de saúde [14]. Assim, para este trabalho foi utilizada a Minimal Standard Terminology (MST), uma vez que
aborda as técnicas acima mencionadas de forma completa, detalhada e de fácil interpretação [61].
Mais recentemente, têm sido desenvolvidas novas formas de visualização do interior do corpo humano ou
novos tipos de Endoscopia, uma vez que não utilizam o instrumento médico mais comum, o endoscópio.
Podem-se destacar a Endoscopia Virtual, bem como a Cápsula Endoscópica.
A Endoscopia Virtual (do inglês, Virtual Endoscopy (VE)) surgiu nas últimas décadas, é não-invasiva e permite
a reconstrução tridimensional, a partir de um conjunto de imagens obtidas por modalidades como a TC ou
a RM, passível de ser analisada pelas técnicas convencionais. Alguns exemplos são a Endoscopia Virtual do
TGI alto e a Colonoscopia Virtual (CTC) [62][63] e podem ser observados na Figura 3.1.
(A) (B)
Figura 3.1 – Exemplos de lesões detetadas por: (A) Endoscopia Virtual do TGI alto – lesão encontrada no Corpo do estômago – (retirado de [64]) e (B) Colonoscopia Virtual – encontrado um pólipo no cólon transverso – (retirado de [65]).
Esta técnica pode melhorar o desempenho da interpretação do profissional de saúde e a diminuição da
frequência de erros de perceção, bem como potenciar o diagnóstico de várias patologias do TGI, uma vez
CAPÍTULO 3. Endoscopia Digestiva
24
que simula as alterações da mucosa, como pode ser verificado pelas técnicas convencionais (Endoscopia
Digestiva e Colonoscopia convencionais). No entanto, a Endoscopia Virtual tem várias desvantagens, entre
as quais se destacam quatro: a morosidade do processo de reconstrução 3D, a partir das imagens médicas
recolhidas; a impossibilidade de serem extraídos corpos estranhos e colhidas amostras; a exposição do
paciente a doses elevadas de radiação ionizante; a impossibilidade de detetar lesões com base em
mudanças de coloração [64].
A Cápsula Endoscópica (do inglês, Capsule Endoscopy ou Wireless Capsule Endoscopy (WCE)) foi
desenvolvida para visualizar o TGI, mais propriamente para atingir áreas do intestino delgado inacessíveis
pelas técnicas convencionais, bem como pela Enteroscopia. A WCE é considerada uma técnica não-invasiva
e, é de pequenas dimensões, o que facilita a sua deglutição e reduz o desconforto a que o paciente fica
sujeito. Este dispositivo descartável atravessa todo o TGI e vai capturando imagens, sendo posteriormente
excretado por vias naturais. Existem vários tipos de cápsulas que exploram o esófago, o intestino delgado e
o cólon, a esofágica, intestinal e colónica, respetivamente. As três apresentam aproximadamente o tamanho
de um comprimido e, são revestidas por um material biocompatível e resistente aos fluidos digest ivos
[66][67][68]. Na Figura 3.2 encontra-se uma cápsula intestinal e um exemplo de uma imagem obtida por
WCE.
(A) (B)
Figura 3.2 – (A) Esquema de uma WCE intestinal: 1 – Extremidade ótica, 2 – Suporte da lente ótica, 3 – Lente ótica; 4 – LEDs (do inglês, Light Emitting Diode), 5 – CMOS (do inglês, Complementary Metal Oxide Semiconductor), 6 –Bateria, 7 – Transmissor ASIC (do inglês, Application-Specific Integrated Circuit), 8 – Antena e (B) Exemplo de uma imagem endoscópica obtida por WCE: deteção de múltiplos pólipos (retirado de [67]).
O exame é analisado por um profissional de saúde, anotando todos os locais com anomalias, este processo
demora cerca de 40 a 60 minutos, sendo uma das principais limitações associadas a este exame. Devido
a este facto existem alguns estudos que mostram que, em vez de serem os próprios gastrenterologistas a
realizar esta análise, uma estratégia rentável seria recorrer-se a enfermeiros e a médicos internos da
CAPÍTULO 3. Endoscopia Digestiva
25
especialidade devidamente treinados para o efeito [67]. Esta técnica permite diagnosticar zonas de
sangramento, tumores, úlceras, entre outras lesões e patologias [68][69].
Este capítulo apresenta uma caracterização da EDA, da EDB e das estruturas anatómicas envolvidas em
cada uma das técnicas. Todo este conhecimento é fundamental para posteriormente ser definida uma
estratégia de desenvolvimento de uma solução que permita a deteção e classificação de regiões de interesse.
3.2 ENDOSCOPIA DIGESTIVA ALTA
A EsofagoGastroDuodenoscopia (do inglês, EsophagoGastroDuodenoscopy (EGD)), mais conhecida como
EDA, é o procedimento mais utilizado para análise da mucosa do TGI, neste caso desde o esófago, passando
pelo estômago, até ao primeiro segmento do intestino delgado, o duodeno, como é observado na Figura 3.3.
Esta técnica é realizada por um gastrenterologista, fazendo ainda parte da equipa enfermeiros e auxiliares
com formação especializada [70][71].
Antes de se executar uma EDA é impreterível ter o consentimento do paciente, no que toca à realização da
mesma e à sua sedação ou analgesia, bem como avaliá-lo e prepará-lo. Apesar de se tratar de um exame
cuja duração é em média de 6 minutos e 36 segundos (podendo variar de 2 a 32 minutos), pode causar
um certo desconforto para o paciente, podendo chegar a sentir dor [26][72][73].
Para realização deste tipo de MCDT, o gastrenterologista insere um endoscópio pela boca do paciente, que
se encontra deitado de lado com ambos os braços para frente e os joelhos e quadris fletidos para a esquerda
(posição de decúbito lateral esquerdo). Este endoscópio é constituído por um tubo flexível, longo e fino – o
diâmetro é variável, mediante o propósito da EDA e a tolerância do paciente, sendo de 8 a 10 mm, podendo
atingir os 15 mm - e, na extremidade, por uma câmara de vídeo e uma pequena fonte de luz. Esta câmara
de vídeo vai transmitir imagens para um monitor, em tempo real, desta forma, o gastrenterologista pode
orientar-se e registar todas as lesões ou patologias que forem encontradas ao longo do TGI alto. Estas
imagens podem ser ainda gravadas e impressas [72][74][75].
CAPÍTULO 3. Endoscopia Digestiva
26
Figura 3.3 – Representação de uma EDA e das regiões em que esta se focaliza (adaptado de [76] e de [77]).
Uma EDA é indicada, primeiramente, para observação do TGI alto, como referido anteriormente. Existem
ainda muitas outras indicações para a realização deste exame, que podem ser divididas em quatro grupos:
sintomas, doenças, verificar o estado de e colher amostras-alvo. Os sintomas do paciente são avaliados
quando não está estabelecido um diagnóstico (e.g. azia, disfagia, dores abdominais, anorexia, anemia, perda
de peso, náuseas, vómitos). Através deste exame ser diagnosticadas, confirmadas e monitorizadas várias
doenças, entre as quais: varizes, úlceras esofágicas, gástricas e duodenais, esófago de Barrett e tumores.
Para além disso, podem ser rastreadas patologias pré-malignas ou malignas em pacientes considerados em
risco de neoplasia e realizadas intervenções terapêuticas. É necessário verificar o estado de algo na ausência
de um sinal específico, possibilitando avaliar um determinada região do TGI alto antes e depois de uma
cirurgia. Para a colheita de amostras-alvo, por vezes, são realizados exames apenas para esse efeito (e.g.,
biópsias) [61][75].
Na Figura 3.4 encontram-se alguns exemplos de possíveis doenças diagnosticas através desta técnica.
Figura 3.4 – Exemplos de diagnósticos do esófago, estômago e duodeno obtidos por EDA (adaptado de [78]).
CAPÍTULO 3. Endoscopia Digestiva
27
3.3 ANATOMIA DO TRATO DIGESTIVO ALTO
Como já foi referido anteriormente, a técnica de EDA é iniciada pela introdução de um endoscópio através
da boca do paciente e, assim, permite a observação da região gastrointestinal superior (Figura 3.5), que vai
desde o esfíncter esofágico superior até à 2ª porção (DII) do duodeno -- excetuando em casos de obstrução
esofágica ou pilórica, uma vez que o aparelho não pode ultrapassar essa obstrução –, passando pelo
estômago [19][59].
Figura 3.5 – Anatomia do Trato Digestivo Alto (adaptado de [79]).
Entre os três órgãos do TGI alto, observados na Figura 3.5 acima, existem variações tanto a nível anatómico
como a nível fisiológico e histológico. Assim, o profissional de saúde deve ser capaz de determinar a posição
espacial de cada um dos órgãos e ainda estar familiarizado com a aparência normal dos mesmos [80]. Na
Figura 3.6 observam-se o esófago, o estômago e o duodeno, sem qualquer tipo de patologia.
(A) (B) (C)
Figura 3.6 – Imagens de Referência, (A) Esófago, (B) Estômago, (C) Duodeno (retirado de [81]).
Nas subseções que se seguem são apresentadas as principais características anatómicas, fisiológicas e
histológicas dos órgãos envolvidos na EDA.
CAPÍTULO 3. Endoscopia Digestiva
28
3.3.1 ESÓFAGO
O esófago (do grego, oisophágos) é um órgão muscular altamente distensível com forma tubular [82]. A sua
principal função é o transporte de alimentos, líquidos e de saliva da faringe até ao estômago.
À nascença, o esófago mede cerca de 11 cm de comprimento, enquanto num adulto mede
aproximadamente 25 cm de comprimento e 2 cm de diâmetro – no entanto, o valor do comprimento varia
em função da altura do indivíduo. A distância dos dentes incisivos superiores ao cárdia do estômago é,
geralmente, de 30 cm a 40 cm de comprimento (Figura 3.7) [82][83].
O esófago começa na extremidade inferior da faringe, ao nível da sexta vértebra cervical (C6) até ao cárdia
do estômago, ao nível da décima primeira ou da décima segunda vértebras torácicas (T11 ou T12), e é
protegido nas suas extremidades pelos esfíncteres esofágicos superior e inferior, como é possível observar
na Figura 3.7 [84].
Figura 3.7 – Localização e comprimento total do esófago e estruturas envolventes (retirado de [85]).
CAPÍTULO 3. Endoscopia Digestiva
29
O esófago é dividido em três segmentos, pela orientação proximal para distal [70][82][84]:
Esófago Cervical – começa imediatamente abaixo da cartilagem cricoide (C6) e termina ao nível da
entrada torácica (T1).
Esófago Torácico – estende-se da entrada torácica (T1) ao diafragma (T10), no interior do tórax. E
é subdividido em três partes:
o Esófago Superior – inicia na entrada torácica e estende-se até à bifurcação da traqueia, mais
conhecida como carina da traqueia.
o Esófago Médio – está compreendido entre o nível inferior da margem da carina da traqueia e o
ponto médio entre o mesmo e a junção esofagogástrica.
o Esófago Inferior – encontra-se a partir do ponto médio entre a carina da traqueia e a junção
esofagogástrica até ao diafragma.
Esófago Abdominal – é o segmento mais curto, ligando o diafragma (T10) ao cárdia do estômago
(T11 ou T12) e, caracteriza-se pela junção esofagogástrica (Figura 3.8), possuindo uma transição
abrupta entre o epitélio esofágico e o gástrico – passando de estratificado escamoso a simples
colunar, respetivamente –, sendo também conhecida como linha Z. Esta região é identificada pela
alteração de cor da mucosa, de rosa pálido, no esófago, para rosa-avermelhado, no estômago e,
também pela presença do esfíncter esofágico inferior.
Figura 3.8 – Transição do esófago para o estômago, observando-se a junção esofagogástrica (adaptado de [83]).
Na Figura 3.9 observa-se a mucosa dos segmentos: esófago torácico superior e esófago abdominal, mais
propriamente na junção esofagogástrica.
CAPÍTULO 3. Endoscopia Digestiva
30
(A) (B)
Figura 3.9 – Mucosa do esófago nos segmentos: (A) esófago torácico superior e (B) esófago abdominal, destacando a junção esofagogástrica (retirado de [80]).
Existem três estruturas clinicamente importantes no esófago, designadas por constrições, que pela sua
posição fixa permitem auxiliar o diagnóstico de patologias, por exemplo, quando realizada uma EDA ou na
visualização de radiografias (Figura 3.7) [83]:
Constrição cervical, ou esfíncter esofágico superior: é localizada a 15 cm dos dentes incisivos, na
junção faringoesofágica, e provocada pelo músculo constritor inferior da faringe.
Constrição torácica (bronco-aórtica): é uma constrição composta, em que primeiramente passa pelo
arco da aorta, a 22,5 cm dos dentes incisivos, e de seguida, pelo brônquio principal esquerdo, a
27,5 cm dos dentes incisivos.
Constrição diafragmática, ou esfíncter esofágico inferior: encontra-se a aproximadamente 38 cm
dos dentes incisivos e é caracterizado pela passagem do esófago pelo diafragma.
Como já referido, é importante conhecerem-se as constrições do esófago e as suas respetivas localizações,
uma vez que é nesses pontos que existe maior número de lesões, podendo também ser diagnosticadas
patologias, como Disfagia (dificuldade de deglutição) ou Doença de Refluxo GastroEsofágico (DRGE,
passagem de conteúdo do estômago para o esófago), entre outras. As lesões mais comuns são úlceras
esofágicas e tumores (benignos e malignos), causados pelo refluxo gástrico, bem como pela ingestão de
substâncias corrosivas [83][86][87]. No entanto, num indivíduo desprovido de patologias e lesões, as células
da mucosa, juntamente com o esfíncter esofágico inferior, protegem o esófago do refluxo de ácido gástrico
[86].
Outro fator essencial para a realização da EDA e para o diagnóstico é conhecer a orientação do esófago
(Figura 3.10). O paciente fica deitado na posição de decúbito lateral esquerdo e, assim qualquer líquido
permanece naturalmente no lado esquerdo do esófago [70][87].
CAPÍTULO 3. Endoscopia Digestiva
31
Figura 3.10 – Orientação do esófago (retirado de [70]).
3.3.2 ESTÔMAGO
O estômago (do grego, stómachos) é um órgão muscular altamente distensível, sendo o mais dilatado de
todo o TGI alto. Localiza-se entre o esófago e o duodeno, e apesar de nas extremidades ser relativamente
fixo, o estômago é muito móvel no meio. As suas principais funções são a decomposição química e mecânica
dos alimentos. Estes são convertidos gradualmente numa mistura semilíquida, denominada de quimo, que
é libertada no duodeno, a uma velocidade controlada, para aí ocorrer o processo de absorção. A motilidade
gástrica é controlada tanto por sinais hormonais como neuronais [86][88].
Para um adulto, a forma, o tamanho, o diâmetro e o volume variam mediante os seus hábitos de vida e o
seu tipo de corpo, isto é, se é magro, robusto, alto ou baixo. Por norma, o estômago tem a forma da letra
“J”. No que toca ao tamanho, este varia de 15 cm a 25 cm de comprimento, já o diâmetro e o volume
variam mediante a quantidade de alimentos que o mesmo contém. Quando está vazio tem o tamanho
aproximado de um punho, um volume de, aproximadamente, 50 ml e um diâmetro ligeiramente maior que
o do intestino grosso. No entanto, quando dilatado pode chegar a ter mais de 75 vezes o seu volume quando
vazio ou armazenar de 2 L a 4 L de alimentos e líquidos e, retorna ao seu tamanho de repouso quando
vazio novamente [83][86].
O estômago tem duas aberturas (orifícios cárdico e pilórico), duas curvaturas (curvaturas maior e menor) e
duas faces (faces anterior e posterior). Anatomicamente, é dividido em quatro partes [83][86][88], como se
observa na Figura 3.11:
Cárdia: estende-se a partir da junção esofagogástrica e envolve o orifício cárdico, ou esfíncter cárdico,
através do qual os alimentos entram no estômago. O esfíncter cárdico auxilia na redução do refluxo
do conteúdo do estômago para o esófago.
CAPÍTULO 3. Endoscopia Digestiva
32
Fundo gástrico: é a parte superior, em forma de cúpula, que se projeta no estômago para cima e
para a esquerda do orifício cárdico. Geralmente, é dilatado através de gases, mas também por
líquidos e alimentos.
Corpo do estômago: é a maior região do estômago, é distensível e localiza-se entre o fundo gástrico
e o antro pilórico.
Porção pilórica: é última fração tubular do estômago, engloba o antro pilórico, o canal pilórico e
termina no piloro, o qual forma o esfíncter pilórico. Este regula o esvaziamento do estômago, ou
seja, o movimento do quimo para o duodeno e, impede o refluxo de conteúdo duodenal para o
estômago.
Figura 3.11 – Anatomia interna do estômago e as suas regiões (retirado de [86]).
Como visto anteriormente, a mucosa do estômago tem uma tonalidade rosa-avermelhada (ver secção 3.3.1 ),
salvo na porção pilórica em que é rosada. Para além disso, no antro pilórico é observável, através da EDA,
a mudança da mucosa de rugosa para lisa [70][83]. Conhecer estas diferenças da mucosa é igualmente
importante para que seja realizado um diagnóstico correto, uma vez que quando esta apresenta alterações
pode ser sinal de algum tipo de lesão. Na Figura 3.12 verificam-se as diferenças da mucosa do estômago.
CAPÍTULO 3. Endoscopia Digestiva
33
(A) (B)
Figura 3.12 – Visualização da mucosa do estômago nas partes: (A) corpo do estômago e (B) antro pilórico (retirado de [80] e de [81]).
Outro fator essencial é a orientação do estômago, no decorrer de uma EDA, na qual o paciente está na
posição de decúbito lateral esquerdo. Assim, a curvatura maior do estômago está na parte inferior, a
curvatura menor na parte superior, a parede posterior do estômago à direita e a anterior à esquerda [70],
como se pode observar na Figura 3.13.
Figura 3.13 – Orientação do estômago (retirado de [70]).
3.3.3 DUODENO
O duodeno (do latim, duodeni) é o primeiro e mais pequeno segmento do intestino delgado – o órgão mais
longo do TGI, com cerca de 7 metros de comprimento e, divide-se em três segmentos: duodeno, jejuno e
íleo –, e, também o mais largo e relativamente imóvel. Embora seja o segmento mais curto do intestino
delgado, é o que tem mais características de interesse [86]. Desempenha um papel importante na regulação
do esvaziamento do conteúdo estomacal para o intestino delgado, bem como nos processos de degradação
enzimática dos alimentos e de absorção de alguns nutrientes [89].
CAPÍTULO 3. Endoscopia Digestiva
34
O duodeno tem a forma da letra “C”, uma vez que se curva ao redor da cabeça do pâncreas. Por norma,
tem um comprimento de, aproximadamente, 20 a 25 cm e localiza-se entre o piloro e a junção
duodenojejunal, ou curvatura duodenojejunal [83].
Como se pode observar na Figura 3.14, o duodeno subdivide-se ainda em 4 partes: parte superior (DI),
parte descendente (DII), parte inferior (DIII) e parte ascendente (DIV) [70][83][87]. Como já foi referido
anteriormente na secção 3.3 , num exame de EDA só é visualizado o duodeno de DI até DII. Estas duas
partes podem ser caracterizadas a seguinte forma [70][83][87]:
Parte superior (DI): é também designada por bolbo duodenal ou ampola, é uma das partes curtas
(aproximadamente 5 cm), estende-se do piloro ao colo da vesícula biliar e encontra-se numa posição
anterior e lateral ao corpo da primeira vértebra lombar (L1).
Parte descendente (DII): é a parte mais longa (aproximadamente 7 a 10 cm) e localiza-se à direita
da coluna vertebral, estende-se da vértebra L1 até à extremidade inferior de L3. A 2ª porção é
constituída pela ampola de Vater, ou papila duodenal maior – ponto de união do ducto pancreático
e do ducto biliar comum - e, também, pela papila duodenal menor - pequena protuberância para o
ducto pancreático acessório, encontra-se a 2 ou 3 cm da ampola de Vater.
Figura 3.14 – Anatomia do duodeno (retirado de [90]).
CAPÍTULO 3. Endoscopia Digestiva
35
A parte superior e a parte descendente são regiões distintas, pela forma da mucosa. Em DI a mucosa é lisa
e apresenta uma colocação rosa clara. Já em DII, a mucosa apresenta pregas circulares, ou pregas de
Kerckring. Neste caso, na Figura 3.15 observam-se as duas partes do duodeno envolventes na EDA, DI e
DII, respetivamente.
(A) (B)
Figura 3.15 – Mucosa do duodeno em: (A) DI e (B) DII (retirado de [80]).
Clinicamente, a parte superior do duodeno é importante, visto que é o local em que são encontradas a
maioria das úlceras duodenais.
3.4 ENDOSCOPIA DIGESTIVA BAIXA
A Endoscopia Digestiva Baixa (EDB), também designada de Colonoscopia, permite investigar o reto, o
intestino grosso, podendo também chegar-se a observar o íleo do intestino delgado [91]. Na Figura 3.16
verifica-se a representação de uma EDB. Assim como na EDA, esta técnica é, também, realizada por um
gastrenterologista, tendo uma equipa de enfermeiros e auxiliares com formação especializada [71].
Antes de um procedimento invasivo, como é o caso da EDB, é essencial obter-se completo consentimento
do paciente, devido às potenciais complicações que lhe estão associadas, como perfurações feitas com o
colonoscópio ou através de uma elevada pressão de ar insuflado, sangramento e infeções, entre outras. De
forma a realizar um diagnóstico correto é essencial uma limpeza intestinal perfeita e, ainda, que o
gastrenterologista tenha treino e experiência adequados. Geralmente, para assegurar o máximo conforto do
paciente, este procedimento é feito sob uma leve sedação com um analgésico adicionado, pois
posteriormente pode causar dor devido ao excesso de insuflação. Trata-se de um exame cuja duração é em
média de 30 minutos, variando entre os 20 minutos e 1 hora [73][91][92][93].
CAPÍTULO 3. Endoscopia Digestiva
36
O exame inicia quando é inserido um colonoscópio pelo ânus do paciente, que se encontra deitado na
posição de decúbito lateral esquerdo. Este colonoscópio é semelhante ao endoscópios utilizado na EDA,
com a diferença de ser mais longo, ter maior diâmetro e um eixo mais flexível. Assim como o endoscópio,
na extremidade, tem uma pequena fonte de luz e uma câmara de vídeo, que vai transmitir, em tempo real,
imagens para um monitor, permitindo acompanhar essa mesma imagem e registar todas as lesões ou
patologias que forem encontradas à medida que o colonoscópio progride no TGI baixo. Estas imagens podem
ser ainda gravadas e impressas. Durante o exame o médico vai insuflando ar através do colonoscópio que
permite a distensão do cólon, a progressão e a correta observação da mucosa [27][92].
Figura 3.16 – Representação de uma Colonoscopia (retirado de [94]).
As indicações para a realização de uma EDB são divididas em quatro grupos, como a EDA: sintomas,
doenças, verificar o estado de e colheita de amostras. Alguns exemplos de sintomas são diarreia, desconforto
ou dor abdominal, alterações dos hábitos intestinais, entre outros. Já as doenças que podem ser
diagnosticadas, excluídas e monitorizadas são pólipos, cancro do cólon e reto, diverticulose, colite isquémica,
entre muitas outras. Este é o exame escolhido para muitas indicações clínicas e de exames de rastreio e
vigilância de cancro do cólon e reto. Quando se fala de verificação do estado pode-se referir a pré e pós
operatório, vigilância, entre outros. Por fim, a colheita de amostras indica que foram realizados exames
apenas para recolher amostras [61]. Na Figura 3.17 encontram-se alguns exemplos de possíveis achados
endoscópicos diagnosticados através desta técnica.
CAPÍTULO 3. Endoscopia Digestiva
37
Figura 3.17 – Exemplos de diagnósticos obtidos através de Colonoscopia (retirado de [95]).
3.5 ANATOMIA DO TRATO DIGESTIVO BAIXO
Como já foi referido anteriormente, a EDB é iniciada pela introdução de um colonoscópio através do ânus
do paciente, permitindo a observação de toda a região gastrointestinal inferior. Esta pode ser subdividida
em três segmentos principais: cego, cólon e reto e tem cerca de 1,5 a 1,8 m de comprimento e 7 cm de
diâmetro [86][87][96]. Na Figura 3.18 observa-se a cores diferentes: a verde alface, o cego, a verde água,
o cólon e a lilás, o reto.
Figura 3.18 – Anatomia geral do intestino grosso e os três segmentos: cego (verde alface), cólon (verde água) e reto (lilás) (retirado de [96]).
Nas subseções que se seguem são apresentadas as principais características anatómicas, fisiológicas e
histológicas dos segmentos referidos anteriormente.
CAPÍTULO 3. Endoscopia Digestiva
38
3.5.1 CEGO
O primeiro segmento do intestino grosso é o cego (do latim, caecus). Inicia na porção inferior direita da
cavidade abdominal, onde se encontra uma saliência tubular (o apêndice vermicular), e vai até ao início do
cólon ascendente, passando pela junção do íleo com o cego (Figura 3.19). Diz-se que o cego é uma
continuação do intestino delgado, através da junção do íleo com o próprio cego, denominada de válvula
ileocecal, cuja função é impedir o refluxo de conteúdos fecais do cólon para o intestino delgado.
Normalmente, a válvula ileocecal resiste a uma pressão inversa de aproximadamente 50 a 60 cm de água.
A principal função do cego é a absorção de água e de sais [83][96][97].
O cego tem a forma de uma bolsa, ou saco, e tem cerca de 6 a 7,5 cm de comprimento e o mesmo de
largura. Este pode ser palpável, quando se encontra distendido por fezes ou ar, através da parede abdominal
[83][96].
Figura 3.19 – Visão anatómica e do íleo (retirado de [90]).
Como visto anteriormente, o gastrenterologista tem que estar devidamente familiarizado com a aparência
normal da mucosa do TGI baixo, que por norma é rosa pálido [70]. Neste caso, na Figura 3.20 observam-
se: o cego, o lúmen do apêndice vermicular e a válvula ileocecal.
CAPÍTULO 3. Endoscopia Digestiva
39
(A) (B) (C)
Figura 3.20 – Visualização do cego em diferentes locais: (A) cego, com a visualização de uma pequena fenda, onde se encontra o apêndice vermicular; (B) lúmen do apêndice vermicular; (C) cego e visualização válvula ileocecal (retirado de [91]).
3.5.2 CÓLON
O cólon (do grego, kólon) é o maior segmento do intestino grosso e é um tubo elástico que está
compreendido entre o cego e o reto. As suas principais funções são essencialmente de absorção de água,
eletrólitos e de alguns nutrientes do quimo para formar as fezes sólidas e de armazenamento do conteúdo
fecal até que este seja expelido. É rico em bactérias, sendo que algumas delas produzem gases ao
absorverem alguns dos nutrientes que não são absorvidos pelo intestino delgado [97][98].
O cólon pode ser dividido em várias regiões distintas, que circundam o intestino delgado [83][86][99], como
se verifica na Figura 3.21:
Cólon ascendente: desloca-se do cego para cima em direção ao rim do lado direito. No ponto mais
alto faz um ângulo reto, de 90º, com o cólon transverso, formando a flexão hepática, ou flexão cólica
direita.
Cólon transverso: desloca-se da flexão hepática até à flexão esplénica, ou flexão cólica esquerda,
percorrendo a cavidade abdominal da direita para a esquerda até chegar à altura do baço.
Cólon descendente: vai desde a flexão esplénica, para baixo na direção esquerda da cavidade
abdominal, até ao cólon sigmoide.
Cólon sigmoide: é a última porção do cólon, tem a forma de um “S” e termina quando inicia o reto.
CAPÍTULO 3. Endoscopia Digestiva
40
Figura 3.21 – Projeção do intestino grosso no esqueleto e as suas principais divisões anatómicas (retirado de [90]).
A mucosa da totalidade do cólon tem uma tonalidade rosa pálida, podendo chegar a ter um tom mais escuro
de rosa no cólon sigmoide (Figura 3.22) [70].
(A) (B) (C)
Figura 3.22 – Visualização de três dos quatro segmentos do cólon: (A) ascendente; (B) transverso; (C) sigmoide (retirado de [91]).
3.5.3 RETO
O reto (do latim, rectum) é o segmento terminal e fixo do TGI baixo. Localiza-se entre o cólon sigmoide e o
ânus e está contido na cavidade pélvica, posteriormente e à esquerda [83].
O reto pode ser dividido em duas regiões: na ampola retal e no ânus, última região do TGI baixo (Figura
3.23). Apesar do seu nome ser reto são observáveis três ou quatro dobras ao longo do segmento,
denominadas válvulas retais. Estas impedem que as fezes passem juntamente com gases. Para além disso,
a ampola retal é uma área altamente expansível que funciona como reservatório. Já o ânus é constituído
CAPÍTULO 3. Endoscopia Digestiva
41
por dois esfíncteres: um esfíncter anal interno composto por músculo liso, com contrações involuntárias e
um esfíncter anal externo composto por músculo esquelético, com contrações voluntárias. Estes controlam
a abertura do ânus, para a saída das fezes [86][96].
Num adulto, o reto endireita apenas quando a ampola retal é distendida com fezes. Numa criança, o reto
encontra-se aproximadamente em linha reta [90].
Figura 3.23 – Anatomia do reto e ânus (retirado de [93]).
A aparência normal da mucosa do reto vai depender da idade do paciente e da preparação utilizada para
realização de uma EDB. A transição do cólon sigmoide para o reto é frequentemente identificada por uma
mudança súbita da mucosa. Por norma, a mucosa do reto tem uma tonalidade rosa pálida e, como se
verifica na Figura 3.24, é muito vascularizada [70][91].
(A) (B)
Figura 3.24 – (A) Visualização da mucosa do reto e (B) do padrão vascular proeminente no mesmo (retirado de [91]).
CAPÍTULO 3. Endoscopia Digestiva
42
Capítulo 4
MYENDOSCOPY
CAPÍTULO 4. MyEndoscopy
44
4.1 INTRODUÇÃO
Os avanços tecnológicos têm permitido a evolução da Informática Médica, não só nas Unidades de Saúde,
mas também para efeitos de investigação científica. Como tal, têm sido permanentemente desenvolvidos
sistemas cujos objetivos incluem a disponibilização e gestão de informação relevante sobre os cuidados de
saúde, bem como a monitorização e promoção da qualidade da prestação dos cuidados de saúde, através
de um apoio contextualizado às decisões médicas. Estes sistemas são denominados sistemas de apoio à
decisão, CADSS, como já foi referido anteriormente. A principal vantagem da incorporação de sistemas
deste tipo é a constante preocupação de melhorar a precisão do diagnóstico médico e, ainda, a utilização
dos meios complementares de diagnóstico e terapêutica existentes até à data [3][100].
Em Portugal, a integração de CADSS nas Unidades de Saúde encontra-se num estado de desenvolvimento
avançado [7]. No entanto, ainda existem muitas lacunas por preencher, no que toca ao desenvolvimento de
sistemas que permitam o apoio ao diagnóstico ou apenas o suporte, principalmente no serviço de
gastrenterologia.
É neste sentido que se justifica o desenvolvimento e introdução de um CADSS que alcance a melhoria da
qualidade de imagem, através da eliminação de informação deteriorada e não relevante, e a detetando-se
apenas as regiões de interesse e relevantes para o diagnóstico [101]. Para o desenvolvimento desta
dissertação é necessário conhecer-se o estado da arte existente, tanto a nível da comunidade científica como
comercial, de forma a serem identificadas lacunas e possíveis soluções para as mesmas. Deve ainda ter-se
em conta o contexto no qual esta dissertação é inserida, desenvolvendo este assunto nas últimas secções
deste capítulo.
Este capítulo divide-se ainda em quatro secções. Na primeira secção é feita uma revisão à literatura
relativamente aos sistemas de apoio à decisão para o diagnóstico médico, destacando os sistemas que
envolvem as mais diversas técnicas de Endoscopia. Na secção seguinte são apresentadas algumas soluções
comerciais existentes. Na terceira secção é estudado o sistema proposto e desenvolvido por Laranjo et al.
[15], denominado MyEndoscopy. Por fim, é contextualizado o módulo proposto integrado no sistema
MyEndoscopy, denominado MIVprocessing, que envolve o processamento de vídeos endoscópicos [101].
CAPÍTULO 4. MyEndoscopy
45
4.2 TRABALHO RELACIONADO (CONTEXTUALIZAÇÃO)
Nesta secção é apresentado uma revisão da literatura referente aos sistemas apresentados anteriormente,
CADSS, bem como aos sistemas de apoio ao diagnóstico, CAD, e aos seus respetivos módulos, com
exemplos para além da especialidade de gastrenterologia e das técnicas convencionais, EDA e EDB.
Assim, é possível começar a compreender a construção da arquitetura geral do MyEndoscopy e dos seus
módulos, uma vez que o planeamento dos mesmos teve como base elementos provenientes de sistemas
encontrados na literatura prévia.
Os objetivos desta revisão da literatura basearam-se na identificação da presença ou ausência dos módulos
propostos no sistema MyEndoscopy – aquisição, armazenamento, processamento e difusão de dados –,
assim como na verificação de limitações das funcionalidades existentes nesses sistemas, tendo em conta o
módulo de processamento como papel principal.
É importante destacar que os sistemas que têm a capacidade de processar automaticamente dados
endoscópicos, têm um elevado potencial na deteção de regiões de interesse ao longo do TGI [102].
Apresentam-se dois exemplos de sistemas CAD aplicados às técnicas Colonoscopias Virtuais e às
Colonoscopias Óticas.
Summers et al. [103] propuseram um sistema CAD de alto rendimento para analisar CTCs, ou Colonografia
por TC. O sistema permite a análise de inúmeros parâmetros e algoritmos com o objetivo de localizar
automaticamente possíveis pólipos. Assim, é criado um laboratório automatizado para testar a multiplicidade
de diferentes parâmetros que podem ser importantes para se obter diagnósticos corretos, podendo também
determinar-se a sensibilidade e especificidade do sistema CAD. Este centra-se, principalmente, na forma da
superfície do cólon e na espessura da sua parede. Os objetivos do sistema são a extração de características,
registo do tempo de processamento, a capacidade de gerar arquivos para automatização das tarefas e
verificação automática da correspondência de deteções de cancro com registos existentes e dados como
verdadeiros. Este sistema lê imagens em formato DICOM [103] (do inglês, Digital Imaging and
Communications in Medicine) – é a norma internacional para formatação de imagens médicas e informações
relacionadas (ISO 12052) [104].
Já Lee et al. [105] basearam-se no sistema de Summers et al. [103], desenvolveram um sistema CAD para
análise de CTCs e de Colonoscopias Óticas (método convencional), com a diferença de possibilitar a
CAPÍTULO 4. MyEndoscopy
46
segmentação da parede do cólon, a deteção de pólipos através de uma característica volumétrica específica,
a contagem de clusters de volumes e o thresholding dos mesmos. Os tamanhos dos pólipos obtidos, por
Colonoscopia Ótica, foram usados como medidas de referência. O conjunto de dados de CTCs foi de um
total de 103 pólipos, divididos em conjuntos de dados para treino e para teste. O sistema CAD foi
desenvolvido para pólipos clinicamente relevantes (≥ 6 mm) da análise resultaram 100% em 8,5% Falsos
Positivos (FP) por paciente, utilizando o conjunto de dados de treino e, 93,3% em 7,7% FP por paciente,
utilizando o conjunto de dados de teste [105].
Assim como na TC, na Endoscopia também se pretende obter características a partir de imagens ou vídeos,
recorrendo a técnicas de processamento de imagem. Assim, o investigador pode tornar o seu trabalho mais
preciso, melhorando deste modo os resultados da Endoscopia.
No ano de 2007, Sawhney em [106] propôs uma solução baseada numa arquitetura orientada para a
aquisição, pré-processamento, arquivo, processamento e difusão de dados, como é possível observar-se na
Figura 4.1. Com o intuito de, primeiramente, se conceber um protótipo capaz de assegurar todas estas
tarefas e, de seguida, disponibilizar e partilhar a informação entre todos os dispositivos deste género ligados
ao sistema, permitindo também o acesso a determinada informação a partir de outro tipo de dispositivos,
que por sua vez podem tirar partido de certas funcionalidades disponibilizadas em interfaces próprias.
Figura 4.1 - Fluxo de um sistema de aquisição, pré-processamento, arquivo, processamento e difusão de dados (retirado de [106]).
Em 2009, Mirota et al. [107] surgiram com um sistema CADSS capaz de realizar a reconstrução 3D da
base do crânio, para ser utilizado em cirurgias endoscópicas endonasais (Figura 4.2).
CAPÍTULO 4. MyEndoscopy
47
Esta reconstrução permite controlar diretamente a posição do endoscópio através de vídeo e de imagens de
TC. Inicialmente, é captada a Endoscopia endonasal à qual vão ser extraídas características essenciais para
a visualização do resultado final. De seguida, estima-se o movimento existente entre frames e a geometria
é reconstruída a partir de pontos característicos. Sendo que estes pontos característicos são registados no
início da sequência do vídeo, a partir do primeiro par de imagens obtidas, numa superfície segmentada de
uma imagem de TC. Este registo é usado para inicializar um algoritmo de tracking que faz a comparação
com posteriores frames.
Figura 4.2 – Visão geral do sistema (retirado de [107]).
Posteriormente em 2011, Liedlgruber e Uhl [100] desenvolveram um sistema CADSS com o objetivo de
obter um diagnóstico, em que é utilizada a mais recente técnica endoscópica, a Endomicroscopia Confocal,
que permite a obtenção de imagens de alta-resolução da camada mucosa do TGI. Esta técnica baseia-se na
iluminação da mucosa com um laser, que é absorvido por um agente fluorescente, sendo depois captada a
luz refletida [108]. Na Figura 4.3 verificam-se as diversas etapas que constituem este sistema. Uma vez que
a técnica envolvida baseia-se em luz fluorescente, o tecido a ser examinado é geralmente tratado com
corantes fluorescentes. Depois da preparação do tecido a ser observado e da aquisição das imagens, segue-
se o pré-processamento. Este permite melhorar a qualidade de imagens possivelmente degradadas.
Dependendo do objetivo da aplicação verifica-se se têm as características adequadas para serem localizadas
e extraídas. Às vezes, um pós-processamento dos recursos é também necessário (e. g., remoção de
combinações de características inválidas no caso de características de alto nível). Se o sistema de apoio à
decisão é direcionado para a classificação de pólipos ou cancro são definidas as características a ser
utilizadas para classificação da imagem, utilizando um classificador previamente treinado. Existem também
outros sistemas que baseiam diretamente as suas decisões sobre as características sem utilizar um
classificador intermediário (e.g. thresholding de características) [100].
CAPÍTULO 4. MyEndoscopy
48
Figura 4.3 – Ilustração do sistema de apoio à decisão e das etapas comuns que podem ser envolvidas, a laranja estão as etapas opcionais deste sistema (retirado de [100]).
Ainda no ano de 2011, Ayoub et al. [109] propuseram um sistema semelhante ao de Liedlgruber e Uhl
[100], referenciado anteriormente. A técnica aplicada para aquisição de dados é a WCE. Esta solução
demonstra alta eficiência no que toca à reconstrução e reconhecimento de formas em 3D, através de um
sensor de visão em 3D, baseado na técnica de visão stereo ativa – utilizada para análise 3D gerada por
duas imagens capturadas por duas câmaras no mesmo instante. A integração da funcionalidade de
reconhecimento permite aumentar a autonomia da cápsula endoscópica, reduzindo o consumo de energia
durante a transmissão, o que representa a maior parte da energia consumida pelo sensor sem fio (wireless)
da mesma [109].
O sensor de visão em 3D está continuamente a ser otimizado de forma a melhorar a sua tarefa de
classificação dos dois tipos de pólipos encontrados no cólon, hiperplásicos e adenomatosos. Este sistema
tradicional de reconhecimento de padrões divide-se em quatro fases principais: aquisição de dados, extração
e seleção de características, classificação e avaliação, como se verifica na Figura 4.4 [109].
Figura 4.4 – Fluxo de um sistema tradicional de reconhecimento de padrões (retirado de [109]).
Um dos blocos de maior importância é o de Processamento para um sistema CADSS ou CAD, uma vez que
se deve ter em conta todas as etapas necessárias para processar imagens ou vídeos, para
consequentemente serem obtidas conclusões acerca dos dados. Na Figura 4.5 pode-se observar o modelo
criado por Annadurai e Shanmugalakshmi [110]. Este baseia-se na aquisição de imagem ou vídeo, seguido
CAPÍTULO 4. MyEndoscopy
49
do pré-processamento, segmentação, representação e extração de características, reconhecimento e
interpretação e, por fim, a apresentação dos resultados. Sendo que a cada passo a informação vai sendo
comparada com uma base de conhecimento existente [110].
Figura 4.5 – Passos fundamentais num módulo de processamento (retirado de [110]).
Já na Figura 4.6, encontra-se o sistema CADSS proposto por Moeslund [111]. O sistema inicia igualmente
com a aquisição da imagem ou vídeo e termina com uma tarefa de classificação do conteúdo da informação
processada. Este é um sistema de interface entre humano e computador, baseia-se em gestos e funciona
com o intuito de contabilizar o número de dedos de um utilizador que esteja em frente à câmara de aquisição
[111].
Figura 4.6 – Diagrama de blocos de um sistema que trabalha com vídeos e imagens, com exemplos das funções de cada bloco (retirado de [111]).
4.3 SOLUÇÕES COMERCIAIS
É de elevada importância não só conhecer-se o estado da arte relativo aos CADSS, ou aos CAD existentes e
mais recentemente desenvolvidos, como também saber quais as soluções comerciais existentes no mercado
e que são utilizadas nos serviços de gastrenterologia.
CAPÍTULO 4. MyEndoscopy
50
Nas subseções seguintes são referidos exemplos de sistemas de Endoscopia, cada um dos sistemas
analisados tem funcionalidades comuns, como a aquisição e o arquivo de dados, e funcionalidades
específicas dos mesmos.
O objetivo deste estudo baseou-se na identificação da presença ou ausência dos módulos propostos no
sistema MyEndoscopy – aquisição, armazenamento, processamento e difusão de dados –, assim como na
verificação de limitações das funcionalidades existentes, para posteriormente serem implementadas de
outra forma, melhorando a sua eficiência. Destaca-se que a maioria das soluções comerciais atuais não
envolve processamento dos dados, desta forma condicionando um diagnóstico rápido e eficiente.
4.3.1 DIVAS HD
O DiVAS HD é um sistema desenvolvido pela XION. Este sistema digital fornece opções de gravação, arquivo,
representação e processamento de dados de vídeo HD, em formato H.264/MPEG-4 AVC, podendo também
conter dados de áudio [112].
As gravações são arquivadas nos registos dos respetivos pacientes, como sessões individuais. Em cada
sessão é registada a identificação do profissional de saúde que executou o exame, a data em que este
ocorreu e comentários adicionais, que são editáveis. De cada sessão podem também resultar relatórios
simples, com imagens e medições nas mesmas. O arquivo dos dados é feito em DVDs, em discos rígidos
adicionais ou na rede [112].
O DiVAS HD permite a visualização da Endoscopia em fullscreen. E os vídeos podem ser exibidos como
imagens individuais ou como sequência. Outras funcionalidades importantes são a comparação de dois
vídeos para seguimento imediato de terapias e, por fim, a compatibilidade do sistema DiVAS HD com todos
os outros sistemas DiVAS [112].
A sua interface principal pode ser observada na Figura 4.7.
CAPÍTULO 4. MyEndoscopy
51
Figura 4.7 - Interface da aplicação DiVAS HD (retirado de [112]).
4.3.2 VICTOR HD
O sistema VictOR (abreviado de Video Image Capture Technology in your Operation Room) HD, desenvolvido
por Richard Wolf, dispõe de manuseamento fácil e intuitivo através de um ecrã sensível ao toque. Tem como
funcionalidades o registo dos dados do paciente, a captura de imagens individuais, a gravação de vídeo e
áudio, a edição de imagens e vídeo e o arquivo dos mesmos. A gravação é de alta qualidade e eficiência,
uma vez que é feita em Full HD 1080p e o codec utilizado é o H.264. Este sistema permite, ainda, o
armazenamento dos dados, imagens individuais ou sequências de vídeo, em tempo real em USB, DVD,
discos Blu-Ray, ou na rede interna [113].
Na Figura 4.8 pode ser visualizada a interface deste sistema.
Figura 4.8 – Interface da aplicação VictOR HD (retirado de [113]).
CAPÍTULO 4. MyEndoscopy
52
4.3.3 ENDOPRO IQ
O endoPRO IQ é um sistema gestão de imagem e de informação, desenvolvido pela PENTAX, constituído
por um conjunto de vários módulos e utilizado em unidades de Endoscopia [114]. Ademais é um sistema
multiplataforma compatível e pode ser integrado noutros sistemas de informação hospitalares [115].
Esta solução é a primeira base de dados de Endoscopia completamente pesquisável. Os módulos integrados
permitem lidar com a gestão da informação dos pacientes, através de cronogramas, agendamento e
acompanhamento de pacientes e equipamentos médicos durante todas as etapas do processo, desde a
chegada até a alta. Para além disso, suporta a observação de procedimentos individuais ou duplos, gerando
relatórios automaticamente acerca dos mesmos e anotações de enfermagem. E, como referido,
anteriormente, tem a capacidade de maximizar a gestão de imagem, através do módulo Motion Picture
Studio. Este permite a captura, o armazenamento e a anotação de imagem, vídeo de longa duração e trechos
de vídeo endoscópicos, em HD ou SD, para posterior integração nos relatórios ou pesquisa dos vídeos,
previamente catalogados, através de palavras-chave [116].
Na Figura 4.9 encontra-se um exemplo do que se pode observar na interface desta solução.
Figura 4.9 – Interface da solução endoPRO IQ (retirado de [114]).
4.3.4 DOCBASE GASTRENTEROLOGIA
A solução DOCbase Gastrenterologia foi desenvolvida por uma empresa portuguesa, a Mobilwave, e é um
módulo de uma plataforma de especialidades, a DOCbase, sendo direcionada para a respetiva especialidade
CAPÍTULO 4. MyEndoscopy
53
clínica, neste caso a gastrenterologia. As diversas soluções dispõem de um tronco funcional comum, ao
qual são acrescidas as especificidades de cada especialidade [117].
Esta aplicação tem como funcionalidades comuns: o registo dos dados do paciente e de cada exame ou ato
clínico; produção e arquivo de relatórios dos diferentes exames com integração de imagem; gravação de
vídeo e captação direta de imagens e de frames do vídeo, arquivando-os automaticamente no registo do
paciente; análise comparativa de evolução através de imagens recolhidas em diferentes exames; a produção
de CDs para o paciente com relatório, imagens e vídeos; a integração e interoperabilidade com outros
sistemas existentes, entre outras [117].
Para além das funcionalidades comuns referidas anteriormente, a solução DOCbase para gastrenterologia
abrange especificidades como a disponibilização da MST para Endoscopia, entre outras. E, tem a
capacidade de registar diversos atos clínicos, entre os quais: Biópsia Hepática Percutânea, Colonoscopia
total e esquerda, EDA, Endoscopia para Balão Intragástrico, Gastrostomia Percutânea Endoscópica [117].
Na Figura 4.10 observa-se a interface da solução para a especialidade de gastrenterologia.
Figura 4.10 – Interface principal da aplicação DOCbase Gastrenterologia (retirado de [117]).
4.3.5 SIIMA GASTRO
O SiiMA foi desenvolvido pela First Solutions, S.A., uma empresa portuguesa. Este engloba um conjunto de
aplicações direcionadas para a gestão de MCDT em diversas áreas clínicas. A sua arquitetura é suportada
por uma plataforma base e por módulos verticais para cada uma das especialidades abrangidas, como é o
caso da gastrenterologia [118].
CAPÍTULO 4. MyEndoscopy
54
O módulo SiiMA Gastro permite a gestão administrativa e clínica de exames e atos clínicos realizados num
serviço de gastrenterologia, a integração com equipamentos médicos e PACS para gestão de imagens
médicas e incorpora suporte para algumas modalidades, como EDA, EDB, CPRE, Ecoendoscopia,
Endoscopia por Cápsula, Proctologia, Biópsia Hepática e Enteroscopia por balão [118].
Neste módulo podem ainda ser encontradas várias funcionalidades como a aquisição de imagens e vídeo,
registar anotações e medições nas imagens, produção de relatórios específicos para cada modalidade e de
estatísticas relativas aos dados clínicos e à produção, gravação de dados de vídeo em CD e DVD e editor de
gráficos de pólipos, entre outras [118].
A sua interface principal pode ser observada na Figura 4.11.
Figura 4.11 – Interface principal do SiiMA Gastro (retirado de [118]).
4.4 ARQUITETURA DO SISTEMA
O sistema MyEndoscopy desenvolvido por Laranjo et al. [15] é bastante complexo, pois integra diversos
módulos e liga diversas Instituições de Saúde e utilizadores. Este sistema pode ser utilizado por qualquer
profissional de saúde de uma Instituição, desde que esteja previamente registado e autorizado para tal. O
facto de ter sido projetado para ligar Instituições beneficia da estandardização do processo clínico dos
pacientes, salientando os dados clínicos dos serviços de gastrenterologia.
CAPÍTULO 4. MyEndoscopy
55
Na Figura 4.12 observa-se a sua arquitetura geral, com todos os módulos que o sistema contém. Este deve
permitir a aquisição, arquivo, processamento e difusão dos dados obtidos por Endoscopia, nomeadamente
por EDA e EDB.
A arquitetura do sistema foi implementada com base em conceitos de computação em nuvem, tal permite
que não só existam componentes centralizados, como também distribuídos por várias Instituições. À medida
que mais Instituições usam estes serviços, os custos destes serviços podem ser mantidos sob controlo se
estas clouds forem partilhadas entre si, permitindo um aumento de economias de escala [15].
O componente fundamental desta arquitetura é a MIVbox, integra-se no sistema MyEndoscopy e é compatível
com dispositivos existentes, como endoscópio, processador de vídeo e fonte de luz. Cada MIVbox tem a
capacidade de receber o vídeo resultante do procedimento endoscópico, permitir a manipulação, a sua
transmissão em tempo real e o arquivo do mesmo. Os utilizadores podem aceder aos dados relativos a cada
paciente através de uma interface Web em qualquer dispositivo com um browser [15].
Figura 4.12 – Arquitetura geral do sistema MyEndoscopy (adaptado de [15]).
É de realçar que a solução proposta tem como objetivo alcançar melhorias no que toca à [15]:
Acquisition Hardware
MIVbox_1
WorkStation
MIVacquisition
0:00 / 4:59
0:00 / 4:59
MIVstream
MIVengine
VideoAPI
Remote
Storage
MIVbox_2 MIVbox_3
S
Worklist/Write report
Procedure Execution
Search for similar cases
Exams upload
Schedule video streaming
S
ApplicationServer
MIVstation
Stre
amin
g
MyHealth
MIVarchive
Local Storage
Video
Frames
Report
MIVprocessing
ApplicationServer
MIVstream
MIVstation
MIVcontrol
CAPÍTULO 4. MyEndoscopy
56
Qualidade dos cuidados de saúde. Esta depende de uma gestão eficiente e global de informação,
permitindo a realização de um diagnóstico devidamente apoiado e evitando a repetição de
procedimentos endoscópicos;
Qualidade e quantidade da informação disponível aos profissionais de saúde, independentemente
do local onde são realizadas as consultas e os relatórios. Torna-se possível que um profissional de
saúde acompanhe remotamente a realização do procedimento endoscópico, podendo dar a sua
opinião pessoal em tempo real, uma vez que o sistema apresenta uma solução para a integração
de especialistas adicionais para a equipa (via streaming), se necessário;
Gestão de recursos, devido à ampla compatibilidade, versatilidade e portabilidade da MIVbox, com
o equipamento usado em Endoscopia.
O módulo de processamento, MIVprocessing, observado na Figura 4.14, tem como objetivo a
implementação de funcionalidades para manipulação do vídeo endoscópico, de forma a facilitar o
diagnóstico por parte do médico.
4.5 MIVPROCESSING
O módulo de processamento, cujo nome é MIVprocessing, foi concebido com a capacidade de agrupar
várias tarefas numa única estrutura [101]. O MIVprocessing está integrado na MIVbox e, por conseguinte,
no sistema MyEndoscopy desenvolvido por Laranjo et al. [15] e, analisado, anteriormente, na secção 4.4 .
Na Figura 4.13 observa-se um exemplo de um fluxo de trabalho de uma consulta de gastrenterologia,
constituído por vários momentos. Este fluxo de trabalho inicia quando o paciente tem certos sintomas e
decide marcar uma consulta médica. No Momento 1, consulta médica, o médico regista dos dados do
paciente e, havendo necessidade, prescreve um MCDT. O Momento 2 envolve o procedimento endoscópico
que é essencial para a realização de um diagnóstico. No Momento 3, é gerado o relatório do procedimento
efetuado. E, no Momento 4, o médico consulta os resultados e informa o paciente dos mesmos. Verifica-se
que a solução MIVprocessing pode ser perfeitamente integrada no fluxo de trabalho, através da realização
de algumas tarefas de processamento adicional aos dados obtidos no procedimento, ajudando o médico a
realizar o diagnóstico [101].
CAPÍTULO 4. MyEndoscopy
57
Figura 4.13 – Fluxo de trabalho de uma consulta de gastrenterologia (retirado de [101]).
Para além da capacidade de agrupar várias tarefas numa única estrutura, o MIVprocessing tem como
principal objetivo facilitar o processamento, a análise e interpretação e a visualização de imagens ou vídeos
endoscópicos, de forma mais precisa e eficiente.
O MIVprocessing resulta da fusão de dois tipos de sistemas, os sistemas CAD e os chamados sistemas de
suporte, e das respetivas tarefas que cada um deles executa. O sistema de suporte engloba as tarefas que
vão apoiar o sistema CAD, ou seja, inclui os métodos que não fornecem diretamente apoio à decisão, apenas
permitem a melhoria da qualidade de imagem e a reparação de imagens degradadas ou não-relevantes
[100]. O sistema de suporte é dividido em três tarefas, Redução do Vídeo (do inglês, Video Summarization),
Pré-Processamento e Pré-Deteção. Já o sistema CAD é constituído pelas tarefas de Segmentação, Extração
de Características e Classificação [101].
Na Figura 4.14 é apresentada a arquitetura do MIVprocessing, de forma detalhada, ilustrando as etapas que
ocorrem desde a aquisição do vídeo até ao arquivo do mesmo, passando pelas etapas de processamento
referidas anteriormente.
A primeira tarefa executada após a aquisição é a Redução do Vídeo, nesta pretende-se a diminuição do
tamanho de armazenamento e do tempo real do vídeo endoscópico, eliminando frames com informação
não-relevante para o diagnóstico, como o caso de frames iniciais e finais relativos ao exame, capturados
fora do TGI a investigar, frames guardados após o término do exame (de cor preta), de informação desfocada.
Segue-se a etapa do Pré-Processamento que tem como finalidade filtrar novamente o vídeo e eliminar ou
corrigir informações que podem prejudicar a realização de um diagnóstico correto, como a presença de
ruído na imagem e de regiões de reflexão especular (brilhos), respetivamente.
O output destas duas etapas é uma versão reduzida do vídeo original que vai ser armazenada juntamente
com o material resultante do exame.
CAPÍTULO 4. MyEndoscopy
58
A terceira e última tarefa do sistema de suporte é a Pré-Deteção, pretende identificar os frames que contêm
a presença do endoscópio e de bolhas e de sucos gastroinstestinais, localizar o lúmen e identificar os
diferentes órgãos, observados tanto na EDA como na Colonoscopia.
A primeira etapa do sistema CAD é a Segmentação. Esta pretende que um elemento dado como input (e.g.
imagem ou vídeo) seja dividido nos seus componentes. O principal objetivo é distinguir o fundo da imagem,
a partir da delimitação de objetos, no entanto esta etapa pode estar diretamente ligada à etapa de Extração
de Características, pois o algoritmo utilizado para extrair características pode incluir a Segmentação da
imagem.
A última etapa envolve a Extração de Características e a Classificação. O processo de Extração de
Características é utilizado para selecionar as características importantes de uma determinada região de
interesse, de forma a, posteriormente, poder classificá-la corretamente. Por fim, o processo de Classificação
atribui uma designação à região de interesse, com base nas características selecionadas previamente.
Figura 4.14 – Arquitetura do módulo MIVprocessing, integrado na MIVbox (retirado de [101]).
Capítulo 5
REDUÇÃO DO VÍDEO ENDOSCÓPICO
CAPÍTULO 5. Redução do Vídeo Endoscópico
60
5.1 INTRODUÇÃO
Um dos grandes fatores limitativos da análise de vídeos de Endoscopia é o tempo de duração dos mesmos.
Apesar de o tempo de duração de um exame de EDA variar entre os 2 e os 32 minutos e de uma EDB entre
os 20 minutos e 1 hora [26][27], a captura do vídeo endoscópico, muitas vezes, inicia e termina fora do TGI
do paciente, podendo capturar a sala de execução do exame e o ambiente que a rodeia, bem como alguns
instrumentos médicos. O vídeo relativo ao exame, gravado para posteriormente ser visualizado e analisado,
é uma representação de tudo o que foi visualizado em tempo real e, até então, não é aplicado qualquer tipo
de processamento.
Todo o tempo do vídeo endoscópico que não seja relativo ao TGI não tem qualquer relevância para o
diagnóstico. Consequentemente, como referido anteriormente, para o profissional de saúde, as tarefas de
visualização e análise podem-se tornar morosas, não só pelo tempo total da gravação dos exames, mas
também devido ao elevado número de vídeos que este tem que analisar. Quanto maior for o tempo total e
o número de vídeos endoscópicos, maior será a probabilidade de o profissional de saúde realizar
diagnósticos pouco precisos, subjetivos ou até mesmo erróneos, podendo alguns achados endoscópicos
passar despercebidos. Pois, se a carga de trabalho for excessiva e prolongada, a sua performance vai
diminuindo ao longo do tempo, podendo resultar num aumento do número de erros nas tarefas a serem
realizadas [28]. Outro fator limitativo de diagnósticos corretos é a possível falta qualidade da imagem,
podendo ser encontradas muitas imagens ou frames desfocados.
É neste sentido que surge a motivação para a implementação de algoritmos de processamento com a
finalidade de gerar um vídeo reduzido, que contenha apenas informação relevante, tendo ainda em conta
que parte desta não foi eliminada. Como tal, foram desenvolvidas metodologias computacionais inovadoras,
de maneira a otimizar o tempo de análise despendido pelo profissional de saúde.
A Redução de Vídeo é a primeira tarefa do módulo MIVprocessing, do sistema MyEndoscopy. Na Figura 5.1
encontra-se destacada a primeira tarefa deste módulo. Compreende a eliminação de frames considerados
não relevantes para o diagnóstico realizado pelo profissional de saúde. Estes dados não relevantes podem
ser de vários tipos, entre os quais se destacam: os frames capturados antes e depois da captura do TGI e
os frames desfocados. Após a extração dos frames não relevantes, a tarefa de análise do conteúdo do vídeo
endoscópico, pelo profissional de saúde, torna-se facilitada.
CAPÍTULO 5. Redução do Vídeo Endoscópico
61
Figura 5.1 - Arquitetura do módulo MIVprocessing, integrado na MIVbox, destacando-se os módulos de Redução de Vídeo abordados nesta dissertação (adaptado de [101]).
Nas secções que se seguem é apresentado um estudo relativo aos sistemas que permitem Redução de
Vídeo, tanto na área médica, como na produção de filmes e no desporto. Segue-se a caracterização do
conjunto de dados utilizado ao longo desta dissertação. As restantes secções são referentes às soluções
desenvolvidas nesta dissertação, fazendo alusão ao estado da arte, à própria solução desenvolvida e aos
resultados obtidos.
5.2 ESTADO DA ARTE
Nos últimos anos, com o rápido avanço tecnológico, a análise de vídeo baseada no seu conteúdo tem-se
tornado cada vez mais alvo de atenção [119]. O principal objetivo é obter um vídeo de menor dimensão,
que permita facilitar a pesquisa e a análise, relativamente ao vídeo original [120].
A Redução de Vídeo é um tema abordado tanto na área da Medicina, como na produção de filmes, no
desporto, em aplicações online e de telemóveis, na televisão em 3D e na interativa, entre outros.
CAPÍTULO 5. Redução do Vídeo Endoscópico
62
Seguidamente, são apresentados vários exemplos de soluções de Redução de Vídeo, implementadas para
algumas das áreas referidas.
No que concerne ao desporto, no ano 2005, Takahashi et al. [121] propuseram um método para a Redução
de Vídeo baseado no seu conteúdo semântico, através de metadados, passível de ser utilizado em vídeos
de basebol. A solução passa por classificar cada cena jogo de acordo com sua importância semântica, sendo
que o seu principal objetivo é a obtenção de um vídeo mais curto, que inclua apenas as cenas de jogo mais
importantes do vídeo original. A qualidade dos vídeos resultantes dependem dos conteúdos que o utilizador
pretende incluir no mesmo [121].
No futebol, Zawbaa et al. [122] desenvolveram um sistema para Redução de Vídeo utilizando Support Vector
Machines (SVM). O sistema proposto inicia com a transformação de todo o fluxo de vídeo em pequenos
segmentos de vídeo. De seguida, o algoritmo SVM é aplicado para classificar os segmentos mais importantes,
a partir da legenda que indica o resultado do jogo [122].
No que toca à produção de filmes, Li et al. [119] desenvolveram um sistema de análise baseado no conteúdo
de vídeos, em indexação e em gravação final. O módulo de deteção permite identificar três tipos de eventos:
diálogos entre duas pessoas, entre múltiplas pessoas e eventos híbridos. Segue-se o módulo de identificação
do orador, através da deteção e reconhecimento da face e do seu movimento. O último módulo permite que
os eventos detetados sejam gravados num vídeo final, sob a forma de um pequeno segmento de vídeo, com
a finalidade de facilitar a visualização dos conteúdos do filme [119].
Almeida et al. [123] criaram um sistema para Redução de Vídeo para aplicações online, com a finalidade
de produzir vídeos reduzidos em tempo útil e com uma qualidade razoável. Para tal, propuseram um método
baseado na exploração de características visuais extraídas a partir dos vídeos originais e na implementação
de um algoritmo simples e rápido para resumir o conteúdo dos mesmos [123].
Nas últimas décadas, na área da Medicina têm sido efetuados vários estudos e desenvolvidas várias
soluções e sistemas que permitem a Redução de Vídeo.
Em 2002, Zhu et al. [124] e [125] desenvolveram uma solução, para eliminação de eventos não relevantes
e deteção de conteúdos relevantes, com o intuito de criar vídeos reduzidos para visualização e análise
posteriores. Os eventos a detetar são de três tipos: consulta, diálogo e intervenção clínica. Esta solução é
baseada em técnicas de clustering, agrupando os eventos detetados de forma hierárquica e mediante o seu
grau de semelhança.
CAPÍTULO 5. Redução do Vídeo Endoscópico
63
Mais especificamente, em gastrenterologia foram também desenvolvidos alguns projetos de Redução de
Vídeo. Iakovidis et al. [126], em 2010, propuseram uma solução automática e melhorada para Redução de
Vídeo resultante de exames obtidos por WCE, com base em estudos preliminares realizados pelos mesmos
autores [127]. A solução passa pela implementação de um algoritmo não supervisionado de redução de
dados, aplicado à extração de frames representativos de um vídeo de WCE, estabelecendo restrições de
ortogonalidade. A metodologia proposta proporciona generalidade e independência de qualquer tipo de
treino e apresenta um mecanismo automático para controlo do número de frames a serem extraídos [126].
Mais recentemente, Ismail et al. [128] desenvolveram uma solução para vídeos de Endoscopia, baseada na
aprendizagem não supervisionada e na discriminação de características. A abordagem de aprendizagem
proposta permite a divisão de frames de vídeo por categorias com base em descritores visuais e temporais.
Além disso, gera associações entre frames, reduzindo a influência de frames com ruído no processo de
aprendizagem. O vídeo endoscópico resultante é constituído pelos frames mais relevantes de cada categoria,
sem a presença de frames não relevantes [128].
Em 2014, Mehmood et al. [129] e [130] apresentaram uma solução que permite a extração de frames com
base na sua relevância para o diagnóstico e a remoção de não relevantes. De maneira a eliminar frames
redundantes e sem qualquer tipo de informação relevante, utilizaram a medida de divergência de Jeffrey
entre histogramas de cor, a correlação dos canais de cores e a extração de características com base na
textura, para posteriormente, facilitar a classificação de frames relevantes [130].
5.3 CONJUNTO DE DADOS
No âmbito desta dissertação utilizaram-se 27 vídeos de exames de EDA e de EDB, sendo 23 de EDA e 4 de
EDB, respetivamente, disponibilizados pelo serviço de gastrenterologia do Hospital de Braga e arquivados
no módulo MIVarchive do sistema MyEndoscopy.
Os codec e container destes vídeos são o AVC1 e MP4, respetivamente. No que toca à resolução, todos os
frames apresentam 1920x1080 pixéis, e estão representados no espaço de cor RGB. Relativamente ao
tamanho de armazenamento (em megabytes (MB)), à duração (em segundos (s)), ao bit rate (em kbps), ao
frame rate (em fps) e ao número total de frames, cada vídeo endoscópico tem valores individuais e distintos
uns dos outros. Pala além disso, cada vídeo tem um nome e ainda um identificador. Na Tabela 5.1 é possível
ver-se descriminadas as informações para cada vídeo endoscópico utilizado, desde os respetivos nome,
CAPÍTULO 5. Redução do Vídeo Endoscópico
64
identificador, codec, container, tamanho de armazenamento, duração, bit rate, frame rate e número total
de frames.
Tabela 5.1 – Informação relativa aos vídeos endoscópicos disponibilizados. As células a cor-de-laranja são referentes aos 4 exames de EDB, as restantes 27 correspondem a EDA.
Inicialmente, no conjunto dos 27 vídeos endoscópicos, o tamanho de armazenamento inicial total é de
4640,4 MB, em que 2777,6 MB e 1862,8 MB equivalem aos 23 vídeos de EDA e aos 4 vídeos de EDB,
respetivamente. Contabiliza-se uma duração de 29551 segundos, correspondendo a 17299 segundos para
Nome ID Container Codec Tamanho
(MB)
Duração
(s)
Resolução
(pixéis)
Bit Rate
(kbps)
Frame Rate
(fps)
Frames
Totais
BRAGA01.0001.2013.11.01.18.46.20 EDA001 .mp4 avc1 98,7 516 1920x1080 1524 11,0 5707
BRAGA01.0001.2013.11.19.09.42.21 EDA002 .mp4 avc1 318,7 1964 1920x1080 1295 15,0 29547
BRAGA01.0001.2013.11.19.10.25.29 EDA003 .mp4 avc1 227,6 1639 1920x1080 1107 19,7 32240
BRAGA01.0001.2013.11.19.10.57.23 EDA004 .mp4 avc1 57,4 301 1920x1080 1524 11,1 3357
BRAGA01.0001.2013.11.19.11.16.15 EDA005 .mp4 avc1 32,4 169 1920x1080 1533 11,2 1889
BRAGA01.0001.2013.11.19.11.53.29 EDA006 .mp4 avc1 30,1 154 1920x1080 1558 12,9 1984
BRAGA01.0001.2013.11.19.12.06.38 EDA007 .mp4 avc1 76,7 416 1920x1080 1473 10,8 4497
BRAGA01.0001.2013.11.19.12.28.28 EDA008 .mp4 avc1 79,1 411 1920x1080 1536 11,3 4649
BRAGA01.0001.2013.11.19.12.47.11 EDA009 .mp4 avc1 242 1361 1920x1080 1419 10,9 14801
BRAGA01.0001.2013.11.19.13.25.18 EDA010 .mp4 avc1 85,6 461 1920x1080 1481 10,7 4945
BRAGA01.0001.2013.11.19.14.53.25 COL001 .mp4 avc1 477,8 2454 1920x1080 1554 11,6 28516
BRAGA01.0001.2013.11.21.12.02.31 EDA011 .mp4 avc1 43,3 231 1920x1080 1497 11,1 2557
BRAGA01.0001.2013.11.21.12.16.47 EDA012 .mp4 avc1 150,9 649 1920x1080 1858 13,6 8808
BRAGA01.0001.2013.11.21.12.33.39 EDA013 .mp4 avc1 66,2 355 1920x1080 1490 12,0 4260
BRAGA01.0001.2013.11.21.12.50.27 EDA014 .mp4 avc1 106,3 284 1920x1080 2990 14,3 4076
BRAGA01.0001.2013.11.21.13.03.12 EDA015 .mp4 avc1 55,2 311 1920x1080 1417 13,1 4088
BRAGA01.0001.2013.11.21.14.40.46 EDA016 .mp4 avc1 83,8 450 1920x1080 1483 10,7 4835
BRAGA01.0001.2013.11.21.15.09.02 EDA017 .mp4 avc1 64,1 330 1920x1080 1546 11,4 3760
BRAGA01.0001.2013.11.21.20.21.39 EDA018 .mp4 avc1 113,7 3232 1920x1080 274 38,6 124619
BRAGA01.0001.2013.11.26.09.42.21 EDA019 .mp4 avc1 107,4 567 1920x1080 1513 11,5 6535
BRAGA01.0001.2013.11.26.10.13.17 EDA020 .mp4 avc1 109 601 1920x1080 1446 11,6 6970
BRAGA01.0001.2013.11.26.10.34.44 EDA021 .mp4 avc1 158,4 683 1920x1080 1850 13,4 9191
BRAGA01.0001.2013.11.26.10.52.12 EDA022 .mp4 avc1 239,6 1154 1920x1080 1657 12,1 14004
BRAGA01.0001.2013.11.26.11.21.48 COL002 .mp4 avc1 485,9 5506 1920x1080 700 30,8 169501
BRAGA01.0001.2013.11.26.12.54.09 EDA023 .mp4 avc1 231,4 1060 1920x1080 1744 12,5 13299
BRAGA01.0001.2013.11.26.13.12.07 COL003 .mp4 avc1 190,8 1022 1920x1080 1490 11,0 11222
BRAGA01.0001.2013.11.26.18.12.25 COL004 .mp4 avc1 708,3 3270 1920x1080 1728 24,2 79010
CAPÍTULO 5. Redução do Vídeo Endoscópico
65
EDA e a 12252 segundos para EDB, que equivale a um total de 8 horas 12 minutos e 31 segundos e um
total de 598867 frames, sendo 310618 frames de EDA e 288249 frames de EDB. Estes valores podem ser
observados na Tabela 5.2.
Tabela 5.2 – Valores totais iniciais relativos ao tamanho de armazenamento, à duração e ao número de frames, dos 23 exames de EDA e dos 4 exames de EDB e ao seu somatório.
O conjunto de dados incluídos na Tabela 5.1 foram convertidos aos container AVI e codec Xvid, através do
Freemake Video Converter [131] – programa de conversão de vídeo –, para posteriormente serem utilizados
nas soluções relativas aos problemas identificados nesta dissertação, uma vez que a biblioteca OpenCV não
suporta os respetivos MP4 e AVC1.
Após a conversão dos 27 vídeos endoscópicos obtiveram-se novos valores para cada vídeo endoscópico,
relativamente ao tamanho de armazenamento, ao bit rate, ao frame rate e aos frames totais, todos os outros
mantiveram-se, ou seja, a duração e a resolução. Para cada vídeo endoscópico tem-se um valor individual
e distinto de bit rate. Já o valor do frame rate passou a ser de 25 fps. A partir deste momento, os vídeos
apenas vão ser identificados através do seu respetivo identificador. Na Tabela 5.3 verificam-se as novas
informações para cada vídeo endoscópico.
Vídeos
Endoscópicos
Número de Vídeos
Endoscópicos ∑ Tamanho (MB) ∑ Duração (s) ∑ Frames Totais
EDA 23 2777,6 17299 310618
EDB 4 1862,8 12252 288249
TOTAL 27 4640,4 29551 598867
CAPÍTULO 5. Redução do Vídeo Endoscópico
66
Tabela 5.3 - Informação relativa aos vídeos endoscópicos utilizados. As células a cor-de-laranja são referentes aos 4 exames de EDB, as restantes 27 correspondem a EDA.
Através da informação da Tabela 5.3 foram calculados os valores totais de tamanho de armazenamento,
duração e número de frames. No que toca ao tamanho de armazenamento tem-se 3184,6 MB na totalidade,
1959,2 MB para os vídeos de EDA e 1225,4 MB para os vídeos de EDB. Verifica-se que a duração dos
vídeos endoscópicos se mantém e regista-se uma totalidade de 739083 frames, em que 432745 frames e
306338 frames correspondem aos vídeos de EDA e de EDB, respetivamente. Estes valores podem ser
conferidos na Tabela 5.4.
ID Container Codec Tamanho
(MB)
Duração
(s)
Resolução
(pixéis)
Bit Rate
(kbps)
Frame
Rate (fps)
Frames
Totais
EDA001 .avi Xvid 77,4 516 1920x1080 1200,0 25 12923
EDA002 .avi Xvid 253,9 1964 1920x1080 1034,2 25 14186
EDA003 .avi Xvid 186,6 1639 1920x1080 910,8 25 40983
EDA004 .avi Xvid 39,6 301 1920x1080 1052,5 25 7538
EDA005 .avi Xvid 25,2 169 1920x1080 1192,9 25 4228
EDA006 .avi Xvid 17,4 154 1920x1080 903,9 25 3851
EDA007 .avi Xvid 55,7 416 1920x1080 1071,2 25 10413
EDA008 .avi Xvid 54,8 411 1920x1080 1066,7 25 10278
EDA009 .avi Xvid 194 1361 1920x1080 1140,3 25 34041
EDA010 .avi Xvid 60,8 461 1920x1080 1055,1 25 11544
COL001 .avi Xvid 322,7 2454 1920x1080 1052,0 25 61369
EDA011 .avi Xvid 39,9 231 1920x1080 1381,8 25 5783
EDA012 .avi Xvid 63,6 649 1920x1080 784,0 25 16233
EDA013 .avi Xvid 55,2 355 1920x1080 1243,9 25 8877
EDA014 .avi Xvid 47 284 1920x1080 1323,9 25 7108
EDA015 .avi Xvid 39 311 1920x1080 1003,2 25 7778
EDA016 .avi Xvid 75,8 450 1920x1080 1347,6 25 11273
EDA017 .avi Xvid 43,3 330 1920x1080 1049,7 25 8274
EDA018 .avi Xvid 114,3 3232 1920x1080 282,9 25 80812
EDA019 .avi Xvid 79,7 567 1920x1080 1124,5 25 49103
EDA020 .avi Xvid 84,9 601 1920x1080 1130,1 25 15039
EDA021 .avi Xvid 77,3 683 1920x1080 905,4 25 17096
EDA022 .avi Xvid 133,6 1154 1920x1080 926,2 25 28872
COL002 .avi Xvid 430,5 5506 1920x1080 625,5 25 137658
EDA023 .avi Xvid 140,2 1060 1920x1080 1058,1 25 26512
COL003 .avi Xvid 170 1022 1920x1080 1330,7 25 25561
COL004 .avi Xvid 302,2 3270 1920x1080 739,3 25 81750
CAPÍTULO 5. Redução do Vídeo Endoscópico
67
Tabela 5.4 – Valores totais de tamanho de armazenamento, duração e número de frames, relativos aos dados convertidos dos 23 exames de EDA e dos 4 exames de EDB e ao seu somatório.
5.4 REMOÇÃO DE FRAMES INICIAIS, FINAIS E PRETOS
5.4.1 ENQUADRAMENTO
O tempo total de um vídeo de um exame endoscópico está apenas sujeito ao tempo de duração do mesmo,
ou seja, ao tempo correspondente à visualização em tempo real do TGI, como também à restante gravação
efetuada pelo profissional de saúde, sem que esta tenha relevância no diagnóstico. Alguns exemplos são a
possibilidade: de começar por capturar o ambiente circundante, como a sala da onde ocorrem este tipo de
exames ou alguns instrumentos médicos que possam vir a ser utilizados durante o próprio exame; e, de
finalizar o exame sem terminar a captura, podendo gravar várias dezenas de segundos de vídeo com a
câmara desligada, resultando num elevado número de frames pretos, como se pode verificar na Figura 5.2.
(A) (B)
Figura 5.2 – Exemplos de frames captados: (A) fora do TGI, neste caso observa-se a sala de intervenção; e (B) depois de finalizar o exame com a câmara desligada.
5.4.2 ESTADO DA ARTE
É bastante claro que este tipo de frames presentes nos vídeos endoscópicos não vai influenciar de maneira
alguma o diagnóstico. Existem várias técnicas que permitem que estes sejam eliminados.
Vídeos
Endoscópicos
Número de Vídeos
Endoscópicos ∑ Tamanho (MB) ∑ Duração (s) ∑ Frames Totais
EDA 23 1959,2 17299 432745
EDB 4 1225,4 12252 306338
TOTAL 27 3184,6 29551 739083
CAPÍTULO 5. Redução do Vídeo Endoscópico
68
Em 2009, Rungseekajee et al. [132] propuseram um método para classificação de imagens extraídas de
vídeos de colonoscopia em duas categorias: frames informativos e não informativos. A classificação é dada
em duas etapas. Na primeira etapa é calculada a percentagem de pixéis isolados, distinguindo as imagens
em três categorias: frames informativos, não informativas e ambíguos. Na segunda e última etapa é utilizado
o número total de pixéis, de forma a identificar os frames ambíguos em informativos ou não informativos.
Após todos os frames terem sido alvo de classificação, os não informativos serão eliminados. Desta forma,
apenas são enviados para o profissional de saúde os frames informativos [132].
Já Stanek et al. [133] desenvolveram um sistema para deteção automática do início e do fim de
procedimentos endoscópicos, de forma a que não seja necessária interação humana para iniciar a captura
dos mesmos. Inicialmente, todos os vídeos endoscópicos contêm informação anterior e posterior ao
respetivo procedimento. De seguida, pretende-se remover o maior número de frames captados fora do TGI
do paciente. Para o sistema conseguir localizar com maior precisão o início e o fim de cada vídeo
endoscópico, foram adicionados recursos temporais e métricas de cor. Para cada frame são medidas a
variação entre a média de pixéis vermelhos e a média normalizada de pixéis vermelhos, criados histogramas
de energia, histogramas para verificação da média de pixéis vermelhos e da média duplamente normalizada
de pixéis vermelhos. A média de pixéis vermelhos é calculada a partir do valor médio da intensidade de
vermelho no espaço de cor RGB. Já a média normalizada de pixéis vermelhos é calculada pela quantidade
média de saturação de vermelho, em cada frame, em comparação com a quantidade média de saturação
verde e azul [133].
5.4.3 SOLUÇÃO DESENVOLVIDA
A abordagem utilizada para a remoção de frames não relevantes para o diagnóstico, mais propriamente,
frames referentes a todo o tipo de captura fora do TGI, baseia-se em métricas de cor, uma vez que, após a
realização da revisão bibliográfica, terá sido a técnica mais apropriada de implementar, permitindo com
precisão e exatidão a distinção entre frames relevantes e não relevantes [134].
Assim, para o desenvolvimento do algoritmo de deteção e eliminação automáticas de frames não relevantes
foram assumidos dois pressupostos. O primeiro consiste no facto de que os frames captados antes e depois
do TGI apresentam uma intensidade próxima de zero e uma maior uma intensidade de pixéis azuis. O
segundo pressuposto consiste no facto de que as regiões relevantes para o diagnóstico apresentam uma
CAPÍTULO 5. Redução do Vídeo Endoscópico
69
intensidade de pixéis vermelhos superior às dos frames com informações não relevantes. Estes pressupostos
podem ser observados pelas diferenças dos frames representados na Figura 5.3.
(A) (B)
Figura 5.3 – Exemplos de frames captados (A) fora do TGI, ou seja, não relevante, e (B) durante uma EDA, ou seja, relevante.
A primeira etapa da solução desenvolvida reside na definição de algumas das características essenciais para
a produção do vídeo final, como o codec, o container, o frame rate e a resolução. Seguidamente, são
definidas várias restrições, com base na diferença das três possíveis cores dominantes, para serem
detetados os frames relevantes, ao mesmo tempo que são eliminados os frames não relevantes presentes
no vídeo endoscópico.
Inicialmente, para isolar os frames não relevantes, cuja área é preenchida por pixéis com uma intensidade
igual a zero, foi utilizada a função countNonZero()da biblioteca OpenCV para contar o número de pixéis
que são diferentes de zero para cada uma das componentes B, G e R do espaço de cor RGB. Assim, todos
os frames que tiverem um ou mais pixéis diferentes de zero são guardados, os restantes são eliminados e
considerados não relevantes.
Para detetar frames relevantes e eliminar os restantes frames capturados fora do TGI, calcula-se a média
das intensidades das componentes individuais B, G, e R do espaço de cor RGB, para cada frame. Deste
modo, promove-se a separabilidade dos frames cuja cor dominante é o vermelho e o azul, respetivamente.
Sempre que a média da intensidade da componente R for maior que a da componente B, o frame é
considerado relevante e, por sua vez, é guardado para ingressar no vídeo final reduzido.
Na Figura 5.4 é possível observar o esquema da solução desenvolvida e das etapas que nela estão envolvidas.
CAPÍTULO 5. Redução do Vídeo Endoscópico
70
Figura 5.4 – Esquema da solução de remoção de frames iniciais, finais e pretos.
5.4.4 RESULTADOS DA SOLUÇÃO
Após a aplicação da solução desenvolvida e explicitada na secção anterior foram obtidos novos valores para
o tamanho de armazenamento, a duração, o bit rate, o frame rate e para o número total de frames de cada
vídeo endoscópico, entre outros valores que podem ser encontrados na Tab. A.1 do Apêndice A, mas que
não têm influência nos resultados. Para além destes valores foram também calculados os totais de tamanho
de armazenamento, duração e número total de frames para os 23 vídeos de EDA, para os 4 vídeos de EDB
e para o conjunto dos 27 vídeos resultantes (Tab. A.2 do Apêndice A).
Na Tabela 5.5 podem ser observados os valores relativos aos ganhos ou às perdas resultantes da solução
implementada ao conjunto de dados utilizados nesta dissertação. Estes resultados foram obtidos pela
diferença entre os valores iniciais enunciados anteriormente, na Tabela 5.3, e os valores registados na Tab.
A.1 do Apêndice A (Equação 5.1). Uma vez que os codec, container e resolução se mantiveram para todos
os vídeos reduzidos, estes não vão ser encontrados na tabela seguinte.
Resultado = Valor inicial − Valor obtido através da solução
Equação 5.1 – Cálculo da diferença entre os valores iniciais e os valores obtidos pela implementação da solução de remoção de frames iniciais, finais e pretos.
CAPÍTULO 5. Redução do Vídeo Endoscópico
71
Tabela 5.5 – Ganhos ou perdas obtidos após aplicação da solução para remoção de frames iniciais, finais e pretos, sendo que as células a azul são referentes aos valores que sofreram um aumento relativamente aos valores para os vídeos endoscópicos originais.
ID Tamanho
(MB) Duração (s)
Bit Rate
(kbps)
Frame Rate
(fps)
Frames
Totais
EDA001 -34,7 41 -688,0 19 10073
EDA002 -101,8 197 -576,2 19 3583
EDA003 -90,4 401 -879,2 19 33555
EDA004 -16,2 63 -823,1 19 6110
EDA005 -9 7 -496,0 19 3252
EDA006 -0,2 78 -948,7 19 3395
EDA007 -21,6 36 -556,2 19 8130
EDA008 -16,6 86 -690,9 19 8327
EDA009 150,8 1137 -402,5 19 32695
EDA010 -10 65 -375,2 19 9166
COL001 1 1040 -768,1 19 52885
EDA011 -8,7 24 -496,4 19 4539
EDA012 8,4 409 -1056,0 19 14788
EDA013 1,3 110 -516,1 19 7402
EDA014 3,5 117 -759,9 19 6105
EDA015 -1,2 137 -845,1 19 6729
EDA016 -9,7 15 -224,9 19 8659
EDA017 -22,2 67 -942,7 19 6693
EDA018 18,3 2807 -1524,1 19 78260
EDA019 -24,6 93 -635,8 19 46257
EDA020 -16,7 165 -734,1 19 12420
EDA021 18,8 388 -681,0 19 15322
EDA022 76,6 876 -714,1 19 27202
COL002 -65,4 3039 -982,6 19 122856
EDA023 31,9 563 -685,1 19 23526
COL003 -88,7 89 -887,5 17 18094
COL004 176 2691 -1004,4 19 78272
Na Tabela 5.6 encontram-se os valores totais de tamanho de armazenamento, duração e total de frames
calculados pelo somatório dos respetivos dados contidos na Tabela 5.5, assim como os valores médios de
duração. Para além dos anteriores, observam-se os valores de variação de tamanho de armazenamento e
de duração, em percentagem, que podem ser encontrados na Tab. A.3 do Apêndice A.
CAPÍTULO 5. Redução do Vídeo Endoscópico
72
Tabela 5.6 – Valores totais de tamanho de armazenamento, duração e frames totais; valores médios de duração relativos aos ganhos obtidos após aplicação da solução para remoção de frames iniciais, finais e pretos; Variações de tamanho de armazenamento e de duração.
Tamanho de Armazenamento
Pode-se verificar que no que toca ao tamanho de armazenamento do vídeo endoscópico final, apenas 10
em 27 conseguiram ter um valor menor relativamente ao inicial, isto significa que a presença de frames não
relevantes era elevada. Os exemplos mais evidentes são os vídeos endoscópicos EDA009 e COL004, cujos
valores de tamanho de armazenamento poupado foram de 150,8 MB e 176 MB, respetivamente. Os
restantes 17 vídeos endoscópicos evidenciaram um aumento do mesmo, como é o caso do EDA002 cujo
tamanho de armazenamento aumentou 101,8 MB relativamente ao inicial. O aumento do tamanho de
armazenamento do vídeo deve-se ao peso que os algoritmos de Visão Computacional têm sobre o mesmo
[135].
Verifica-se ainda que houve um acréscimo de tamanho de armazenamento de 74 MB que corresponde a
um aumento de 3,8 %, no caso das EDAs, e um decréscimo de 22,9 MB que corresponde a uma redução
de 1,9 %, no caso das EDBs. Ademais, contabilizando-se todos os valores de tamanho de armazenamento
é possível concluir que houve um aumento de 51,1 MB, sendo que os todos os vídeos endoscópicos passam
a ocupar 3235,7 MB, em vez dos 3184,6 MB iniciais. Neste caso, não houve uma poupança relativamente
a esta variável, mas sim um acréscimo de 1,6 %.
Duração
Relativamente, à duração dos vídeos endoscópicos pode-se observar que todos foram reduzidos, destacando
os EDA018 e COL002 que obtiveram ganhos de 2807 segundos e 3039 segundos, respetivamente. Esta
redução proporciona uma poupança do tempo despendido nas tarefas de visualização e análise de 14741
segundos, para os 27 vídeos endoscópicos, que resulta da diferença entre os 29551 segundos iniciais e os
14810 segundos correspondentes ao tempo total útil despendido nas mesmas tarefas, perfazendo uma
poupança de 49,9 %. Observam-se ainda variações positivas para ambos os exames de EDA e de EDB, de
45,6 % e 56%, respetivamente.
Vídeos
Endoscópicos
Número de Vídeos
Endoscópicos
∑ Tamanho
(MB)
∆ Tamanho
(%)
∑ Duração
(s)
Duração Média
(s)
∆ Duração
(%) ∑ Frames Totais
EDA 23 -74 -3,8 7882 342,7 45,6 376188
EDB 4 22,9 1,9 6859 1714,8 56 272107
TOTAL 27 -51,1 -1,6 14741 546 49,9 648295
CAPÍTULO 5. Redução do Vídeo Endoscópico
73
A média do tempo despendido nas tarefas de visualização e análise, por parte do profissional de saúde, é
de 342,7 segundos, para o caso das EDAs e de 1714,8 segundos, para os exames de EDB e, na totalidade
dos vídeos endoscópicos é de 546 segundos.
Bit Rate
Verifica-se que todos os valores de bit rate aumentaram. Este valor em nada vai influenciar o tempo de
visualização e análise despendido pelo profissional de saúde. Denota-se que o aumento do bit rate foi
influenciado pelo aumento do tamanho de armazenamento do vídeo endoscópico final, como tal, maior será
a quantidade de dados armazenados. Valores elevados de bit rate podem tornar-se num fator limitativo para
a velocidade de conexão e de transmissão e para os custos associados à mesma. É necessário ter -se um
valor de bit rate inferior ao valor máximo da velocidade de upload, caso contrário a transmissão
simplesmente não é efetuada [38].
Frame Rate
No que toca ao frame rate é possível observar que o valor da diferença entre resultados foi de 19 fps, para
26 dos 27 vídeos, e de 17 fps para o único caso, COL003, ou seja, os valores de frame rate passaram de
25 fps para 6 fps e 8 fps, respetivamente. Esta propriedade sofreu ajustes em relação ao frame rate dos
vídeos originais, uma vez que para o tipo de codec utilizado a função, get(CV_CAP_PROP_FPS), do
OpenCV que permite utilizar o valor de frame rate original não é suportada, tendo o frame rate final sido
verificado manualmente, numa fase inicial de implementação desta solução.
Número de Frames Totais
Por fim, obteve-se valores bastante satisfatórios no que concerne à totalidade de frames classificados como
não relevantes e que, por sua vez, não foram incluídos nos vídeos endoscópicos reduzidos, permitindo que
um total de 648295 frames não relevantes não tenham sido incluídos nos mesmos, ou seja, 376188 e
272107 frames não relevantes, em exames de EDA e de EDB, respetivamente. Tal significa que dos 739083
frames, apenas 90788 foram guardados nos vídeos endoscópicos reduzidos.
CAPÍTULO 5. Redução do Vídeo Endoscópico
74
5.5 REMOÇÃO DE FRAMES DESFOCADOS
5.5.1 ENQUADRAMENTO
Uma outra categoria inerente aos frames não relevantes é a do tipo desfocado. Um frame pode ser
classificado como desfocado caso não apresente nitidez suficiente para uma visualização correta do
conteúdo anatómico presente nesse mesmo frame. Podem ser destacadas duas razões relativas à respetiva
aquisição. Esta pode ter sido efetuada muito de perto ou demasiado longe, de maneira a não ser possível
focar a mucosa do TGI, ou abrangendo substâncias estranhas (e.g. fezes, bolhas de ar, sucos
gastroinstestinais) [136]. No entanto, existem outros fatores que podem influenciar a presença de frames
desfocados nos vídeos endoscópicos entre os quais se destacam os movimentos peristálticos do TGI. Na
Figura 5.5 é possível verificar de forma clara dois exemplos relativos às razões para aquisição de frames
desfocados, acima descritas.
(A) (B)
Figura 5.5 - Exemplos de frames desfocados (A) devido à aquisição ter sido efetuada demasiado perto e (B) devido à presença de sucos gastroinstestinais.
5.5.2 ESTADO DA ARTE
Assim como os frames captados antes e após a visualização, em tempo real, do TGI, os frames desfocados
não vão influenciar o diagnóstico. No entanto, podem impedir a observação de uma dada patologia ou lesão.
Existem várias técnicas que permitem que estes sejam eliminados.
Em 2004, Tong et al. [137] propuseram um método de deteção e classificação de imagens desfocadas com
base na análise dos contornos e da nitidez, utilizando a Transformada de Haar (do inglês, Haar wavelet
CAPÍTULO 5. Redução do Vídeo Endoscópico
75
transform). Para além da classificação de imagens, esta solução permite ainda determinar até que ponto a
imagem se encontra desfocada, através da análise da nitidez dos contornos [137].
Assim como Rungseekajee et al. [132], Oh et al. [136] desenvolveram um sistema CAD semiautomático
com o intuito de se distinguirem dois tipos de frames - relevantes e não relevantes – reduzindo, assim, o
número de frames a serem visualizados pelo profissional de saúde. Este sistema propõe duas soluções para
classificar os respetivos frames, uma baseada em técnicas de clustering, através da Transformada Discreta
de Fourier, e outra baseada na deteção de contornos de Canny (do inglês, Canny Edge Detector). Para além
das técnicas referidas, é ainda proposta uma técnica de deteção de reflexão especular, ou seja, presença
de reflexos brilhantes nos frames, de maneira a aumentar a precisão da classificação. Primeiramente, é
calculada a percentagem de pixéis isolados. Se este valor for superior a um valor declarado de threshold, o
frame é classificado como não relevante. De seguida, é implementada a Transformada Discreta de Fourier,
sendo extraídas características com base na análise da textura dos frames e, posteriormente, a técnica de
clustering [136].
No ano de 2008, Liu et al. [138] desenvolveram um sistema semiautomático de deteção de imagens
desfocadas. Este sistema baseia-se na deteção das regiões desfocadas, através da extração de
características baseadas na cor, no gradiente e no espectro das imagens. E, permite ainda obter uma
classificação robusta [138].
Tsomko e Kim [139] propuseram um método baseado na previsão de regiões desfocadas entre pixéis
vizinhos e na medida da variância para estimar a qualidade de imagem. Em vez de ser fornecida uma
decisão binária, ou seja, se a imagem é nítida ou desfocada, o algoritmo proposto classifica as imagens em
três grupos: imagens nítidas, desfocadas e de qualidade média [139].
5.5.3 SOLUÇÃO DESENVOLVIDA
A abordagem utilizada para a remoção de frames desfocados baseia-se em métricas de cor e na deteção
de contornos de Canny, permitem classificar com exatidão os frames relevantes e os não relevantes
[132][136].
A primeira etapa da solução desenvolvida depende da definição de algumas das características essenciais
para a produção do vídeo final, como o codec, o container, o frame rate e a resolução. Novamente, estas
CAPÍTULO 5. Redução do Vídeo Endoscópico
76
características mantiveram-se e foram definidas a partir dos vídeos previamente reduzidos pela solução
descrita na secção anterior, Remoção de Frames Iniciais, Finais e Pretos.
A segunda etapa é iniciada pela transformação dos frames dos vídeos endoscópicos, que se encontram no
espaço de cor RGB, para uma escala de cinzentos, através da função cvtColor(). Seguidamente, é
aplicada a função blur()para redução de ruído com um kernel de 3x3. A aplicação da deteção de
contornos de Canny é o passo seguinte, permitindo a obtenção de frames binários, nos quais as regiões
relevantes vão ser detetadas e são desenhados os contornos.
A terceira etapa engloba o cálculo da percentagem de pixéis isolados [132]. Esta é conseguida através da
relação entre o número de pixéis isolados e o número total de pixéis brancos presentes nos frames binários.
Esta percentagem é comparada com os valores previamente declarados de threshold, referentes ao limite
inferior e superior que este pode atingir. Caso, o valor da percentagem seja superior ao maior valor de
threshold, o frame é classificado como não relevante, caso contrário o frame detetado é relevante.
Finalmente, foi utilizada a função countNonZero()para contar o número total de pixéis que são
diferentes de zero e, caso este seja superior a um valor total de pixéis previamente declarado, os frames
são guardados, os restantes são eliminados e considerados não relevantes.
Na Figura 5.6 observa-se o esquema da solução desenvolvida e das etapas que nela estão envolvidas.
Figura 5.6 – Esquema da solução de remoção de frames desfocados.
CAPÍTULO 5. Redução do Vídeo Endoscópico
77
5.5.4 RESULTADOS DA SOLUÇÃO
Como referido anteriormente, esta solução foi aplicada aos vídeos endoscópicos obtidos através da Remoção
de Frames Iniciais, Finais e Pretos.
Através desta solução resultaram novos valores para o tamanho de armazenamento, a duração, o bit rate e
para o número total de frames de cada vídeo, entre outros valores que podem ser encontrados no Apêndice
B.
Na Tabela 5.7 podem ser observados os valores relativos aos ganhos resultantes da solução implementada.
Estes resultados foram obtidos pela diferença entre os valores obtidos na e os valores registados
posteriormente na Tab. B.1 do Apêndice B (Equação 5.2). Uma vez que os codec, container e resolução se
mantiveram para todos os vídeos reduzidos, estes não vão ser encontrados na tabela imediatamente abaixo.
Resultado = Valor remoção de frames iniciais, finais e pretos − Valor remoção de frames desfocados
Equação 5.2 – Cálculo da diferença entre os valores obtidos através da solução de remoção de frames iniciais, finais e pretos e os obtidos pela solução para remoção de frames desfocados.
CAPÍTULO 5. Redução do Vídeo Endoscópico
78
Tabela 5.7 – Ganhos ou perdas obtidos após aplicação da solução para remoção de frames desfocados, sendo que as células a azul são referentes aos valores que sofreram um aumento relativamente aos valores para os vídeos originais.
ID Tamanho
(MB)
Duração
(s)
Bit Rate
(kbps)
Frame Rate
(fps)
Frames
Totais
EDA001 4,4 25 -26,67 0 146
EDA002 8,8 30 12,72 0 179
EDA003 3,2 8 9,17 0 44
EDA004 2,4 13 -23,04 0 78
EDA005 2,2 10 4,68 0 61
EDA006 1,8 10 -62,52 0 58
EDA007 3,1 15 1,07 0 92
EDA008 2,8 13 -1,44 0 79
EDA009 4,6 26 -16,74 0 153
EDA010 6,6 34 11,52 0 206
COL001 22,3 141 -61,45 0 844
EDA011 2,2 12 -25,33 0 73
EDA012 1,9 8 2,07 0 53
EDA013 1,6 8 -5,40 0 48
EDA014 3,1 12 -1,33 0 70
EDA015 1,6 11 -46,20 0 70
EDA016 6,6 34 -1,65 0 203
EDA017 1,5 6 0,18 0 37
EDA018 5,4 41 -80,44 0 248
EDA019 1,2 1 16,57 0 3
EDA020 4,4 23 -18,59 0 140
EDA021 3,8 21 -10,64 0 127
EDA022 3,5 28 -71,71 0 169
COL002 10,8 50 2,48 0 299
EDA023 7,6 48 -50,95 0 288
COL003 3,2 2 22,73 0 18
COL004 12,2 68 -41,04 0 408
Na Tabela 5.8 encontram-se os valores totais de tamanho de armazenamento, duração e total de frames
calculados pelo somatório dos respetivos dados contidos na Tabela 5.7, assim como os valores médios de
duração. Observam-se também os valores de variação de tamanho de armazenamento e de duração, em
percentagem, que podem ser encontrados na Tab. B.3 do Apêndice B.
CAPÍTULO 5. Redução do Vídeo Endoscópico
79
Tabela 5.8 – Valores totais de tamanho de armazenamento, duração e frames totais; valores médios de duração calculados através dos dados relativos aos ganhos obtidos após aplicação da solução para remoção de frames desfocados; variações de tamanho de armazenamento e de duração.
De uma maneira geral, pode-se verificar que os resultados obtidos para esta solução foram satisfatórios.
Tamanho de Armazenamento
Relativamente ao tamanho de armazenamento do vídeo final, todos os 27 vídeos endoscópicos conseguiram
ter um valor menor relativamente ao inicial. Os exemplos mais evidentes são os dos vídeos endoscópicos
EDA002 e COL001, cujos valores de tamanho de armazenamento diminuíram em 8,8 MB e 22,3 MB,
respetivamente. Os ganhos obtidos são de 84,3 MB, para EDAs, e de 48,5 MB, para EDBs, resultando numa
poupança total de 132,8 MB para os 27 vídeos endoscópicos. Isto representa uma variação positiva de
tamanho de armazenamento de 4,1 %, 4 % e 4,1 %, respetivamente. Uma vez que o tamanho de
armazenamento foi reduzido, conclui-se que a presença de frames desfocados era elevada.
Duração
No que toca à duração dos vídeos endoscópicos, pode-se observar que todos eles foram reduzidos, sendo
que as EDAs sofreram uma redução de 437 segundos, que se traduz num decréscimo de 4,6 %. As EDBs
evidenciaram uma redução de 261 segundos, resultando numa variação positiva de 4,8 %. Na totalidade
dos vídeos verifica-se que houve uma diminuição de 698 segundos, o que significa que ocorreu uma
poupança de tempo para as tarefas de visualização e análise de 4,7 %.
Obteve-se uma poupança média do tempo despendido nas tarefas de visualização e análise, por parte do
profissional de saúde, de: 25,9 segundos, para os 27 casos; 19 segundos, para as EDAs; e 65,3 segundos,
para os exames de EDB.
Bit Rate
Verifica-se que maioritariamente os valores de bit rate voltaram a aumentar. Como foi mencionado
anteriormente, este valor não tem qualquer influência no tempo de visualização e análise despendido pelo
Vídeos
Endoscópicos
Número de Vídeos
Endoscópicos
∑ Tamanho
(MB)
∆ Tamanho
(%)
∑ Duração
(s)
Duração Média
(s)
∆ Duração
(%) ∑ Frames Totais
EDA 23 84,3 4,1 437 19 4,6 2625
EDB 4 48,5 4 261 65,3 4,8 1569
TOTAL 27 132,8 4,1 698 25,9 4,7 4194
CAPÍTULO 5. Redução do Vídeo Endoscópico
80
profissional de saúde. No entanto, pode influenciar a velocidade de conexão e de transmissão de vídeo. O
que vai causar que o tempo de acesso ao vídeo aumenta, podendo este nunca ficar acessível, caso o valor
de bit rate ultrapasse o valor máximo da velocidade de upload [38]. Observa-se ainda que 10 dos 27 vídeos
reduziram o seu valor de bit rate. Estes resultados quantitativos são animadores e mostram que é possível
o acesso mais rápido aos vídeos e à sua transmissão, por termos um vídeo ainda mais reduzido [130][140].
Frame Rate
Dado que o valor do frame rate não foi alterado entre as duas soluções desenvolvidas não houve qualquer
tipo de ganho ou nem perda.
Número de Frames Totais
Por não se denotar uma variação tão acentuada, no que toca à redução da duração dos vídeos endoscópicos,
também não são registados ganhos na ordem dos milhares relativos à totalidade de frames. Assim,
contabiliza-se um total de 2625 e de 1569 frames não relevantes, em exames de EDA e de EDB,
respetivamente, perfazendo um total de 4194 frames não relevantes que não foram incluídos nos vídeos
endoscópicos finais.
Capítulo 6
EXTRAÇÃO E CLASSIFICAÇÃO DE
ACHADOS ENDOSCÓPICOS
CAPÍTULO 6. Extração e Classificação de Achados Endoscópicos
82
6.1 INTRODUÇÃO
Os achados endoscópicos (e.g., pólipos, sangramento), que possam ser diagnosticados durante ou após
um procedimento, são facilmente detetados pelo gastrenterologista. No entanto, como já foi referido, alguns
achados podem não ser detetados, por exemplo, se a carga associada às tarefas de análise e visualização
dos vídeos for excessiva e prolongada, ou devido à falta de qualidade da imagem captada [28].
O sistema CAD presente no módulo MIVprocessing, do sistema MyEndoscopy tem como objetivo realizar
tarefas de Segmentação, Extração de Características e Classificação de frames de vídeo. Este sistema
apenas é acionado após a extração dos frames não relevantes, através das soluções desenvolvidas e
explicitadas no capítulo anterior [101].
As vantagens associadas à implementação de um sistema CAD constatam-se na deteção automática de
regiões de interesse, para o diagnóstico médico, que não tenham sido detetadas durante o exame
endoscópico, bem como na sua classificação. Para além disso, os sistemas CAD apresentam variadas
soluções para o rastreio de patologias [25].
Nas secções seguintes são estudadas as técnicas e as metodologias que são consideradas adequadas no
contexto deste sistema.
6.2 ACHADOS ENDOSCÓPICOS
Em Portugal, as doenças do sistema digestivo têm aumentado ao nível da incidência e da prevalência, como
é o caso das doenças inflamatórias do intestino grosso, que têm vindo a aumentar progressivamente
afetando 56 a cada 100000 habitantes. O cancro digestivo tem uma elevada incidência, sendo o cancro do
cólon e reto a primeira causa de morte por cancro (14,8% das mortes por cancro). Já a hemorragia digestiva
apresenta uma mortalidade de 10 a 14%. A existência de pólipos no TGI funciona como um alerta, pois são
precursores de aproximadamente de 90% dos casos de cancro do cólon. Assim, os exames de EDA e de
EDB são utilizados para realização de diagnósticos e de rastreio a possíveis casos de cancro [17][18].
CAPÍTULO 6. Extração e Classificação de Achados Endoscópicos
83
6.3 PÓLIPOS
6.3.1 ENQUADRAMENTO
Os pólipos são regiões anormais que afetam a população com alguma frequência. Existem vários estudos
que comprovam que a sua manifestação deve-se, essencialmente, a fatores genéticos, a uma dieta
desequilibrada, ao tabagismo, ao peso e à idade, ocorrendo especialmente após os 50 anos [141]. De forma
a minimizar o risco do aparecimento ou reaparecimento dos mesmos, geralmente, é aconselhada uma dieta
baixa em gordura e rica em frutas, verduras e fibras [142].
Os pólipos revelam-se a partir do crescimento protuberante de tecidos na mucosa do TGI, maioritariamente,
no intestino grosso, sendo que a maioria não é cancerígena. No entanto, apesar da maioria dos pólipos
serem benignos, podem tornar-se malignos ao longo do tempo. Os dois principais fatores que contribuem
para isso são o tamanho do pólipo e o seu grau de displasia. O termo displasia refere-se, na verdade, a uma
anormalidade no desenvolvimento de células e, quanto maior for a taxa de displasia, o mais provável é que
o pólipo se transforme em maligno. Podem surgir alguns sintomas, como sangramento, fezes com sangue,
dor abdominal e fadiga, mas estes raramente se manifestam, isto é, na maioria dos casos não há sintomas,
daí a importância de um rastreio regular.
Para se determinar o caráter patológico de um pólipo, com precisão, é necessária uma intervenção
terapêutica, a citologia. No entanto, sempre que possível, deve-se proceder à extração do pólipo para poder-
se examinar com maior detalhe [143].
Um pólipo pode ser mole, carnoso ou fibroso. No que toca à sua estrutura podem ser de dois tipos: os
pediculados, que são os pólipos que se encontram ligados à mucosa por uma haste longa e estreita; e os
sésseis que crescem na mucosa, ou seja, encontram-se presos. Em relação à forma, os pólipos podem ser
classificados como esféricos ou semiesféricos, no caso de serem pediculados ou sésseis, respetivamente.
No entanto, podem-se também encontrar pólipos com uma forma semelhante a uma esfera alongada.
Quanto maior for a dimensão do pólipo maior é o risco de este ser maligno [143].
É de realçar que pólipos podem ser designados por neoplásicos ou não-neoplásicos. As neoplasias
gastrointestinais provêm das células epiteliais da mucosa do tubo digestivo, um exemplo são os adenomas,
sendo, por norma, estes os precursores do cancro gastrointestinal. Por sua vez, os pólipos não-neoplásicos
são benignos e encontram-se, maioritariamente, no reto. Sendo que um exemplo deste tipo de pólipos são
os pólipos hiperplásticos [20][144]. Na Figura 6.1 encontram-se dois exemplos de pólipos, (A) não-
neoplásico e (B) neoplásico.
CAPÍTULO 6. Extração e Classificação de Achados Endoscópicos
84
(A) (B)
Figura 6.1 – Exemplos de pólipos (A) não-neoplásico e (B) neoplásico.
É de consenso internacional, por parte dos profissionais de saúde da especialidade, que independentemente
da localização, tamanho ou distribuição, entre muitas outras características, todos os pólipos encontrados
no decorrer de um exame endoscópico devem ser removidos. Por outro lado, podem surgir alguns pólipos
que não são detetados a olho nu e, mesmo, as imagens captadas podem não ajudar na sua visualização,
ou seja, a observação da existência de crescimentos anormais de tecidos da mucosa, ou pólipos, nem
sempre é a mais bem conseguida, devido às razões referidas anteriormente - variação tanto no tamanho,
como cor, textura ou até mesmo na distribuição. Como tal, estes pólipos que permaneceram no organismo
do paciente podem evoluir para tumores de maior dimensão e passar a ser malignos [20].
6.3.2 ESTADO DA ARTE
Para deteção de pólipos e de adenomas, em fase inicial, recorre-se, então, a sistemas CAD. Os sistemas
CAD permitem que através de frames endoscópicos, sejam extraídas características paramétricas e
classificação. Através da implementação de diversos métodos propostos na literatura e existentes nesses
sistemas torna-se possível um diagnóstico para a deteção de regiões anormais, tanto em imagens como em
vídeos endoscópicos [21]. Alguns sistemas permitem também realizar o processamento de imagens obtidas
por TC [145].
Foi no final dos anos 90 que começaram a surgir os primeiros métodos para análise de texturas juntamente
com técnicas inteligentes de classificação de padrões. Uma das maiores motivações que levou ao seu
desenvolvimento foi o facto de as características das texturas das lesões poderem ser utilizadas para o
diagnóstico realizado microscopicamente e macroscopicamente [21][146][147]. Já a análise de texturas por
níveis de cinzento baseada em redes neuronais engloba a utilização de espectros de textura [148], da matriz
CAPÍTULO 6. Extração e Classificação de Achados Endoscópicos
85
de coocorrência [149][150], padrões binários locais (do inglês, Local Binary Pattern (LBP)) [151], e wavelet-
domain, sendo este um recurso da matriz de coocorrência. Esta última abordagem tem sido aplicada para
a deteção de tumores em sequências de frames em vídeos de Colonoscopias [152].
O método proposto por Wang et al. [151] classifica as imagens endoscópicas com base na textura e em
redes neuronais. Um outro método proposto, desta vez por Krishnan et al. [153] baseia-se na segmentação
de imagens endoscópicas processadas na escala de cinzentos através do método de deteção de contornos
de Canny, e da análise da curvatura para os contornos detetadas. Dhandra et al. [154] desenvolveram um
método em que as imagens endoscópicas são segmentadas pelo contorno ativo, com recurso ao método de
determinação do nível de energia mínima e, assim, identificar as regiões anormais de acordo com o número
de regiões segmentadas. Karkanis et al. em [155], utilizam a textura como característica principal e a
classificação é efetuada com base em redes neuronais.
Para além de ser importante a caracterização de lesões pela sua textura, por exemplo através de contornos,
estas podem ser também detetadas através da cor. Neste sentido, Tjoa e Krishnan [156] combinaram o
espectro de textura com o histograma para a análise das características da cor do cólon. Karkanis et al.
[157] ampliaram o conceito de recurso da matriz de coocorrência para imagens a cores e desenvolveram a
Color Wavelet Covariance (CWC), através de um sistema CAD, para deteção de adenomas no cólon através
da análise de frames de vídeos endoscópicos de elevada resolução. Em relação a este método foi observada
uma maior sensibilidade na deteção de lesões quando comparado com os métodos baseados na textura e
nos níveis de cinzento [157].
Posteriormente, Zheng et al. [158] propuseram um sistema de apoio à decisão baseado no esquema de
fusão Bayesiana, combinando cor, textura e informação relativa aos contornos do lúmen para a deteção de
massas e lesões hemorrágicas. Mais uma vez, este novo método levou a uma melhoria da sensibilidade e
especificidade dos sistemas de deteção de regiões anormais, em comparação com o desempenho
anteriormente alcançado através da extração de níveis de cinzento por histogramas de LBP. Já Iakovidis et
al. [20] propuseram um sistema inteligente para deteção automática de adenomas do cólon e gástricos
através de vídeos endoscópicos. Recorre a características de cor e textura e incorpora SVM não-lineares para
alcançar uma maior precisão na deteção, quando comparado com os métodos de classificação linear. E
ainda, desenvolveram um método de extração de características apropriadas para a análise de vídeo-frames
de baixa resolução, em vez de alta resolução. Há assim redução do tempo de processamento de vídeos e
de imagens endoscópicas. Para avaliação do desempenho do sistema implementado, Iakovidis et al. utilizam
CAPÍTULO 6. Extração e Classificação de Achados Endoscópicos
86
o método Receiver Operating Characteristics (ROC), que fornece estimativas com maior grau de precisão
em comparação com outras medidas, não decorrentes de ROC, adotadas nos trabalhos anteriormente
citados.
6.4 SANGRAMENTO
6.4.1 ENQUADRAMENTO
Uma região de sangramento é observada devido à elevada intensidade da cor vermelha, podendo a cor
variar de vermelho vivo a escuro. Este tipo de anomalia pode ainda identificar a presença outras lesões,
como úlceras, infeções bacterianas. Estas podem ser classificadas por sangramento, angiectasia e eritema
[159]. Na Figura 6.2 observa-se a deteção de sangue no TGI.
Figura 6.2 – Exemplo de sangramento.
6.4.2 ESTADO DA ARTE
A deteção de regiões de sangramento é muitas vezes feita através da análise do espaço de cor. Algumas
soluções baseadas na deteção desse tipo de característica são exemplificadas de seguida.
Bourbakis et al. [160] desenvolveram uma metodologia através de redes neuronais artificiais para deteção
de sangue em imagens obtidas por WCE. As características avaliadas tiveram por base a cor das imagens.
Shah et al. [161] propuseram um método de classificação de imagens de sangramento através do espaço
de cor - matiz, saturação e intensidade (HSI, do inglês Hue, Saturation, Intensity) - e da segmentação por
CAPÍTULO 6. Extração e Classificação de Achados Endoscópicos
87
regiões. Para tal, inicialmente, os dados em bruto são convertidos em HSI, sendo este espaço de cor o que
mais se aproxima da perceção humana. A etapa seguinte engloba a segmentação de cada imagem em
regiões de não-sangramento e de sangramento. Esta é obtida usando o algoritmo de segmentação por
regiões JEDISON. Por fim, as imagens segmentadas são classificadas mediante a existência de sangramento
e não-sangramento, pelas técnicas de aplicação de threshold à cor e do limiar de rigidez das regiões de
sangramento. Foram obtidos resultados com maior precisão, em imagens de sangramento, quando
comparados com resultados de algoritmos existentes, como o Indicador de Suspeita de Sangue.
Em 2009, Penna et al. [162] desenvolveram uma solução recorrendo à modelação da cor, deteção de
contornos, através do algoritmo de deteção de Reed-Xiaoli, que tem como objetivo diferençar as regiões de
sangramento, dos tecidos normais circundantes. No entanto, para que o algoritmo de Reed-Xiaoli atinja
áreas de sangue muito específicas, todos os dados foram submetidos a um pré-processamento através de
um filtro de multi-fase, assim, o resultado final é melhorado, por meio de operações morfológicas.
No ano seguinte, Al-rahayfeh et al. [163] propuseram a deteção de regiões de sangramento gastrointestinal
em duas etapas. A primeira engloba uma discriminação eficiente dos vídeos de input que contém
características de sangramento relativamente aos que não incluem essas mesmas características. A
segunda tem como objetivo verificar se a classificação inicial efetivamente corresponde a padrões de
sangramento ativo. A cor é a principal característica utilizada para distinguir colorações normais dos tecidos
gastrointestinais, usando uma gama de cores para o sangramento, iniciando na pureza da cor sangramento,
seguida de uma proporção para cada um dos canais de R, G e B.
Mais recentemente, Ma et al. [164] apresentaram uma solução para a deteção e eliminação de zonas que
se assemelham a sangramento, mas que não o são. Esta solução implementa SVM para classificar imagens
obtidas por WCE.
CAPÍTULO 6. Extração e Classificação de Achados Endoscópicos
88
Capítulo 7
CONCLUSÕES
CAPÍTULO 7. Conclusões
90
O presente capítulo enquadra e caracteriza de forma sinóptica o trabalho de pesquisa efetuado e apresenta
as contribuições e conclusões fruto deste trabalho. Indica também propostas de trabalho futuro que usam
este trabalho como base.
7.1 SINOPSE
É possível resumir os resultados obtidos com a presente dissertação através de um pequeno sumário
referente a cada capítulo.
No capítulo introdutório apresenta-se o enquadramento deste trabalho pela descrição da Informática
primitiva, pela introdução do conceito da Informática Médica e os objetivos e as aplicações relativas a esta
área de estudo. Segue-se, a definição dos MCDT, referindo de que forma é que estes têm influenciado a
prestação de cuidados de saúde e analisa-se a utilização das diferentes categorias de MCDT nos anos 2009-
2010, em Portugal. Introduziu-se o domínio da Imagem Médica, desde que este surgiu, e a sua influência
na prestação de cuidados de saúde, nomeadamente, na utilização da Endoscopia para o diagnóstico de
patologias e lesões. Apresenta-se sucintamente a Endoscopia Digestiva e a motivação da escolha desta
técnica para realização deste trabalho. Na secção Endoscopia Digestiva Alta foram apresentados alguns
conceitos médicos e técnicos relativamente a essa técnica. Introduziram-se ainda as tecnologias de
Processamento de Imagem e de Visão Computacional e as vantagens da sua utilização nos sistemas de
apoio à decisão. De seguida, apresentam-se os problemas em que se enquadra esta dissertação, que por
sua vez motivaram o desenvolvimento e os seus respetivos objetivos. Por último, neste capítulo descreve-se
a metodologia de investigação seguida.
No capitulo seguinte é realizada uma revisão dos fundamentos teóricos abordados e das tecnologias
utilizadas. É mencionada a importância que o vídeo endoscópico tem no diagnóstico e são descritas as
características que determinam a qualidade do vídeo. Por último, descreve-se o espaço de cor RGB.
No terceiro capítulo introduz-se o conceito de Endoscopia, o momento em que este surgiu e as suas variantes
na Medicina, com ênfase na gastrenterologia. Destacam-se as diversas técnicas relativas à Endoscopia
Digestiva e definiram-se os TGI alto e baixo, a nível anatómico, fisiológico e histológico, como forma de
apreender o conhecimento desta especialidade da Medicina.
Segue-se o capítulo relativo ao sistema MyEndoscopy, onde é efetuada uma análise detalhada referente aos
sistemas de apoio à decisão desenvolvidos nos domínios da investigação científica e comercial, sendo
CAPÍTULO 7. Conclusões
91
destacada a arquitetura do sistema MyEndoscopy, que suporta o módulo MIVprovessing. E, dado que este
serviu de base para as soluções desenvolvidas nesta dissertação.
No quinto capítulo são descritas as soluções propostas para a resolução dos problemas identificados
inicialmente, sendo estes a presença de frames não relevantes para o diagnóstico e a duração total dos
vídeos de Endoscopia Digestiva. As soluções propostas contém ferramentas para deteção e eliminação de
frames captados fora do TGI e desfocados. Neste capítulo são, ainda, apresentados e interpretados os
resultados obtidos.
Finalmente, é apresentada a última etapa do módulo MIVprocessing, a qual pertence o sistema CAD, e feita
uma revisão da literatura no que toca a soluções desenvolvidas para deteção e classificação de achados
endoscópicos, mais propriamente, pólipos e sangramento, uma vez que são as lesões mais frequentes e
que podem redundar em cancro ou até mesmo morte.
7.2 CONTRIBUIÇÕES
Este trabalho tem como desiderato a melhoria das condições vigentes para cada agente que intervém na
prestação de cuidados de saúde, tais como profissionais de saúde, pacientes, unidades de saúde, e
investigadores.
Relativamente aos profissionais de saúde, duas soluções inovadoras com o intuito de eliminar problemas
que surgem nas tarefas de visualização e análise de vídeos endoscópicos, para melhoria da performance
do seu trabalho, através da redução do tempo despendido nas mesmas, e indiretamente um aumento da
qualidade dos serviços de saúde prestados aos pacientes.
As unidades de saúde beneficiarão com estas soluções, pois permitem que os profissionais de saúde
utilizem o tempo poupado noutras tarefas, com a consequente economia de custos.
Já os investigadores interessados nesta área de trabalho passarão a ter à sua disposição uma MIVbox
melhorada, com duas soluções inovadoras desenvolvidas para o módulo MIVprocessing, para análise de
vídeo, com a possibilidade das mesmas serem usadas nesta área de investigação, otimizadas de acordo
com as suas necessidades.
CAPÍTULO 7. Conclusões
92
7.3 CONCLUSÕES E TRABALHO FUTURO
O resultado do trabalho efetuado no âmbito da presente dissertação é a criação de duas soluções
correspondentes aos problemas inerentes à qualidade da imagem capturada e presente nos vídeos
endoscópicos e o tempo despendido, pelo profissional de saúde, na visualização e análise dos mesmos.
As soluções desenvolvidas são enquadradas no módulo MIVprocessing do sistema MyEndoscopy, mais
propriamente na MIVbox. Assim, o sistema MyEndoscopy beneficia de um conjunto de duas soluções
inovadoras que funcionam no backend, para análise dos vídeos endoscópicos, que até então não existiam.
Os resultados obtidos através das soluções desenvolvidas evidenciaram que os frames não revelantes foram
removidos dos vídeos endoscópicos. Além disso, através destas soluções é possível reduzir o tempo
despendido pelo profissional de saúde nas tarefas de visualização e análise, subsequentes aos exames
endoscópicos.
A solução que engloba a eliminação de frames capturados fora do TGI permitiu obter vídeos reduzidos e,
consequentemente, ganhos de tempo nas tarefas de visualização e análise dos mesmos, na ordem dos
45,6 %, para o caso das EDAs e dos 56 %, para os exames de EDB, e no conjunto dos 27 vídeos
endoscópicos na ordem dos 49,9 %. Constata-se que todos os valores de bit rate aumentaram, mas tal
resultado não afeta o tempo de visualização e análise despendido pelo profissional de saúde. Contudo, este
aumento é considerado um fator limitativo na transmissão do conteúdo dos vídeos, devido à maior
quantidade de dados armazenados, e por isso deve ter-se em atenção a largura de banda existente para a
transmissão. Para além do anterior, o aumento do tamanho de armazenamento do vídeo é outro fator
limitativo, mas tal deriva do peso que os algoritmos de Visão Computacional têm sobre o mesmo. No
conjunto dos 27 vídeos endoscópicos este aumento é de 1,6 % e para os 23 vídeos de EDA o aumento é de
3,8 %. Contudo, para os 4 vídeos de EDB houve um decréscimo de 1,9 %.
Já a solução referente à eliminação de frames desfocados permitiu não só ter ganhos de tempo de 4,6 %,
para EDAs, de 4,8 %, para EDBs, e de 4,7 % para os 27 vídeos endoscópicos, como de tamanho de
armazenamento dos vídeos reduzidos, de 4,1 %, para EDAs, de 4 %, para EDBs, e de 4,1 % para a totalidade
dos vídeos endoscópicos. Tal como na solução anterior, também aqui se identifica um fator limitativo, que
é o bit rate.
CAPÍTULO 7. Conclusões
93
Pode dirimir-se que os objetivos propostos para este trabalho foram atingidos e que as soluções
apresentadas possibilitam resolver os problemas inicialmente destacados, recorrendo a tecnologias de uso
livre.
Como trabalho futuro, as soluções desenvolvidas nesta dissertação e as já existentes no Sistema de Suporte
podem ser otimizadas de acordo com as necessidades da própria investigação. Paralelamente, as soluções
inovadoras realizadas no decorrer desta dissertação devem ser validadas pelos profissionais de saúde.
Atendendo ao estudo efetuado no sexto capítulo, no âmbito da deteção e classificação dos achados
endoscópicos, foram abertos caminhos de exploração futura para implementação de uma ferramenta de
apoio ao diagnóstico, com base em técnicas de Aprendizagem Máquina, minimizando a intervenção dos
profissionais de saúde.
CAPÍTULO 7. Conclusões
94
REFERÊNCIAS
[1] E. H. Shortliffe and M. S. Blois, “The Science and the Pragmatics,” in Biomedical Informatics: Computer Applications in Health Care and Biomedicine, 4th ed., E. H. Shortliffe and J. J. Cimino, Eds. Springer Science & Business Media, 2014, pp. 3–37.
[2] R. E. Hoyt and E. V. Bernstam, “Overview of Health Informatics,” in Health Informatics: Practical Guide for Healthcare and Information Technology Professionals, 5th ed., R. E. Hoyt, N. Bailey, and A. Yoshihashi, Eds. 2012, pp. 1–36.
[3] J. Vasconcelos, Á. Rocha, and R. Gomes, “Sistemas de Informação de Apoio à Decisão Clínica: Estudo de um caso de uma Instituição de Saúde,” Present. 5a Conferência da Assoc. Port. Sist. Informação, pp. 3–5, 2004.
[4] Á. Rocha, “Modelos de Maturidade para a Gestão dos Sistemas e Tecnologias de Informação na Saúde,” Interciencia, vol. 37, pp. 934–940, 2012.
[5] European Commission, “eHealth Action Plan 2012-2020: Frequently Asked Questions,” 2012.
[6] L. V. Lapão, “Organizational Challenges and Barriers to Implementing IT Governance in a Hospital,” Electron. J. Inf. Syst. Eval., vol. 14, no. 1, pp. 37–45, 2011.
[7] L. V. Lapão, “Survey on the status of the hospital information systems in Portugal,” Methods Inf. Med., vol. 46, no. 4, pp. 493–9, Jan. 2007.
[8] C. Costa, R. Santana, and S. Lopes, “Podem a Organização, a Gestão e o Financiamento das Organizações de Saúde em Portugal Produzir Resultados Diferentes em Termos de Eficiência?,” Lisboa, 2011.
[9] F. Lopes and Tribunal de Contas, “Meios Complementares de Diagnóstico e Terapêutica (MCDT),” Portal da Codificação Clínica e dos GDH, 2006. [Online]. Available: http://codplus.gim.med.up.pt/index.php/Meios_Complementares_de_Diagn%C3%B3stico_e_Terap%C3%AAutica_(MCDT). [Accessed: 14-Apr-2014].
[10] Direcção-Geral da Saúde, “Elementos Estatísticos: Informação Geral: Saúde 2009-2010,” Direção de Serviços de Informação e Análise Divisão de Epidemiologia e Estatística, 2013.
[11] Z. X. Z. Xue-jun, G. H. G. Hong, Z. Y. Z. Yun-ting, L. Y. L. Ying, and G. L. G. Li, “Educational Practice of Computer Science in Medical Imaging,” Educ. Technol. Comput. Sci. (ETCS), 2010 Second Int. Work., vol. 3, pp. 546 – 549, 2010.
[12] A. A. T. Bui, R. K. Taira, and H. Kangarloo, “Introduction,” in Medical Imaging Informatics, A. A. T. Bui and R. K. Taira, Eds. Springer Science & Business Media, 2010, pp. 3–13.
REFERÊNCIAS
96
[13] D. Aberle, S. El-saden, P. Abbona, A. Gomez, K. Motamedi, N. Ragavendra, L. Bassett, L. Seeger, M. Brown, K. Brown, A. A. T. Bui, and H. Kangarloo, “A Primer on Imaging Anatomy and Physiology,” in Medical Imaging Informatics, A. A. T. Bui and R. K. Taira, Eds. Springer Science & Business Media, 2010, pp. 15–90.
[14] M. J. M. Groenen, “Standardization and Coding of Gastrointestinal Endoscopy Reports,” Erasmus Universiteit Rotterdam, 2011.
[15] I. Laranjo, J. Braga, D. Assunção, A. Silva, C. Rolanda, L. Lopes, J. Correia-Pinto, and V. Alves, “Web-Based Solution for Acquisition, Processing, Archiving and Diffusion of Endoscopy Studies,” in Distributed Computing and Artificial Intelligence, vol. 217, Springer International Publishing, 2013, pp. 317–24.
[16] Sociedade Portuguesa de Endoscopia Digestiva (SPED), “O que é a Endoscopia Digestiva?,” Sociedade Portuguesa de Endoscopia Digestiva, 2012. [Online]. Available: http://www.sped.pt/index.php?option=com_k2&view=item&layout=item&id=25&Itemid=105. [Accessed: 25-May-2014].
[17] C. Avunduk, “Diagnostic an Therapeutic Procedures,” in Manual of Gastroenterology: Diagnosis and Therapy, 4th ed., C. Avunduk, Ed. Lippincott Williams & Wilkins, 2008, pp. 13–44.
[18] Ministério da Saúde and Administração Central do Sistema de Saúde (I.P.), “Rede de Referenciação Hospitalar de Gastrenterologia,” 2008.
[19] Sociedade Portuguesa de Endoscopia Digestiva (SPED), “Normas de Avaliação e Garantia da Qualidade da Endoscopia Digestiva em Portugal,” 2009.
[20] D. K. Iakovidis, D. E. Maroulis, and S. a Karkanis, “An intelligent system for automatic detection of gastrointestinal adenomas in video endoscopy,” Comput. Biol. Med., vol. 36, no. 10, pp. 1084–103, Oct. 2006.
[21] B. Wang and D. Yang, “Computer-Assisted Diagnosis of Digestive Endoscopic Images Based on Bayesian Theory,” Int. Conf. Inf. Eng. Comput. Sci., pp. 1–4, Dec. 2009.
[22] Y. Wu, “An Introduction to Computer Vision.” pp. 1–7, 2003.
[23] I. Culjak, D. Abram, T. Pribanic, H. Dzapo, and M. Cifrek, “A brief introduction to OpenCV,” MIPRO, 2012 Proc. 35th Int. Conv., pp. 1725–1730, 2012.
[24] C. Avunduk, “Approach to the Patient with a Gastroenterologic Disorder,” in Manual of Gastroenterology: Diagnosis and Therapy, 4th ed., C. Avunduk, Ed. Lippincott Williams & Wilkins, 2008, pp. 3–12.
[25] L. Ferro, “Contribuições para o Pré-processamento de Imagens Endoscópicas para a Detecção e Caracterização de Focos de Criptas Aberrantes,” Universidade do Porto, 2012.
REFERÊNCIAS
97
[26] J. L. Teh, J. R. Tan, L. J. F. Lau, N. Saxena, A. Salim, A. Tay, A. Shabbir, S. Chung, M. Hartman, and J. Bok-Yan So, “Longer Examination Time Improves Detection of Gastric Cancer During Diagnostic Upper Gastrointestinal Endoscopy,” Clin. Gastroenterol. Hepatol., vol. 13, no. 3, pp. 480–487, 2014.
[27] Sociedade Portuguesa de Endoscopia Digestiva (SPED), “Colonoscopia,” Sociedade Portuguesa de Endoscopia Digestiva, 2012. [Online]. Available: http://www.sped.pt/index.php?option=com_k2&view=item&layout=item&id=63&Itemid=172. [Accessed: 27-May-2014].
[28] A. Pimenta, D. Carneiro, P. Novais, and J. Neves, “Analysis of Human Performance as a Measure of Mental Fatigue,” Hybrid Artif. Intell., p. 12, 2014.
[29] D. Avison, F. Lau, M. Myers, and P. A. Nielsen, “Action Research,” Commun. ACM, 1999.
[30] B. Dick, “Action Research Theses,” pp. 1–90, 1993.
[31] J. McNiff, Action Research for Professional Development: Concise Advice for New Action Researchers. 2002.
[32] M. K. Mandal, “Multimedia Data Acquisition,” in Multimedia Signals and Systems, Kluwer Academic Publishers, 2003, pp. 57–82.
[33] J. Ozer, “Streaming 101: The Basics - Codecs, Bandwidth, Data Rate and Resolution,” Streaming Learning Center, 2009. [Online]. Available: http://www.streaminglearningcenter.com/articles/streaming-101-the-basics---codecs-bandwidth-data-rate-and-resolution.html. [Accessed: 12-Oct-2014].
[34] D. Briere and P. Hurley, “Getting the Big (Video) Picture,” in Home Theater For Dummies, 2nd ed., D. Briere and P. Hurley, Eds. Wiley Publishing, Inc., 2006, pp. 47–56.
[35] S. Monahan, “Video Editing Terms Explained – Part 2: Progressive (p) vs Interlaced (i) Recordings,” 2012. [Online]. Available: http://www.serif.com/blog/video-editing-terms-explained-part-2-progressive-p-vs-interlaced-i-recordings/. [Accessed: 12-Oct-2014].
[36] Axis Communications, “Image Scanning Techniques,” 2014. [Online]. Available: http://www.axis.com/products/video/camera/progressive_scan.htm. [Accessed: 13-Oct-2014].
[37] Rice, “Video Formats - A Guide to Understanding Video Containers & Codecs.” pp. 1–15, 2011.
[38] Liquid Team, “Stream Quality Guide,” TeamLiquid Forum, 2011. [Online]. Available: http://www.teamliquid.net/forum/tech-support/220584-stream-quality-guide. [Accessed: 12-Oct-2014].
[39] M. Pilgrim, “Video on the Web,” in HTML5: Up and Running, O’Reilly Media, 2010, pp. 83–120.
REFERÊNCIAS
98
[40] R. Pierson, “What is Video Compression?,” 2011. [Online]. Available: http://www.lockergnome.com/media/2011/08/12/what-is-video-compression/. [Accessed: 13-Jul-2014].
[41] B. Erol, F. Kossentini, A. Joch, G. J. Sullivan, and L. Winger, “MPEG-4 Visual and H.264/AVC: Standards for Modern Digital Video,” in The Essential Guide to Video Processing, A. C. Bovik, Ed. Academic Press, 2009, pp. 295–330.
[42] L. Case, “All About Video Codecs and Containers,” 2010. [Online]. Available: http://www.techhive.com/article/213612/all_about_video_codecs_and_containers.html. [Accessed: 13-Jul-2014].
[43] J. Ostermann, J. Bormans, P. List, D. Marpe, M. Narroschke, F. Pereira, T. Stockhammer, and T. Wedi, “Video coding with H.264/AVC: Tools, Performance, and Complexity,” IEEE Circuits and Systems Magazine, p. 28, 2004.
[44] The MPEG Industry Forum, “Understanding MPEG-4: Technologies, Advantage, and Markets,” MEPG-4, no. An MPEGIF White Paper, pp. 1–44, 2005.
[45] Xvid, “Questions and Answers,” Xvid, 2014. [Online]. Available: https://www.xvid.com/faq/. [Accessed: 15-Jul-2014].
[46] XviD Movies, “What is XviD?,” XviDMovies.com, 2015. [Online]. Available: http://www.xvidmovies.com/info/. [Accessed: 15-Jul-2014].
[47] Angelo Lorenzo, “A Guide to Common Video Formats: Containers, Compression, and Codecs,” Fallen Empire, 2013. [Online]. Available: http://www.fallenempiredigital.com/blog/2013/02/08/a-guide-to-common-video-formats-containers-compression-and-codecs/. [Accessed: 14-Jul-2014].
[48] Motion Elements, “What You Need to Know About the 5 Most Common Video File Formats,” 2013. [Online]. Available: http://www.motionelements.com/blog/articles/what-you-need-to-know-about-the-5-most-common-video-file-formats. [Accessed: 15-Jun-2014].
[49] Matroska, “What is Matroska?,” 2013. [Online]. Available: http://matroska.org/technical/whatis/index.html. [Accessed: 01-Aug-2014].
[50] D. Wu, Y. T. Hou, W. Zhu, Y. Q. Zhang, and J. M. Peha, “Streaming video over the internet: Approaches and directions,” IEEE Trans. Circuits Syst. Video Technol., vol. 11, no. 3, pp. 282–300, 2001.
[51] B. Stroustrup, “Notes to the Reader,” in The C ++ Programming, 2013, pp. 3–36.
[52] K. Pulli, A. Baksheev, K. Kornyakov, and V. Eruhimov, “Real-time computer vision with OpenCV,” Commun. ACM, vol. 55, no. 6, pp. 61–69, 2012.
REFERÊNCIAS
99
[53] Itseez, “About OpenCV,” OpenCV. [Online]. Available: http://opencv.org/about.html. [Accessed: 03-Sep-2013].
[54] T. B. Moeslund, “Color Images,” in Introduction to Video and Image Processing: Building Real Systems and Applications, Springer, 2012, pp. 25–42.
[55] R. C. Gonzalez and R. E. Woods, “Color Image Processing,” in Digital Image Processing, 3rd ed., Prentice Hall, 2008, pp. 416–482.
[56] F. I. Parke, “Color Spaces,” Texas A&M University, 2005. [Online]. Available: http://www.viz.tamu.edu/faculty/parke/ends375f05/notes/sec1_4.html. [Accessed: 21-Nov-2013].
[57] Dr. Camran Nezhat, “History of Endoscopy,” Society of Laparoendoscopic Surgeons, 2005. [Online]. Available: http://laparoscopy.blogs.com/endoscopyhistory/. [Accessed: 04-Nov-2014].
[58] G. Berci and K. A. Forde, “History of endoscopy,” Surg. Endosc., vol. 14, no. 1, pp. 5–15, Jan. 2000.
[59] M. F. e Costa, “endoscopia,” in Dicionário de Termos Médicos, Porto Editora, 2014.
[60] Sociedade Portuguesa de Endoscopia Digestiva (SPED), “O que é a Gastrenterologia?,” Sociedade Portuguesa de Endoscopia Digestiva, 2012. [Online]. Available: http://www.sped.pt/index.php?option=com_k2&view=item&layout=item&id=24&Itemid=104. [Accessed: 25-May-2014].
[61] L. Aabakken, B. Rembacken, O. LeMoine, K. Kuznetsov, J.-F. Rey, T. Rösch, G. Eisen, P. Cotton, and M. Fujino, “Minimal standard terminology for gastrointestinal endoscopy - MST 3.0.,” Aug. 2009.
[62] Cancer.Net, “Newer Types of Endoscopy,” Cancer.Net, 2015. [Online]. Available: http://www.cancer.org/treatment/understandingyourdiagnosis/examsandtestdescriptions/endoscopy/endoscopy-new-types-endoscopy. [Accessed: 05-Feb-2014].
[63] Healthwise Staff, “Virtual Colonoscopy,” WebMD, 2013. [Online]. Available: http://www.webmd.com/digestive-disorders/tc/virtual-colonoscopy-topic-overview. [Accessed: 13-Mar-2014].
[64] Y. Shen, H. K. Kang, Y. Y. Jeong, S. H. Heo, S. M. Han, K. Chen, and Y. Liu, “Evaluation of Early Gastric Cancer at Multidetector CT with Multiplanar Reformation and Virtual Endoscopy,” Radiogr. - Gastrointest. Imaging, vol. 31, pp. 189–99, 2011.
[65] R. M. Summers, J. Yao, P. J. Pickhardt, I. Bitter, D. Brickman, V. Krishna, and R. Choi, “Computed Tomographic Virtual Colonoscopy Computer-Aided Polyp Detection in a Screening Population,” Gastroenterology, vol. 129, no. 6, pp. 1832–1844, 2005.
REFERÊNCIAS
100
[66] D. S. Mishkin, R. Chuttani, J. Croffie, J. Disario, J. Liu, R. Shah, L. Somogyi, W. Tierney, L. M. Wong Kee Song, and B. T. Petersen, “ASGE Technology Status Evaluation Report: Wireless Capsule Endoscopy,” Gastrointest. Endosc., vol. 63, pp. 539–545, 2006.
[67] M. Delvaux and G. Gay, “Capsule Endoscopy: Technique and Indications,” Best Pract. Res. Clin. Gastroenterol., vol. 22, no. 5, pp. 813–837, 2008.
[68] M. Muñoz-Navas, “Capsule endoscopy,” World J. Gastroenterol., vol. 15, no. 13, pp. 1584–1586, 2009.
[69] G. Pan and L. Wang, “Swallowable Wireless Capsule Endoscopy: Progress and Technical Challenges,” Gastroenterol. Res. Pract., vol. 2012, pp. 1–10, 2012.
[70] J. M. Canard, J.-C. Létard, and A. M. Lennon, “Diagnostic upper endoscopy,” in Gastrointestinal Endoscopy in Practice, 1st ed., J. M. Canard, J.-C. Létard, L. Palazzo, I. Penman, and A. M. Lennon, Eds. Elsevier Churchill Livingstone, 2011, pp. 84–100.
[71] P. B. Cotton and C. B. Williams, “The Endoscopy Unit and Staff,” in Practical Gastrointestinal Endoscopy: The Fundamentals, 6th ed., Wiley-Blackwell, 2008, pp. 1–6.
[72] P. B. Cotton and C. B. Williams, “Patient Care, Risks, and Safety,” in Practical Gastrointestinal Endoscopy: The Fundamentals, 6th ed., Wiley-Blackwell, 2008, pp. 22–36.
[73] Sociedade Portuguesa de Endoscopia Digestiva (SPED), “Preparação e Monitorização em Endoscopia Digestiva,” 2006.
[74] P. B. Cotton and C. B. Williams, “Endoscopic Equipment,” in Practical Gastrointestinal Endoscopy: The Fundamentals, 6th ed., Wiley-Blackwell, 2008, pp. 7–36.
[75] P. B. Cotton and C. B. Williams, “Upper Endoscopy: Diagnostic Techniques,” in Practical Gastrointestinal Endoscopy: The Fundamentals, 6th ed., Wiley-Blackwell, 2008, pp. 37–60.
[76] Mayo Foundation for Medical Education and Research, “Endoscopy,” Mayo Foundation for Medical Education and Research, 2015. [Online]. Available: http://www.mayoclinic.org/tests-procedures/endoscopy/multimedia/endoscopy/img-20007299. [Accessed: 17-Mar-2014].
[77] Mayo Foundation for Medical Education and Research, “Video: Endoscopy,” Mayo Foundation for Medical Education and Research, 2015. [Online]. Available: http://www.mayoclinic.org/tests-procedures/endoscopy/multimedia/endoscopy/vid-20084761. [Accessed: 17-Mar-2014].
[78] Portascope.com, “Complimentary Endoscope Information and Inspection Procedures,” Olympus Pentax Fujinon Endoscopes Endoscopy Equipment Inventory, 2012. [Online]. Available: http://www.1800endoscope.com/faq.htm. [Accessed: 18-Apr-2014].
[79] National Digestive Diseases Information Clearinghouse, “Upper GI Series,” 14, 2014.
[80] K. F. R. Schiller, R. Cockel, R. H. Hunt, and B. F. Warren, “Upper Gastrointestinal Tract,” in Atlas of Gastrointestinal Endoscopy and Related Pathology, 2nd ed., Blackwell Science, 2002, pp. 19–226.
REFERÊNCIAS
101
[81] J.-C. Létard, “Endoscopy reports,” in Gastrointestinal Endoscopy in Practice, 1st ed., J. M. Canard, J.-C. Létard, L. Palazzo, I. Penman, and A. M. Lennon, Eds. Elsevier Churchill Livingstone, 2011, pp. 80–83.
[82] K. Takubo, “Structure of the Esophagus,” in Pathology of the Esophagus: An Atlas and Textbook, 2nd ed., Springer Science & Business Media, 2009, pp. 8–45.
[83] K. L. Moore, A. F. Dalley, and A. M. R. Agur, “Abdomen,” in Clinically Oriented Anatomy, 6th ed., Lippincott Williams & Wilkins, 2010, pp. 181–325.
[84] P. J. Lamb and S. M. Griffin, “The Anatomy and Physiology of the Oesophagus,” in Upper Gastrointestinal Surgery, J. W. L. Fielding and M. T. Hallissey, Eds. Springer, 2005, pp. 1–16.
[85] F. H. Netter, “Topography and Constrictions of Esophagus,” in Atlas of Human Anatomy, 6th ed., Elsevier Health Sciences, 2014, p. 230.
[86] E. N. Marieb and K. Hoehn, “The Digestive System,” in Human Anatomy & Physiology, 9th ed., Pearson Education, 2013, pp. 849–905.
[87] R. L. Drake, A. W. Vogl, and A. W. M. Mitchell, “Vísceras Abdominais,” in Gray’s - Anatomia para Estudantes, 1st ed., Elsevier, 2005, pp. 226–313.
[88] I. R. Daniels and W. H. Allum, “The Anatomy and Physiology of the Stomach,” in Upper Gastrointestinal Surgery, J. W. L. Fielding and M. T. Hallissey, Eds. Springer, 2005, pp. 17–38.
[89] S. J. Belsley, “Duodenum - Struture, Function, and Role in Weight-Loss,” Laparoscopic.MD, 2014. [Online]. Available: http://www.laparoscopic.md/digestion/duodenum. [Accessed: 20-Mar-2014].
[90] M. Schuenke, E. Schulte, and U. Schumacher, “Abdomen and Pelvis,” in Atlas of Anatomy: Neck and Internal Organs, 1st ed., Thieme, 2010, pp. 150–332.
[91] K. F. R. Schiller, R. Cockel, R. H. Hunt, and B. F. Warren, “Lower Gastrointestinal Tract,” in Atlas of Gastrointestinal Endoscopy and Related Pathology, 2nd ed., Blackwell Science, 2002, pp. 227–342.
[92] P. B. Cotton and C. B. Williams, “Colonoscopy and Flexible Sigmoidoscopy,” in Practical Gastrointestinal Endoscopy: The Fundamentals, 6th ed., Wiley-Blackwell, 2008, pp. 87–175.
[93] G. Jechart, “General Information Regarding Examination,” in Atlas of Colonoscopy: Examination Techniques and Diagnosis, H. Messmann, Ed. Thieme, 2011, pp. 2–6.
[94] Mayo Foundation for Medical Education and Research, “Colonoscopy,” Mayo Foundation for Medical Education and Research, 2015. [Online]. Available: http://www.mayoclinic.org/tests-procedures/colonoscopy/multimedia/colonoscopy-exam/img-20008879. [Accessed: 17-Mar-2014].
[95] EugeneGI, “Colonoscopy,” Eugene Gastroenterology Consultants, 2014. [Online]. Available: http://www.eugenegi.com/procedures/procedures. [Accessed: 18-Mar-2014].
REFERÊNCIAS
102
[96] OpenStax College, “The Digestive System,” in Anatomy & Physiology, Rice University, 2013, pp. 1035–1094.
[97] J. E. Hall, “Propulsion and Mixing of Food in the Alimentary Tract,” in Guyton and Hall Textbook of Medical Physiology, 12th ed., Elsevier Health Sciences, 2010, pp. 763–772.
[98] Sociedade Portuguesa de Gastrenterologia, “O Aparelho Digestivo,” 2007.
[99] S. J. Belsley, “The Colon and How Bacteria Help Digestion,” Laparoscopic.MD, 2015. [Online]. Available: http://www.laparoscopic.md/digestion/colon. [Accessed: 20-Mar-2014].
[100] M. Liedlgruber and A. Uhl, “A Summary of Research Targeted at Computer-Aided Decision Support in Endoscopy of the Gastrointestinal Tract,” 2011.
[101] I. Laranjo, J. Braga, D. Assunção, C. Rolanda, L. Lopes, J. Correia-pinto, and V. Alves, “Video Processing Architecture: A Solution for Endoscopic Procedures Results,” Ambient Intell. Appl. Int. Publ. ISO 690, vol. 291, pp. 117–125, 2014.
[102] N. Bourbakis, “Detecting abnormal patterns in WCE images,” Proc. - BIBE 2005 5th IEEE Symp. Bioinforma. Bioeng., pp. 232–238, 2005.
[103] R. M. Summers, A. K. Jerebko, M. Franaszek, and J. D. Malley, “An integrated system for computer-aided diagnosis in CT colonography: work in progress,” Int. Congr. Ser., vol. 1230, pp. 669–675, Jun. 2001.
[104] DICOM, “DICOM: About DICOM,” DICOM. [Online]. Available: http://medical.nema.org/Dicom/about-DICOM.html. [Accessed: 27-Jun-2014].
[105] J.-G. Lee, J. Hyo Kim, S. Hyung Kim, H. Sun Park, and B. Ihn Choi, “A straightforward approach to computer-aided polyp detection using a polyp-specific volumetric feature in CT colonography.,” Comput. Biol. Med., vol. 41, no. 9, pp. 790–801, Sep. 2011.
[106] G. S. Sawhney, “Digital Image Acquisition and Processing,” in Fundamentals of Biomedical Engineering, New Age International (P) Ltd., 2007, pp. 186–193.
[107] D. Mirota, H. Wang, R. H. Taylor, M. Ishii, and G. D. Hager, “Toward video-based navigation for endoscopic endonasal skull base surgery,” Med. Image Comput. Comput. Interv. – MICCAI 2009, vol. 12, no. Pt 1, pp. 91–9, Jan. 2009.
[108] Sociedade Portuguesa de Endoscopia Digestiva (SPED), “Endomicroscopia Confocal,” Sociedade Portuguesa de Endoscopia Digestiva, 2012. [Online]. Available: http://www.sped.pt/index.php?option=com_k2&view=item&id=56:endomicroscopia-confocal&Itemid=254. [Accessed: 28-May-2014].
[109] J. Ayoub, B. Granado, O. Romain, and Y. Mohanna, “A new approach to 3D form recognition within video capsule endoscopic,” Proc. 2011 Conf. Des. Archit. Signal Image Process., pp. 1–7, Nov. 2011.
REFERÊNCIAS
103
[110] S. Annadurai and R. Shanmugalakshmi, “Introduction to Digital Image Processing,” in Fundamentals of Digital Image Processing, 1st ed., Pearson Education, 2007, pp. 1–18.
[111] T. B. Moeslund, “Introduction,” in Introduction to Video and Image Processing: Building Real Systems and Applications, Springer, 2012, pp. 1–6.
[112] XION, “Xion HD 1080p.” Xion, pp. 1–5, 2009.
[113] R. Wolf, “VictOR HD HDTV Recording Technology - a touching experience.” pp. 1–6, 2011.
[114] PENTAX, “endoPRO iQ®,” PENTAX Medical, 2014. [Online]. Available: http://pentaxmedical.com/pentax/en/99/2/EndoPRO-iQ/;jsessionid=D2FEA7C6356B5068ECE7022A03FB7B2F.node0. [Accessed: 08-Aug-2014].
[115] S. Mangiola, “PENTAX Launches Cross-Platform Software for Endoscopy Units,” Medical Design, 2014. [Online]. Available: http://medicaldesign.com/electronics/pentax-launches-cross-platform-software-endoscopy-units-0. [Accessed: 08-Aug-2014].
[116] PENTAX, “PENTAX Medical endoPRO iQ ® Technology Solutions.” PENTAX Medical, pp. 1–2, 2014.
[117] Mobilwave, “DOCbase Gastrenterologia,” Mobilwave Healthcare Solutions. [Online]. Available: http://www.mobilwave.pt/gastrenterologia.php. [Accessed: 09-Aug-2014].
[118] SiiMA, “SiiMA management of SMDTs in clinical services,” First, 2011. [Online]. Available: http://www.first-global.com/pt/pages/siima.aspx. [Accessed: 09-Aug-2014].
[119] Y. Li, S. Narayanan, and C.-C. J. Kuo, “Movie Content Analysis, Indexing and Skimming,” in Video Mining, Kluwer Academic Publishers, 2003, pp. 1–32.
[120] R. M. Jiang, A. H. Sadka, and D. Crookes, “Advances in Video Summarization and Skimming,” in Recent Advances in Multimedia Signal Processing and Communications, vol. 231, M. Grgic, K. Delac, and M. Ghanbari, Eds. Springer, 2009, pp. 27–50.
[121] Y. Takahashi, N. Nitta, and N. Babaguchi, “Video Summarization for Large Sports Video Archives,” IEEE Int. Conf. Multimed. Expo, ICME 2005, pp. 1170–1173, 2005.
[122] H. M. Zawbaa, N. El-Bendary, A. E. Hassanien, and A. Abraham, “SVM-based Soccer Video Summarization System,” 2011 Third World Congr. Nat. Biol. Inspired Comput., no. 2, pp. 7–11, 2011.
[123] J. Almeida, N. J. Leite, and R. D. S. Torres, “VISON: VIdeo Summarization for ONline applications,” Pattern Recognit. Lett., vol. 33, no. 4, pp. 397–409, 2012.
[124] X. Zhu, J. Fan, A. K. Elmagarmid, and W. G. Aref, “Hierarchical Video Summarization for Medical Data,” Proc. SPIE, vol. 4676, pp. 395–406, 2002.
REFERÊNCIAS
104
[125] X. Zhu, J. Fan, W. G. Aref, and A. K. Elmagarmid, “ClassMiner: Mining Medical Video Content Structure and Events Towards Efficient Access and Scalable Skimming,” Res. Issues Data Min. Knowl. Discov. - DMKD, 2002.
[126] D. K. Iakovidis, S. Tsevas, and A. Polydorou, “Reduction of Capsule Endoscopy Reading Times by Unsupervised Image Mining,” Comput. Med. Imaging Graph., vol. 34, pp. 471–478, 2010.
[127] S. Tsevas, D. K. Iakovidis, D. Maroulis, and E. Pavlakis, “Automatic Frame Reduction of Wireless Capsule Endoscopy Video,” 8th IEEE Int. Conf. Bioinforma. Bioeng. BIBE 2008, 2008.
[128] M. M. Ben Ismail, O. Bchir, and A. Z. Emam, “Endoscopy Video Summarization based on Unsupervised Learning and Feature Discrimination,” 2013 IEEE Int. Conf. Vis. Commun. Image Process., pp. 1–6, 2013.
[129] I. Mehmood, M. Sajjad, and S. W. Baik, “Video Summarization Based Tele-Endoscopy: a Service to Efficiently Manage Visual Data Generated During Wireless Capsule Endoscopy Procedure,” J. Med. Syst., vol. 38, no. 109, pp. 1–9, 2014.
[130] I. Mehmood, M. Sajjad, and S. W. Baik, “Mobile-Cloud Assisted Video Summarization Framework for Efficient Management of Remote Sensing Data Generated by Wireless Capsule Sensors,” Sensors, vol. 14, pp. 17112–17145, 2014.
[131] Ellora Assets Corporation, “Freemake Downloads,” freemake.com. [Online]. Available: http://www.freemake.com/downloads/. [Accessed: 16-Jan-2015].
[132] N. Rungseekajee, M. Lohvithee, and I. Nilkhamhang, “Informative frame classification method for real-time analysis of colonoscopy video,” in 2009 6th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, 2009, vol. 2, pp. 1076–1079.
[133] S. R. Stanek, W. Tavanapong, J. Wong, J. H. Oh, and P. C. de Groen, “Automatic real-time detection of endoscopic procedures using temporal features,” Comput. Methods Programs Biomed., vol. 108, no. 2, pp. 524–35, Nov. 2012.
[134] M. Ajmal, M. H. Ashraf, and M. Shakir, “Video Summarization Techniques and Classification,” pp. 1–13, 2012.
[135] G. G. Lee, C. Chen, and H. Lin, “Algorithmic complexity analysis on data transfer rate and data storage for multidimensional signal processing,” 2013 IEEE Work. Signal Process. Syst., pp. 171–176, 2013.
[136] J. Oh, S. Hwang, J. Lee, W. Tavanapong, J. Wong, and P. C. De Groen, “Informative frame classification for endoscopy video,” Med. Image Anal., vol. 11, no. 2, pp. 110–127, 2007.
[137] H. Tong, M. Li, H. Zhang, and C. Zhang, “Blur detection for digital images using wavelet transform,” Multimed. Expo, 2004, vol. 1, pp. 17–20, 2004.
REFERÊNCIAS
105
[138] R. Liu, Z. Li, and J. Jia, “Image partial blur detection and classification,” 26th IEEE Conf. Comput. Vis. Pattern Recognition, CVPR, pp. 1–8, 2008.
[139] E. Tsomko and H. J. Kim, “Efficient method of detecting globally blurry or sharp images,” WIAMIS 2008 - Proc. 9th Int. Work. Image Anal. Multimed. Interact. Serv., pp. 171–174, 2008.
[140] C. A. Segall, P. Karunaratne, and A. K. Katsaggelos, “Pre-processing of Compressed Digital Video,” pp. 1–12, 2001.
[141] L. M. Morimoto, P. A. Newcomb, C. M. Ulrich, R. M. Bostick, C. J. Lais, and J. D. Potter, “Risk Factors for Hyperplastic and Adenomatous Polyps: Evidence for Malignant Potential?,” J. Natl. Cancer Inst., vol. 11, pp. 1012–1018, 2002.
[142] R. MacLennan, F. Macrae, C. Bain, D. Battistutta, P. Chapuis, H. Gratten, J. Lambert, R. C. Newland, M. Ngu, A. Russell, M. Ward, and M. L. Wahlqvist, “Randomized trial of intake of fat, fiber, and beta carotene to prevent colorectal adenomas,” J. Natl. Cancer Inst., vol. 87, no. 23, pp. 1760–6, Dec. 1995.
[143] L. B. Saltz, Colorectal Cancer: multimodality management. Humana Press, 2002, p. 854.
[144] L. P. de Carvalho and T. J. Wilson, “Estudo comparativo entre pólipos hiperplásicos e adenomas colorretais em pacientes submetidos à colonoscopia,” vol. 55, no. 1, pp. 37–41, 2011.
[145] A. Alexandre and N. Nobre, “Polyp Detection in Endoscopic Video Using SVMs,” pp. 358–365, 2007.
[146] A. Nasser Esgiar, R. N. G. Naguib, B. S. Sharif, M. K. Bennett, and A. Murray, “Microscopic image analysis for quantitative measurement and feature identification of normal and cancerous colonic mucosa,” IEEE Trans. Inf. Technol. Biomed., vol. 2, no. 3, pp. 197–203, 1998.
[147] S. Kudo, S. Tamura, T. Nakajima, H. Yamano, H. Kusaka, and H. Watanabe, “Diagnosis of colorectal tumorous lesions by magnifying endoscopy.,” Gastrointest. Endosc., vol. 44, no. 1, pp. 8–14, Jul. 1996.
[148] S. Karkanis, K. Galousi, and D. Maroulis, “Classification of Endoscopic Images Based on Texture Spectrum,” in Proceedings of the Workshop on Machine Learning in Medical Applications, Advance Course in Artificial Intelligence, 1999, pp. 63–69.
[149] S. A. Karkanis, G. D. Magoulas, M. Grigoriadou, and M. Schurr, “Detecting Abnormalities in Colonoscopic Images by Textural Description and Neural Networks,” in Proceedings of the Workshop on Machine Learning in Medical Applications, Advance Course in Artificial Intelligence, 1999, pp. 59–62.
[150] G. D. Magoulas, V. P. Plagianakos, and M. N. Vrahatis, “Neural network-based colonoscopic diagnosis using on-line learning and differential evolution,” Appl. Soft Comput., vol. 4, no. 4, pp. 369–379, Sep. 2004.
REFERÊNCIAS
106
[151] P. Wang, S. M. Krishnan, C. Kugean, and M. P. Tjoa, “Classification of endoscopic images based on texture and neural network,” Conf. Proc. 23rd Annu. Int. Conf. IEEE Eng. Med. Biol. Soc., vol. 4, pp. 3691–3695, 2001.
[152] S. A. Karkanis, D. K. Iakovidis, D. A. Karras, and D. E. Maroulis, “Detection of lesions in endoscopic video using textural descriptors on wavelet domain supported by artificial neural network architectures,” in Proceedings 2001 International Conference on Image Processing (Cat. No.01CH37205), 2001, vol. 2, pp. 833–836.
[153] S. M. Krishnan, X. Yang, K. L. Chan, S. Kumar, and P. M. Y. Goh, “Intestinal abnormality detection from endoscopic images,” in Proceedings of the 20th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Vol.20 Biomedical Engineering Towards the Year 2000 and Beyond (Cat. No.98CH36286), 1998, vol. 2, pp. 895–898.
[154] B. V. Dhandra, R. Hegadi, M. Hangarge, and V. S. Malemath, “Endoscopic image classification based on active contours without edges,” 2006 1st Int. Conf. Digit. Inf. Manag., no. 1, pp. 167–172, Apr. 2007.
[155] S. A. Karkanis, D. K. Iakovidis, D. E. Maroulis, G. D. Magoulas, and N. G. Theofanous, “Tumor recognition in endoscopic video images using artificial neural network architectures,” in Proceedings of the 26th Euromicro Conference. EUROMICRO 2000. Informatics: Inventing the Future, 2000, vol. 2, pp. 423–429.
[156] M. P. Tjoa and S. M. Krishnan, “Feature extraction for the analysis of colon status from the endoscopic images,” Biomed. Eng. Online, vol. 2, pp. 1–9, Apr. 2003.
[157] S. a Karkanis, D. K. Iakovidis, D. E. Maroulis, D. a Karras, and M. Tzivras, “Computer-aided tumor detection in endoscopic video using color wavelet features,” IEEE Trans. Inf. Technol. Biomed., vol. 7, no. 3, pp. 141–52, Sep. 2003.
[158] G. Van de Wouwer, P. Scheunders, S. Livens, and D. Van Dyck, “Wavelet correlation signatures for color texture characterization,” Pattern Recognit., vol. 32, no. 3, pp. 443–451, Mar. 1999.
[159] A. Karargyris and N. Bourbakis, “A methodology for detecting blood-based abnormalities in Wireless Capsule Endoscopy videos,” in 8th IEEE International Conference on BioInformatics and BioEngineering, 2008, pp. 1–6.
[160] N. Bourbakis, S. Makrogiannis, and D. Kavraki, “A neural network-based detection of bleeding in sequences of WCE images,” Proc. - BIBE 2005 5th IEEE Symp. Bioinforma. Bioeng., pp. 324–327, 2005.
[161] S. K. Shah, P. P. Rajauria, J. Lee, and M. E. Celebi, “Classification of Bleeding Images in Wireless Capsule Endoscopy using HSI Color Domain and Region Segmentation,” pp. 1–7, 2007.
[162] B. Penna, T. Tillo, M. Grangetto, E. Magli, and G. Olmo, “A technique for blood detection in wireless capsule endoscopy images,” 17th Eur. Signal Process. Conf., no. Eusipco, pp. 1864–1868, 2009.
REFERÊNCIAS
107
[163] A. A. Al-Rahayfeh and A. A. Abuzneid, “Detection of Bleeding in Wireless Capsule Endoscopy Images Using Range Ratio Color,” 2010.
[164] J. Ma, T. Tillo, B. Zhang, Z. Wang, and E. Lim, “Novel Training and Comparison Method for Blood Detection in Wireless Capsule Endoscopy Images,” no. 10, pp. 56–60, 2013.
REFERÊNCIAS
108
APÊNDICES
APÊNDICES
110
Apêndice A. REMOÇÃO DE FRAMES INICIAIS, FINAIS E PRETOS
Na Tab. A.1 que se encontra abaixo, estão os valores resultantes da aplicação da solução para remoção de
frames iniciais, finais e pretos, nos vídeos originais.
Tab. A.1 – Resultados obtidos após aplicação da solução para remoção de frames iniciais, finais e pretos. As células a cor-de-laranja são referentes aos 4 exames de EDB, as restantes 27 correspondem a EDA.
ID Container Codec Tamanho
(MB)
Duração
(s)
Resolução
(pixéis)
Bit Rate
(kbps)
Frame Rate
(fps)
Frames
Totais
EDA001 .avi Xvid 112,1 475 1920x1080 1888,0 6 2850
EDA002 .avi Xvid 355,7 1767 1920x1080 1610,4 6 10603
EDA003 .avi Xvid 277 1238 1920x1080 1790,0 6 7428
EDA004 .avi Xvid 55,8 238 1920x1080 1875,6 6 1428
EDA005 .avi Xvid 34,2 162 1920x1080 1688,9 6 976
EDA006 .avi Xvid 17,6 76 1920x1080 1852,6 6 456
EDA007 .avi Xvid 77,3 380 1920x1080 1627,4 6 2283
EDA008 .avi Xvid 71,4 325 1920x1080 1757,5 6 1951
EDA009 .avi Xvid 43,2 224 1920x1080 1542,9 6 1346
EDA010 .avi Xvid 70,8 396 1920x1080 1430,3 6 2378
COL001 .avi Xvid 321,7 1414 1920x1080 1820,1 6 8484
EDA011 .avi Xvid 48,6 207 1920x1080 1878,3 6 1244
EDA012 .avi Xvid 55,2 240 1920x1080 1840,0 6 1445
EDA013 .avi Xvid 53,9 245 1920x1080 1760,0 6 1475
EDA014 .avi Xvid 43,5 167 1920x1080 2083,8 6 1003
EDA015 .avi Xvid 40,2 174 1920x1080 1848,3 6 1049
EDA016 .avi Xvid 85,5 435 1920x1080 1572,4 6 2614
EDA017 .avi Xvid 65,5 263 1920x1080 1992,4 6 1581
EDA018 .avi Xvid 96 425 1920x1080 1807,1 6 2552
EDA019 .avi Xvid 104,3 474 1920x1080 1760,3 6 2846
EDA020 .avi Xvid 101,6 436 1920x1080 1864,2 6 2619
EDA021 .avi Xvid 58,5 295 1920x1080 1586,4 6 1774
EDA022 .avi Xvid 57 278 1920x1080 1640,3 6 1670
COL002 .avi Xvid 495,9 2467 1920x1080 1608,1 6 14802
EDA023 .avi Xvid 108,3 497 1920x1080 1743,3 6 2986
COL003 .avi Xvid 258,7 933 1920x1080 2218,2 8 7467
COL004 .avi Xvid 126,2 579 1920x1080 1743,7 6 3478
APÊNDICES
111
A partir dos valores obtidos na Tab. A.1 calcularam-se os valores totais de tamanho de armazenamento,
duração e número de frames, que estão representados na Tab. A.2.
Tab. A.2 – Valores totais de tamanho de armazenamento, duração e número de frames, relativos aos dados resultantes da aplicação da solução para remoção de frames iniciais, finais e pretos.
Após o cálculo dos valores totais é possível obter-se a variação de tamanho de armazenamento e de duração,
em percentagem, que permite tirar conclusões sobre o ganho ou a perda referentes aos mesmos, a partir
das equações Eq. A.1 e Eq. A.2:
∆ Tamanho = (1 −Tamanho final
Tamanho inicial) × 100
Eq. A.1 – Variação de tamanho de armazenamento em percentagem.
∆ Duração = (1 −Duração final
Duração inicial
) ×100
Eq. A.2 – Variação da duração em percentagem.
Na Tab. A.3 encontram-se os valores iniciais e finais de tamanho de armazenamento e de duração dos
vídeos endoscópicos, ou seja, os valores originais e os valores resultantes das soluções para remoção de
frames iniciais, finais e pretos, assim como os valores das respetivas variações.
Tab. A.3 – Valores iniciais e finais de tamanho de armazenamento e de duração e os seus respetivos valores de variação.
Vídeos
Endoscópicos
Número de Vídeos
Endoscópicos ∑ Tamanho (MB) ∑ Duração (s) ∑ Frames Totais
EDA 23 2033,2 9417 56557
EDB 4 1202,5 5393 34231
TOTAL 27 3235,7 14810 90788
Vídeos
Endoscópicos
Número de Vídeos
Endoscópicos
∑ Tamanho
inicial (MB)
∑ Tamanho
final (MB)
∆ Tamanho
(%)
∑ Duração
inicial (s)
∑ Duração
final (s)
∆ Duração
(%)
EDA 23 1959,2 2033,2 -3,8 17299 9417 45,6
EDB 4 1225,4 1202,5 1,9 12252 5393 56
TOTAL 27 3184,6 3235,7 -1,6 29551 14810 49,9
APÊNDICES
112
Apêndice B. REMOÇÃO DE FRAMES DESFOCADOS
Na Tab. B.1 que se encontra abaixo, estão os valores resultantes da aplicação da solução para remoção de
frames desfocados, nos vídeos resultantes da solução para remoção de frames iniciais, finais e pretos.
Tab. B.1 – Resultados obtidos após aplicação da solução para remoção de frames desfocados. As células a cor-de-laranja são referentes aos 4 exames de EDB, as restantes 27 correspondem a EDA.
ID Container Codec Tamanho
(MB)
Duração
(s)
Resolução
(pixéis)
Bit Rate
(kbps)
Frame Rate
(fps)
Frames
Totais
EDA001 .avi Xvid 107,7 450 1920x1080 1914,7 6 2704
EDA002 .avi Xvid 346,9 1737 1920x1080 1597,7 6 10424
EDA003 .avi Xvid 273,8 1230 1920x1080 1780,8 6 7384
EDA004 .avi Xvid 53,4 225 1920x1080 1898,7 6 1350
EDA005 .avi Xvid 32 152 1920x1080 1684,2 6 915
EDA006 .avi Xvid 15,8 66 1920x1080 1915,2 6 398
EDA007 .avi Xvid 74,2 365 1920x1080 1626,3 6 2191
EDA008 .avi Xvid 68,6 312 1920x1080 1759,0 6 1872
EDA009 .avi Xvid 38,6 198 1920x1080 1559,6 6 1193
EDA010 .avi Xvid 64,2 362 1920x1080 1418,8 6 2172
COL001 .avi Xvid 299,4 1273 1920x1080 1881,5 6 7640
EDA011 .avi Xvid 46,4 195 1920x1080 1903,6 6 1171
EDA012 .avi Xvid 53,3 232 1920x1080 1837,9 6 1392
EDA013 .avi Xvid 52,3 237 1920x1080 1765,4 6 1427
EDA014 .avi Xvid 40,4 155 1920x1080 2085,2 6 933
EDA015 .avi Xvid 38,6 163 1920x1080 1894,5 6 979
EDA016 .avi Xvid 78,9 401 1920x1080 1574,1 6 2411
EDA017 .avi Xvid 64 257 1920x1080 1992,2 6 1544
EDA018 .avi Xvid 90,6 384 1920x1080 1887,5 6 2304
EDA019 .avi Xvid 103,1 473 1920x1080 1743,8 6 2843
EDA020 .avi Xvid 97,2 413 1920x1080 1882,8 6 2479
EDA021 .avi Xvid 54,7 274 1920x1080 1597,1 6 1647
EDA022 .avi Xvid 53,5 250 1920x1080 1712,0 6 1501
COL002 .avi Xvid 485,1 2417 1920x1080 1605,6 6 14503
EDA023 .avi Xvid 100,7 449 1920x1080 1794,2 6 2698
COL003 .avi Xvid 255,5 931 1920x1080 2195,5 8 7449
COL004 .avi Xvid 114 511 1920x1080 1784,7 6 3070
APÊNDICES
113
Através dos valores obtidos na Tab. B.1 calcularam-se os valores totais de tamanho de armazenamento,
duração e número de frames, que estão representados na Tab. B.2.
Tab. B.2 – Valores totais de tamanho de armazenamento, duração e número de frames, relativos aos dados resultantes da aplicação da solução para remoção de frames desfocados.
Os valores de variação de tamanho de armazenamento e de duração poupados são calculados a partir das
duas equações anteriormente mencionadas, Eq. A.1 e Eq. A.2. Estes valores podem ser observados na Tab.
B.3, bem como os valores de tamanho de armazenamento e de duração dos vídeos endoscópicos, iniciais
e finais - resultantes das soluções para remoção de frames iniciais, finais e pretos e para remoção de frames
desfocados, respetivamente.
Tab. B.3 – Valores iniciais e finais de tamanho de armazenamento e de duração e os seus respetivos valores de variação.
Vídeos
Endoscópicos
Número de Vídeos
Endoscópicos ∑ Tamanho (MB) ∑ Duração (s) ∑ Frames Totais
EDA 23 1948,9 8980 53932
EDB 4 1154 5132 32662
TOTAL 27 3102,9 14112 86594
Vídeos
Endoscópicos
Número de Vídeos
Endoscópicos
∑ Tamanho
inicial (MB)
∑ Tamanho
final (MB)
∆ Tamanho
(%)
∑ Duração
inicial (s)
∑ Duração
final (s)
∆ Duração
(%)
EDA 23 2033,2 1948,9 4,1 9417 8980 4,6
EDB 4 1202,5 1154 4 5393 5132 4,8
TOTAL 27 3235,7 3102,9 4,1 14810 14112 4,7
APÊNDICES
114