Detecci on de caras · 2019-05-25 · Algunos autores usan redes como MLP, clasi cadores estad...
Transcript of Detecci on de caras · 2019-05-25 · Algunos autores usan redes como MLP, clasi cadores estad...
Deteccion de carasLeccion 11.2
Dr. Pablo Alvarado Moya
MP6127 Vision por ComputadoraPrograma de Maestrıa en Electronica
Enfasis en Procesamiento Digital de SenalesEscuela de Ingenierıa Electronica
Tecnologico de Costa Rica
II Cuatrimestre 2019
P. Alvarado Deteccion de caras 1 / 1
Contenido
P. Alvarado Deteccion de caras 2 / 1
Deteccion
Tarea: encontrar objetos de una categorıa en imagen
Paso previo a reconocimiento
Ampliamente utilizada: deteccion de caras humanas
P. Alvarado Deteccion de caras 3 / 1
Deteccion de caras
Gran variedad de metodos propuestos
Reto: debe ser ¡muy rapido!
Tres tipos de tecnicas1 basadas en caracterısticas2 basadas en plantillas3 basadas en apariencia
P. Alvarado Deteccion de caras 4 / 1
Deteccion de caras
Gran variedad de metodos propuestos
Reto: debe ser ¡muy rapido!
Tres tipos de tecnicas1 basadas en caracterısticas
buscan patrones caracterısticos como ojos, nariz y boca, yluego verifican plausibilidad geometrica.
2 basadas en plantillas3 basadas en apariencia
P. Alvarado Deteccion de caras 4 / 1
Deteccion de caras
Gran variedad de metodos propuestos
Reto: debe ser ¡muy rapido!
Tres tipos de tecnicas1 basadas en caracterısticas2 basadas en plantillas
ajustan plantilla (AAM, ASM) que soporta variabilidad, perorequiere buena inicializacion
3 basadas en apariencia
P. Alvarado Deteccion de caras 4 / 1
Deteccion de caras
Gran variedad de metodos propuestos
Reto: debe ser ¡muy rapido!
Tres tipos de tecnicas1 basadas en caracterısticas2 basadas en plantillas3 basadas en apariencia
barren imagen buscando candidatos factibles, proceso que serefina jerarquicamente con clasificadores cada vez masselectivos, pero mas caros computacionalmente
P. Alvarado Deteccion de caras 4 / 1
Deteccion basada en apariencia
Uso de clasificadores implica cuerpos de entrenamiento decaras y no-caras
Sinteticamente se rotan, reflejan, y desplazan datos
Preprocesamiento necesario (iluminacion, contraste, ruido . . .)
Por ejemplo, Rowley et al. restan mejor ajuste lineal y luegoecualizan histograma
Rowley, Baluja y Kanade, 1998
P. Alvarado Deteccion de caras 5 / 1
Reduccion de dimensiones (1)
Maldicion de la dimensionalidad exige reducir dimension dedatos
Por ejemplo, Sung y Poggio utilizan aglomeracion conk-medias y ACP en cada conglomerado
Usualmente “parches” de caras de 19× 19 hasta 30× 30
Sung y Poggio, 1998
P. Alvarado Deteccion de caras 6 / 1
Reduccion de dimensiones (2)
6 conglomerados para cara y 6 para no-cara
Distancia de patron en estudio a cada conglomerado formadescriptor
Algunos autores usan redes como MLP, clasificadoresestadısticos como SVM, boosting, etc.
P. Alvarado Deteccion de caras 7 / 1
Detector de Viola y Jones
Metodo de Viola y Jones (IJCV, 52(2), 2004) es el mas usado
Metodo es rapido y robusto
Utiliza imagenes integrales (usadas tambien en SURF) paracalcular rapidamente caracterısticas rectangulares de 2, 3 o 4rectangulos:
Entrenamiento busca cuales caracterısticas discriminan
Se usa boosting
P. Alvarado Deteccion de caras 8 / 1
Boosting
Boosting implica combinar varios clasificadores debiles enuno mas fuerte:
h(x) = signum
m−1∑j=0
αjhj(x)
Viola y Jones usan AdaBoosting (adaptive boosting)
Los valores de los descriptores provienen de la umbralizacionde las caracterısticas fj (rectangulos)
hj(x) = aj [fj < θj ] + bj [fj ≥ θj ] =
{aj si fj < θj
bj resto
Factores aj y bj se elijen simetricos, usualmente aj = −sj ybj = sj con sj = ±1.
P. Alvarado Deteccion de caras 9 / 1
Boosting
Boosting implica combinar varios clasificadores debiles enuno mas fuerte:
h(x) = signum
m−1∑j=0
αjhj(x)
Clasificador debil es aquel solo un poco mejor que un clasificador
aleatorio
Viola y Jones usan AdaBoosting (adaptive boosting)
Los valores de los descriptores provienen de la umbralizacionde las caracterısticas fj (rectangulos)
hj(x) = aj [fj < θj ] + bj [fj ≥ θj ] =
{aj si fj < θj
bj resto
Factores aj y bj se elijen simetricos, usualmente aj = −sj ybj = sj con sj = ±1.
P. Alvarado Deteccion de caras 9 / 1
Boosting
Boosting implica combinar varios clasificadores debiles enuno mas fuerte:
h(x) = signum
m−1∑j=0
αjhj(x)
Viola y Jones usan AdaBoosting (adaptive boosting)
Los valores de los descriptores provienen de la umbralizacionde las caracterısticas fj (rectangulos)
hj(x) = aj [fj < θj ] + bj [fj ≥ θj ] =
{aj si fj < θj
bj resto
Factores aj y bj se elijen simetricos, usualmente aj = −sj ybj = sj con sj = ±1.
P. Alvarado Deteccion de caras 9 / 1
AdaBoost (1)
1 Entrada: N patrones positivos y negativos de entrenamiento:
{(xi ,yi )}, con yi = 1 cara (positivos) e yi = −1 no-cara (negativos)
2 Inicialice pesos para datos de primer clasificador debil wi,1 ← 1N .
(Viola y Jones usan N1 para datos positivos y N2 para negativos)
3 Para cada fase de entrenamiento j = 1 . . .M
1 Renormalice los pesos para que sumen 12 Seleccione el clasificador hj(x; fj ,θj ,sj) que minimiza el error de
clasificacion ponderado:
ej =N−1∑i=0
wi,jei,j
ei,j = 1− δ(yi ,hj(xi ; fj ,θj ,sj))
P. Alvarado Deteccion de caras 10 / 1
AdaBoost (2)
3 Calcule tasa de error modificada βj y ponderacion delclasificador αj
βj =ej
1− ejy αj = − log βj
4 Actualice los pesos de acuerdo a los errores de clasificacion ei,j
wi,j+1 ← wi,jβ1−ei,jj
(baja peso para patrones correctamente clasificados)
4 El clasificador final resulta de
h(x) = signum
m−1∑j=0
αjhj(x)
P. Alvarado Deteccion de caras 11 / 1
AdaBoost
Clasificadores debiles se entrenan secuencialmente
Entrenamiento es proceso costoso computacionalmente
Uso del resultado es eficiente
Tasas de 15 cuadros por segundo posibles con resolucion VGA
Puede aumentarse confiabilidad de deteccion con otras pistas(color, posicion, etc.)
P. Alvarado Deteccion de caras 12 / 1
Otros tipos de detecciones
Deteccion de peatones
Deteccion de vehıculos
P. Alvarado Deteccion de caras 13 / 1
Enlaces
Tom Neumark presents on Facial Detection
Michal Hruby: deteccion con OpenCL (GPU)
P. Alvarado Deteccion de caras 14 / 1
Resumen
P. Alvarado Deteccion de caras 15 / 1
Este documento ha sido elaborado con software libre incluyendo LATEX, Beamer, GNUPlot, GNU/Octave, XFig,Inkscape, LTI-Lib-2, GNU-Make, Kazam, Xournal y Subversion en GNU/Linux
Este trabajo se encuentra bajo una Licencia Creative Commons Atribucion-NoComercial-LicenciarIgual 3.0 Unpor-ted. Para ver una copia de esta Licencia, visite http://creativecommons.org/licenses/by-nc-sa/3.0/ o envıeuna carta a Creative Commons, 444 Castro Street, Suite 900, Mountain View, California, 94041, USA.
© 2013 Pablo Alvarado-Moya Escuela de Ingenierıa Electronica Instituto Tecnologico de Costa Rica
P. Alvarado Deteccion de caras 16 / 1