際際滷

際際滷Share a Scribd company logo
Framework Viola-Jones
Universit`a degli Studi di Firenze
Facolt`a di Ingegneria
Viola-Jones Face Detector
Marco Righini
3 Febbraio 2014
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Face detection
Il problema del rilevamento facciale costituisce una componente di
notevole interesse nel panorama della computer vision.
Presenta un ampio spazio applicativo
sistemi di videosorveglianza;
auto-focus delle fotocamere;
programmi di videochat.
. . . ed una natura intrinsecamente complessa
variabilit`a dei lineamenti umani;
molteplici variabili ambientali (luce, occlusioni, posa facciale);
vincolo temporale quasi-realtime.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Face detection
Il problema del rilevamento facciale costituisce una componente di
notevole interesse nel panorama della computer vision.
Presenta un ampio spazio applicativo
sistemi di videosorveglianza;
auto-focus delle fotocamere;
programmi di videochat.
. . . ed una natura intrinsecamente complessa
variabilit`a dei lineamenti umani;
molteplici variabili ambientali (luce, occlusioni, posa facciale);
vincolo temporale quasi-realtime.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Idea ed innovazioni
Idea [Paul Viola and Michael Jones, 2001]
Utilizzo di feature semplici a basso costo computazionale, non
molto espressive nella singolarit`a ma potenti se combinate
opportunamente.
Il metodo ha introdotto tre innovazioni fondamentali:
immagine integrale per computazione rapida delle feature;
apprendimento tramite meta-algoritmo AdaBoost;
disposizione in cascata dei classi鍖catori.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Idea ed innovazioni
Idea [Paul Viola and Michael Jones, 2001]
Utilizzo di feature semplici a basso costo computazionale, non
molto espressive nella singolarit`a ma potenti se combinate
opportunamente.
Il metodo ha introdotto tre innovazioni fondamentali:
immagine integrale per computazione rapida delle feature;
apprendimento tramite meta-algoritmo AdaBoost;
disposizione in cascata dei classi鍖catori.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Idea ed innovazioni
Idea [Paul Viola and Michael Jones, 2001]
Utilizzo di feature semplici a basso costo computazionale, non
molto espressive nella singolarit`a ma potenti se combinate
opportunamente.
Il metodo ha introdotto tre innovazioni fondamentali:
immagine integrale per computazione rapida delle feature;
apprendimento tramite meta-algoritmo AdaBoost;
disposizione in cascata dei classi鍖catori.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Idea ed innovazioni
Idea [Paul Viola and Michael Jones, 2001]
Utilizzo di feature semplici a basso costo computazionale, non
molto espressive nella singolarit`a ma potenti se combinate
opportunamente.
Il metodo ha introdotto tre innovazioni fondamentali:
immagine integrale per computazione rapida delle feature;
apprendimento tramite meta-algoritmo AdaBoost;
disposizione in cascata dei classi鍖catori.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Feature
Lobiettivo `e codi鍖care il contrasto locale in caratteristiche zone
facciali.
Tre tipologie di feature: a 2, 3 o 4 rettangoli.
La risposta di una feature f in punto (x, y)
f (x, y) =
pj Pb
I(pj ) 
pk Pw
I(pk)
dove Pb rappresenta la regione nera e al contrario Pw quella
bianca.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Feature
Lobiettivo `e codi鍖care il contrasto locale in caratteristiche zone
facciali.
Tre tipologie di feature: a 2, 3 o 4 rettangoli.
La risposta di una feature f in punto (x, y)
f (x, y) =
pj Pb
I(pj ) 
pk Pw
I(pk)
dove Pb rappresenta la regione nera e al contrario Pw quella
bianca.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Feature
Lobiettivo `e codi鍖care il contrasto locale in caratteristiche zone
facciali.
Tre tipologie di feature: a 2, 3 o 4 rettangoli.
La risposta di una feature f in punto (x, y)
f (x, y) =
pj Pb
I(pj ) 
pk Pw
I(pk)
dove Pb rappresenta la regione nera e al contrario Pw quella
bianca.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Immagine integrale
La computazione rapida di una feature `e ottenuta tramite lutilizzo
dellimmagine integrale II(x, y).
Essa fornisce una rappresentazione intermedia dellimmagine
originaria I(x, y), tramite la de鍖nizione
II(x, y) =
x x,y y
I(x , y )
Le鍖cienza deriva da:
II(x, y) `e calcolata in un singolo passaggio su I(x, y), tramite
opportuna ricorrenza;
la somma delle intensit`a dei pixel di un
rettangolo richiede solamente 4 riferimenti.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Immagine integrale
La computazione rapida di una feature `e ottenuta tramite lutilizzo
dellimmagine integrale II(x, y).
Essa fornisce una rappresentazione intermedia dellimmagine
originaria I(x, y), tramite la de鍖nizione
II(x, y) =
x x,y y
I(x , y )
Le鍖cienza deriva da:
II(x, y) `e calcolata in un singolo passaggio su I(x, y), tramite
opportuna ricorrenza;
la somma delle intensit`a dei pixel di un
rettangolo richiede solamente 4 riferimenti.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Immagine integrale
La computazione rapida di una feature `e ottenuta tramite lutilizzo
dellimmagine integrale II(x, y).
Essa fornisce una rappresentazione intermedia dellimmagine
originaria I(x, y), tramite la de鍖nizione
II(x, y) =
x x,y y
I(x , y )
Le鍖cienza deriva da:
II(x, y) `e calcolata in un singolo passaggio su I(x, y), tramite
opportuna ricorrenza;
la somma delle intensit`a dei pixel di un
rettangolo richiede solamente 4 riferimenti.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Feature e normalizzazione
Di鍖erenze di illuminazione sono gestite durante la valutazione delle
feature tramite normalizzazione della varianza.
Si noti che
pR
I(p)
(R)
=
1
(R)
pR
I(p)
con
2
(R) =
1
n
pR
I2
(p) 
錚
錚1
n
pR
I(p)
錚
錚
2
pR I2(p) `e ottenuto in tempo costante tramite immagine
integrale in riferimento allimmagine avente come singole intensit`a
il quadrato delle intensit`a originarie.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Feature e normalizzazione
Di鍖erenze di illuminazione sono gestite durante la valutazione delle
feature tramite normalizzazione della varianza.
Si noti che
pR
I(p)
(R)
=
1
(R)
pR
I(p)
con
2
(R) =
1
n
pR
I2
(p) 
錚
錚1
n
pR
I(p)
錚
錚
2
pR I2(p) `e ottenuto in tempo costante tramite immagine
integrale in riferimento allimmagine avente come singole intensit`a
il quadrato delle intensit`a originarie.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Feature e normalizzazione
Di鍖erenze di illuminazione sono gestite durante la valutazione delle
feature tramite normalizzazione della varianza.
Si noti che
pR
I(p)
(R)
=
1
(R)
pR
I(p)
con
2
(R) =
1
n
pR
I2
(p) 
錚
錚1
n
pR
I(p)
錚
錚
2
pR I2(p) `e ottenuto in tempo costante tramite immagine
integrale in riferimento allimmagine avente come singole intensit`a
il quadrato delle intensit`a originarie.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Apprendimento
Per una 鍖nestra di rilevamento di dimensioni tipiche 24  24 pixel,
la cardinalit`a dellinsieme delle feature `e  160000, molto superiore
al numero di pixel della 鍖nestra.
Ipotesi (classi鍖catore)
Risulta su鍖ciente combinare un numero ristretto di feature critiche
per formare un classi鍖catore e鍖cace.
La selezione delle feature e laddestramento del classi鍖catore sono
perseguiti tramite lalgoritmo AdaBoost. Permette di ottimizzare
semplici algoritmi di apprendimento tramite aggregazione di
funzioni classi鍖catrici deboli h(x) (weak learner).
h(x, f , p, 慮) =
1 se pf (x) < p慮
0 altrimenti
con f feature, 慮 threshold appreso e p polarit`a della disuguaglianza.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Apprendimento
Per una 鍖nestra di rilevamento di dimensioni tipiche 24  24 pixel,
la cardinalit`a dellinsieme delle feature `e  160000, molto superiore
al numero di pixel della 鍖nestra.
Ipotesi (classi鍖catore)
Risulta su鍖ciente combinare un numero ristretto di feature critiche
per formare un classi鍖catore e鍖cace.
La selezione delle feature e laddestramento del classi鍖catore sono
perseguiti tramite lalgoritmo AdaBoost. Permette di ottimizzare
semplici algoritmi di apprendimento tramite aggregazione di
funzioni classi鍖catrici deboli h(x) (weak learner).
h(x, f , p, 慮) =
1 se pf (x) < p慮
0 altrimenti
con f feature, 慮 threshold appreso e p polarit`a della disuguaglianza.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Apprendimento
Per una 鍖nestra di rilevamento di dimensioni tipiche 24  24 pixel,
la cardinalit`a dellinsieme delle feature `e  160000, molto superiore
al numero di pixel della 鍖nestra.
Ipotesi (classi鍖catore)
Risulta su鍖ciente combinare un numero ristretto di feature critiche
per formare un classi鍖catore e鍖cace.
La selezione delle feature e laddestramento del classi鍖catore sono
perseguiti tramite lalgoritmo AdaBoost. Permette di ottimizzare
semplici algoritmi di apprendimento tramite aggregazione di
funzioni classi鍖catrici deboli h(x) (weak learner).
h(x, f , p, 慮) =
1 se pf (x) < p慮
0 altrimenti
con f feature, 慮 threshold appreso e p polarit`a della disuguaglianza.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Apprendimento (algoritmo)
Data: Example images (x1, y1), . . . , (xN , yN ) where yi = 0, 1 for negative and positive examples respectively; T
鍖nal number of weak classi鍖ers.
1 begin
2 Initialize weights w1,i = 1
2m
, 1
2l
for yi = 0, 1 respectively, where m and l are the number of negatives and
positives respectively
3 for t = 1, . . . , T do
4 Normalize the weights, wt,i =
wt,i
N
j=1
wt,j
5 Select the best weak classi鍖er with respect to the weighted error
t = min
f ,p,
N
i=1
wt,i |h(xi , f , p, )  yi |
6 De鍖ne ht (x) = h(x, ft , pt , t ) where ft , pt and t are the minimizers of t
7 Update the weights
wt+1,i = wt,i 硫
1ei
t
where ei = 0 if example xi is classi鍖ed correctly, ei = 1 otherwise, and 硫t = t
1 t
8 end
9 return the 鍖nal strong classi鍖er C(x) =
1 if T
t=1 留t ht (x)  1
2
T
t=1 留t
0 otherwise
where 留t = log 1
硫t
10 end
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Classi鍖catori in cascata
Idea (disposizione in cascata)
Strutturazione a cascata di classi鍖catori forti al 鍖ne di
incrementare laccuratezza e ridurre il tempo di esecuzione.
Esempio: con K = 10 livelli, ciascuno con percentuale di
rilevamento di = 99% e di falsi positivi fi = 30%, si ottiene in
conclusione D = K
i=1 di  0.9 e F = K
i=1 fi  6  106.
Lesecuzione ordinata della cascata permette di eliminare molte
regioni negative nei primi livelli. Le 鍖nestre dellimmagine che
superano invece tutte le fasi sono accettate come facce.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Classi鍖catori in cascata
Idea (disposizione in cascata)
Strutturazione a cascata di classi鍖catori forti al 鍖ne di
incrementare laccuratezza e ridurre il tempo di esecuzione.
Esempio: con K = 10 livelli, ciascuno con percentuale di
rilevamento di = 99% e di falsi positivi fi = 30%, si ottiene in
conclusione D = K
i=1 di  0.9 e F = K
i=1 fi  6  106.
Lesecuzione ordinata della cascata permette di eliminare molte
regioni negative nei primi livelli. Le 鍖nestre dellimmagine che
superano invece tutte le fasi sono accettate come facce.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Classi鍖catori in cascata
Idea (disposizione in cascata)
Strutturazione a cascata di classi鍖catori forti al 鍖ne di
incrementare laccuratezza e ridurre il tempo di esecuzione.
Esempio: con K = 10 livelli, ciascuno con percentuale di
rilevamento di = 99% e di falsi positivi fi = 30%, si ottiene in
conclusione D = K
i=1 di  0.9 e F = K
i=1 fi  6  106.
Lesecuzione ordinata della cascata permette di eliminare molte
regioni negative nei primi livelli. Le 鍖nestre dellimmagine che
superano invece tutte le fasi sono accettate come facce.
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Classi鍖catori in cascata (algoritmo di apprendimento)
Data: the maximum acceptable false positive rate per layer f ; the minimum acceptable detection rate per layer d;
the overall false positive rate Ftarget .
1 begin
2 P = set of positive examples
3 N = set of negative examples
4 F0 = 1.0; D0 = 1.0
5 i = 0
6 while Fi > Ftarget do
7 i = i + 1
8 ni = 0; Fi = Fi1
9 while Fi > f  Fi1 do
10 ni = ni + 1
11 Use P a N to train a classi鍖er with ni features using AdaBoost
12 Evaluate current cascaded classi鍖er on validation set to determine Fi and Di
13 Decrease threshold for the i-th classi鍖er until the current cascaded classi鍖er has a detection rate
of at least d  Di1. This also a鍖ects Fi
14 end
15 N = 
16 if Fi > Ftarget then
17 Evaluate the current cascaded detector on the set of non-face images and put any false
detection into the set N
18 end
19 end
20 end
Marco Righini Viola-Jones face detector
Framework Viola-Jones
Grazie per l'attenzione
Marco Righini Viola-Jones face detector

More Related Content

Viewers also liked (11)

PDF
USAF1
David Funk
PDF
Tesoro-Buy-Report
Alvy Mizelle
PDF
Web-based Control of Home Appliances Sketch
Madalina Neghina
DOC
Manoj_CV
Manoj Dhiman
ODP
nuria y paula pechakucha marx
nuriagaitan
DOC
Ben scholey cv V3
Ben Scholey
PDF
ETDP 2015 D1 - Introduction
Comit Projects Ltd
PPTX
Trash art, cheap art, food art
流了凌 虜虜旅僚凌
PDF
Eugene Island 188
Jerry Beets
PPTX
Unconventional Wells.ppt
Jerry Beets
PDF
Cimarex Energy's First Rogersville Shale Horizontal Deep Well the Walbridge 1...
Dexter Marsh
USAF1
David Funk
Tesoro-Buy-Report
Alvy Mizelle
Web-based Control of Home Appliances Sketch
Madalina Neghina
Manoj_CV
Manoj Dhiman
nuria y paula pechakucha marx
nuriagaitan
Ben scholey cv V3
Ben Scholey
ETDP 2015 D1 - Introduction
Comit Projects Ltd
Trash art, cheap art, food art
流了凌 虜虜旅僚凌
Eugene Island 188
Jerry Beets
Unconventional Wells.ppt
Jerry Beets
Cimarex Energy's First Rogersville Shale Horizontal Deep Well the Walbridge 1...
Dexter Marsh

Viola Jones Face Detector

  • 1. Framework Viola-Jones Universit`a degli Studi di Firenze Facolt`a di Ingegneria Viola-Jones Face Detector Marco Righini 3 Febbraio 2014 Marco Righini Viola-Jones face detector
  • 2. Framework Viola-Jones Face detection Il problema del rilevamento facciale costituisce una componente di notevole interesse nel panorama della computer vision. Presenta un ampio spazio applicativo sistemi di videosorveglianza; auto-focus delle fotocamere; programmi di videochat. . . . ed una natura intrinsecamente complessa variabilit`a dei lineamenti umani; molteplici variabili ambientali (luce, occlusioni, posa facciale); vincolo temporale quasi-realtime. Marco Righini Viola-Jones face detector
  • 3. Framework Viola-Jones Face detection Il problema del rilevamento facciale costituisce una componente di notevole interesse nel panorama della computer vision. Presenta un ampio spazio applicativo sistemi di videosorveglianza; auto-focus delle fotocamere; programmi di videochat. . . . ed una natura intrinsecamente complessa variabilit`a dei lineamenti umani; molteplici variabili ambientali (luce, occlusioni, posa facciale); vincolo temporale quasi-realtime. Marco Righini Viola-Jones face detector
  • 4. Framework Viola-Jones Idea ed innovazioni Idea [Paul Viola and Michael Jones, 2001] Utilizzo di feature semplici a basso costo computazionale, non molto espressive nella singolarit`a ma potenti se combinate opportunamente. Il metodo ha introdotto tre innovazioni fondamentali: immagine integrale per computazione rapida delle feature; apprendimento tramite meta-algoritmo AdaBoost; disposizione in cascata dei classi鍖catori. Marco Righini Viola-Jones face detector
  • 5. Framework Viola-Jones Idea ed innovazioni Idea [Paul Viola and Michael Jones, 2001] Utilizzo di feature semplici a basso costo computazionale, non molto espressive nella singolarit`a ma potenti se combinate opportunamente. Il metodo ha introdotto tre innovazioni fondamentali: immagine integrale per computazione rapida delle feature; apprendimento tramite meta-algoritmo AdaBoost; disposizione in cascata dei classi鍖catori. Marco Righini Viola-Jones face detector
  • 6. Framework Viola-Jones Idea ed innovazioni Idea [Paul Viola and Michael Jones, 2001] Utilizzo di feature semplici a basso costo computazionale, non molto espressive nella singolarit`a ma potenti se combinate opportunamente. Il metodo ha introdotto tre innovazioni fondamentali: immagine integrale per computazione rapida delle feature; apprendimento tramite meta-algoritmo AdaBoost; disposizione in cascata dei classi鍖catori. Marco Righini Viola-Jones face detector
  • 7. Framework Viola-Jones Idea ed innovazioni Idea [Paul Viola and Michael Jones, 2001] Utilizzo di feature semplici a basso costo computazionale, non molto espressive nella singolarit`a ma potenti se combinate opportunamente. Il metodo ha introdotto tre innovazioni fondamentali: immagine integrale per computazione rapida delle feature; apprendimento tramite meta-algoritmo AdaBoost; disposizione in cascata dei classi鍖catori. Marco Righini Viola-Jones face detector
  • 8. Framework Viola-Jones Feature Lobiettivo `e codi鍖care il contrasto locale in caratteristiche zone facciali. Tre tipologie di feature: a 2, 3 o 4 rettangoli. La risposta di una feature f in punto (x, y) f (x, y) = pj Pb I(pj ) pk Pw I(pk) dove Pb rappresenta la regione nera e al contrario Pw quella bianca. Marco Righini Viola-Jones face detector
  • 9. Framework Viola-Jones Feature Lobiettivo `e codi鍖care il contrasto locale in caratteristiche zone facciali. Tre tipologie di feature: a 2, 3 o 4 rettangoli. La risposta di una feature f in punto (x, y) f (x, y) = pj Pb I(pj ) pk Pw I(pk) dove Pb rappresenta la regione nera e al contrario Pw quella bianca. Marco Righini Viola-Jones face detector
  • 10. Framework Viola-Jones Feature Lobiettivo `e codi鍖care il contrasto locale in caratteristiche zone facciali. Tre tipologie di feature: a 2, 3 o 4 rettangoli. La risposta di una feature f in punto (x, y) f (x, y) = pj Pb I(pj ) pk Pw I(pk) dove Pb rappresenta la regione nera e al contrario Pw quella bianca. Marco Righini Viola-Jones face detector
  • 11. Framework Viola-Jones Immagine integrale La computazione rapida di una feature `e ottenuta tramite lutilizzo dellimmagine integrale II(x, y). Essa fornisce una rappresentazione intermedia dellimmagine originaria I(x, y), tramite la de鍖nizione II(x, y) = x x,y y I(x , y ) Le鍖cienza deriva da: II(x, y) `e calcolata in un singolo passaggio su I(x, y), tramite opportuna ricorrenza; la somma delle intensit`a dei pixel di un rettangolo richiede solamente 4 riferimenti. Marco Righini Viola-Jones face detector
  • 12. Framework Viola-Jones Immagine integrale La computazione rapida di una feature `e ottenuta tramite lutilizzo dellimmagine integrale II(x, y). Essa fornisce una rappresentazione intermedia dellimmagine originaria I(x, y), tramite la de鍖nizione II(x, y) = x x,y y I(x , y ) Le鍖cienza deriva da: II(x, y) `e calcolata in un singolo passaggio su I(x, y), tramite opportuna ricorrenza; la somma delle intensit`a dei pixel di un rettangolo richiede solamente 4 riferimenti. Marco Righini Viola-Jones face detector
  • 13. Framework Viola-Jones Immagine integrale La computazione rapida di una feature `e ottenuta tramite lutilizzo dellimmagine integrale II(x, y). Essa fornisce una rappresentazione intermedia dellimmagine originaria I(x, y), tramite la de鍖nizione II(x, y) = x x,y y I(x , y ) Le鍖cienza deriva da: II(x, y) `e calcolata in un singolo passaggio su I(x, y), tramite opportuna ricorrenza; la somma delle intensit`a dei pixel di un rettangolo richiede solamente 4 riferimenti. Marco Righini Viola-Jones face detector
  • 14. Framework Viola-Jones Feature e normalizzazione Di鍖erenze di illuminazione sono gestite durante la valutazione delle feature tramite normalizzazione della varianza. Si noti che pR I(p) (R) = 1 (R) pR I(p) con 2 (R) = 1 n pR I2 (p) 錚 錚1 n pR I(p) 錚 錚 2 pR I2(p) `e ottenuto in tempo costante tramite immagine integrale in riferimento allimmagine avente come singole intensit`a il quadrato delle intensit`a originarie. Marco Righini Viola-Jones face detector
  • 15. Framework Viola-Jones Feature e normalizzazione Di鍖erenze di illuminazione sono gestite durante la valutazione delle feature tramite normalizzazione della varianza. Si noti che pR I(p) (R) = 1 (R) pR I(p) con 2 (R) = 1 n pR I2 (p) 錚 錚1 n pR I(p) 錚 錚 2 pR I2(p) `e ottenuto in tempo costante tramite immagine integrale in riferimento allimmagine avente come singole intensit`a il quadrato delle intensit`a originarie. Marco Righini Viola-Jones face detector
  • 16. Framework Viola-Jones Feature e normalizzazione Di鍖erenze di illuminazione sono gestite durante la valutazione delle feature tramite normalizzazione della varianza. Si noti che pR I(p) (R) = 1 (R) pR I(p) con 2 (R) = 1 n pR I2 (p) 錚 錚1 n pR I(p) 錚 錚 2 pR I2(p) `e ottenuto in tempo costante tramite immagine integrale in riferimento allimmagine avente come singole intensit`a il quadrato delle intensit`a originarie. Marco Righini Viola-Jones face detector
  • 17. Framework Viola-Jones Apprendimento Per una 鍖nestra di rilevamento di dimensioni tipiche 24 24 pixel, la cardinalit`a dellinsieme delle feature `e 160000, molto superiore al numero di pixel della 鍖nestra. Ipotesi (classi鍖catore) Risulta su鍖ciente combinare un numero ristretto di feature critiche per formare un classi鍖catore e鍖cace. La selezione delle feature e laddestramento del classi鍖catore sono perseguiti tramite lalgoritmo AdaBoost. Permette di ottimizzare semplici algoritmi di apprendimento tramite aggregazione di funzioni classi鍖catrici deboli h(x) (weak learner). h(x, f , p, 慮) = 1 se pf (x) < p慮 0 altrimenti con f feature, 慮 threshold appreso e p polarit`a della disuguaglianza. Marco Righini Viola-Jones face detector
  • 18. Framework Viola-Jones Apprendimento Per una 鍖nestra di rilevamento di dimensioni tipiche 24 24 pixel, la cardinalit`a dellinsieme delle feature `e 160000, molto superiore al numero di pixel della 鍖nestra. Ipotesi (classi鍖catore) Risulta su鍖ciente combinare un numero ristretto di feature critiche per formare un classi鍖catore e鍖cace. La selezione delle feature e laddestramento del classi鍖catore sono perseguiti tramite lalgoritmo AdaBoost. Permette di ottimizzare semplici algoritmi di apprendimento tramite aggregazione di funzioni classi鍖catrici deboli h(x) (weak learner). h(x, f , p, 慮) = 1 se pf (x) < p慮 0 altrimenti con f feature, 慮 threshold appreso e p polarit`a della disuguaglianza. Marco Righini Viola-Jones face detector
  • 19. Framework Viola-Jones Apprendimento Per una 鍖nestra di rilevamento di dimensioni tipiche 24 24 pixel, la cardinalit`a dellinsieme delle feature `e 160000, molto superiore al numero di pixel della 鍖nestra. Ipotesi (classi鍖catore) Risulta su鍖ciente combinare un numero ristretto di feature critiche per formare un classi鍖catore e鍖cace. La selezione delle feature e laddestramento del classi鍖catore sono perseguiti tramite lalgoritmo AdaBoost. Permette di ottimizzare semplici algoritmi di apprendimento tramite aggregazione di funzioni classi鍖catrici deboli h(x) (weak learner). h(x, f , p, 慮) = 1 se pf (x) < p慮 0 altrimenti con f feature, 慮 threshold appreso e p polarit`a della disuguaglianza. Marco Righini Viola-Jones face detector
  • 20. Framework Viola-Jones Apprendimento (algoritmo) Data: Example images (x1, y1), . . . , (xN , yN ) where yi = 0, 1 for negative and positive examples respectively; T 鍖nal number of weak classi鍖ers. 1 begin 2 Initialize weights w1,i = 1 2m , 1 2l for yi = 0, 1 respectively, where m and l are the number of negatives and positives respectively 3 for t = 1, . . . , T do 4 Normalize the weights, wt,i = wt,i N j=1 wt,j 5 Select the best weak classi鍖er with respect to the weighted error t = min f ,p, N i=1 wt,i |h(xi , f , p, ) yi | 6 De鍖ne ht (x) = h(x, ft , pt , t ) where ft , pt and t are the minimizers of t 7 Update the weights wt+1,i = wt,i 硫 1ei t where ei = 0 if example xi is classi鍖ed correctly, ei = 1 otherwise, and 硫t = t 1 t 8 end 9 return the 鍖nal strong classi鍖er C(x) = 1 if T t=1 留t ht (x) 1 2 T t=1 留t 0 otherwise where 留t = log 1 硫t 10 end Marco Righini Viola-Jones face detector
  • 21. Framework Viola-Jones Classi鍖catori in cascata Idea (disposizione in cascata) Strutturazione a cascata di classi鍖catori forti al 鍖ne di incrementare laccuratezza e ridurre il tempo di esecuzione. Esempio: con K = 10 livelli, ciascuno con percentuale di rilevamento di = 99% e di falsi positivi fi = 30%, si ottiene in conclusione D = K i=1 di 0.9 e F = K i=1 fi 6 106. Lesecuzione ordinata della cascata permette di eliminare molte regioni negative nei primi livelli. Le 鍖nestre dellimmagine che superano invece tutte le fasi sono accettate come facce. Marco Righini Viola-Jones face detector
  • 22. Framework Viola-Jones Classi鍖catori in cascata Idea (disposizione in cascata) Strutturazione a cascata di classi鍖catori forti al 鍖ne di incrementare laccuratezza e ridurre il tempo di esecuzione. Esempio: con K = 10 livelli, ciascuno con percentuale di rilevamento di = 99% e di falsi positivi fi = 30%, si ottiene in conclusione D = K i=1 di 0.9 e F = K i=1 fi 6 106. Lesecuzione ordinata della cascata permette di eliminare molte regioni negative nei primi livelli. Le 鍖nestre dellimmagine che superano invece tutte le fasi sono accettate come facce. Marco Righini Viola-Jones face detector
  • 23. Framework Viola-Jones Classi鍖catori in cascata Idea (disposizione in cascata) Strutturazione a cascata di classi鍖catori forti al 鍖ne di incrementare laccuratezza e ridurre il tempo di esecuzione. Esempio: con K = 10 livelli, ciascuno con percentuale di rilevamento di = 99% e di falsi positivi fi = 30%, si ottiene in conclusione D = K i=1 di 0.9 e F = K i=1 fi 6 106. Lesecuzione ordinata della cascata permette di eliminare molte regioni negative nei primi livelli. Le 鍖nestre dellimmagine che superano invece tutte le fasi sono accettate come facce. Marco Righini Viola-Jones face detector
  • 24. Framework Viola-Jones Classi鍖catori in cascata (algoritmo di apprendimento) Data: the maximum acceptable false positive rate per layer f ; the minimum acceptable detection rate per layer d; the overall false positive rate Ftarget . 1 begin 2 P = set of positive examples 3 N = set of negative examples 4 F0 = 1.0; D0 = 1.0 5 i = 0 6 while Fi > Ftarget do 7 i = i + 1 8 ni = 0; Fi = Fi1 9 while Fi > f Fi1 do 10 ni = ni + 1 11 Use P a N to train a classi鍖er with ni features using AdaBoost 12 Evaluate current cascaded classi鍖er on validation set to determine Fi and Di 13 Decrease threshold for the i-th classi鍖er until the current cascaded classi鍖er has a detection rate of at least d Di1. This also a鍖ects Fi 14 end 15 N = 16 if Fi > Ftarget then 17 Evaluate the current cascaded detector on the set of non-face images and put any false detection into the set N 18 end 19 end 20 end Marco Righini Viola-Jones face detector
  • 25. Framework Viola-Jones Grazie per l'attenzione Marco Righini Viola-Jones face detector