10. Nola detektatzen ditu AAk gure aurpegiak?

Aurpegien detekzioa CNN bidez

Nola ikusten dituzte aurpegiak Neurona-sare konboluzionalek?

Pribatutasun oharra: FaceDemo aplikazioan hartutako irudi guztiak lokalki prozesatzen dira, zure web nabigatzailean. Ez da irudirik ateratzen zure ordenagailutik.

Irudien iturria eta lizentzia: Orri honetan erabiltzen diren irudi guztiak AI4K12.org webgunetik ateratakoak dira eta CC-BY-SA lizentziapean argitaratuta daude. Irudi hauek berrerabiltzeko, jatorrizko iturria aipatu behar da eta lizentzia berarekin partekatu.

1. Sarrera

Nola lortzen dute ordenagailuek aurpegiak detektatzea argazki eta bideoetan? Gaur ezagutuko dugu Neurona-sare konboluzionalak (CNN) nola erabiltzen diren ikusmen artifizialean, bereziki aurpegiak detektatzeko prozesuan.

FaceDemo aplikazioa erabiliz, ikasiko dugu nola CNN-ek aurpegietako koloreak eta ertzak detektatzen dituzten - hauek baitira ikusmen prozesamenduaren lehen urratsak. FaceDemo aplikazioa https://www.cs.cmu.edu/~dst/FaceDemo helbidean aurkituko duzu eta jarduera honen jatorrizko azalpenak AI4K12-ren dokumentazioan daude eskuragarri.

FaceDemo aplikazioaren pantaila-irudia

FaceDemo aplikazioaren erabiltzaile-interfazea.

FaceDemo aurpegi detekzioa martxan

FaceDemo aplikazioak aurpegia detektatzen du eta konfiantza maila erakusten du (0.96).

Zer ikasiko duzu?

  • Nola detektatzen dituzten ordenagailuek aurpegiak irudian koloreak eta ertzak prozesatuz
  • Nola funtzionatzen duten konboluzio-geruzek lehen mailako ezaugarrien detekziorako
  • CNN-en kernelen funtzionamendua kolore-orban eta ertzen detekzioan
  • Nola lortzen duten CNN-ek aurpegien kokapena zehaztasunez aurkitzea

2. CNN baten sarrera eta irteera

CNN prozesua: sarreratik irteerara

CNN prozesua: sarrera iruditik aurpegi detekziora, geruzaz geruza.

Sarrera irudia

  • Kamerako irudi koloreduna
  • Pixel bakoitza RGB balio bezala adierazita
  • Prozesatzeko prest dagoen informazio gordina

CNN prozesua

  • Konboluzio geruza anitz
  • Max-pooling operazioak
  • Ezaugarrien erauzketa automatikoa

Irteera emaitza

  • Aurpegiaren inguruko lauki mugatzailea
  • Konfiantza maila (0tik 1era)
  • Aurpegiaren kokapena eta tamaina

FaceDemo aplikazioan ikus dezakezunez, lehen pantailan (goiko ezkerraldean) kamerak hartutako irudia azaltzen da, eta aurpegia aurkitzen duenean, lauki urdin bat agertzen da haren inguruan. Lauki horren goiko ertzean konfiantza-maila bat azaltzen da (adibidez, 0.96 zenbakiak %96ko konfiantza esan nahi du aurkitu den objektua aurpegi bat dela).

Horrez gain, irudiaren ondoan 7x7 sareta bat agertzen da. Bertan, detektorearen erantzunak modu sakonagoan ikus daitezkeen. Saretan detektore ugari daude bakoitza eskala desberdinetan, eta kamera mugitzen duzunean, detektore hauek aktibatzen dira.

Eskala txikiko aurpegi detekzioa

Eskala txikiko detekzioa (gorriz) - kameratik urrun dagoenean eta eskala handiko detekzioa (horiz) - kameratik gertu dagoenean.

Eskala ertaineko aurpegi detekzioa

Eskala ertaineko detekzioa (zianez) - distantzia egokian dagoenean.

3. Kolore orbanen detekzioa

CNN-ek irudiaren oinarrizko ezaugarriak aztertzen dituzte lehenik. Hauetako bat koloreen detekzioa da. Pantailaren eskuinaldean "Convolutional Layer 1" izeneko eremuan, koloreak detektatzeko hainbat filtroren erantzunak ikus ditzakegu.

Kolore detektatzaile desberdinen erantzunak

Kolore detektatzaile desberdinen erantzunak argi forma batean.

Kolore orbanen detekzio esperimentua

Erabil dezagun ortzadar bat edo kolore-gurpil bat kolore detektatzaileak nola erantzuten duten ikusteko.

Ortzadar koloreak

Ortzadar koloreak - desberdin erantzuten dute detektatzaile desberdinetan.

Emaitzak:

  • Orban horia detektatzeko kernelak erantzun handiena erakutsiko du ortzadarreko hori eta laranja zatietan.
  • Orban gorria detektatzeko kernelak gehien erantzungo die ortzadarreko gorri zatiei.
  • Urdin-berde detektatzaileak erantzun handiena erakutsiko du ortzadarreko urdin, turkesa eta berde zatietan.

Saia zaitez zure aurpegia kamerara gerturatuz, eta ikusi zer gertatzen den. Zein kernelak erantzuten dio gehiago zure azalari? Zein kernelak detektatuko ditu zure ezpainak edo begiak?

Kernelak eta konboluzioa

Kernel bat 3×3 tamainako pisu-matrizea da, irudiaren gainean aplikatzen dena ezaugarri konkretu bat detektatzeko. Konboluzioa eragiketa bat da non kernel bat irudi osoan zehar mugitzen den, erantzunak sortuz.

Hiru kernel garrantzitsu hauei begiratu:

4. Ertzen detekzioa

CNN-en lehen geruzetan beste funtzio garrantzitsu bat ertzen detekzioa da. Ertzen bidez objektuaren egitura eta mugak identifikatzen dira.

Edge detectors in convolutional layer 1

Ertz detektatzaile desberdinak lehen konboluzio geruzan.

Ertzen detekzioa

Ertz bat irudi batean distira-aldaketa bat dagoen gunea da. CNN-ek orientazio desberdineko ertzak detektatzen dituzte: bertikalak, horizontalak eta diagonalak.

Hiru ertz detektatzaile garrantzitsu:

9 - Ertz bertikal detektatzailea

RGB kanal guztietarako antzeko pisuekin:

  • Ezkerreko zutabea: Pisu positiboak
  • Eskuineko zutabea: Pisu negatiboak

Honek ezkerretik eskuinerako aldaketa detektatzen du (zuritik beltzera).

10 - Ertz horizontal detektatzailea

RGB kanal guztietarako antzeko pisuekin:

  • Goiko ilera: Pisu positiboak
  • Beheko ilera: Pisu negatiboak

Honek goitik beherako aldaketa detektatzen du (zuritik beltzera).

15 - Beltz/hori ertz bertikal detektatzailea

9. kernelaren alderantzizkoa:

  • Ezkerreko zutabea: Pisu negatiboak
  • Eskuineko zutabea: Pisu positiboak

Honek ezkerretik eskuinerako aldaketa detektatzen du (beltzetik zurira).

Ertzen detekzio esperimentua

Erabil dezagun karratu beltz sinple bat ertzen detektatzaileak nola erantzuten duten ikusteko.

Emaitzak:

  • 9 - Ertz bertikal detektatzaileak karratuaren ezkerreko ertza nabarmentzen du (zuritik beltzera).
  • 10 - Ertz horizontal detektatzaileak karratuaren goiko ertza nabarmentzen du (zuritik beltzera).
  • 15 - Beltz/hori ertz detektatzaileak karratuaren eskuineko ertza nabarmentzen du (beltzetik zurira).

Karratu sinplea 45° biratuz gero, ikusiko duzu nola detektatzaileek ertz diagonal desberdinetara nola erantzuten duten.

Aurpegian ertzen detekzioa

Zure aurpegia kameran jartzean, ertz-detektatzaileek nabarmentzen dituzte aurpegiaren beraren mugak, begien ingurukoak, sudurraren ertza eta ezpainen ingurukoak. Ertz hauek aurpegia identifikatzeko ezinbestekoak dira!

5. Aurpegi detekzioa konboluzioak erabiliz

Orain ulertzen dugu nola detektatzen dituen CNN batek koloreak eta ertzak. Baina nola pasatzen da sistema sinple hauetatik aurpegi oso bat detektatzera?

Konboluzio geruza 1

  • Oinarrizko ezaugarriak: koloreak, ertzak, orbanak
  • 16 kernel desberdin
  • 3×3 tamainako pisu-matrizeak

Tarteko geruzak

  • Konplexutasun handiagoko ezaugarriak
  • Begiak, ahoa, sudurra detektatzea
  • Ezaugarri konbinazioen patroiak

Irteera geruza

  • 245 aurpegi detekzio zirkuitu (7×7 sareta)
  • 5 detektore eskala bakoitzeko (distantzia desberdinak)
  • Aurpegiaren kokapena eta konfiantza maila

FaceDemo aplikazioan 7×7 sareta ikusten dugu, 245 aurpegi-detekzio zirkuitu dituena. Detekzio hauek aurpegiak eskala desberdinetan aurkitu ditzakete, eta eskala bakoitza kolore desberdin batez adierazten da:

Eskala txikia (gorria)

Kameratik urrun dagoen aurpegia detektatzen du. Aurpegia pixel gutxik osatzen dute.

Eskala ertaina (ziana)

Distantzia ertainean dagoen aurpegia detektatzen du.

Eskala handia (horia/berdea)

Kameratik gertu dagoen aurpegia detektatzen du. Aurpegia pixel askorekin osatuta dago.

Probatu mugimenduan

Proba ezazu zure burua mugituz kameraren aurrean:

  • Aurrera eta atzera mugitu, eta ikusi nola aldatzen den lauki mugatzailearen kolorea.
  • Eskuak aurpegiaren aurrean jarri, eta ikusi nola erantzuten duen detektoreak.
  • Bigarren pertsona bat sartu irudian, eta ikusi nola sortzen den beste lauki mugatzaile bat.

Konfiantza-atalasea jaisteko botoia sakatuz gero (beheko botoi urdina), konfiantza baxuagoko detekzioak ere ikusiko dituzu.

6. Laburpena eta konklusioak

Aurpegi detekzioarekin ikasi dugunak erakusten digu CNNek nola prozesatzen duten informazio bisuala hainbat geruzatan zehar:

Lehen geruza

Koloreak eta ertzak detektatzen ditu kernel eta konboluzioen bidez, oinarrizko ezaugarriak harrapatuz.

Erdiko geruzak

Konplexutasun handiagoko ezaugarriak detektatzen dituzte, aurpegien zati desberdinak identifikatuz.

Irteera geruza

Aurpegien kokapena eta konfiantza maila zehazten ditu, lauki mugatzaileak sortuz.

FaceDemo aplikazioak erakusten digu nola CNN batek detektatzen dituen koloreak eta ertzak, eta haietatik nola pasatzen den aurpegi osoak identifikatzera.

CNNen gaitasuna

Oinarrizko kontzeptu hauek ulertzea lagungarria da ikusteko nola gaur egungo aurpegi detekzio teknologiek, telefono adimendunetan, argazki aplikazioetan edo segurtasun sistemetan, oinarri berdinak partekatzen dituzten, nahiz eta askoz ere sofistikatuagoak izan.

Baliabide gehiago FaceDemoren inguruan

Irudien kredituak

Webgune honetan erabilitako irudiak AI4K12.org proiektutik datoz eta CC-BY-SA lizentziapean banatzen dira. AI4K12 proiektua AAAI eta CSTA erakundeek babestutako ekimena da, adimen artifizialaren eta ikusmen artifiziala bezalako teknologien ezagutza K-12 hezkuntzan sartzeko.

 

Zabaldu!

Web-orria erabiltzen jarraitu ezkero, cookien erabilerarekin ados zaudela adierazten duzu. informazio gehiago

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Itxi