Adimen artifiziala hezkuntzan:
Ikastaroaren edukia
- 1 Adimen artifizialaren historia laburra
- 2 Ikasketa Automatikoa: gida laburra
- 3 Ikasketa Automatikotik Ikasketa Sakonera
- 4 Zer da LLM bat?
- 5 Nola funtzionatzen du LLM batek barrutik?
- 6 LLM vs. Txabota
- 7 AAren erabilera etikoa hezkuntzan
- 8 AA Haur Hezkuntzatik Batxilergora arte
- 9 Markov kateak: txatboten aurrekariak
- 10 Nola detektatzen ditu AAk gure aurpegiak?
- 11 UNESCOren AA printzipio etikoak
Aurpegien detekzioa CNN bidez
Nola ikusten dituzte aurpegiak Neurona-sare konboluzionalek?
Pribatutasun oharra: FaceDemo aplikazioan hartutako irudi guztiak lokalki prozesatzen dira, zure web nabigatzailean. Ez da irudirik ateratzen zure ordenagailutik.
Irudien iturria eta lizentzia: Orri honetan erabiltzen diren irudi guztiak AI4K12.org webgunetik ateratakoak dira eta CC-BY-SA lizentziapean argitaratuta daude. Irudi hauek berrerabiltzeko, jatorrizko iturria aipatu behar da eta lizentzia berarekin partekatu.
1. Sarrera
Nola lortzen dute ordenagailuek aurpegiak detektatzea argazki eta bideoetan? Gaur ezagutuko dugu Neurona-sare konboluzionalak (CNN) nola erabiltzen diren ikusmen artifizialean, bereziki aurpegiak detektatzeko prozesuan.
FaceDemo aplikazioa erabiliz, ikasiko dugu nola CNN-ek aurpegietako koloreak eta ertzak detektatzen dituzten - hauek baitira ikusmen prozesamenduaren lehen urratsak. FaceDemo aplikazioa https://www.cs.cmu.edu/~dst/FaceDemo helbidean aurkituko duzu eta jarduera honen jatorrizko azalpenak AI4K12-ren dokumentazioan daude eskuragarri.

FaceDemo aplikazioaren erabiltzaile-interfazea.

FaceDemo aplikazioak aurpegia detektatzen du eta konfiantza maila erakusten du (0.96).
Zer ikasiko duzu?
- Nola detektatzen dituzten ordenagailuek aurpegiak irudian koloreak eta ertzak prozesatuz
- Nola funtzionatzen duten konboluzio-geruzek lehen mailako ezaugarrien detekziorako
- CNN-en kernelen funtzionamendua kolore-orban eta ertzen detekzioan
- Nola lortzen duten CNN-ek aurpegien kokapena zehaztasunez aurkitzea
2. CNN baten sarrera eta irteera

CNN prozesua: sarrera iruditik aurpegi detekziora, geruzaz geruza.
Sarrera irudia
- Kamerako irudi koloreduna
- Pixel bakoitza RGB balio bezala adierazita
- Prozesatzeko prest dagoen informazio gordina
CNN prozesua
- Konboluzio geruza anitz
- Max-pooling operazioak
- Ezaugarrien erauzketa automatikoa
Irteera emaitza
- Aurpegiaren inguruko lauki mugatzailea
- Konfiantza maila (0tik 1era)
- Aurpegiaren kokapena eta tamaina
FaceDemo aplikazioan ikus dezakezunez, lehen pantailan (goiko ezkerraldean) kamerak hartutako irudia azaltzen da, eta aurpegia aurkitzen duenean, lauki urdin bat agertzen da haren inguruan. Lauki horren goiko ertzean konfiantza-maila bat azaltzen da (adibidez, 0.96 zenbakiak %96ko konfiantza esan nahi du aurkitu den objektua aurpegi bat dela).
Horrez gain, irudiaren ondoan 7x7 sareta bat agertzen da. Bertan, detektorearen erantzunak modu sakonagoan ikus daitezkeen. Saretan detektore ugari daude bakoitza eskala desberdinetan, eta kamera mugitzen duzunean, detektore hauek aktibatzen dira.

Eskala txikiko detekzioa (gorriz) - kameratik urrun dagoenean eta eskala handiko detekzioa (horiz) - kameratik gertu dagoenean.

Eskala ertaineko detekzioa (zianez) - distantzia egokian dagoenean.
3. Kolore orbanen detekzioa
CNN-ek irudiaren oinarrizko ezaugarriak aztertzen dituzte lehenik. Hauetako bat koloreen detekzioa da. Pantailaren eskuinaldean "Convolutional Layer 1" izeneko eremuan, koloreak detektatzeko hainbat filtroren erantzunak ikus ditzakegu.

Kolore detektatzaile desberdinen erantzunak argi forma batean.
Kolore orbanen detekzio esperimentua
Erabil dezagun ortzadar bat edo kolore-gurpil bat kolore detektatzaileak nola erantzuten duten ikusteko.

Ortzadar koloreak - desberdin erantzuten dute detektatzaile desberdinetan.
Emaitzak:
- Orban horia detektatzeko kernelak erantzun handiena erakutsiko du ortzadarreko hori eta laranja zatietan.
- Orban gorria detektatzeko kernelak gehien erantzungo die ortzadarreko gorri zatiei.
- Urdin-berde detektatzaileak erantzun handiena erakutsiko du ortzadarreko urdin, turkesa eta berde zatietan.
Saia zaitez zure aurpegia kamerara gerturatuz, eta ikusi zer gertatzen den. Zein kernelak erantzuten dio gehiago zure azalari? Zein kernelak detektatuko ditu zure ezpainak edo begiak?
Kernelak eta konboluzioa
Kernel bat 3×3 tamainako pisu-matrizea da, irudiaren gainean aplikatzen dena ezaugarri konkretu bat detektatzeko. Konboluzioa eragiketa bat da non kernel bat irudi osoan zehar mugitzen den, erantzunak sortuz.
Hiru kernel garrantzitsu hauei begiratu:

1 - Orban horia, gorria eta urdin-berdea detektatzaileak
1 - Orban horia detektatzailea
RGB kanal bakoitzean pisu desberdinak ditu:
- R kanala: Pisu ahul positiboak
- G kanala: Pisu positibo sendoak
- B kanala: Pisu negatibo sendoak
Honek irudi bateko zati horien detekzioa ahalbidetzen du (gorria eta berdea nahasita, urdinik gabe).
11 - Orban gorria detektatzailea
RGB kanal bakoitzean:
- R kanala: Pisu positibo sendoak
- G kanala: Pisu negatiboak
- B kanala: Ia zero pisuak
Honek irudi bateko zati gorrien detekzioa ahalbidetzen du.
12 - Urdin-berde orban detektatzailea
RGB kanal bakoitzean:
- R kanala: Pisu negatiboak
- G kanala: Pisu positiboak
- B kanala: Pisu positiboak
Honek irudi bateko kolore urdin eta berdeen detekzioa ahalbidetzen du.
Azalaren kolorea detektatzen
Gizakien azalaren koloreak oso aldakorrak dira espektro zabal batean. CNN-ek kernel desberdinak erabiltzen dituzte azal tonu guztiak detektatzeko. Orban gorriaren detektatzaileak (kernel 11) tonu gorriagoak dituzten azal eremuetara erantzuten du, adibidez ezpainetara, baina azal mota guztiak detektatzeko, CNN-ek kernel konbinazio desberdinak erabiltzen dituzte.
4. Ertzen detekzioa
CNN-en lehen geruzetan beste funtzio garrantzitsu bat ertzen detekzioa da. Ertzen bidez objektuaren egitura eta mugak identifikatzen dira.

Ertz detektatzaile desberdinak lehen konboluzio geruzan.
Ertzen detekzioa
Ertz bat irudi batean distira-aldaketa bat dagoen gunea da. CNN-ek orientazio desberdineko ertzak detektatzen dituzte: bertikalak, horizontalak eta diagonalak.
Hiru ertz detektatzaile garrantzitsu:
9 - Ertz bertikal detektatzailea
RGB kanal guztietarako antzeko pisuekin:
- Ezkerreko zutabea: Pisu positiboak
- Eskuineko zutabea: Pisu negatiboak
Honek ezkerretik eskuinerako aldaketa detektatzen du (zuritik beltzera).
10 - Ertz horizontal detektatzailea
RGB kanal guztietarako antzeko pisuekin:
- Goiko ilera: Pisu positiboak
- Beheko ilera: Pisu negatiboak
Honek goitik beherako aldaketa detektatzen du (zuritik beltzera).
15 - Beltz/hori ertz bertikal detektatzailea
9. kernelaren alderantzizkoa:
- Ezkerreko zutabea: Pisu negatiboak
- Eskuineko zutabea: Pisu positiboak
Honek ezkerretik eskuinerako aldaketa detektatzen du (beltzetik zurira).
Ertzen detekzio esperimentua
Erabil dezagun karratu beltz sinple bat ertzen detektatzaileak nola erantzuten duten ikusteko.
Emaitzak:
- 9 - Ertz bertikal detektatzaileak karratuaren ezkerreko ertza nabarmentzen du (zuritik beltzera).
- 10 - Ertz horizontal detektatzaileak karratuaren goiko ertza nabarmentzen du (zuritik beltzera).
- 15 - Beltz/hori ertz detektatzaileak karratuaren eskuineko ertza nabarmentzen du (beltzetik zurira).
Karratu sinplea 45° biratuz gero, ikusiko duzu nola detektatzaileek ertz diagonal desberdinetara nola erantzuten duten.
Aurpegian ertzen detekzioa
Zure aurpegia kameran jartzean, ertz-detektatzaileek nabarmentzen dituzte aurpegiaren beraren mugak, begien ingurukoak, sudurraren ertza eta ezpainen ingurukoak. Ertz hauek aurpegia identifikatzeko ezinbestekoak dira!
5. Aurpegi detekzioa konboluzioak erabiliz
Orain ulertzen dugu nola detektatzen dituen CNN batek koloreak eta ertzak. Baina nola pasatzen da sistema sinple hauetatik aurpegi oso bat detektatzera?
Konboluzio geruza 1
- Oinarrizko ezaugarriak: koloreak, ertzak, orbanak
- 16 kernel desberdin
- 3×3 tamainako pisu-matrizeak
Tarteko geruzak
- Konplexutasun handiagoko ezaugarriak
- Begiak, ahoa, sudurra detektatzea
- Ezaugarri konbinazioen patroiak
Irteera geruza
- 245 aurpegi detekzio zirkuitu (7×7 sareta)
- 5 detektore eskala bakoitzeko (distantzia desberdinak)
- Aurpegiaren kokapena eta konfiantza maila
FaceDemo aplikazioan 7×7 sareta ikusten dugu, 245 aurpegi-detekzio zirkuitu dituena. Detekzio hauek aurpegiak eskala desberdinetan aurkitu ditzakete, eta eskala bakoitza kolore desberdin batez adierazten da:
Eskala txikia (gorria)
Kameratik urrun dagoen aurpegia detektatzen du. Aurpegia pixel gutxik osatzen dute.
Eskala ertaina (ziana)
Distantzia ertainean dagoen aurpegia detektatzen du.
Eskala handia (horia/berdea)
Kameratik gertu dagoen aurpegia detektatzen du. Aurpegia pixel askorekin osatuta dago.
Probatu mugimenduan
Proba ezazu zure burua mugituz kameraren aurrean:
- Aurrera eta atzera mugitu, eta ikusi nola aldatzen den lauki mugatzailearen kolorea.
- Eskuak aurpegiaren aurrean jarri, eta ikusi nola erantzuten duen detektoreak.
- Bigarren pertsona bat sartu irudian, eta ikusi nola sortzen den beste lauki mugatzaile bat.
Konfiantza-atalasea jaisteko botoia sakatuz gero (beheko botoi urdina), konfiantza baxuagoko detekzioak ere ikusiko dituzu.
6. Laburpena eta konklusioak
Aurpegi detekzioarekin ikasi dugunak erakusten digu CNNek nola prozesatzen duten informazio bisuala hainbat geruzatan zehar:
Lehen geruza
Koloreak eta ertzak detektatzen ditu kernel eta konboluzioen bidez, oinarrizko ezaugarriak harrapatuz.
Erdiko geruzak
Konplexutasun handiagoko ezaugarriak detektatzen dituzte, aurpegien zati desberdinak identifikatuz.
Irteera geruza
Aurpegien kokapena eta konfiantza maila zehazten ditu, lauki mugatzaileak sortuz.
FaceDemo aplikazioak erakusten digu nola CNN batek detektatzen dituen koloreak eta ertzak, eta haietatik nola pasatzen den aurpegi osoak identifikatzera.
CNNen gaitasuna
Oinarrizko kontzeptu hauek ulertzea lagungarria da ikusteko nola gaur egungo aurpegi detekzio teknologiek, telefono adimendunetan, argazki aplikazioetan edo segurtasun sistemetan, oinarri berdinak partekatzen dituzten, nahiz eta askoz ere sofistikatuagoak izan.
Baliabide gehiago FaceDemoren inguruan
- FaceDemo aplikazioa probatu hemen: https://www.cs.cmu.edu/~dst/FaceDemo
- GitHub errepositorioa: https://github.com/touretzkyds/FaceDemo
- Hitz teknikoen hiztegia eskuragarri dago materialean.
Irudien kredituak
Webgune honetan erabilitako irudiak AI4K12.org proiektutik datoz eta CC-BY-SA lizentziapean banatzen dira. AI4K12 proiektua AAAI eta CSTA erakundeek babestutako ekimena da, adimen artifizialaren eta ikusmen artifiziala bezalako teknologien ezagutza K-12 hezkuntzan sartzeko.