Ikasketa Automatikoa (Machine Learning) hasiberrientzat

Jatorrizko testua Inès Chokri-k esteka honetan publikatutakoa da eta berezuma.com-ek itzuli du euskarara Adimen Artifiziala erabilita.

Sarrera

Ikaskuntza automatikoa nonahi erabiltzen da gaur egun, Netflixen analisi prediktibotik hasi eta gidaririk gabeko autoetaraino, teknologia aurreratu hori erabiltzen ari gara gure eguneroko bizitzan, konturatu ere egin gabe. Azken urteotan gero eta ospe handiagoa hartu du, gero eta pertsona gehiago ari dira interesatzen ikaskuntza automatikoan, eta horri buruz gehiago jakitea gustatuko litzaieke.
Pertsona horietako bat bazara, ezagutzen baduzu edo ez, artikulu hau zuretzat da.
Baina Machine Learningen erabat sartu aurretik, Adimen Artifizialaren (AI), Machine Learningen (ML) eta Deep Learningen (DL) arteko aldeak argituko ditugu lehenik, pertsonek poltsa berean jartzen baitituzte normalean, anbiguo samarra baita.

AI, ML eta DLren arteko aldea

Zer da Adimen Artifiziala?

Adimen Artifiziala, dena iraultzen ari den teknologia hori, informatikaren adar bat da, giza portaera imitatzen duten makina adimendunak sortzeari eskainia. AA bi gai nagusitan bana dezakegu: ahula eta indartsua.

AA ahula, estua ere deitua, funtzionalitate mugatuak dituen Adimen Artifiziala da. Arazoak konpontzeko edo arrazoitzeko lan espezifikoak egiteko algoritmo aurreratuak erabiltzen dituzten makinak dira. Adibidez, ahotsean oinarritutako laguntzaile pertsonalak, Siri eta Alexa kasu, adimen artifizialeko programa ahultzat har litezke, aurretik definitutako funtzio multzo mugatu baten barnean jarduten dutelako, honek, sarri, erantzun programatu bat dutela esan nahi duelarik.

AA indartsua, berriz, Adimen artifiziala da, makinek giza kontzientzia garatzea eragin dezakeena. Buru propioa duten makina edo programak dira, eta beren kabuz lan konplexuak pentsatu eta egin ditzaketenak, inolako giza interferentziarik gabe. Kontzientzia maila hori oraindik ez da lortu, baina oso azkar ari da eboluzionatzen, eta laster ikus genezake.

Adimen artifizialak hiru mota ditu:

1 – Makina erreaktiboa
Adimen artifizial mota hori erreaktibo hutsa da, eta ez du oroitzapenak osatzeko edo erabakiak hartzeko iraganeko esperientziak erabiltzeko gaitasunik. Makina horiek lan zehatzak egiteko diseinatuta daude.

2 – Memoria mugatua
Adimen artifizial mota horrek iraganeko esperientzia eta egungo datuak erabiltzen ditu erabaki bat hartzeko.

3 – Adimenaren teoria
Horrelako makinek giza emozioak gizarteratu eta uler ditzakete. Emozio horiek imitatzen saiatuko dira.

Adimen artifiziala Machine Learningekin lor daiteke.

Zer da ikaskuntza automatikoa?

Ikaskuntza automatikoa adimen artifizialaren azpieremu bat da. Ordenagailuei datuak eta informazioa esplizituki programatu gabe ematean gizaki gisa ikasi eta jarduteko zientzia da. Hitz gutxitan esanda, ikasketa automatikoak ikasteko gaitasuna ematen dio Adimen Artifizialari.

Deep Learning Machine Learning egiteko modu berezi bat da.

Zer da ikasketa sakona?

Ikasketa Sakona edo Deep Learning sistema autonomo eta autodidakta da, eta bertan dauden datuak erabiltzen ditugu patroiak aurkitzeko algoritmoak entrenatzeko, eta gero datu berriei buruzko iragarpenak egiteko erabiltzen ditugu. Giza garunaren sare neuronala imitatzeko gaitasuna du. Adibidez, demagun robot bat eraikitzen dugula, eta hori aitortzea nahi dugu.

Bere programa milaka irudirekin elikatuz entrenatuko genuke, gu izan edo ez. Gure robotak patroiak ezarriko ditu, irudiaren datuak sailkatuz eta taldekatuz. Patroi horiek, gero, eredu prediktibo bat osatuko dute, irudi multzo berri bat begiratu eta atxikitzen gaituzten ala ez aurreikus dezakeena.

Machine Learning egiteko beste modu bat aurkeztu nahi dizuet, Reinforcement Learning izenekoa. Errefortzu bidezko ikaskuntza (RL) ingurune bateko ikaskuntza-prozesua da, Ia baten portaeraren atzeraelikaduraren bidez. Haurrak ginenean, bakarrik ibiltzen ikasi behar genuen, inork ez zigun benetan esan nola ibili, besterik gabe praktikatu, behin eta berriz estropezu egin, lortu arte, eta azkenean oin bat bestearen aurrean jarri genuen.

Makinekin gauza bera da, datuekin elikatzen ditugu eta euren kabuz ikasteko aukera ematen diegu. Esperientzia irabaziko dute, gizakiek akatsak egitean egiten duten bezala, eta horretatik ikasiko dute (ez al da hala?)

Machine Learning-ekin aurrera egin aurretik, hona hemen AI, ML, DL eta RL harremanak hobeto ulertzeko eskema txiki bat.

Ikaskuntza automatikoko metodoak

Teknologia bakoitzak metodoak ditu, gauzak egiteko modu bat, eta Machine Learningek bi metodo herrikoi ditu, ikasketa gainbegiratua eta ez gainbegiratua.

Ikaskuntza gainbegiratua

Ikaskuntza gainbegiratua trebakuntza-etiketak dituen ikaskuntza-prozesua da, baina zein dira gaikuntza-etiketa horiek? Zer esan nahi dugu horrekin? Kontzeptu hori hobeto azaltzeko, imajina ezazu seme bat izatea (ala, agian, badaukazu?), haur horri koloreen izena erakutsi nahi diogu. Adibidez, haurrari kolore gorria erakutsiko genioke, eta esango genioke hau dela kolore gorria, gero kolore berdea erakutsiko genioke eta esango genioke hau dela kolore berdea.

Haurrari kolorea erakustea eta zein koloretakoa den esatea, entrenatzeko etiketa da; beraz, haurrari berriz ere kolore berdea erakusten diogunean eta zein koloretakoa den galdetzen diogunean, berdea edo gorria erantzungo du. Erantzun zuzena ematen ez badu, oker dagoela esango diogu.

Horrela funtzionatzen du ikaskuntza gainbegiratuak. Makina datu etiketatuekin elikatzen dugu eta prozesatzen uzten diegu; gero, akatsak adierazten ditugu ikaskuntza-prozesuan.

Galdetu eta robotak berdez edo gorriz erantzungo du, aurretik duen esperientziaren arabera

Gainbegiratzerik gabeko ikaskuntza

Gainbegiratutako ikaskuntza ez bezala, gainbegiratu gabeko ikaskuntza trebakuntza-etiketarik gabeko ikaskuntza-prozesua da. Taldea ere deitzen da. Ez dago aldez aurretik konfiguratuta datu-mota espezifikoak hautatzeko; antzekotasunen arabera taldeka daitezkeen datuak bilatzen ditu, besterik gabe. Makina datu tonekin elikatzen dugu, eta bere kabuz ikasten uzten diogu.

Ikaskuntza automatikoaren ikuspegiak

Machine Learningek ikuspegi ezberdinak ditu, edo algoritmo ere dei genitzake. Algoritmoa datuen patroiak ikasteko eta horietatik informazio esanguratsua ateratzeko erabiltzen diren arau eta teknika estatistikoen multzoa da. Machine Learningen eredu baten atzean dagoen logika da.

Algoritmo desberdin asko eskaintzen zaizkigu:

Gainbegiratutako algoritmoak:
1 – Erregresio lineala:
Algoritmo ezagunenetako bat etengabeko ezaugarrietan oinarritutako emaitza iragartzen duen ikaskuntza gainbegiratuko algoritmo bat da. Esteka hau berrikustera gonbidatzen zaitugu, erregresio lineala hobeto ulertzeko. Erregresio lineala, adibidez, klima aurreikusteko erabil daiteke.

Content not available.
Please allow cookies by clicking Accept on the banner

2 – Erabakitzeko zuhaitza:

Sailkapen eta erregresio helburuetarako erabiltzen da. Erabaki-zuhaitzek datuetatik ikasten dute kurba sinusoide bat hurbiltzeko, bai -orduan– beste erabaki-arau batzuekin. Zuhaitza zenbat eta sakonagoa izan, orduan eta konplexuagoak dira erabakitzeko arauak, eta gehiago egokitzen da eredua.

Ikusi erabaki-zuhaitzei buruzko bideo interesgarri hau!

Content not available.
Please allow cookies by clicking Accept on the banner

3 – Euskarri-bektoreen makina:

Support Vector Machine gainbegiratutako sailkapen-algoritmo ezaguna da, eta datu-kategorien artean banaketa-lerro bat sortzen du.

Content not available.
Please allow cookies by clicking Accept on the banner

4 – K bizilagun hurbilenak:

K-tik hurbilen dauden bizilagunak, sailkapenean espezializatutako ikaskuntza gainbegiratuko algoritmo bat da. Hori azaltzen duen bideo bat dago hemen.

Content not available.
Please allow cookies by clicking Accept on the banner

5 – Ausazko basoak:

Herri-talde gainbegiratuaren ikaskuntza-algoritmoa da. “Multzoak” esan nahi du “ikasle ahulez” osatutako talde bat behar dela, eta elkarrekin lan eginarazten die iragarle indartsu bat osatzeko.

Content not available.
Please allow cookies by clicking Accept on the banner

Gainbegiratu gabeko algoritmoak:

1 – K-taldekatzea esan nahi du:

K-means taldekatzea gainbegiratu gabeko ikaskuntza sailkatzeko algoritmo bat da, normalean taldekatze arazoari aurre egiteko erabiltzen dena.

K: erabiltzaileak sartutako kluster kopurua adierazten du. Azken buruan, datu-zientzialariaren esku dago “k” balio zuzena hautatzea.

Content not available.
Please allow cookies by clicking Accept on the banner

2 – Osagai nagusien azterketa:

Osagai nagusien analisia (CPA) dimentsioak murrizteko algoritmoa da, eta datu zientzialarientzat gauza pare bat egin ditzake.

Content not available.
Please allow cookies by clicking Accept on the banner

Nola aukeratu algoritmo zuzena?

Hui Li doktoreak esan zuen bezala:

Algoritmo bat aukeratzerakoan, beti izan kontuan alderdi hauek: zehaztasuna, entrenatzeko denbora eta erabiltzeko erraztasuna. Erabiltzaile askok zehaztasuna jartzen dute lehenik; hasiberriek, berriz, hobekien ezagutzen dituzten algoritmoetan zentratzeko joera dute.
Zure kasura ondoen egokitzen den algoritmoa zein den jakiteko, egin galdera hauek:

1 – Zein da zure datuen tamaina, kalitatea eta izaera?

2 – Zer egin nahi duzu datuekin?

3 – Zein azkar nahi duzu izatea?

4 – Zein zehaztapen maila nahi duzu?

Orduan, zer algoritmo komeni zaigun ere froga genezake gure datuekin frogatuz.

Esteka hau berrikustera gonbidatzen zaituztet xehetasun gehiagorako.

Ikaskuntza automatikoaren aplikazioa mundu errealean

Irudia ezagutzea:

Ikaskuntza automatikoaren erabilera ohikoenetako bat irudiak ezagutzea da. Egoera askotan irudiaren aitorpena behar da. Facebookek teknologia hori erabiltzen du norbaiten aurpegia argitaratutako irudian agertzen den edo ez antzemateko, eta erabiltzaileari pertsona hori identifikatu nahi duen edo ez galdetuko dio.

Irudiak antzematea kriminal bat bilatzeko ere erabil liteke. Bilatutako pertsona bat kamerak hartutako irudian denbora errealean dagoen detektatuko luke makinak.

Diagnostiko medikoa:

Ikaskuntza automatikoak hainbat arlo medikotan diagnostiko- eta pronostiko-arazoak konpontzen lagun dezaketen metodoak, teknikak eta tresnak ematen ditu. Gaixotasunaren progresioa aurreikus lezake, emaitzak ikertzeko ezagutza medikoa atera. Ikaskuntza automatikoa datuak aztertzeko ere erabiltzen da, hala nola datuetan erregulartasunak detektatzea datu ez-perfektuak behar bezala tratatzean, Zainketa Intentsiboetako Unitatean erabilitako datu jarraituen interpretazioa eta monitorizazio eraginkor eta efizientea dakarten alarma adimendunetarako.

Ondorioak

Adimen artifizialaren, ikaskuntza automatikoaren eta ikasketa sakonaren arteko aldea zein den ikusi dugu. Ikaskuntza automatikoaren ikuspegi ezberdinak ikusi ditugu, bere algoritmo ezberdinak, bere metodo ezberdinak eta algoritmo zuzena nola aukeratu.

Adimen artifiziala gizateriaren etorkizuna da, mundua abiadura handian eboluzionatzen ari da. Duela hogei urte ez genuen hau guztia imajinatuko, eta, hala ere, hemen gaude. Baina neure buruari galdetzen diot, adimen artifiziala urrats positiboa al da gizateriarentzat? Ez gaitu suntsituko? Makinek mundua hartuko dute? Guretik oso gertu dagoen adimen artifiziala lortuko al dute zientzialariek?

Zabaldu!