De drie categorieën algoritmes binnen machine learning uitgelegd - TMC (nl) Shape caret-double-left caret-double-right caret-down caret-left caret-right-circle caret-right Shape close dropdown expand more facebook Logo linkedin logo-footer logo-mark logo-mobile mail play search twitter youtube instagram
Menu Sluiten
article

De drie categorieën algoritmes binnen machine learning uitgelegd

Machine Learning is niet meer weg te denken binnen kunstmatige intelligentie. Er zijn diverse manieren om machine learning te implementeren binnen jouw bedrijf. Allereerst dien je hiervoor het meest geschikte algoritme te kiezen, wat het meest geschikt is voor jouw specifieke case. Er bestaan enorm veel verschillende soorten algoritmes binnen machine learning, maar ze zijn in te delen in drie categorieën: supervised learning, unsupervised learning en reinforcement learning. Romain Huet, senior data scientist bij TMC Data Science, legt uit wat deze algoritmes precies zijn en hoe en wanneer ze gebruikt worden.

1.Supervised learning

Bij deze vorm van machine learning, gecontroleerd leren in het Nederlands, heb je zowel je input variabelen en je output variabelen beschikbaar: je hebt dus een complete dataset tot je beschikking. Er worden tijdens het trainen van het model voorbeelden gegeven van ‘hoe het hoort’, zodat de machine op basis van nieuwe input, toekomstige output kan leren voorspellen. Een supervised learning algoritme is het meest geschikt voor jouw case wanneer je al weet wat een model voor je moet voorspellen op basis van een bepaalde input en je deze data beschikbaar hebt.

We geven een voorbeld om een idee te geven van hoe supervised learning in de praktijk werkt. Stel, je bent leraar en je wilt graag een voorspelling doen van wat de resultaten van je studenten worden van een volgend tentamen. Hiervoor heb je eerst een dataset nodig, in dit geval: hun aanwezigheidspercentage tijdens colleges, hoe goed maken ze tussentijdse opdrachten (inputdata) en hun score op het vorige tentamen (outputdata). Met deze data kun je het algoritme leren om een verband te herkennen tussen het gedrag tijdens de cursus en de uiteindelijke score van het tentamen. Er kunnen nu voorspellingen worden gedaan over de toekomstige resultaten van de leerlingen. Hiervoor verzamel je opnieuw dezelfde inputdata, zodat het getrainde model een voorspelling kan doen.

2. Unsupervised learning

Bij unsupervised learning, ook wel ongecontroleerd leren genoemd, doe je eigenlijk het tegenovergestelde van supervised learning. Wanneer je een dataset hebt met enkel inputdata, maar je nog geen gewenste output weet, wordt deze methode gebruikt. Je zoekt dan naar groepen in je bestaande data; een relatie tussen observaties om groepen te kunnen definiëren. De machine zal dus inkomende data scannen en deze uiteindelijk gaan structureren in clusters of categorieën.

Unsupervised learning wordt vaak gebruikt in een verkennend proces. Als je bijvoorbeeld een grote dataset met voedingsmiddelen hebt, maar je weet nog niet in welke categorieën je deze wilt onderverdelen, kun je dit gebruiken. Het algoritme gaat voor je op zoek naar overeenkomsten tussen deze voedingswaren, bijvoorbeeld: groente en fruit. Hier kan het model twee categorieën van maken. Uiteindelijk kan dit nog verder worden gecategoriseerd, fruit wordt dan bijvoorbeeld verder uitgesplitst in exotisch fruit en citrusvruchten.

3. Reinforcement learning

Er is een vorm van machine learning waarin een machine leert aan de hand van trial and error, reinforcement learning. Hiermee wordt een model geoptimaliseerd door middel van feedback op eerdere ervaringen en acties. Vaak worden deze optimalisaties gebaseerd op beloningen, wat betekent dat sommige acties meer zinvolle ervaringen kunnen opleveren. Een voorbeeld hiervan is een muis die kaas krijgt als hij uit een doolhof komt. Afhankelijk van de te ondernemen actie, zal het model zichzelf updaten door deze feedback te gebruiken om de beloningen te optimaliseren.

Er is een computer die geleerd heeft hoe hij een level van Super Mario kan uitspelen, een indrukwekkend voorbeeld van hoe Reinforcement Learning al ingezet is. Het model heeft geleerd dat hoe verder hij komt in het level. Hoe meer punten hij haalt, hoe beter. Met deze informatie start de computer met het spel. Iedere keer dat hij ‘af gaat’, weet hij dat er op dat punt verbeterd kan worden. Wanneer er meer punten worden behaald dan tijdens het vorige potje, wordt dit als een beloning gezien. Op deze manier weet het model dat hij deze zetten nog eens kan proberen. Na veel pogingen heeft het model op basis van trial and error geleerd hoe hij Super Mario kan uitspelen. In deze video kun je meer inzichten krijgen over hoe dit model gebouwd is.

Wat is je volgende stap? We kunnen je daarbij helpen

Stel je vraag