BLOG | Volg TMC Data Science tijdens hun Kaggle-competitie - TMC (nl) Shape caret-double-left caret-double-right caret-down caret-left caret-right-circle caret-right Shape close dropdown expand more facebook Logo linkedin logo-footer logo-mark logo-mobile mail play search twitter youtube instagram
Menu Sluiten
article

BLOG | Volg TMC Data Science tijdens hun Kaggle-competitie

We houden je via deze blog op de hoogte van de voortgang, uitdagingen en resultaten van het TMC Data Science-team tijdens hun eerste Kaggle-competitie.

De bovenste 10% bereiken | Romain Huet

26 juli 2018 | Zoals mijn collega Valentin in zijn artikel uitlegt, nemen wij als Employeneurs van TMC Data Science deel aan een Kaggle-competitie. Ik help hem met het voorbereiden van onze deelname. Omdat dit onze eerste gezamenlijke competitie is, willen we een groepsproject indienen waarmee we de bovenste 10% kunnen bereiken.

Onderwijzen en leren

We nodigen daarom elke week vrolijke en enthousiaste Employeneurs uit die tijdens pizzasessies bijdragen leveren aan dit project en die leren wat Machine Learning kan betekenen voor echte problemen in de wereld. Sommigen van ons hebben meer ervaring en hebben een sterke achtergrond op het gebied van Machine Learning. Het is op zich al een uitdaging om te zorgen dat anderen op de hoogte blijven van de ontwikkelingen.

Tijdens deze wekelijke bijeenkomsten deelt iedereen wat ze de afgelopen week hebben gedaan. Dit levert open discussies en vragen op, zodat we meer leren over Machine Learning. Dit is met name interessant voor nieuwsgierige beginnelingen. Dit is een tijdrovende bezigheid voor de meer ervaren mensen die als enige een bijdrage leveren aan de competitie en die anderen uitleg geven en vragen beantwoorden. Elke leraar vindt het echter leuk als mensen leren en hun werk verbeteren.

Leren van fouten

De competitie waar we aan werken is gestart door Santander Group, een Spaanse bank, die de waarde wil kunnen bepalen van transacties voor potentiële klanten. Een prettige eigenschap van de data is dat er geen domeinkennis is vereist. Dit betekent dat we ons volledig kunnen richten op het voorverwerken van data en op het onderdeel Machine Learning. Het lukte ons de bovenste 14% te bereiken door te werken met 'Kaggle Kernels' die corresponderen met codes die door andere Kaggle-deelnemers worden gedeeld, tot er een 'lek' ontstond. Tijdens dit soort competities kan er van alles gebeuren en je kunt in een paar uur kelderen naar de laagste plaats op het scorebord. Het zogenaamde lek is eigenlijk een hack die helpt om beter inzicht te krijgen in de data. Iedereen, wij ook, profiteert nu van deze datahack door de 'Kernels' te gebruiken die op de fora worden gedeeld.

Deelname aan zo'n competitie levert snel meer kennis op over Machine Learning. Je kunt bovendien zien hoe sterk Machine Learning zich ontwikkelt met de hulp van deskundigen. Ik leer niet alleen, maar kan mijn kennis ook delen met anderen. Zo heb ik ontdekt dat er ook voor mij nog heel veel over dit interessante onderwerp te leren valt.

Wat is je volgende stap? We kunnen je daarbij helpen

Stel je vraag