woensdag 11 mei 2016

Lerende machines

Big Data, Business Intelligence, Learning Analytics, Machine Learning, Internet Intelligence. Steeds meer bedrijven, instellingen en overheden zien de mogelijkheden van slimme algoritmes die data analyseren om er informatie uit te halen. Dat biedt ongelooflijk veel mogelijkheden, waarschijnlijk meer dan waar we (allemaal) blij van worden.

Het fenomeen van lerende machines fascineert me al een hele tijd. Daarom heb ik de stoute schoenen aangetrokken en ben me er met enkele MOOC's in gaan verdiepen. Inmiddels heb ik een officieel certificaat Machine Learning van Stanford te pakken. Volgens Andrew Ng mag ik me zelf nu een machine learning expert noemen. Zelf denk ik daar toch wel iets anders over, al heb ik wel een hele hoop geleerd. Via video lectures, documentatie en een hoop opdrachten weet ik nu (veel) meer over allerlei toepassingen om informatie uit data te halen en computers op basis daarvan beslissingen te kunnen laten nemen. Linear of Logistic Regression, Neural Networks, Support Vector Machines, Anomaly Detection, K-Means Clustering, noem maar op.

Waar ik met name verbaasd over ben is de relatieve eenvoud waarop al die algoritmes gebaseerd zijn. En de slimheid van die wiskundigen en informatici die in staat zijn geweest leerprocessen in formules en algoritmes te vatten. Om een programma handschriften te leren herkennen of een auto te leren besturen kun je met een zeer beperkt aantal programmeerregels toe. Weliswaar in programma's die in staat zijn grote hoeveelheden data in één keer te kunnen verwerken. Daarvoor is het matrixrekenen uitgevonden. Met één simpele regel kunnen duizenden gegevens worden bewerkt.

Het grootste probleem voor mij waren de programmeeropdrachten. Een formule kan dan wel betrekkelijk eenvoudig zijn, dat heb je nog niet zo snel vertaald in een stukje programma in bijvoorbeeld MatLab of Octave, twee programmeertalen waarmee die grote, complexe berekeningen kunnen worden gemaakt. Het probleem was, dat ik onvoldoende wist van die programmeertalen.Als ik dan na flink wat geworstel de juiste programmaregels vond, dacht vaak: 'ach ja, natuurlijk'. Maar wel achteraf en met hulp van zoon Job die als neurowetenschapper kan lezen en schrijven met MatLab of dochter Mijke, die als datascientist de wiskunde erachter helemaal uit het hoofd kent.
De grootste opbrengst van deze cursus is, dat ik nu snap hoe een computer kan leren teksten herkennen, foto's kan categoriseren en de juiste aanbevelingen doen als ik op internet iets aan het zoeken ben.

Tegelijkertijd maak ik me zorgen over de manier waarop het volstrekt verkeerd gebruikt kan worden, zoals een krantenartikel in de Volkskrant beschreef. In China wil men op basis van data-analyse studenten beoordelen, zogenaamd om hen te helpen. Zolang mensen handelen en zich uiten in lijn met de partijdoctrine kunnen kredietpunten worden verdiend. Laat je wat te kritisch uit op internetfora, kan je dat punten kosten, waarmee het bijvoorbeeld moeilijker wordt een lening aan te gaan. Big Brother is learning...