Skip to main content

De laatste jaren ontpopt de ene na de andere IT trend. Termen als ‘Big Data’, ‘Internet of Things’, ‘3DPrinting’ en ‘Virtualization’ zijn tegenwoordig overal te vinden. Nu is er een nieuwe IT hype om aan dat rijtje toe te voegen: Advanced Machine Learning, een term die voor sommigen misschien nog onbekend is. Na het lezen van dit artikel zal dit niet meer het geval zijn.

Wat is Advanced Machine Learning?

Advanced Machine Learning bouwt voort op Machine Learning; een term die al wat langer bestaat. Machine Learning (letterlijk: machinaal leren of automatisch leren) maakt het voor computers mogelijk om bepaalde informatie te vinden, zonder dat ze daartoe geprogrammeerd zijn. Hierbij wordt er gebruik gemaakt van algoritmes die leren van data door dit steeds te herhalen. Computers leren hierdoor van zichzelf. Alan Turing, een bekende wiskundige en informaticus, vroeg zich in 1950 in zijn artikel ‘Computing Machinery and Intelligence  reeds af of machines konden denken. In 1977 herformuleerde Tom M. Mitchell (ook een bekend informaticus) de vraag “Can machines think?” in “Can machines do what we (as thinking entities) can do?”. Hij geeft dan ook de volgende definitie aan Machine Learning: “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E.”

Ondanks de lange historie van Machine Learning is het concept recentelijk pas echt bekend geworden, en staat nu soms ook wel bekend als Advanced Machine Learning. Het concept blijft hetzelfde, maar wordt nu toegepast op de enorme datastromen van Big Data en de gigantische computerkracht van tegenwoordig. De kracht achter Machine Learning is het iteratieve aspect: het continu herhalen van berekeningen door de computer, waardoor bepaalde patronen worden herkend om vervolgens het vermogen te hebben om zichzelf onafhankelijk aan te passen. Op basis van opgedane ervaring kunnen de computers zichzelf dus automatisch verbeteren. Dit is dus niet hetzelfde als bijvoorbeeld data mining. Waar data mining voorheen onbekende patronen en kennis ontdekte, wordt Machine Learning gebruikt om patronen en kennis te herhalen op ander data dan van waar de patronen ontwikkeld zijn, om vervolgens die resultaten weer te gebruiken.

Maar wat kun je met Advanced Machine Learning? Het concept wordt reeds toegepast in meer aspecten dan je denkt. Enkele voorbeelden waarin Machine Learning wordt toegepast zijn bijvoorbeeld:

  • Gezichtsherkenning op afbeeldingen
  • Online aanbevelingen mechanismes (bijvoorbeeld: “personen die u misschien kent”)
  • Zelfrijdende auto van Google
  • Onderwerpen herkennen (het categoriseren van nieuwsartikelen op politiek, sport, entertainment, etc.)
  • Spam filtering
  • Fraude detectie
  • Klanten segmentatie (of een bepaalde doelgroep wel of niet op een advertentie zou reageren)

In al deze voorbeelden wordt herhaling toegepast om patronen te herkennen, waardoor de computer vervolgens bijvoorbeeld zelfstandig gezichten kan herkennen, omdat de computer bepaalde patronen in de afbeelding herkent en die vervolgens aanduidt als gezicht.

Hoe werkt Advanced Machine Learning?

De werking van Machine Learning bestaat eigenlijk uit twee fases. De eerste fase is de leer-fase, waarop verschillende manieren van leren worden toegepast op een zogenoemde ‘training dataset’, om vervolgens voorspellingen te kunnen doen in de tweede fase die het algoritme valideren. Simpel weergegeven, ziet het proces er als volgt uit:

AML1Figuur 1 – Leer proces

Machine Learning kent verschillende manieren van leren. De vier meest gebruikte zullen kort behandeld worden. De weergegeven figuren komen van deze bron.

  • Supervised Learning – deze manier van leren is mogelijk wanneer de input en de output duidelijk gedefinieerd en gelabeld zijn. Op basis van deze labels leert de computer hoe de eigenschappen van bepaalde inputs bepalend zijn voor de outputs. Dit wordt vervolgens omgezet in een bepaald algoritme, waardoor de computer dit patroon zelfstandig kan herhalen op nieuwe – unlabeld – input en dus zelf de juiste output kan genereren. Supervised learning is het meest geschikt wanneer toekomstige trends op historische data worden voorspeld. Voorbeelden van supervised learning bevatten onder andere classificatie en regressie.

AML2

  • Unsupervised Learning – deze manier van leren bevat geen vooraf gelabelde input en output, en dus ook geen historische data. De computer dient dus zelf op basis van de gegeven input en output een bepaalde structuur te ontdekken om een algoritme op te baseren. De computer kan dit bijvoorbeeld doen door de input te verdelen in groepen van elementen die bepaalde eigenschappen delen, zoals bij k-gemiddeld clusteranalyse. Deze manier van leren wordt vaak gebruikt bij online aanbevelingen.

AML3

  • Semi-supervised Learning – zoals de naam al doet vermoeden, is deze manier van leren een combinatie van de bovenstaande manieren. Zowel gelabelde als niet-gelabelde data wordt hierbij gebruikt; vaak een groot deel niet-gelabelde data met een klein deel gelabelde data, omdat niet-gelabelde data een stuk gemakkelijker te verkrijgen is. Deze manier van leren wordt vaak toegepast op stem- en gezichtsherkenning.

AML4

 

  • Reinforcement Learning – deze manier van leren creëert een algoritme op basis van trial-and-error, waarbij gekeken wordt welke acties leiden tot een beter resultaat. Een voorbeeld hiervan is een genetisch algoritme.

AML5

 

Hoe ziet de toekomst eruit met Advanced Machine Learning?

Een rapport van Mckinsey stelt: “As ever more of the analog world gets digitized, our ability to learn from data by developing and testing algorithms will only become more important for what are now see nas traditional businesses. […] Continious (and often automatic) experimentation will improve the way we optimize business processes in our organizations”. Met de enorme groei van data en de constant evoluerende technologieën stijgt de vraag naar Machine Learning technieken, omdat Machine Learning het mogelijk maakt om snel en automatisch modellen te creeëren die grotere, complexere datasets kunnen analyseren. SAS omschrijft het resultaat van Machine Learning als volgt: “High-value predictions that can guide better decisions and smart actions in real time without human intervention”. Er kan dan ook wel geconcludeerd worden dat Machine Learning de traditionele manier van statistische analyses heeft vervangen, en dat het belang van Machine Learning in onze data-gedreven wereld steeds groter zal worden in de komende jaren.

Leave a Reply