In het kort

Machine learning leidt tot nieuwe inzichten in verschillende factoren. Een groot probleem dat AI oplossingen verhindert tot grootschalige implementatie is het black box probleem.  Dit probleem typeert zich als je een input en een output hebt zonder een idee te hebben wat de link is tussen die twee.

Neural networks

Bij neural networks worden hidden layers en nodes gebruikt om een probleem te generaliseren. Tijdens het trainen worden er bepaalde weights berekent tijdens het trainingsproces. Deze weights beïnvloeden de input in een manier waarop de test data en toekomstige data juist geclassificeerd kunnen worden. Deze vervorming maakt dat je niet duidelijk af kan lezen wat er precies met de data gebeurt.

Decision trees

Een decision tree kan veel makkelijker uitgelegd worden omdat er steeds wordt gesorteerd op één variabele op elke tak. De waardes kunnen wel meerdere keren voorkomen, maar er wordt meestal een harde limiet gegeven over de grootte van de tree. Dit wordt gedaan zodat de decision tree niet aan het overfitten is, wat gebeurt als de tree te vaak getraind wordt waardoor het te specifiek fout gebeurt.

Afbeelding 1: Links decision tree met diepte 3. Rechts neural network met één hidden layer.

Een decision tree trainen op basis van de input en output van een neural network kan helpen om de keuzes van een neural network duidelijker te maken. Gebruikmakend van test data werd er getest of een decision trees, gegenereerd op een neural network, efficiënter waren dan decision trees alleen.

Resultaat

Een decision tree gegenereerd op basis van een neural network had een test accuracy of 80.6 % wat 2 % hoger was dan een decision tree alleen.

Door tests met meerdere gegenereerde decision trees werd duidelijk dat een tree met depth 8 ook daadwerkelijk het efficients was.

Decision trees gegenereerd op een neural network waren significant slechter dan neural networks alleen. Waar neural networks een test accuracy hadden van 95.9% hadden decision trees gebaseerd hierop een accuracy van 85%(Letterman dataset).

Takeaways

  • Afwegingen maken die voorheen werden gegokt kunnen nu accuraat worden voorspeld om tot een hogere accuracy te komen.
  • De GDPR wet van de EU (omtrent privacy) en specifiek ‘the right of explanation of machine learning algorithms’ zal inhaken op machine learning en kan neural networks het lastig maken bij het verzamelen van data.
  • Alhoewel de GDPR wet heel vaag is op het gebied van machine learning moet er voor de ethiek uitgelegd kunnen worden waarom bepaalde keuzes worden gemaakt voordat machine learning veelal in alledaags leven wordt geïmplementeerd.
  • Research in het uitleggen van de beslissingen van machine learning is van belang voor de toekomstige implementatie van AI.
  • Decision trees zijn een manier om de wat complexere machine learning algoritmes uit te leggen, maar er wordt op dit moment te veel informatie verloren gegaan.

Nicholas Frosst, Geoffrey Hinton(2017). Distilling a Neural Network Into a Soft Decision Tree by the Google Brain Team