Kunstmatige intelligentie blogreeks: Unsupervised learning: Foto’s comprimeren met AI

Welkom bij het dertiende artikel in de blogreeks “Kunstmatige intelligentie”. Het twaalfde deel heeft als titel “Supervised learning: De magie van datalabels”. In dit deel wordt ingegaan op hoofdstuk 13: Unsupervised learning: Foto’s comprimeren met AI.

13. UNSUPERVISED LEARNING: FOTO’S COMPRIMEREN MET AI

Unsupervised learning is één van de drie categorieën van machine learning. In unsupervised learning is het doel de computer te leren om data te groeperen op basis van de gegevens die van de datapunten bekend zijn. Aangezien het doel juist is om de beste groepen te vinden, kan de computer niet bouwen op vooraf ingegeven groeperingen van mensen, vandaar de term ‘unsupervised’. Technieken van deze vorm van machine learning hebben onder andere toepassingen gevonden in het comprimeren van digitale bestanden, het categoriseren van foto’s en het detecteren van fraude.

Moderne problemen…

Het gevreesde moment is daar: het geheugen van je telefoon is vol. De afgelopen tijd heb je zoveel foto’s gemaakt en ontvangen dat er niet één meer bij kan. Er zit niks anders op dan het digitale fotoalbum door te spitten en op zoek te gaan naar foto’s die weg mogen. Je komt erachter hoeveel foto’s je in de afgelopen jaren hebt verzameld en dat het nog niet meevalt om die te ordenen. Laat staan om te beslissen welke foto’s je voor eens en altijd in de prullenmand zal laten verdwijnen. Wat zou het handig zijn als er een stukje software bestond om je te helpen je foto’s te categoriseren. Of nog beter, een stukje software dat ervoor kan zorgen dat foto’s minder opslagruimte in beslag nemen zodat je niks hoeft weg te gooien.

AI blogreeks image Als deze situatie herkenbaar klinkt, is er goed nieuws: deze twee Stukjes software bestaan al! Sterker nog, waarschijnlijk maak je er al gebruik van. Veel telefoons herkennen automatisch welke personen er vaak op je foto’s voorkomen. Je kan ze gemakkelijk taggen en in aparte mapjes plaatsen. Zo wordt je digitale album al een stuk overzichtelijker. Daarnaast kun je foto’s (of zelfs hele mapjes) comprimeren: het datavolume verkleinen zonder dat er informatie verloren gaat.

… met moderne oplossingen

Het automatisch taggen en comprimeren van foto’s zijn toepassingen die mede mogelijk zijn gemaakt door unsupervised learning. Letterlijk vertaald ‘leren zonder toezicht’, wat wil zeggen dat je een computer zelfstandig laat zoeken naar patronen en structuren in data. Bij het categoriseren van foto’s zoekt een algoritme bijvoorbeeld naar groepjes foto’s die veel overeenkomsten bevatten. Voor het comprimeren van bestanden zoekt een algoritme naar patronen in de bestandsopbouw. Op basis daarvan kan de computer herkennen welke data er minimaal nodig zijn om dat specifieke bestand volledig op te bouwen. De overbodige data worden weggegooid. Hiermee maak je een bestand kleiner zonder echt informatie te verliezen.

Unsupervised learning is één van de drie vakgebieden die samen machine learning vormen; de andere twee zijn supervised learning en reinforcement learning. Bij supervised learning laat je een algoritme leren op basis van datapunten die door mensen gelabeld zijn. Denk aan foto’s waar een mens al iemand in heeft getagd. De computer kan daarmee leren wat de kenmerken van die getagde persoon zijn en zelf ook foto’s van hem of haar herkennen. Bij reinforcement learning heeft een algoritme niet zozeer een set datapunten met een label op elke observatie, maar krijgt na het uitvoeren van een reeks acties automatisch te horen of het gewenste resultaat is bereikt of niet.

Een computer die bezig is met unsupervised learning heeft het in zekere zin moeilijker dan bij de andere twee methodes omdat er geen voorbeelden zijn van ‘correcte antwoorden’ om van te leren. Dit maakt het ook moeilijker om te testen of zo’n algoritme goede uitkomsten geeft, want wat zijn immers de goede’ uitkomsten? Het algoritme zelf weet dat in ieder geval niet en kan zichzelf dus moeilijk bijsturen en verbeteren, zoals supervised- en reinforcement learning-algoritmen dat wel (deels) kunnen. De beste test is in veel gevallen een menselijke test: laat iemand achteraf de resultaten van het algoritme nalopen en controleren of de uitkomsten er logisch en kloppend uitzien. Maar zelfs dan is het niet altijd makkelijk om vast te stellen of de uitkomsten juist zijn.

In welk hokje past een fraudeur?

Neem het vakgebied van fraudedetectie, waar unsupervised learning veel wordt toegepast. De computer krijgt een dataset met informatie over financiële transacties die personen hebben uitgevoerd. Hierin zoekt de computer naar transacties of combinaties van transacties die er verdacht uitzien. Wat ‘verdacht’ is, is echter de vraag: mensen die frauderen met hun bankzaken zullen dat zeker niet in de transactieomschrijving vermelden. Computer noch mens weet precies welke datapunten voorbeelden zijn van fraude en welke niet, wat het moeilijk maakt om de computervoorspellingen te valideren of te verbeteren.

AI blogreeks image

Bij de categorisering van je foto’s is dat makkelijker te doen. Jij ziet in één oogopslag wanneer je telefoon jou in hetzelfde mapje heeft gezet als je broer of zus. Of per ongeluk twee verschillende mapjes heeft aangemaakt voor jou met bril en jou zonder bril. Allemaal fouten die wel eens voorkomen bij deze software maar makkelijk te herstellen zijn en geen al te grote gevolgen hebben.

Met het groeperen van je foto’s komt het dus wel goed. Maar hoe zit het met die fraudedetectie, waar we de computer niet zo goed kunnen helpen? Hier kan een computer op zoek gaan naar anomalieën in de data: transacties (of combinaties van transacties) die afwijken van de norm. Zijn er bepaalde transacties met gekke bedragen, gekke tijdstippen of gekke betalingskenmerken? Als je de data groepeert in clusters, zijn er dan bepaalde transacties die buiten de boot vallen? Transacties die op al deze punten eruit springen kun je op zijn minst ‘ongewoon’ noemen, en zijn de moeite van het extra checken waard.

Die extra check is hier uiteraard van groot belang. Voor een ‘ongewoon’ datapunt zijn, naast fraude, meerdere verklaringen mogelijk: een storing in het systeem, een fout in het algoritme of gewoon een toevalligheid. Allemaal zaken om uit te sluiten voordat iemand van fraude kan worden beschuldigd. Alleen “omdat de computer het zegt” is niet genoeg bewijs. De kracht van computers ligt bij dit soort taken vooral in het structureren en ontdekken van patronen en daarmee kunnen ze ons gelukkig een heel eind op weg helpen.

Rest ons mensen de taak om verstandig met de resultaten van het algoritme om te gaan. Om goed te controleren of een transactie écht verdacht is, en je telefoon te corrigeren wanneer die een nieuw fotomapje voor je aanmaakt omdat je deze maand toevallig een baard hebt laten staan.