WhatsApp Facebook Twitter LinkedIn Mail

Datamining

Inhoudsopgave

  1. Wat is datamining?
    1. Probleem definiëren
    2. Verzamelen en voorbereiden
    3. Data modeling
    4. Evaluatie
  2. Verschillen big data, datamining en BI
  3. Praktijk datamining
    1. Personalisering marketing
    2. Winkelontwerp
    3. Andere toepassingen

Waarvoor dient data mining?

Datamining is het geheel van technieken en technologieën waarmee data uit systemen worden geëxtraheerd. Deze mining gebeurt meestal om patronen of tendensen te detecteren. Hiervoor moeten de geëxtraheerde data eerst geïnterpreteerd worden met behulp van wiskundige modellen. Deze modellen doen aan datasegmentering, en doen voorspellingen over hoe patronen of tendensen in de toekomst zullen evolueren. De volgende stappen zijn belangrijk bij datamining:

proces data mining fases

1. Bepaling van de pijnpunten en doelstellingen

In deze eerste stap wordt er gekeken naar wat de precieze pijn- of verbeterpunten zijn, en naar hoe deze aangepakt zouden kunnen worden. Dit worden dan de doelstellingen voor het bedrijf. Om dit na te gaan kan een bedrijf gebruik maken van Business Intelligence (BI), of eenvoudigere analysetools zoals Google Analytics. Zo kan er worden nagegaan waar het bedrijfsproces knelpunten vertoont, en kan er een plan worden gemaakt voor de datamining.

Een voorbeeld: een bedrijf heeft als doelstelling om de verkoop van een specifiek product te doen stijgen. In dit geval zal data mining een hulpmiddel zijn om na te gaan welke consumenten de meeste interesse tonen in het product. Hiervoor wordt een voorspellingsmodel gemaakt, dat gebaseerd is op klanten die het product al gekocht hebben. Van deze klanten wordt het profiel bestudeerd, om na te gaan welke gemeenschappelijke eigenschappen ze hebben. Dit kan gaan om data als leeftijd, geslacht, locatie en hobby’s.

2. Verzameling en voorbereiding van data

Zodra de onderneming duidelijk voor ogen heeft welke data van belang zijn, kunnen deze geëxtraheerd worden uit de verschillende bronnen. Wanneer de nodige data verzameld zijn, heeft het bedrijf vaak al een goed idee van de ernst van het probleem of de grootte van het verbeterpunt. Ook blijkt soms dat bepaalde data overbodig zijn, of dat er juist data ontbreken. Bovendien kan de kwaliteit van de data worden gecontroleerd. Problemen met de kwaliteit kunnen bijvoorbeeld zijn: doublures, incoherente data, verkeerde data-invoer, etc. Om deze zaken te controleren, kan er gebruik worden gemaakt van software voor data-integratie, zoals een ETL-tool, of van systemen voor masterdata.

datamigratie overzetten gegevens protocol etl

Zodra alle data verzameld zijn, moeten ze voorbereid worden voor de volgende fase: de data modeling. De voorbereiding bestaat uit het opschonen van de data. Met opschonen bedoelen we de verwijdering van overbodige data, de zoektocht naar gelijkenissen en de transformatie naar een formaat waarmee data models kunnen werken. Er moet ook beslist worden over de tabellen en attributen die gebruikt zullen worden. De geboortedata van cliënten kunnen bijvoorbeeld zo getransformeerd worden dat in een bepaalde kolom van een tabel in de database (om privacyredenen) alleen de leeftijd wordt getoond.

De voorbereiding van data helpt ook om ervoor te zorgen dat de gegevens zo reëel en specifiek mogelijk zijn. Bijvoorbeeld: in de plaats van als attribuut alleen het gemiddelde aankoopbedrag van een klant te gebruiken, kan ervoor gekozen worden om toe te voegen hoe vaak de aankopen het voorbije jaar boven een bepaald bedrag uitkwamen. Zo wordt duidelijk of er een verband ontstaat met een uitverkoopperiode of een bepaalde marketingcampagne.

3. Data modeling

Bij data modeling worden de data onderworpen aan wiskundige algoritmes, en worden statistieken opgemaakt. Dit gebeurt meestal met behulp van een BI-systeem. Als het systeem bij het toepassen van de algoritmes een probleem meldt, betekent dit dat de data niet goed getransformeerd zijn. In dat geval moet er dus een stap terug gezet worden, naar de voorbereidingsfase. Vaak wordt er bij data modeling ook gebruik gemaakt van artificial intelligence (AI), waardoor er nog beter patronen kunnen worden gevonden in de geanalyseerde data.

Tip! Om na te gaan of de voorbereiding goed verlopen is, doen veel bedrijven eerst een proef, waarbij de algoritmes worden toegepast op een kleine hoeveelheid data. Zo kunnen fouten in de transformatiefase sneller worden opgespoord, en gaat er geen of minder kostbare tijd verloren.

4. Evaluatie

De laatste stap is een controlestap. De bedoeling hiervan is om na te gaan of de verkregen resultaten coherent zijn en of ze voldoen aan de oorspronkelijk doelstellingen. Hiervoor wordt teruggegaan naar stap 1, en wordt er gekeken of er nieuwe inzichten zijn ontstaan die tot strategische beslissingen kunnen leiden. De vragen die bijvoorbeeld gesteld kunnen worden, zijn:

  • Hebben we een duidelijk gedragspatroon van bestaande klanten voor wat betreft dit product?
  • Hebben we nog extra informatie nodig om het profiel van potentiële klanten te vervolmaken?

De antwoorden op zulke vragen helpen een bedrijf om de situatie vóór de datamining te vergelijken met die van erna. Sommige analysesoftware biedt ook de mogelijkheid de beide situaties visueel voor te stellen. Er kan bijvoorbeeld een dashboard of rapportage gemaakt worden van wat er over klanten bekend was in juli, voor de datamining, en in september, na de datamining. In het dashboard of de rapportage van september zou antwoord op de openstaande vragen van juli gegeven moeten worden. Als dit niet het geval is, dan moet de datamining misschien (deels) opnieuw worden gedaan.

Wat is het verschil tussen big data, datamining en business intelligence?

Deze termen worden vaak op één hoop gegooid, maar er zijn verschillen. Big data is het in bulk opslaan van grote hoeveelheden data. Datamining extraheert deze gegevens uit big data en andere bronnen, en helpt bij het vinden van patronen en relaties tussen de geëxtraheerde data. Business Intelligence, tot slot, gebruikt data mining om rapportages en visuele dashboards op te maken, waarmee leidinggevenden ondersteund worden bij het nemen van strategische beslissingen.

Wist je dat? Volgens Forbes is datamining een strategische activiteit, die in bijna 80% van de bedrijven die business intelligence (BI) inzetten belangrijk wordt geacht.
  Big data Datamining Business Intelligence
Concept Verzamelt grote hoeveelheden data en slaat deze op. Identificeert en extraheert relevante informatie die uit big data en andere bronnen komt. Maakt gebruik van de relevante data om de beslissingsvorming van leidinggevenden te verbeteren, en daarmee het rendement van het bedrijf.
Verwerking Kan niet verwerkt worden met traditionele software (te grote hoeveelheid data). Gebruikt wiskundige algoritmes en artificial intelligence om de data te structureren en er patronen in te zien. De data zijn al getransformeerd en gebruiksklaar voor het uitvoeren van analyses.
Voorspelbaarheid De data zijn erg heterogeen en niet-gestructureerd, waardoor de informatiedichtheid niet hoog ligt en voorspellingen moeilijk te maken zijn. Kan voor precieze voorspellingen zorgen. De rapportages geven leidinggevenden inzicht in de actuele en historische situatie, en tonen voorspellingen voor de toekomst.
Tools/software Er zijn tools nodig om de informatie te extraheren, structureren en beheren (zoals Apache Hadoop, MongoDB, etc.). Classificatie, segmentatie van de data, en voorspellingsmodellen worden gemaakt met behulp van software (zoals IBM SPSS, KNIME, etc.). Gebruikt rapportagesoftware (zoals SAP Analytics Cloud, SAP Business Objects en Power BI) om de informatie te structureren in dashboards en rapporten. Vaak vergeleken met de KPI’s.
Datakwaliteit Erg divers. De data moeten getransformeerd worden om er een goede analyse van te kunnen maken. Transformeert de informatie om waardevolle kennis op te doen. Verkrijgt kwaliteitsvolle informatie dankzij de getransformeerde data, waardoor er waardevolle rapportages kunnen worden opgesteld.

Hoe zetten bedrijven datamining in?

Datamining biedt veel mogelijkheden voor wat betreft het voorspellen van patronen en gedrag. Vandaar dat veel bedrijven de techniek inzetten om hun strategieën steeds fijner af te stellen. Datamining wordt vooral gebruikt voor:

Een gepersonaliseerde marketingaanpak

Een groot deel van het werk van marketingmedewerkers is het leren kennen van de (potentiële) klanten. Hiervoor zoeken ze veel data op in databases en allerlei andere systemen. Al deze gegevens moeten dan samengebracht worden, om tot een goed klantprofiel te kunnen komen. Op basis van dit profiel krijgt de klant een bepaalde campagne wel of niet te zien.

Met behulp van datamining kan de segmentatie van klanten eenvoudiger verlopen. Het systeem helpt medewerkers met het definiëren van klantgroepen, bijvoorbeeld op basis van leeftijd, geslacht, hobby’s, interesses etc. Het systeem kijkt per groep ook naar het gedrag (wat koopt de groep, waarin toont men interesse etc.), en kan de campagnes daarop afstemmen. Ten slotte kunnen aan datamining ook artificial intelligence en deep learning gekoppeld worden, waardoor er, eventueel na revisie van een marketingmedewerker, automatisch nieuwsbrieven en aankoopsuggesties naar de (potentiële) klant worden gestuurd.

Wist je dat? Nieuwe klanten werven is van grote betekenis, maar nog belangrijker is het behouden van bestaande klanten. Volgens een studie van het internationale marketingbureau Invesp kost het een bedrijf vijf keer meer om een nieuwe klant aan te trekken, dan om een bestaande te behouden.

De slimme inrichting van winkels

Wanneer iemand een winkel verlaat met meer dan wat hij of zij aanvankelijk van plan was te kopen, dan komt dit vaak door een doordachte winkelinrichting. Het is een instrument om de verkoop op te krikken. Winkelinrichting wordt bestudeerd in alle soorten winkels: van supermarkten tot kantoorboekwinkels en kledingzaken.

Een belangrijk element bij slimme winkelinrichting is het bestuderen van het koopgedrag van klanten. Datamining kan inzicht geven in welke producten vaak samen gekocht worden of hoe mensen zich bewegen in een winkel. Producten die vaak samen gekocht worden, worden dan dicht bij elkaar gezet, zodat mensen bij het ene product meteen ook het tweede zien en dit aankopen. Een heel andere tactiek is net het uit elkaar zetten van producten die bij elkaar horen, zodat mensen de winkel door moeten om het tweede product te vinden, en onderweg waarschijnlijk nog wat andere producten in hun karretje laden. Deze tweede tactiek zie je in de meest vergaande vorm bijvoorbeeld in IKEA, waar klanten de hele winkel doorgeloodst worden om tot de kassa te komen.

Andere toepassingen van datamining

In principe kunnen alle bedrijven datamining inzetten voor het verbeteren van (verkoop)strategieën. Een reclamebureau kan bijvoorbeeld nagaan welk soort kijker er naar welk tv-programma kijkt. Zo krijgt men een idee welke advertenties het meeste effect zullen hebben op de kijkers van een bepaald programma. Op basis daarvan kiest men er bijvoorbeeld voor om reclame voor loophulpmiddelen te laten zien bij een programma dat veel bekeken wordt door oudere mensen.

Een heel ander voorbeeld is dat van de machinebouw. Hierbij worden geen mensen, maar productieactiviteiten geanalyseerd. Door datamining wordt het inzichtelijk wanneer er pieken en dalen zijn in de productiviteit. Deze informatie wordt gebruikt om bijvoorbeeld onderhoudsbeurten te plannen op minder drukke momenten.

Dit artikel als bron gebruiken? Klik en kopieer:

European Knowledge Center for Information Technology. (2021, 19 oktober). Datamining. ICT Portal. https://www.ictportal.nl/ict-lexicon/datamining