Big Data behapbaar in 5 stappen
Iedereen heeft het tegenwoordig over Big Data. Toepassingen springen als paddenstoelen uit de grond en iedereen is er op de een of andere manier mee bezig, lijkt het na een paar uurtjes zoeken op internet. Er is enorm veel te lezen over Big Data. Een recente Gartner’s hypecycle laat zien dat Big Data nog een paar jaartjes te gaan heeft voordat het over het hoogtepunt van zijn hype heen is, dus de echte waarde van Big Data moet zich nog aandienen. Dit fenomeen is ook merkbaar als je op zoek bent naar beschrijvingen over hoe je nu Big Data behapbaar maakt en met concrete stappen kunt invoeren in de organisatie. Deze blog beschrijft in 5 stappen hoe Big Data gerelateerde vraagstukken kunnen worden aangepakt om de ambitie van de organisatie te realiseren.Big Data is een technologie die betrekking heeft op verkrijgen van kennis uit zeer veel, en zeer diverse, gegevens. In essentie draait het om nog sneller dan voorheen (management-)beslissingen te kunnen nemen. Extra uitdaging hierbij is dat de hoeveelheid gegevens zoals gezegd erg groot zijn: honderden terabytes of meer, zeer divers van aard: relationele bedrijfsdata, multi-media data, geografisch (spatial) data, ongestructureerde data afkomstig van documenten, social-media, clickstream data, RFID, telecommunicatie, et cetera. Het verzamelen van alle vindbare data en daaruit kennis extraheren leidt in de meeste gevallen niet tot het gewenste resultaat. Men ziet het spreekwoordelijke bos niet meer door de bomen. De hier beschreven beknopte stappenplan leidt tot betere resultaten.
Stap 1: begin met het doel: bepaal welk bedrijfsdoel nagestreefd moet worden. Welke beslissing(en) wil men nemen waarvoor Big Data technologie in kan ondersteunen in de beantwoording. Bijvoorbeeld, betreft het het vergroten van de klantloyaliteit of -tevredenheid, het verhogen van de conversiesnelheid, verbeteren cross- en upselling, verbeteren productinnovatie, verkleinen risico’stijd, verbetering product- of dienstkwaliteit, et cetera.
Nadat het doel helder is, volgt…
Stap 2: het categoriseren van gegevens of gegevensgroepen. Alle data beschouwen leidt doorgaans tot overcomplexe situaties: de bekende bomen en het bos niet meer zien. Probeer de complexiteit te reduceren door een relevante doorsnede van de voorhanden gegevens te bewerkstelligen. Als het doel te maken heeft met de klantrelatie kan het zinvol zijn om de customer-journey als basis te nemen bij het onderkennen van categorieën. Hierbij kan je denken aan categorieën als: demografische gegevens (leeftijd, geografie), click-gedragsgegevens (aantal bezoeken op website, bezoekduur, aantal bezochte webpagina’s), loyaliteitsgegevens (aantal klachten, aantal likes, rententie), waarde gebaseerde gegevens (waarde van de goederen, marge of obv omzet). Indien relevant bepaal of de data online of offline verkregen wordt.
Stap 3: Maak combinaties van doelen en gegevenscategorieën. Als er meerdere doelen te realiseren zijn, of als het doel kan worden opgebouwd/opgesplitst in een doelenhiërarchie, zijn met de resultaten uit de vorige stappen data-doelen combinaties af te leiden. Deze geven per doel weer met welke datacategorie(ën) het antwoord verkregen wordt.
Stap 4: Kies de juiste technologie en informatiesystemen. Grofweg dient er hier een keuze gemaakt te worden in systemen die voorzien in real-time opslag en verwerking van enorme hoeveelheden gegevens (opslag- en verwerkingssystemen) en systemen die voorzien in de mogelijkheid om complexe analyse toe te passen op de (opgeslagen) gegevensstroom (analyse systemen). Het betreft hier analytische systemen en technologieën.
Stap 5: Maak keuzes in de wijze waarop de technologie wordt aangekocht, gebruikt en in beheer wordt genomen. Nadat duidelijk in kaart is gebracht wat het doel is, welke gegevens daarvoor nodig zijn en welke technologische middelen kunnen ondersteunen, rest nog een laatste stap voordat daadwerkelijk aan de slag gegaan kan worden. Hoe wordt de technologie in de (ICT-)organisatie ingebed. Zaken waarbij je aan kan denken is, vinden we de gewenste gegevens online of offline (binnen de muren van de organisatie), welke software licentiemodel kiezen we (COTS, open source, community, …), gaan we voor een algemene oplossing of een niche oplossing?
One more thing… Succes!!