Hoe link je je data architectuur aan je data strategie?

Hoe je data architecture eruit ziet, hangt af van de data die je nodig hebt om je strategy op te volgen.

De data definiëren die je nodig hebt

Het is belangrijk om een brede visie te hebben van waar je naartoe wilt, en niet gewoon te beginnen met het gebruik van de data die je bij de hand hebt. In het vorige gedeelte bespraken we KPI's, basket analysis en customer segmentation als manieren om je organisatie te sturen richting customer intimacy. Deze use cases zijn allemaal duidelijk verschillend, maar ze hebben één ding gemeen: ze gebruiken min of meer dezelfde brondata. Op zijn minst zouden eerdere verkopen per product per klant in de dataset moeten staan om de analyse te kunnen doen die we in gedachten hebben. Natuurlijk zou het nog beter zijn om een paar extra attributen te hebben voor elk record in je data, zoals sales rep, regio, demografische gegevens, ...

Business process analysis

Een data analytics project kan zelden worden uitgevoerd zonder een kijkje te nemen naar de business processen en de manier waarop ze worden weergegeven in de business applicaties. Meestal is een overzicht op hoog niveau van welke bronnen je zou willen gebruiken niet genoeg. Je moet ze in meer detail analyseren om een goed begrip te krijgen van de betekenis van de verschillende velden in je applicaties. Om deze verschillende systemen met elkaar te kunnen verbinden, moet je unieke identifiers identificeren op het juiste detailniveau.

Uitzoeken waar de data zich bevindt

De volgende stap is het identificeren van de bronsystemen waar we de data hebben die we nodig hebben. Het kan slechts één systeem zijn, bijvoorbeeld de database van de kassa. Of het kunnen verschillende systemen zijn, bijvoorbeeld de database van je e-shop voor de verkoop info en de CRM voor meer details over de klant. Als je gross margins per verkoop wilt opnemen, kan het nodig zijn om ook de product database of het ERP te koppelen. En als je nog verder wilt gaan en naar de net margin per periode wilt kijken, zul je waarschijnlijk ook de data van het financiële systeem moeten opnemen.

Data integration

Het proces van het combineren van data uit verschillende bronnen in één enkele, geünificeerde weergave wordt data integration genoemd. Het kan zijn dat deze unieke identifier om de data te integreren nog niet bestaat. Dan moet je een gesprek hebben met de mensen die deze applicaties beheren om mogelijkheden te verkennen om ze op de een of andere manier toe te voegen. Zeer pragmatisch zou dit kunnen betekenen het toevoegen van een verplicht custom veld in je factureringssysteem waar je het projectnummer invult dat wordt gebruikt in je CRM. Dit zal het mogelijk maken om de data van de twee systemen aan elkaar te koppelen. Controleer hoe dit custom veld verschijnt in de database of API van je factureringssysteem om er zeker van te zijn dat je het later kunt gebruiken in je data integration stappen. In je accounting systeem kun je analytische boekhouding gebruiken om de unieke identifiers toe te voegen die je nodig hebt als kostenplaats of kostendrager. Afhankelijk van de accounting software die je gebruikt, zal dit eenvoudig of lastiger zijn, maar zelden volledig onmogelijk.

Begin klein, maar met het eindresultaat in gedachten

Zodra je de verschillende systemen hebt geïdentificeerd die binnen de scope vallen, kun je beginnen met het samenstellen van een plan over hoe deze data te verzamelen en te transformeren in een formaat dat geschikt is voor analyse. Het is begrijpelijk als je niet de hele omgeving wilt bouwen voordat je enkele resultaten krijgt, dus begin je klein met de systemen die gemakkelijk toegankelijk zijn zodat je de waarde van je werk vroeg aan de business stakeholders kunt tonen. Houd echter de toekomstige use cases in gedachten zodat je de initiële setup dienovereenkomstig kunt uitbreiden en schalen.