Datamanagement en data analytics zijn historisch gezien twee verschillende werelden. In de laatste paar jaar wordt de wederzijdse waarde langzaam maar zeker erkend. De wereld van datamanagement ziet data analytics steeds meer als de leverancier van de kwantitatieve waarde van data voor de business. Andersom erkent data analytics datamanagement steeds meer als randvoorwaarde voor het leveren van toegevoegde waarde op een efficiënte en gestructureerde manier. Als gevolg hiervan groeien beide domeinen steeds meer naar elkaar toe. Dit is echter op het gebied van de onderliggende capability modellen nog maar heel beperkt het geval. In dit artikel presenteren we een capability model wat wel het gehele werkgebied van data omvat. Dit model kan een handvat bieden voor organisaties die integraal met data aan de slag willen gaan.
Traditioneel hebben capability modellen op het gebied van data een bepaalde oorsprong. Hierdoor zijn zij vaak ook beperkt in scope. De oorspronkelijke scheiding tussen de werelden van datamanagement en analytics maakt dat de capability modellen die horen bij deze domeinen slechts beperkt overlappen. Capability modellen afkomstig uit het datamanagement domein zoals die van DAMA (DAMA DMBOK), CMMI (DMM) en de EDM Council (DCAM) besteden zeer beperkt aandacht aan data analytics gerelateerde capabilities. Eenzelfde beperking (maar dan in relatie tot datamanagement) is te zien in modellen afkomstig uit de wereld van analytics (bijvoorbeeld het DELTA+ model). Daarnaast is het domein van data engineering slechts beperkt vertegenwoordigd in bestaande modellen. Een holistische benadering voor alle capabilities die nodig zijn om het die het gehele data domein te beslaan ontbreekt dan ook logischerwijs.
Ondanks de logische verklaring van het ontbreken van een integraal model is het wel van belang voor organisaties om data als onderwerp integraal te benaderen. Het gebruik van een model dat dit vakgebied als geheel omvat kan dit faciliteren. Het maakt het immers in één oogopslag inzichtelijk voor een organisatie wat er nodig is om meer datagericht te gaan werken. Daarnaast helpt het ook om de verschillende domeinen binnen het vakgebied (datamanagement, data analytics en data engineering) dichter bij elkaar te brengen en verbanden te zien tussen de verschillende domeinen.
Om tot een overkoepeld model te komen wat het gehele werkgebied van data omvat hebben we de overlap en de verschillen geanalyseerd tussen de verschillende capability modellen. Op basis van deze analyse is een eerste versie van een integraal capability model opgesteld. Deze initiële versie is vervolgens aangevuld met andere, data gerelateerde capability modellen (bijvoorbeeld het “Value driven D&A” model van Gartner), veelgebruikte bronnen binnen het opkomende vakgebied van data engineering en uitkomsten van trendanalyses (voor uitkomsten van deze trendanalyse zie de voorgaande blogs met de datamanagement trends, data engineering trends en data analytics trends).
Deze analyse heeft geleid tot een overkoepelend capability model dat bestaat uit 23 capabilities (zie hieronder) waarbij een deel van de capabilities behoort tot een exclusief domein (management, analytics of engineering) en een deel zich op het grensvlak bevindt van twee of drie domeinen.
Figuur 1: BearingPoint data capability model
In het midden van het model bevindt zich de datastrategie. Dit is gedaan omdat een gedegen datastrategie alle drie de domeinen omvat en deze met elkaar verbindt. Capabilities binnen het datamanagement domein omvatten de verschillende capabilities die traditioneel behoren tot dit domein en de daarbij horende capability zoals de DAMA DMBOK, DMM en DCAM.
Capabilities binnen het analytics domein omvatten zowel capabilities die gaan over het analyseren van historische gegevens om wat er in het verleden is gebeurd, waarom dit is gebeurd en wat er zal gebeuren (en daar ook direct op kunnen anticiperen). De uitkomsten van deze analyses moeten gedeeld worden met de rest van de organisatie. Ook hiervoor zijn capabilities in het model opgenomen (data geletterdheid). Tot slot bevat dit domein een capability rondom het al dan niet uitvoeren van bepaalde analyses (data ethiek). Deze capability is in dit domein geplaatst omdat de vraag of het ethisch verantwoord is om een bepaalde analyse uit te voeren (of niet) inhoudelijk het dichtst bij dit domein aansluit.
Capabilities binnen het engineering domein omvatten de verschillende aspecten van de data levenscyclus. Deze capabilities omvatten de technische implementatie en ondersteuning die noodzakelijk is om het gebruik van data (in bijvoorbeeld analytics toepassingen) mogelijk te maken. Daarnaast zijn capabilities opgenomen rondom de ontwikkeling en gebruik van data platforms en tools.
De gehele set van capabilities stelt organisaties in staat om zich een integraal beeld te vormen over hoe volwassen ze is op het gebied van data en waar kansen liggen om deze volwassenheid te verhogen. Het vormen van dit beeld kan in een keer op alle capabilities of slechts voor een deel van het model. Als dit laatste wordt gedaan, dan is de organisatie dankzij dit model wel bewust waar zich een mogelijke blinde vlek bevindt waarbij het verstandig is om deze in de toekomst nog nader te onderzoeken.
In dit artikel is de toegevoegde waarde van een integrale benadering data in een organisatie weergegeven. Hierbij hoort ook een integraal capability model om dit te ondersteunen. Het in dit artikel gepresenteerde capability model consolideert de gangbare modellen op het gebied van data om zo de verschillende data domeinen dichter bij elkaar te brengen. Dit stelt organisaties in staat alle aspecten die nodig zijn om serieus met data om te kunnen gaan in kaart te brengen en hierop, indien gewenst en nodig, verbeteringen te ondernemen. Wilt u meer weten hoe u dit capability model kunt inzetten om uw organisatie verder te brengen op het gebied van data, neem dan gerust contact op. Wij gaan graag met u in gesprek.
Joris Schut
Senior Consultant
joris.schut@bearingpoint.com