Data is overal. Het lijkt het meest urgente en tegelijkertijd ongrijpbare thema van deze tijd. Trendwatchers buitelen over elkaar heen om te duiden hoe organisaties het ‘nieuwe goud’ moeten ontginnen. De trends en ontwikkelingen vliegen ons om de oren. Het is een uitdaging om modegrillen te onderscheiden van concepten die daadwerkelijk relevant zijn voor de ontwikkeling van een toekomstbestendige organisatie. In dit vierluik nemen we je mee in de zin en onzin van de datatrends van 2023. Wat zijn deze trends, hoe moet u deze op waarde schatten en wat is er nodig om er een succes van te maken?
In dit artikel zijn de data analytics trends aan de beurt. We nemen je mee in de 10 belangrijkste trends die wij zien op dit gebied in 2023. Daarnaast geven we een inkijkje in de urgentie en complexiteit van implementatie van deze trends. Per trend zal een korte toelichting worden gegeven. Daarnaast worden de belangrijkste elementen beschreven waar organisaties mee aan de slag moeten om de beloftes van de trend te verwezenlijken.
In de vorige delen kwamen de trends van datamanagement en data engineering al aan bod en in het volgende deel zullen we een bredere duiding geven aan de gevolgen van deze trends voor organisaties.
Deze lijst is samengesteld door te kijken naar trends en ontwikkelingen die verschillende kennisinstituten en onderzoeksbureaus benoemen maar ook wat wij dagelijks in de praktijk tegenkomen als consultants. Het biedt dus een goede balans tussen een meer theoretische en praktische inslag op het vakgebied. De trends die we in dit artikel presenteren zijn niet gerangschikt en daarmee ook gelijkwaardig.
Data centrische AI gebruikt kunstmatige intelligentie om nieuwe data te creëren. Het legt de focus op het belang van hoogwaardige data voor het succes van AI-toepassingen en daardoor de nadruk op het verzamelen, beheren, verrijken en analyseren van kwalitatief hoogwaardige data. Door te investeren in data centrische AI kunnen organisaties betere besluitvorming, voorspelmodellen en gepersonaliseerde AI-oplossingen realiseren. Organisaties hebben eerst een solide datafundament nodig, voordat zij aan de slag kunnen met, en het volledige potentieel van, data centrische AI kunnen benutten. Voorbeelden hiervan zijn synthetische data, het labelen en annoteren van data en het aanvullen van ontbrekende waarden.
Hybride AI kan worden gezien als de perfecte combinatie van kunstmatige intelligentie en menselijke intelligentie. Een voorbeeld hiervan kan zijn dat machine learning en machine reasoning samenwerken om zo enerzijds goede voorspellingen te krijgen, maar anderzijds ook systematisch te kunnen verklaren waarom deze voorspellingen eruit komen.
Het combineert de kracht van menselijke creativiteit, intuïtie en emotionele intelligentie met de rekenkracht en schaalbaarheid van AI-algoritmen: AI wordt ingezet om menselijke capaciteiten aan te vullen en te versterken, in plaats van ze te vervangen. Het doel is om AI-systemen te ontwikkelen die samenwerken met mensen in complexe taken, zoals probleemoplossing, besluitvorming en creatieve processen.
Hierdoor wordt het belang benadrukt van menselijke betrokkenheid en verantwoordelijkheid in het ontwerpen, trainen en implementeren van modellen. Het bevordert ethische overwegingen en transparantie om ervoor te zorgen dat modellen op een verantwoorde en waardevolle manier worden toegepast in verschillende domeinen. Dit vereist nauwe samenwerking tussen (data) specialisten en de business/domein experts.
ModelOps of MLOps richt zich op het verminderen van het aantal stappen tussen de bouw en inzet van modellen. Het richt zich dus op het beheer en de operationele aspecten van het levenscyclusbeheer van machine learning modellen: deze integratiewerkzaamheden vinden nu vaak nog handmatig plaats. ModelOps omvat processen, tools en best practices om het implementeren, schalen, monitoren en onderhouden van modellen efficiënter te maken. Het stelt organisaties in staat om het volledige potentieel van hun modellen te benutten door middel van gestroomlijnde workflows, continue modelverbetering en snelle implementatie.
Met ModelOps kunnen bedrijven de betrouwbaarheid, prestaties en schaalbaarheid van hun modellen verbeteren, terwijl ze ook rekening houden met aspecten zoals beveiliging, compliance en governance. Deze trend speelt een cruciale rol bij het succesvol operationaliseren van machine learning modellen in organisaties. Maar het betekent ook dat er eerst geïnvesteerd moet worden om ModelOps op te kunnen zetten. Enkele vereisten zijn: een cloudplatform, een modelleeromgeving, versiebeheer, containers en containerorkestratie, monitoring en logging.
Selfservice analytics past portaalachtige curatie- en samenwerkingsfuncties toe op analytics en Business Intelligence (BI) content en stelt gebruikers in staat zelfstandig dashboards, rapporten en datasets van uiteenlopende platforms op één plaats te verkennen, analyseren en visualiseren. Hierbij is geen (directe) afhankelijkheid meer van IT- en/of data-afdelingen.
De directe toegang tot gegevens wordt mogelijk gemaakt door intuïtieve tools en platforms die een gebruiksvriendelijke interface bieden, zodat niet-technische gebruikers complexe analyses kunnen uitvoeren met minimale technische kennis. Selfservice analytics bevordert data gedreven besluitvorming, versnelt de tijd tot inzicht en vermindert de afhankelijkheid van traditionele rapportageprocessen. Echter hangen er ook risico’s aan vast zoals het verkeerd interpreteren van de resultaten. Men zal de afweging tussen dit risico en de snelheid die het kan bieden tegen elkaar af moeten wegen. En als er voor een dergelijk portaal wordt gekozen, zijn/haar mensen goed moeten opleiden/trainen in het gebruik ervan.
Augmented analytics (ook wel AI-gedreven analytics genoemd) is een opkomende trend die de manier waarop organisaties gegevens analyseren en inzichten verkrijgen, verandert. Het combineert geavanceerde analytische technieken, zoals machine learning, met menselijke interpretatie (natural language generation) om een krachtig beslissingsondersteunend systeem te creëren. Daar waar traditionele BI op regels gebaseerde programma’s gebruikt om statische rapporten op te leveren.
Deze analysetechniek helpt bij het ontdekken van verborgen patronen, het identificeren van trends en het genereren van bruikbare inzichten uit enorme hoeveelheden data. Door automatisering en het bieden van intuïtieve interfaces vereenvoudigt augmented analytics het analytische proces en maakt het toegankelijk voor niet-technische gebruikers. Deze trend heeft de potentie om de manier waarop bedrijven beslissingen nemen en waarde halen uit gegevens te automatiseren, waardoor ze competitiever en datagedreven worden.
Digital twins zijn interactieve virtuele replica's (of digitale representaties) van fysieke bedrijfsmiddelen: objecten, systemen of processen. Deze replica's stellen beheerders van bedrijfsmiddelen in staat om real-time informatie vast te leggen, te analyseren en te simuleren, waardoor ze diepgaand inzicht kunnen krijgen in de prestaties en het gedrag van hun producten en zo de digitale transitie te omarmen. Zoals in het vorige artikel omschreven, kan het gezien worden als een aspect van de Metaverse en is de verwachting dat bedrijven meer en meer die kant op zullen bewegen.
Door het creëren van een virtuele kopie van een object, zoals een machine of een infrastructuur, kunnen bedrijven scenario's testen, onderhoud voorspellen, optimalisaties doorvoeren en zelfs simulaties uitvoeren om toekomstige resultaten te voorspellen. Dit biedt enorme voordelen op het gebied van efficiëntie, kostenbesparing en innovatie. De ‘Digital twin’ trend zal naar verwachting blijven groeien en een breed scala aan industrieën transformeren, zoals de maakindustrie, de gezondheidszorg en de stedelijke planning.
Meeslepende analytics (Immersive analytics) is een nieuwe manier waarbij gebruik wordt gemaakt van een visuele 3D-interface om gegevens te visualiseren en analyseren. Het combineert geavanceerde technologieën zoals virtual reality (VR), augmented reality (AR) en mixed reality (MR) met data-analyse om een meeslepende en interactieve gebruikerservaring te creëren en analyses op een nieuwe manier uit te voeren. Met immersive analytics kunnen gebruikers gegevens in een virtuele omgeving verkennen, manipuleren en visualiseren, waardoor complexe patronen en relaties gemakkelijker te begrijpen zijn.
Door gebruik te maken van intuïtieve gebaren en bewegingen, kunnen gebruikers door gegevenssets navigeren en direct inzichten verkrijgen. Immersive analytics maakt gegevensanalyse niet alleen efficiënter, maar ook boeiender en intuïtiever. Een mooi voorbeeld is de visualisatie van graph databases in een virtual reality omgeving.
Verhalende inzichten combineert interactieve datavisualisatie met verhalende technieken om inzichten te leveren in meeslepende vormen en wordt gebruikt om besluitvormers te informeren en op te leiden. Het gaat verder dan enkel het presenteren van feiten en cijfers, en richt zich op het begrijpelijk en impactvol communiceren van inzichten die uit data worden verkregen. Om die reden staat het ook wel bekend onder de term ‘data storytelling’.
Door middel van visuele elementen, storytelling-structuren en contextuele uitleg, helpen verhalende inzichten om complexe gegevens toegankelijk te maken en betrokkenheid te creëren. Insights Narrative kan helpen bij het toegankelijk maken van data om zo de datageletterdheid binnen een bedrijf te vergroten. De New York Times gebruikt soms deze manier om artikelen te representeren zoals “The Yen, Won and Renminbi: A Triangular Guide to the East Asian Currency Wars” en “The Changing Nature of Middle-Class Jobs”. Deze trend is waarschijnlijk de meest eenvoudige om de eerste stappen in te zetten: begin eens met het omzetten van een statisch terugkomend rapport naar een storytelling structuur.
Met geautomatiseerde besluitvorming wordt zakelijke beslissingen gemaakt met behulp van beslissingsintelligentie (zie uitleg in het vorige artikel). Het verwijst naar het gebruik van geautomatiseerde processen en algoritmen om beslissingen te nemen zonder directe menselijke tussenkomst. Deze trend wordt aangedreven door geavanceerde technologieën zoals machine learning en kunstmatige intelligentie, die grote hoeveelheden gegevens kunnen verwerken en patronen kunnen identificeren.
Geautomatiseerde besluitvorming biedt verschillende voordelen, zoals het verbeteren van de efficiëntie, het verminderen van menselijke fouten en het versnellen van besluitvormingsprocessen. Maar brengt ook uitdagingen met zich mee, zoals transparantie, verantwoordelijkheid en ethische overwegingen. Het is belangrijk om een evenwicht te vinden tussen de voordelen en risico's van geautomatiseerde besluitvorming en ervoor te zorgen dat er voldoende menselijke controle en toezicht is. Om deze reden zal men het proces tot volledig geautomatiseerde besluitvorming langzaam op moeten bouwen en zullen steekproeven altijd aan de orde blijven. Waarbij mensen altijd de eindverantwoordelijkheid voor deze keuzes moeten dragen.
Vereenvoudigde modellering helpt gebruikers bij het samenstellen en automatiseren van data gestuurde workflows. Het richt zich op het vereenvoudigen van het modelleringsproces in data preparatie, engineering en analyse. Het doel is om programmeren toegankelijker te maken voor niet-technische gebruikers door met intuïtieve gebruikersinterfaces, vooraf gebouwde templates en automatisering van analytische stappen workflows gemakkelijker en sneller tot stand te brengen. Door de vermindering in complexiteit en de vergroting in bruikbaarheid, kan men sneller en gemakkelijker modellen bouwen en inzichten verkrijgen en is de noodzaak van diepgaande technische expertise minder.
Ook met deze trend zou men snel aan de slag kunnen aangezien de keuze in het aanbod van software die dit ondersteund enorm is en een goede tip zou zijn om de (data) experts eerst ambassadeur te maken, zodat het daarna eenvoudiger uitgerold kan worden in de gehele organisatie.
De hierboven genoemde trends verschillen van elkaar in de mate hoe urgent en complex ze zijn. Om de relatie op deze twee assen inzichtelijk te maken zijn de trends met elkaar vergeleken op deze twee assen. Daarnaast is gekeken in hoeverre deze trends verplicht zijn of bijdragen aan het onderscheidend vermogen van een organisatie. Dit laatste is gedaan door de trends in te delen in drie categorieën:
Als gekeken wordt naar de urgentie en complexiteit van de verschillende trends ten opzichte van elkaar zijn ‘Hybride AI’ en ‘verhalende inzichten’ de meest urgente trends. Wat logisch te rijmen is met de strengere handhaving op wet- en regelgeving met betrekking tot persoonsgegevens en stijgende bewustwording op het gebied van datageletterdheid. Als gekeken wordt naar de meest complexe trends zijn dit voornamelijk trends waarbij het van groot belang is om resources in huis te hebben met sterke programming competenties, waarbij de kwaliteit van data dan ook nog eens van hoog niveau moet zijn zoals ‘Augmented analytics’ en ‘Digital twin’.
Naast deze trends op het gebied van data analytics zijn trends op het gebied van datamanagement en data engineering van belang. Deze trends en hoe ze zich verhouden tot de trends op het gebied van data analytics zijn hier en hier, respectievelijk toegelicht. Mocht u in de tussentijd meer willen weten over hoe deze trends toegepast kunnen worden op u organisatie? Neem dan gerust contact met ons op om hierover met ons in gesprek te gaan.
Joyce Thomas
Senior Consultant
joyce.thomas@bearingpoint.com