Nadat het afgelopen decennia Business Intelligence tools steeds uitgebreider en complexer geworden zijn is er nu de ontwikkeling van self-service BI. De belofte is hierbij dat BI weer 'eenvoudig' wordt. Met laagdrempelige tools kunnen gebruikers zelf dashboards en overzichten maken en de benodigde inzichten krijgen, zonder dat (lang) gewacht moet worden op IV afdelingen.

 

Deze belofte vraagt een nuancering. In deze blog beschrijf ik aan de hand van concrete praktijkervaringen met self-service BI op welke manier self-service te organiseren en wat daarvoor in de informatievoorziening gedaan kan worden.

 

Maar eerst wil ik onderscheid gaan maken in 2 soorten self-service gebruik. Ten eerste zijn er gebruikers die zelf dashboards samenstellen, aanpassen en zelf analyses uitvoeren. Deze gebruikers werken op voorbereidde data (in Excel of via bijvoorbeeld een datawarehouse). Met voorbereidde data bedoel ik data waarbij een aantal zaken al vastgesteld zijn. Bijvoorbeeld de berekening van een doorlooptijd of van het ziekteverzuim. Hier zitten afspraken onder die met elkaar gemaakt zijn over de manier waarop we deze berekenen (de definities). Een voorbeeld hiervan is de begindatum waarop de doorlooptijd berekening start. Is dit de datum van ontvangst van een verzoek bij de organisatie of de datum dat deze bij een vakafdeling in behandeling genomen is? Door deze afspraken in de data op te nemen wordt de kans op het verschillend interpreteren van de data door de self-service gebruikers verkleind.

 

Ten tweede zijn er gebruikers die zelf nieuwe databronnen onderzoeken, in bestaande bronnen nieuwe verbanden proberen te ontdekken, verschillende gegevens met elkaar combineren, et cetera. Deze gebruikers werken op ruwere data en hebben meer kennis van het omgaan met gegevens, verschillende datamodellen en datakwaliteit issues. Zij kijken onder andere vanuit een statistisch oogpunt naar data. Dit zijn de data science medewerkers.

 

In mijn praktijk zie ik een sterke groei van self-service gebruik voor de eerste soort gebruikers. De tweede groep is in ontwikkeling of was al aanwezig bij kern van BI specialisten in de organisatie.  

 

Hoe kunnen deze 2 verschillende gebruikersgroepen nu gelijktijdig geholpen worden? Hoe kunnen we dit bij elkaar brengen, een relatie ertussen maken?

 

Vanuit organisatorisch oogpunt kunnen we BI Modal toepassen, hierbij worden 2 stromen in de organisatie gecreëerd, een snelle innovatieve stroom en een stabiele voorspelbare stroom. Lees deze blog hierover voor meer informatie. De data science medewerkers kunnen dan de snelle stroom gebruiken en de andere groep de stabiele stroom.  

 

Vanuit technisch oogpunt kan een datawarehouse architectuur gecreëerd worden waar plaats is beide soorten self-service. Dit is een gelaagde structuur waarbij een detaildata laag logisch gemodelleerd is, zodat deze voorbereid is voor het uitvoeren van analyses. In deze laag zitten gegevens vanuit verschillende bronnen. Hier worden alleen feitelijke gegevens opgenomen en geen definities. De data science medewerkers kunnen toegang krijgen tot deze laag met detailgegevens.

 

Op deze logische laag zit een laag waarin de definities opgenomen worden. Hier wordt van de ruwe data informatie voorbereid. Ook kunnen hier een aantal handige indicaties opgenomen worden waarmee self-service eenvoudig wordt. Denk bijvoorbeeld aan een indicatie openstaand waarmee heel snel alleen de zaken getoond kunnen worden die openstaan (de werkvoorraad). Met deze business laag kan de self-service tool verbonden worden. Ook kunnen de standaard dashboards en rapporten die in gebruik zijn op deze laag gebaseerd worden. Hiermee wordt geborgd dat op dezelfde manier naar de data gekeken wordt. Door het maken van een goede ondersteunende documentatie zoals een data dictionary (een begrippenlijst met de definities) wordt een eenduidige kijk op de data gecreëerd.