Veel hr-organisaties beseffen dat ze op een datagoudmijn zitten. Het is verleidelijk om in het wilde weg te gaan delven. Want je vindt altijd wel wat. Je ziet dan ook dat veel organisaties een datateam optuigen en enthousiast aan de slag gaan. Wat dat datateam zich niet altijd realiseert, is hoe gevoelig data van medewerkers zijn. En hoe snel je de fout in kan gaan en de verkeerde conclusies trekt. Vijf aspecten waar je als it-afdeling op moet letten.
- Zonder domeinkennis geen goede analyses
Een datateam, waar jij misschien wel onderdeel van bent, beschikt over statistische kennis en heeft ook de technische skills om data uit meerdere bronnen te ontsluiten en in samenhang te analyseren. Maar wat jullie gewoonlijk niet voldoende hebben, is domeinkennis. Daarom is het essentieel dat de hr-afdeling altijd zelf betrokken blijft bij het ontwikkelen van analytische tools zoals dashboards.
- Ken het verschil tussen causaal verband en indirecte correlatie
Als buitenstaanders kun je moeilijk het verschil zien tussen een causaal verband en een indirecte correlatie. Als je data over inkomensniveau per postcode zou onderzoeken, zou je kunnen ontdekken dat er gebieden zijn waar het inkomen significant boven (of beneden) het gemiddelde ligt. Toch snapt iedereen dat je dit hogere (of lagere) inkomen niet direct verkrijgt door naar zo’n postcode te verhuizen.
Stel nu dat dit ook geldt voor teams: de medewerkers in team A hebben er gemiddeld meer salaris bij gekregen dan die in team B. Is dit een indirecte correlatie die ontstaat doordat de leidinggevende van team A wat royaler is? Of is het een causaal verband omdat de prestaties in dat team ook meer zijn verbeterd? Of neem juniors die promotie maken naar een medior-functie. Komt dat doordat ze zich hebben ontwikkeld (een causaal verband), of lukte het recruitment niet om meer mediors aan te nemen en hebben daarom enkele junioren maar promotie gekregen (een indirecte correlatie)? Door simpelweg alleen naar de data te kijken, kan het zijn dat je verkeerde conclusies trekt.
- Kijk uit met generaliseren van conclusies
Daarnaast ligt het risico op generalisatie van conclusies op de loer. Want als je gaat werken met data, dan ga je vaak uit van gemiddelden. Terwijl die gemiddelden veelal weinig zeggen. Neem het gemiddelde salarisniveau in een bedrijf. Dat kan best hoog zijn. Maar komt dat doordat de medewerkers op de werkvloer zoveel verdienen? Of verdienen de managers en bestuurders relatief veel?
- Verwissel oorzaak en gevolg niet
Zonder domeinkennis kan het lastig zijn om oorzaak en gevolg uit elkaar te halen. Neem sturen op productiviteit. Zonder domeinkennis kun je makkelijk denken dat een hoge productiviteit het gevolg is van hard werken. In de praktijk is het meestal een optelsom van veel factoren: beschikken medewerkers over de juiste tools om hun werk te doen? Zijn de processen slim ingericht? Als ze bijvoorbeeld verplicht worden om allerlei handmatige controles te doen, als ze heel vaak data van het ene in het andere systeem moeten overtypen, en als er veel hand-overs in een proces zitten maar die mensen van elkaar niet goed begrijpen wat ze doen, dan kun je veel meer productiviteitswinst behalen door te investeren in een betere werkomgeving dan door medewerkers achter de broek te zitten om harder te werken. Sterker, hoe meer uren medewerkers in zo’n situatie worden gedwongen te werken, hoe groter de kans dat ze een overtypefout maken of iets vergeten, hoe meer rework en hoe lager de productiviteit. Zonder domeinkennis is het lastig om dit te achterhalen.
- Waak voor een averechts effect
Johan Cruijff waarschuwde ons al: je gaat het pas zien als je het doorhebt. Dat geldt zeker voor hr-data. Voor je het weet, stuur je op de verkeerde indicatoren en bereik je hooguit het omgekeerde effect. Hr-data zijn te waardevol om niet te gebruiken, maar wees dus bewust van het risico dat eraan kleeft.
(Auteur Steven Koppenol is manager it & data analytics bij Visma Raet.)