PSV behaalde dit seizoen met een imposante reeks wedstrijden de landstitel in de Eredivisie van het betaalde voetbal. Uiteraard komt dat succes voor rekening van spelers, coach Peter Bosz en staf. Maar er is ook een belangrijke rol weggelegd voor data-analisten.
Hoofd sportwetenschap en analytics Ruud van Elk vertelt een paar weken voor het kampioenschap hoe de club data analyseert. Dat doet hij tijdens een evenement van Salesforce. De Eindhovense eredivisionist maakt gebruik van datavisualisatie-software van Tableau, dat vier jaar geleden door Salesforce is overgenomen. Datawetenschap en sport is een onderwerp dat in de belangstelling staat. Vandaar dat Van Elk gevraagd is als spreker om inzicht te geven in de technische middelen en de manier waarop data-analyse wordt ingezet.
Hij vertelt dat data worden verzameld via hesjes met een lps-tracker (local positioning system) die de spelers onder hun shirt dragen. Eerder gebeurde dat alleen tijdens trainingen, onder meer om hartslag en loopvermogen te monitoren. Inmiddels mogen die hesjes ook tijdens wedstrijden gedragen worden. Voor uitgebreide analyse van wedstrijden wordt ook een videosysteem gebruikt. Dat camerasysteem is gekoppeld aan software. Op basis van rugnummers en shirtkleur – niet gezichtsherkenning – wordt van iedere speler op het veld data verzameld. Bij sommige acties, zoals de drukte in het zestienmetergebied bij een hoekschop, heeft het systeem moeite om de voetballers te herkennen. Een dataleverancier voert dan handmatig in wie er bij de bal zijn. Eerder deden Van Elk en een collega dat zelf.
PSV heeft samen met een data-scienceteam van chipmachinemaker ASML ook een eigen model ontwikkeld om te meten welke ploeg het veldoverwicht heeft. Dat pitchcontrol-model verdeelt het voetbalveld in 1.600 vakjes en op basis van de bewegingsgegevens wordt berekend welke speler als eerste een specifieke positie zou kunnen bereiken en dus de controle over die ruimte heeft. ‘Dat gebeurt met camera’s die 25 keer per seconde de locatie van voetballers en de bal doorgeven’, vertelt Van Elk. Het model vormt de basis voor nog veel geavanceerdere metingen, maar die wil hij vanwege concurrentierisico’s niet allemaal delen.
Hawk-Eye
Een wedstrijd levert een berg aan data op. Alleen al het Hawk-Eye-systeem, dat voor doellijntechnologie wordt gebruikt en met speciale camera’s vanaf vaste punten een panorama-registratie (360 of 180 graden) maakt van waar de bal precies op het veld is, legt per wedstrijd 35 miljoen datapunten vast. Dat is goed voor zo’n 4,5 GB aan gegevens.
PSV vergaart die wedstrijdstatistieken en de data van individuele spelers om prestaties te verbeteren. Het gaat bijvoorbeeld om wedstrijdevaluaties. Na elke match analyseert de staf van PSV de prestaties aan de hand van cijfers en grafieken. De stafmedewerkers bekijken of het aantal gescoorde doelpunten overeenkomt met het aantal verwachte goals op basis van de kwaliteit van de kansen. Ook registreert het systeem het wedstrijdverloop en tactische scores gebaseerd op de speelstijl van de coach. Om tot de juiste meetwaarden te komen, ontwikkelt het team van Van Elk modellen die per trainer kunnen verschillen. Een nieuwe trainer betekent dus altijd een flinke berg werk voor de data-wetenschappers.
Sport-tech
Er zijn tal van aanbieders van technologie voor het meten van prestaties van sporters en meerdere systemen voor het beheer en delen van die data. Voorbeelden zijn:
Inmotio: prestatie-analysesoftware en lps-hesjes
ChyronHego: hard- en software voor videotracking
Oura: slimme ring voor slaaponderzoek en gezondheidsmonitoring thuis)
Hawk-Eye: doellijntechnologie en trackingprovider, onderdeel van Sony Group
Opta: platform met statistieken van verschillende profcompetities
Game on technologies: videofeedback voor trainingen
Soccerlab: administratiesysteem voor onder meer prestaties, trainingsdata, medische informatie van profvoetballers
Vald: hard- en software voor fysieke tests van atleten
De stack die PSV gebruikt voor analyse van data bestaat uit:
Databricks: samenwerkingsplatform voor data-engineers, data-scientists en analisten
Azure SQL: beheer van database-omgevingen in de cloud, Microsoft.
Tableau: software voor datavisualisatie, zoals het maken van grafieken en dashboards
Individuele spelers
Naast de data over wedstrijdverloop kijkt de club ook naar de individuele ontwikkeling van spelers. Tijdens zijn presentatie toont Van Elk een scherm met de data van een PSV’er. Zijn naam en foto zijn wegens privacyredenen niet zichtbaar, wel zijn snelheid, vetpercentage, beschikbaarheid tijdens wedstrijden en trainingen, sprongkracht en prestaties op cognitieve testen te zien. Deze gegevens worden gebruikt om de persoonlijke trainingsprogramma’s te optimaliseren.
Voor de scouting van nieuwe spelers en talent zijn ook dashboards ontwikkeld. Deze moeten helpen in de keuze om een speler wel of niet aan te trekken. PSV monitort zelfs de slaapkwaliteit van zijn eigen spelers. Dat gebeurt met behulp van een slimme Oura-ring van een Fins gezondheidstechnologiebedrijf. Deze meet hartslag, lichaamstemperatuur en slaapscores. Ze moeten de staf helpen met de begeleiding van spelers bij hun herstel en trainingsbelasting en aangeven wie moe of overbelast is.
Het meten van details over slaap ging sommige spelers te ver
Hoewel spelers over het algemeen bekend zijn met data-analyse en het meten van prestaties bij wedstrijden en trainingen, ging het meten met die ring sommigen een stap te ver. Het data verzamelen van de werkgever komt zo zelfs hun slaapkamer binnen. Van Elk vertelt dat een deel van de spelersgroep de ring die in de privétijd om moet, niet zomaar accepteerde. Pas na een voorlichtingsbijeenkomst met de groep en de toezegging dat de club alleen slaapscores registreert, en niet het aantal geslapen uren en het tijdstip waarop de speler naar bed gaat, gingen de PSV’ers unaniem akkoord.
Het data-team
Om de data-analyse in goede banen te leiden beschikt de Eindhovense club over een team van acht ict’ers, datawetenschappers, engineers en sportwetenschappers. Daarnaast wordt de club vanuit een samenwerking met de Brainportregio bijgestaan door experts van ASML. Daarmee beschikt PSV over een voor Nederlandse begrippen riante ploeg aan data-analisten. Alleen Ajax en Feyenoord hebben vergelijkbare teams opgesteld. Clubs als AZ en FC Twente hebben budget vrijgemaakt om data en analytics te ontwikkelen. Maar daar gaat het vaak om enkele personen of een stagiair, vertelt Van Elk die regelmatig contact heeft met collega’s bij andere clubs.
In Europese topcompetities zoals de Engelse Premier League en de Duitse Bundesliga zijn die teams dan weer groter dan bij PSV. Maar volgens van Elk heeft een kleiner team ook zijn voordelen doordat zijn collega’s in direct contact met coach, spelers en stafleden staan. Wordt de groep groter, dan komen techneuten en data-analisten meer op afstand van de spelersgroep, staf en trainer. Koploper in data-analyse zijn teams in de Premier League, vooral ploegen met een Amerikaanse eigenaar – ongeveer de helft – doen veel aan data-analyse.
Hoewel met Tableau eindeloos data zijn te visualiseren in rapportages en grafieken, ontvangt Bosz na een wedstrijd zijn data-analyse toch het liefst op papier. Hij krijgt zes velletjes met informatie over het wedstrijdverloop, informatie over spelers en de ‘vijfsecondenregel’ (het streven om bij balverlies binnen vijf seconden de bal weer terug te krijgen). Het systeem turft hoe vaak dat lukt en hangt er een score aan. Ook scouts, fysiotherapeuten en andere stafleden krijgen rapportages op maat.
Sprinten en fysieke belasting
In de Eredivisie is het aantal sprintmeters de afgelopen vier jaar, afhankelijk van de positie van een speler, met tien à vijftien procent gestegen. Van Elk: ‘We moeten onze spelers voorbereiden om daarin mee te kunnen. Dus gebruiken we data om onze manier van trainen te optimaliseren.’ Zo werd in een voorgaand seizoen een afrondingsoefening met veel sprinten, die voor vleugelspelers vlak voor een wedstrijd nogal belastend bleek te zijn, op basis van data-analyse aangepast.
Bescheiden
Van Elk is bescheiden is over zijn rol in het kampioenschap. Volgens hem dient data-analyse vooral voor het analyseren van prestaties van spelers en het team over een langere termijn. Er is geëxperimenteerd om in de rust al data te delen, maar een coach heeft tijdens die pauze maar vijftien minuten om zijn mensen toe te spreken en kan dan niet ook hele data-analyses doornemen. Ook is het storend als coaches constant data zouden krijgen tijdens de wedstrijd. Allerlei pushberichten zouden dan afleiden. Een coach is bovendien getraind om te zien hoe zijn spelers erbij lopen en of ze presteren, stelt Van Elk.
In het volle programma met competitiewedstrijden, bekerduels, Europees voetbal en interlands is het belangrijk om de individuele fitheid en teamprestaties in de gaten te houden en trainingsprogramma’s aan te passen, vertelt Van Elk. Hij mag dan niet degene zijn die in het veld de prestaties geleverd heeft, de data-analyses van zijn team geven wel extra glans aan de kampioensschaal van de Eindhovenaren.
Dit artikel is tot stand gekomen op basis van een presentatie van hoofd sportwetenschap en analytics Ruud van Elk en achtergrondinformatie uit het artikel ‘Vijf manieren waarop PSV data gebruikt’ uit Voetbal International, geschreven door Pieter Zwart.
Ik heb niks tegen data-analyse in de sport alleen maar iets tegen de opportunisten want als Ajax dezelfde budgetten heeft dan moet van Elk even uitleggen hoe het kan dat een club met de meeste landstitels het momenteel zo slecht doet. Succes heeft vele vaders en mislukking blijft een wees want sapper-de-flap bieden de resultaten uit het verleden geen garanties voor de toekomst. Wat betreft een logica van Johan Cruijff over op tijd vertrekken en weten waar de bal neerkomt zodat je niet zo hard hoeft te lopen devalueert het gebruik van statistiek met een coach die even makkelijk wisselt van systeem als een voetballer die wisselt van hoek bij het schieten van een penalty.