De komende weken is Europa in de ban van het Europees Kampioenschap voetbal. Dat loopt tot midden juli met de finale in Berlijn. Zo’n tornooi is ook voer voor data-analisten om de winnaar te voorspellen. Al zou die niet uit Nederland of België komen, analyseren twee Snowflake-experts.
Tijdens de voorbije summit van ai-datacloudbedrijf Snowflake stond één uitgebreide en opmerkelijke praktijksessie in het kader van het EK voetbal. Twee Snowflake-data-analisten – een Italiaan en een Engelsman, allebei voetballiefhebber – gingen met de eigen technologie aan de slag.
Portugal wint
Volgens hun data-analyse wint Portugal het EK in een finale met Engeland. De verliezende halve finalisten zouden Spanje en Kroatië zijn. Nederland strandt in de kwartfinale en botst daar op Engeland. België doorstaat de groepsfase maar gaat meteen daarna eruit tegen Spanje.
Om hun model te trainen gebruikten de twee voetballiefhebbers dertig jaar aan data van interlandwedstrijden. Het belang van die wedstrijden werd ook ingeschat, zo werden vriendschappelijke wedstrijden als minder belangrijk aanzien. Het thuisvoordeel op dit tornooi (voor Duitsland) werd mee ingecalculeerd. En voorts werd er onder meer ook rekening gehouden met het recente vormpeil van het betreffende landenteam.
Of is het Engeland?
De bedoeling was vooral om een praktische toepassing van de technologie te tonen. Voor de data- en Snowflake-specialisten onder ons: het ging om een volledige end-to-end modelpijplijn die werd gebouwd in Snowpark ML. De modellen werden opgeslagen in de Snowflake Model Registry en vervolgens gebruikt voor inferentie met zowel Snowpark Python als SQL.
Opvallend is dat bij het uitvoeren van het model er ook wel eens een andere winnaar opdook, en meer bepaald Engeland. Dat heeft deels te maken met het opzet van het tornooi en de knock-outfase met strafschoppen in het bijzonder. Om het element strafschoppen bij uitschakeling mee te rekenen werd in het model een random-functie gebruikt. Eigenlijk gelijkaardig met kruis of munt als je een muntje opwerpt.
Of zoals voetballiefhebbers en -commentatoren al lang weten: het nemen van strafschoppen op het eind is een loterij. En die is zo goed als onmogelijk te voorspellen.