Connect with us

Hvad søger du?

Science ReportScience Report

Forside

Computerprogram kan fastsætte pris på fodboldspillere

Big data er på vej ind i fodbold, hvor en ny algoritme kan fastsætte prisen på en spiller

Ved brug af big data og algoritmer kan prisen på fodboldspillere nu fastsættes.

Fodbold har det hele – berømmelse, nederlag, spænding og masser af penge. Forventningen er, at der bliver slået rekord for brug af penge ved køb og salg af spillere med en samlet sum på over 1,4 mia pund eller knap 12 mia kr. denne sommer – måske endda noget mere med den rekordstore sum penge PSG betalte Barcelona for Neymar på 1,65 mia kr.

Der er kort sagt nok at snakke om for både fans og finansfolk, når de hænger på de høje barstole med ølskum på overlæben. Og det er en verden, der allerede som 5-årig smittede Oliver Müller, der idag er lektor på ITU

– For over 3 år siden sad jeg og to forskervenner, der også er vilde med fodbold over en øl, og snakkede om hvordan man i dag bruger statistik i baseball i USA og om man overhovedet kunne gøre det samme i fodbold, hvor holdet har større betydning end i baseball og hvor der findes færre data, fortæller den mørkhårede forsker på et engelsk, med en umiskendelig understrøm af tysk.

Hans tyske ophav er ikke blevet visket ud efter nogle år i Danmark på trods af kontorudsigten over København. De tre forskervenner arbejder tilfældigvis alle tre med data, algoritmer og hvordan beslutninger bliver truffet, og derfor fostrede nysgerrigheden ideen om at bygge et værktøj, der kunne beregne en ”objektiv” pris på spillerne.

– Altså, det er jo ikke et normalt marked. Når man fx ser på lejligheder, så bliver prisen langt hen ad vejen bestemt af udbud og efterspørgsel, men sådan er det ikke med fodbold. For Messi eller Ronaldo er der måske kun én klub, der har råd til dem, så hvad skal prisen være?

Nu vil jeg ikke bashe nogen, men måske var fx Beckham mere populær, end han var en god spiller.

Når spillere skal handles, enten fordi de gerne vil skifte klub, eller en klub vil sælge dem, mødes trænere og agenter og aftaler en pris. Med en eksponentiel vækst i data fra fodbold over de sidste 20 år, findes der allerede værktøjer som trænere og klubber bruger til at fastsætte priser, men de tager sjældent sådan noget som berømmelse med i ligningen. En faktor, der ellers kan have stor betydning for fx salg af merchandise, hvor der eksempelvis blev solgt over 10.000 spillertrøjer med Neymars navn på da den blev udbudt til salg for sultne PSG- fans – på bare den første dag. Dermed bør berømmelse også indgå i prisen for en spiller, mente Oliver og hans videnskabelige kumpaner, der gerne ville have faktoren med i deres algoritme

– Vi analyserede data og prøvede at komme op med en algoritme baseret på alle de data, der findes for spillerne – og samtidig indregne spillernes popularitet. Nu vil jeg ikke bashe nogen, men måske var fx Beckham mere populær, end han var en god spiller.

Derfor bør prisen også sættes efter både popularitet og spillerevner.

Algoritmen bygger på fælles visdom
Når spillere bliver handlet, kigger mange med fra sidelinien. Journalister kaster sig gladelig ind i gættelegen om prisen på en given spiller, ligesom fansene spiller en stadig større rolle. Den viden gjorde forskerne brug af, da de lavede værktøjet.

– På hjemmesiden ”Transfermarkt”, som er en af de største fodboldsider der findes, sidder tusindvis af fans og diskuterer, hvad de mener, en spiller er værd, og selv om de ikke er meget objektive i deres gæt, ville algoritmen ikke virke uden dem.

Det kan naturligvis synes underligt at gæt på en spillerpris fra fans skal indgå, men det giver alligevel god mening, viser meget forskning. For at forstå hvordan, skal vi tilbage til 1906.

Året 1906 er kendt for mange ting – nordisk film grundlægges, Ellehammer laver sin første flyvning, men en af de ting som de færreste ved er, at begrebet ”Wisdom of the crowds” fostres på et dyreskue i Plymouth, England.

Sir Francis Galton var allerede på det den tid en kendt forsker, på vej ind i sit livs efterår. Han havde masser af videnskabeligt vingefang og spændte over så forskelligartede faggrene som psykologi, antropologi, sociologi, eugenik – og statistik. På dyreskuet var der ud over Galton – og sikkert også en hel masse andre mennesker – også en slagtet okse, hvis vægt man kunne gætte på. Den, der kom tættest vandt oksen. 800 mennesker deltog i konkurrencen og efterfølgende bad Galton om at få alle sedlerne med gættene på. Oksen vejede 1207 pund, men hvad der var mere vigtigt, var hvad Galton så, da han kom hjem og undersøgte alle gættene. Til sin overraskelse fandt han nemlig, at middeltallet var kun 1% forkert fra den rigtige vægt. Det virkede som om man kunne spørge folket, og få svar der gav mening. Som om folket i virkeligheden i fællesskab kendte svaret.

Algoritmen er bygget, så den så at sige lærer sig selv, hvilken betydning de enkelte faktorer har ved at indhente data, ligesom den har opbygget en erfaring af sig selv ved at analysere data fra de sidste mange år.

Siden da er det vist utallige steder. Man kan måske nok ikke tale om en lovmæssighed, men eksempler taler deres tydelige sprog, og fænomenet bliver kaldt ”wisdom of the crowds”.

Dermed giver det også bedre mening at spørge fansene, end man umiddelbart skulle tro. Men naturligvis spiller mange andre elementer ind, når prisen på en spiller skal beregnes i forskernes algoritme

– På hjemmesiderne siger fansene måske ”Ham der scorer tit”, men der mangler hårde tal. Men hårde tal som scorede mål, pasninger, røde kort, tacklinger eller målgivende afleveringer indgår naturligvis også i beregningen, fortæller Oliver.

Ud over hårde tal og fans-gæt på pris indgår en hel række andre faktorer, fra hvor ofte der bliver søgt efter spilleren på nettet, eller hvor tit et navn bliver brugt i en nyhedsoverskrift, til hvor mange videoer der ligger på youtube med bestemte spillere. Over 25 forskellige faktorer indgår i beregningen.

Alle de data bliver kogt sammen og ud kommer en pris

– Magic happens og efter hver sæson, eller faktisk efter hver kamp, opdaterer algoritmen sig selv og dermed kan man få en mere eller mindre realtime pris på en spiller

Dermed kan man fx også se hvilken betydning et mål har for en spillers pris. For eksempel øger et mål gennemsnitligt en spillers værdi med omkring 2,5 procent, mens et måloplæg kan give et positivt udslag på omkring 1,5 procent.

Algoritmen er bygget, så den så at sige lærer sig selv, hvilken betydning de enkelte faktorer har ved at indhente data, ligesom den har opbygget en erfaring af sig selv ved at analysere data fra de sidste mange år.

– Ved at kigge på historikken bag 4000 – 5000 spiller, har den har lært sig logikken bag fansnes gæt, og forholdet mellem pris, popularitet og performance, og nu kan vi med et tryk på en knap få en spillers eksakte pris.

Danske spillere
Algoritmen er kun sat op til at virke i de 5 største ligaer i Europa, og der for kan han kun trække tal på danske spiller i udlandet. Men det ser ikke godt ud.

– Ud fra sin performance, ser Christian Eriksen ud til at være estimeret ca. 10 mio euro for lavt i vores algorime, og ud af de danske spillere, der er i de ligaer vi har i algoritmen, har vi testet 5-6 stykker, og de er alle sat lidt for lavt.

Det samme gælder for Yussef Poulsen, der spiller for RB Leipzig i Bundesligaen. Han er ifølge algoritmen godt 8,5 mio euro værd i øjeblikket.

Den lave pris har Oliver Müller en forklaring på.

– Når vi kigger på, hvem der er mest overprisede, så er det spillere fra Sydamerika. Men spørgsmålet er, om det virkelig skyldes de er gode, eller skyldes at ryet siger de er gode, og det derfor gælder om at købe den næste spiller så hurtigt som muligt?

Jeg siger ikke, at man kun skal stole på algoritmen, men når man skal finde prisen på en relativt ukendt spiller, vil vores algoritme og erfaringen fra fx træneren være et godt mix.

I Danmark har vi ikke haft nogen rigtige fodboldtriumfer siden EM 1992, og epokegørende og verdenskendte spiller som Michael Laudrup er en saga blot. Derfor er vores spillere måske sat for lavt, men det kan ændre sig.

– For 20 år siden var der ingen, der kiggede på Spanien, men indenfor de sidste 10 år er der kommet mange gode fodboldspillere, og derfor har de nu et godt ry, som måske holder priserne oppe på spanske spillere.

Hvad kan den bruges til?
Selv om algoritmen er ”selvlærende”, kan den ikke bruges til at forudsige præcis hvilken pris, der er den rigtige, fordi markedet er så flydende som det er, og der er mange følelser indblandet. Men på mange andre måder er den brugbar.

– Man kan bruge den til fx ukendte spillere. Hvis vi ser på en spiller fx fra 2 liga i Portugal eller fra Tjekkiet, som du aldrig har set og ikke er på tv, ingen journalist kender navnet, så kan vi fodre vores algoritme med hans tal og få en pris ud.

Det er muligvis ikke særlig interessant for topklubberne, der kun køber velkendte spillere, men for andre klubber kan det være væsentligt.

– For en klub som FC midtjylland, der har meget fokus på data, og for hvem mange, mange spillere kan være interessante, og du kan ikke tage ud og se dem alle, tror jeg især algoritmen vil være brugbar. Altså ikke for de bedste, men de mellembedste klubber. Jeg siger ikke, at man kun skal stole på algoritmen, men når man skal finde prisen på en relativt ukendt spiller, vil vores algoritme og erfaringen fra fx træneren være et godt mix.

For nuværende er algoritmen ikke tilgængelig for offentligheden, men forskerne søger samarbejdspartnere, der kan hjælpe med at bringe projektet videre.

– Og ellers kan man jo bare selv bygge det, det er beskrevet i artiklen, slutter Oliver Müller med et grin.

Ud over Oliver Müller har Markus Weinmann og Alexander Simons, begge fra University of Liechtenstein deltaget i arbejdet.

Forsiden lige nu:

Forskningen i Region Sjælland har vokseværk

På seks år er Regions Sjællands samlede antal af forskningsartikler steget med over 50 procent. ​Særligt to forskningsområder og et hospital høster gode resultater.

Seneste artikler:

Loading...

Something went wrong. Please refresh the page and/or try again.