Uutiset

Löytyykö data-analyysille koskaan paikkaa jalkapallon sydämestä?

Jalkapallo on hyvin konservatiivinen laji, se lienee selvää kaikille. Muutoksiin suhtaudutaan lähtökohtaisesti kriittisesti, onhan yhteisöllä käsissään suosituin versio kaikista pallopelien muunnoksista. Niinpä kaikenlaisen teknologian, ja sen osana data-analyysin hivuttautuminen kohti jalkapallo-pelin ydintä on kestänyt yllättävän kauan. FIFA esimerkiksi hyväksyi pelaajien päälle puettaviin mikrosiruihin perustuvat analyysimenetelmät vasta muutama vuosi sitten.

 

data-analyysi

 

Suomeen tilastojen vallankumous saapui viimeistään 2013, kun jalkapallo-dataa kustannustehokkaasti mahdollisimman monen saataville tuottava venäläisyritys InStat aloitti yhteistyönsä Veikkausliigan kanssa. Jotain uudistusten leviämistahdista kertoo se, että alan raamattu, Michael Lewisin Moneyball-kirja ilmestyi 10 vuotta aikaisemmin. Myös kehitys on ollut hitaampaa kuin teknologian voittokulkuun tottuneessa maailmassa voisi odottaa. Vaikka data-analyysi on osa laajempaa kokonaisuutta, jalkapallotiedettä, ja tiede on jo määritelmänsä mukaisesti jatkuvasti kehittyvä, päivittyvä ja itseään korjaava asia, on data-analyysi edelleen osittain jumissa samojen ongelmien kanssa kuin syntyvuosinaan. InStatilla puolestaan on omat ongelmansa silläkin.

Data-analyysin perusongelma on, että jalkapallo on lajina dynaamisempi ja soljuvampi kuin esimerkiksi numeroiden mullistama baseball. Jalkapallossa on vaikea muuttaa numeroiksi mitään, mikä ennustaisi tarkasti joko yksilön tai joukkueen menestymistä pitkällä aikajänteellä. Ei siis ole olemassa tilastoa, jonka selitysosuus joukkueen keräämästä pistemäärästä olisi erityisen suuri. Lajissa ei ole vastinetta sellaisille ”kuolleille tilanteille”, joista baseball-peli käytännössä koostuu. Baseballin syötöstä voi tilastoida suurella tarkkuudella nopeuden kilometreissä tunnissa, sekä alueen, johon syöttö tulee. Tietynlainen syöttö mahdollistaa tietynlaiset lyönnit. Nämä kaikki on hyvin suoraviivaista tilastoida, ja niiden perusteella on suhteellisen helppoa sanoa, tekikö pelaaja tilanteessa oikean vai väärän ratkaisun. Jalkapallon kuolleisiin tilanteisiin, jotka edustavat suhteessa häviävän pientä osaa peliajasta, osallistuu useampia pelaajia ja liittyy lukuisia muuttujia. Esimerkiksi maalipotkun tai sivurajaheiton liikkeelle laittamisen jälkeen on vaikea tehdä luotettavaa tilastoa siitä, miten millekin alueelle pelattu sivurajaheitto esimerkiksi johtaa pallonmenetykseen tai luotuun maalipaikkaan.

Kattavampia tilastoja etsitään edelleen aktiivisesti. Vuonna 2012 Manchester City julkisti kaiken edellisellä kaudella keräämänsä datan. Toiveena oli valjastaa lajiyhteisön ulkopuoliset ihmiset, kuten blogistit ja tutkijat mukaan kehittämään muuttujia tai faktoreita, jotka vastaisivat kysymykseen: mikä tekee jalkapallojoukkueesta voittavan? Baseballissa moneyball-vallankumouksen käynnistivät juuri lajin ulkopuoliset ihmiset Bill Jamesin johdolla.

Maaliodotuksessakin puutteensa

Tällä hetkellä yksi parhaiten voittamisen kanssa korreloivista tilastoista on maaliodotus, joka Suomessakin on jo osa jalkapallon tilastokeskustelua. Maaliodotuksessakin on omat hyvin dokumentoidut ongelmansa, kuten sen kyvyttömyys ottaa huomioon laukovan pelaajan maalintekotaito tai epäonnistuneeseen viimeiseen syöttöön tai huonoon ensimmäiseen kosketukseen kariutunut maalintekopaikka.

Toinen esimerkki luovasti kehitellystä tilastosta on nimeltään packing. Sen takana on kaksi saksalaiskeskikenttäpelaajaa, kauteen 2015 lopettanut Stefan Reinartz ja edelleen Bristol Cityssä pelaava Jens Hegeler. Kaksikon luoma systeemi mittaa syöttämisen tai kuljettamisen tehokkuutta laskemalla vastustajien määrän, jonka syöttö tai kuljetus ohittaa. Packing-tilaston korrelaatio voittamisen kanssa on 0.3–0.4 välissä, joka on tilastollisesti merkitsevä korrelaatio. Tilasto mittaa sekä joukkueen että yksilön syöttämisen tehokkuutta. Lisäksi arvoa kohottaa kyky vastaanottaa niitä syöttöjä, jotka ohittavat paljon vastustajia. Esimerkiksi Bayern Munchenin puolustaja Jerome Boateng saa packing-tilastossa arvon 75, mikä tarkoittaa sitä, että Boateng ohittaa keskimäärin 75 pelaajaa per ottelu joko kuljetuksillaan tai onnistuneilla syötöillään. Joukkuekohtainen packing-numero taas kertoo joukkueen pelityylistä, esimerkiksi vastahyökkäyksille altis joukkue joutuu keskimäärin ohitetuksi todella usein, ja tehotonta pallonhallintaa harjoittava joukkue taas nakuttaa matalia packing-lukemia.

Packing-tilastossakin on luonnollisesti omat ongelmansa. Kuten esimerkiksi se, ettei monta pelaajaa ohittanut omille mennyt syöttö ole siltikään aina välttämättä pelitilanteen kannalta paras ratkaisu. Syöttämällä kuuden pelaajan ohi yksinäiselle kanssapelaajallesi saat tilastoosi kuusi pistettä lisää, mutta neljää vastustajaa vastaan ahtaassa tilassa pelaava joukkuekaverisi silti todennäköisesti menettää pallon. YLE Puheen Urheiluillassa data-analyysista puhumassa ollut A-maajoukkueen videoanalyytikko Henri Lehto ennusti, että seuraava kehitysaskel jalkapallo-tilastoissa voisi olla pelikäsityksen mittaaminen. Eli toisin sanoen se, tekeekö pelaaja kussakin pelitilanteessa pelin kannalta oikean ratkaisun vai ei. Jalkapallossa tämäkin on monimutkainen kysymys. On otettava huomioon esimerkiksi se, onko vaikkapa havainnointi ollut puutteellista jo ennen pallon saamista, jolloin pelin kannalta paras mahdollinen ratkaisu ei ole enää ollenkaan mahdollinen kun pelaaja saa pallon. Tai oliko alkuperäinen liike pelattavaksi siihen paikkaan, jossa pelaaja pallon sai oikea ratkaisu? Tässä sivutaan myös yhtä tilastojen ongelmaa: ne mittaavat suhteellisen paljon yhden pelaajan pallollisia pelitekoja suhteessa siihen, kuinka vähän aikaa yksittäinen pelaaja on 90 minuutin aikana pallon kanssa tekemisissä.

Kalliit tilastot vai tukkimiehen kirjanpito?

Entä InStatin ongelmat sitten? Yrityksen liikeideana oli tuoda data mahdollisimman monen saataville. Tämä tarkoitti sitä, että myytävän palvelun on oltava halpa. Suomessakin InStat on pyrkinyt myymään palveluitaan jopa Kolmosen joukkueille melko maltillisella hinnalla. Halpa harvoin on kaikkein korkealaatuisinta, ja suomalaisten asiakkaiden riveistä onkin kuulunut joitain soraääniä. Yksi ongelmista on ollut tilastopaketin saapuminen viiveellä, joskin tällä kaudella tilastot ovat olleet saatavilla jo vuorokauden päästä pelistä. Parhaassa tapauksessa tilastointi olisi reaaliaikaista, jolloin tilastoja voisi käyttää hyväksi esimerkiksi puoliajalla palautteenantoon ja tukemaan valmentajan subjektiivista kokemusta ensimmäisestä jaksosta. Toisena ongelmana on ollut InStatin tilastojen epätarkkuus. Vaikka yhtiö mainostaa nettisivuillaan, että tilastot on tarkastettu kolmesti ja virheprosentti on vain 1.2, ovat seurojen omat tilastot eronneet melko selkeästikin InStatin vastaavista. Lisäksi jotkut pelaajat ovat saaneet omien palauteklippiensä joukkoon tilanteita, joissa eivät ole ollenkaan mukana.

Perusongelma on se, että InStat tuottaa vain informaatiota. Jotta 50-sivuinen läpyskä muuttuu tietämykseksi, pitää se analysoida joukkueen pelitapaan peilaten. Analysoijan pitää olla henkilö, jolle pelitapa on tuttu. Käytännössä ison raakadatan läpikäynti jää Suomessa päävalmentajan tai apuvalmentajan harteille, kun päätoimisia analyytikkoja analytiikka-tiimeistä puhumattakaan on harvalla. Datassa enemmän ei aina olekaan parempi, vaan joskus yksinkertaisempi kynä-paperi -metodi voi toimia paremmin. Jos oman joukkueen peliin halutaan lisätä elementti, pitää suunnitella harjoite, jossa tuo elementti toistuu. Tilastoimalla harjoituksissa ja peleissä elementin esiintymiskertoja vaikka tukkimiehen kirjanpidolla saadaan palautteenantoa varten varsin käyttökelpoista dataa.

Ehkä data-analyysin paikka ei edes ole lajin ytimessä. Henri Lehto totesi YLE Puheella viisaasti, että data-analyysi on vähän kuin tötsät ja liivit, sen tehtävä on olla yksi työkalu valmentajalle. Jalkapallon juoksevaa luonnetta ei todennäköisesti koskaan pystytä vangitsemaan matemaattisiin yhtälöihin ja numeroihin yhtä hyvin kuin tilastopainotteisempia amerikkalaislajeja. Tai sitten jalkapallon Bill James on jossain tuolla, odottamassa että hänet löydetään, kuten Cityn analyysiosaston päällikkö Gavin Fleig ennusti.

Jesse Saarinen

Lähteet:
The Guardian
ESPN FC
The Set Pieces


Kuva: Mari Hietala