Small data

Nu ik mijn eigen cijfermatige data een tijdje volg en analyseer, raak ik er meer en meer door gefascineerd. Het is ware datadoping. Wel roepen die data allerlei vragen bij me op en probeer ik ermee te prognotiseren.

Big data heeft beloften en gevaren in zich, zeggen ze. Als onderwijsonderzoeker ben ik niet zo’n rekenaar (anders was ik wel statisticus geworden). Het liefst heb ik data die ik kan horen, zien, voelen en ruiken. Die rechtstreeks uit het klaslokaal komen.

Data
Small data uit Trainingspeaks

Bestaande, vaak cijfermatige data in de systemen van de school worden tegenwoordig gebruikt bij zogenaamde ‘learning analytics’, net zoals dynamische data van en over sporters gebruikt worden bij ‘sports analytics’ (zie bijvoorbeeld https://medium.com/@divyemadan.19/sports-analytics-the-game-changer-a846af556348). Nu ik mijn eigen cijfermatige data een tijdje volg en analyseer, raak ik er meer en meer door gefascineerd. Het is ware datadoping. Wel roepen die data allerlei vragen bij me op. Hoe berekent Polar eigenlijk de hartslag die getoond wordt? En wat wordt er dan doorgestuurd als ik synchroniseer? De berekening die ik op mijn horloge zag, of de ruwe data van tijd en plaats en hartslagen? Beroepsdeformatie zullen we maar zeggen.
Of je data van één persoon over tijd ook groot moet noemen weet ik, maar ik ben op basis ervan (hier meer over mijn trainingsdata) maar eens aan het prognotiseren begonnen voor Almere. Spoiler alert, het zegt allemaal niets.
Eerst even intuïtief een prognose op gevoel, hoewel dat, nu ik al in de data gedoken ben, niet helemaal zonder kennis is uiteraard. Ik voel me fit, doe in wedstrijden lekker mee in het veld (loop in ieder geval niet achteraan) en ik blijf vaste routes steeds sneller zwemmen/fietsen/lopen. Vanuit dat gevoel denk ik dus dat als het heel goed gaat ik misschien wel onder een uur kan zwemmen, maar dat het waarschijnlijk tussen een uur en 1:10:00 zal worden. Voor fietsen hoop ik onder de zes uur te halen, omdat ik denk wel gemiddeld iets meer dan 30 km/uur te kunnen fietsen. Tot slot hoop ik dat ik de marathon ergens tussen vier en vierenhalf uur kan lopen. Dan kom ik dus tot een bandbreedte van 10:45 en 12:15 uur. Lekker ruime marge, zie onderstaande tabel.

Tabel 1: geschatte tijd op intuïtie

Dan nu het echte rekenwerk. Dit seizoen heb ik drie triatlons gedaan die ik als uitgangspunt kan nemen: Oud-Gastel (1/3), Aarschot (1/3) en Embrun (Olympische Afstand). Als ik daarvan de snelste tijden voor elk onderdeel neem en die extrapoleer[1] naar een hele, dan kom ik uit op onderstaande tabel. Onder de tien uur, dat lijkt wel heel snel.

Tabel 2: Tijden op basis van eerdere tijden

Omdat je natuurlijk niet zomaar het ene parcours met het andere kan vergelijken en je ook heel anders racet in een korte wedstrijd, kan ik beter uitgaan van de snelheid die ik lang kan volhouden. De literatuur zegt dat je een hele triathlon in zone 2, met af en toe een uitschieter naar zone 3 zou moeten kunnen volhouden.[2] Als ik dus van die zones de snelheid neem en die omreken naar de tijd die ik over elk onderdeel doe, kom ik tot onderstaande tabel. Ook weer een ruime bandbreedte tussen 9 1/2 en bijna 12 uur.

Tabel 3: tijden op basis van zonetempo

Tot slot de benadering die ik de sportcommentatorbenadering noem: op basis van eerdere rankings inschatten hoe hoog ik in Almere kom. Maar dan in tijd. Dus ik neem de gemiddelde ranking in percentage van het aantal deelnemers van elk onderdeel, reken die om naar de ranking in Almere en zoek daarbij de tijd die in 2018 in Almere is gelopen. Een beetje vergezocht misschien. Maar wel leuk rekenwerk en een interessante tabel.

Tabel 4: geschatte tijden op basis van rankings

De eindtijden die dit laatste rekenwerk oplevert zien er voor mij wat geruststellender uit en kloppen ook beter met mijn eerdere natte vingerwerk. Wel ook weer een brede marge. 12:25u. is de tijd die nr 63 in Heren 45+ in 2018 heeft gelopen. 13:25u. is de som van elk onderdeel, zonder wissels (die ik heb nergens mee gerekend, maar gezien de bandbreedte maakt 5 of 10 minuten wisselen niet heel veel uit).

Kortom, de resultaten uit het verleden laten zien dat ik tussen de 9 1/2 en 13 1/2 uur over het wedstrijdje zou kunnen doen. Maar ja, resultaten uit het verleden zeggen niet zo veel. Je zult maar bij de finish staan te supporteren.

Voetnoten

[1]Extrapoleren is in de wetenschap altijd riskant! In de financiële wereld zeggen ze dan:”Resultaten uit het verleden….”

[2] In mijn trainingsschema’s ga ik uit van de zones (7) van Matt Fitzgerald and David Warden in hun boek 80/20 Triathlon: Discover the Breakthrough Elite-Training Formula for Ultimate Fitness and Performance.

Meer van de Bananenwinkel

Misschien wil je meer lezen zoals dit:

Fado en eindelijk die bel?

“Laat het los,” zei mijn vader via mijn berichtendienst, toen ik wel en hij niet aan het boarden was voor de vlucht naar Lissabon voor de Ironman® Cascaïs. Ik had in plaats van de naam in zijn paspoort, zijn roepnaam op het ticket gezet. Dat mag dus niet, dat wist ik wel. Een slordigheidje. Wachtend op een telefoontje van de luchtvaartmaatschappij dat het aangepast was, benadrukte hij ook dat ik vooral wel (alvast) moest gaan. Duidelijke aanmoediging. Zoals ouders doen, althans de mijne.

Lees verder »

De vasten gaat beginnen

Veel wedstrijden zijn hun inschrijvingen begonnen en veel atleten, die ik begeleid bijvoorbeeld, zijn druk doende hun jaarschema te bouwen. Dus met de vastenperiode, begint

Lees verder »

Snel Contact

Via sms of door te bellen. Ik heb ook Signal, geen Whatsapp.

Kom bij de Bananenclub

De Bananenclub is een club met atleten die ooit wat kochten bij de Bananenwinkel of zij die dat ooit gaan doen. Ben je lid dan ontvang je niet meer dan eens per maand een nieuwsbrief met trainingstips en suggesties. Bovendien krijg je 10% korting op alle volgende aankopen in de Bananenwinkel!