paź 29, 2024
Power BI Pro vs Power BI Premium – Kompletny przewodnik
Wersje Power BI Pro i Power BI Premium różnią się funkcjami, zasobami i modelem licencjonowania, co ma kluczowe znaczenie przy...
Piotr Reszka
paź 4, 2019
W ubiegłą niedzielę przebiegłem swój pierwszy maraton (PZU Maraton Warszawski). Po 8 miesiącach treningu zrobiłem wynik 3:19:57. Dla wtajemniczonych, ponoć zejście poniżej 3:20 jest związane z większym wysiłkiem. Biegłem z kolegą, który robił swój szesnasty maraton, poprawił wynik życiowy o 5 min., przybiegłem na metę 5 s. po nim… (dziękuję Paweł!). Jest sukces, okropne zakwasy w nogach i refleksja, czy jest coś co mógłbym zrobić lepiej?
Na co dzień zajmuję się analizą danych, więc naturalne było sięgnięcie po wyniki publikowane przez sts-timing i próba znalezienia w nich ciekawostek, ale zacznijmy od początku…
Moją największą bolączką była kontuzja kręgosłupa spowodowana treningiem uzupełniającym na wiosłach. Dzień przed maratonem ból był tak silny, że nie mogłem wziąć głębokiego oddechu. Bałem się, że przez to będę miał słabszą wydolność. W nocy przed startem budziłem się kilka razy. Niby biegłem już w dwóch półmaratonach, jednak nigdy nie zrobiłem dystansu większego niż 27 km. Rano wszystko poszło płynnie, ciuchy przygotowane, ryż z masłem orzechowym i bananem zjedzony na siłę na śniadanie, czynności administracyjne i z buta na kolejkę WKD. Kręgosłup jakby mniej dokuczał, dzięki czemu nastawienie psychiczne od razu mi się poprawiło. Jechałem razem z kolegą, dla którego był to już któryś start, więc było raźniej. Omawialiśmy strategię odnośnie tempa.
Na miejscu organizacja i oznaczenia super, sprawnie odnaleźliśmy wozy do depozytów, krótka rozgrzewka i próba przepchnięcia się do swojej strefy.
Były trzy strefy startowe: dla kosmitów, dla osób deklarujących czas < 4 godzin i dla tych, co chcą przeżyć bieg. Niestety 5 min. przed startem wpadłem na pomysł ostatniego ataku na toaletę, po powrocie startowałem praktycznie z końca peletonu. Było to o tyle słabe, że wymijanie osób biegnących wolniej wymuszało bieg zygzakiem, w efekcie na mecie odkryłem, że przebiegłem o 400 m więcej! Dodatkowo na drugim kilometrze, nieopatrznie schyliłem się po tabletki, które wypadły koledze i naciągnąłem jakieś ścięgno w lewej stopie. Ból stopy spowodował, że zapomniałem o bólu kręgosłupa i przez 40 km biegłem praktycznie stawiając stopę na zewnętrznej krawędzi. Poza tymi “drobnymi” niedogodnościami trasa była świetnie zorganizowana, picie co 2 km, setki kibiców, muzyka, a do tego piękna pogoda, ani nie za ciepło, ani nie za zimno.
Analiza danych z maratonu wymagała przekształcenia pliku pdf do danych w postaci, w której można było pobawić się nimi w Tableau (tę część opiszę na końcu artykułu). Po godzinie zabawy z Alteryxem miałem już gotowe źródło danych na Tableau Server.
Pierwsze spojrzenie na dane, mamy 4559 osób, które ukończyły bieg. Zdecydowana większość to mężczyźni (na niebiesko). W obu przypadkach najwięcej osób startowało w grupie wiekowej 41-45 lat (w tym ja). Czyżby bieganie maratonu było związane z kryzysem wieku średniego? ?
Najstarszy zawodnik, Pan Stanisław lat 79, ukończył maraton w czasie 4:17:04. Chciałbym w tym wieku jeszcze biegać….
Większość warszawskich maratończyków to Polacy, jednak mieliśmy ponadto 550 gości z 53 krajów. Najwięcej z Ukrainy, UK, Szwecji. Ciekawe, że było relatywnie mało osób z Niemiec, być może przyczyną był maraton w Berlinie odbywający się w tym samym dniu.
Główną kwestią, którą chciałem przeanalizować był czas. W danych mamy kilka zmiennych podających czas. Najważniejsza z nich do Chip Time, czas z chipów umieszczonych pod numerami sczytywany przy każdym przebiegnięciu bramki, co 5 km oraz na mecie (42,195 km). Poniżej histogram czasów przebiegnięcia maratonu w przedziałach minutowych. Spodziewałem się rozkładu Gaussa, ze środkiem w okolicach 4 h, najwięcej osób stawia sobie za cel złamanie bariery 4h. Faktycznie to wynika z danych, ale ciekawa jest też następująca anomalia, 106 osób przebiegło maraton w czasie 5:16.
Błąd w danych?? Jeśli zmniejszymy przedział do 10 s. anomalia jest widoczna jeszcze bardziej.
Najwyraźniej biegła tu duża grupa osób. Po sprawdzeniu szczegółów, wszystko stało się jasne. Grupa biegaczy SPARTANIE DZIECIOM trzymali się razem i razem wbiegli na metę! Gratulacje!
Czas ukończenia maratonu w poszczególnych grupach wiekowych pokazuje również ciekawą zależność.
Można się spodziewać, że najmłodsi, przed 30 rokiem życia, pobiegną najszybciej. Jednak to grupa 30-40 jest najlepsza, niezależnie od płci. Czyżby tutaj była najlepsza proporcja między siłą mięśni, wytrzymałością, a psychiką?
Przejdźmy teraz do sprawy, która najbardziej mnie nurtowała. Z powodu wizyty w toalecie biegłem z końca peletonu, przebiegłem o 400 m więcej. Załóżmy, że połowa z tego wynikała z kluczenia pomiędzy ludźmi, których wyprzedzałem, co oznacza, że na mecie mogłem być o dobrą minutę wcześniej (moje średnie tempo 4:44 min/km). W danych nie ma oczywiście informacji, kto ile przebiegł vs nominalny dystans, jest za to czas od wystrzału startowego (Gun Time) i czas z czytników (Chip Time). Porównałem różnice tych dwóch czasów z pozycją na mecie.
Istotnie, najlepsi na mecie mają najmniejszą różnicę pomiędzy oficjalnym startem a przebiegnięciem przez bramkę startową. Jestem “outlierem”, dobiegnięcie do bramki zajęło mi ponad 4 min., pomimo dobrego miejsca na mecie! Musi być jakaś korelacja pomiędzy tym czasem, a nadrobionym dystansem. Chętnie dowiem się, co Wy o tym sądzicie. Możecie podzielić się swoja opinią w komentarzu.
Bohaterem w tej kategorii jest 20-letnia Eunice z Etiopii, której Chip Time wystartował 4,5 min. po wystrzale z pistoletu, więc musiała się przedzierać przez tłumy z końca peletonu a zajęła 15 miejsce!!!!
Ostatnią rzeczą, którą przejrzałem jest analiza tempa na poszczególnych odcinkach. Zerknijmy najpierw na przeciętne prędkości zawodników.
Mężczyźni biegają szybciej od kobiet (mediana 10,31 vs 9,22). Prędkości średnie zawodników w czołówce są dla mnie kosmiczne. Przebiegłem maraton ze średnim tempem 4:44 min/km, była to moja granica możliwości na obecny stan wytrenowania. Nie jestem w stanie biec sprintu w tempie zwycięzcy (3:07 min/km), on przebiegł tak 42 km, kosmos…
Ciekawe są różnice w prędkościach na poszczególnych odcinkach, w danych miałem informacje o czasie z chipa po każdych 5 km oraz na mecie. Wygląda to następująco
Zgodnie z moimi odczuciami pogorszenie kondycji nastąpiło po 30 km. Dane wskazują, że na odcinku pomiędzy 35 a 40 km wiele osób bardzo zwalniało, żeby ostatecznie jednak przyspieszyć na ostatnich 2 km przed metą. Niestety dla niektórych skończyło się to źle, prędkość < 2 km/h, prawdopodobnie skurcz mięśni (widziałem kilka osób idących wolno).
I jeszcze jedna niespodzianka w danych. Jeden z zawodników wystartował z niesamowitą prędkością, zrobił pierwsze 5 km w tempie 2:31, okazuje się, że to nasza Eunice z Etiopii!!!
Dane do analizy przygotowałem w Alteryx, wcześniej kopiując pdf do tekstu. Zajęło mi to ok. 1 h, główne wyzwanie, to zabawa z wyrażeniami regularnymi do wygrzebywania tekstu z poszczególnych pól. Najbardziej skomplikowane było poskładanie różnic w prędkościach biegaczy na poszczególnych odcinkach , co wymagało delikatnej dekompozycji danych. Poniżej screen procesu. Jeśli ktoś byłby zainteresowany samym procesem w Alteryx (albo danymi do analizy), chętnie się podzielę.
Pełną analizę wyników 41-szego Maratonu Warszawskiego wykonaną w Tableau znajdziecie na naszym profilu na Tableau Public.
A to ja na mecie wraz z moim trofeum…
paź 29, 2024
Wersje Power BI Pro i Power BI Premium różnią się funkcjami, zasobami i modelem licencjonowania, co ma kluczowe znaczenie przy...
paź 23, 2024
Power BI to nowoczesne narzędzie do analizy i wizualizacji danych, które zyskuje coraz większą popularność w firmach na całym świecie....
paź 16, 2024
Analiza predykcyjna to zaawansowana technika analizy danych, która pozwala przewidywać przyszłe zdarzenia na podstawie historycznych danych i zaawansowanych algorytmów. Wykorzystując...