W tym artykule przedstawiam korzyści płynące z połączenia możliwości Tableau i R, przedstawiam listę wymagań aby zrealizować to połączenie. Opisuję jak ta współpraca jest realizowana ze strony Tableau. Do tego zamieszczam kilka wskazówek jak zoptymalizować współdziałanie i zaprezentuje przykład użycia R w analizie Tableau.
Wdrożenie Tableau w organizacji otwiera zupełnie nowe możliwości raportowe, nie tylko ze względu na demokratyzację danych, szybkie uzyskiwanie odpowiedzi na złożone pytania i wyciąganie wniosków biznesowych, czy też łączenie wielu różnych źródeł informacji, ale również ze względu na możliwość wykorzystania w analizach zaawansowanych możliwości języka programowania R.
R to interpretowany język programowania oraz środowisko do obliczeń statystycznych i wizualizacji wyników. Projekt ten został stworzony na uniwersytecie Auckland przez Roberta Gentelmana i Rossa Ihakę jako implementacja języka S stworzonego wcześniej w Bell Laboratories. W obecnej chwili R jest jednym z dwóch najpopularniejszych języków programowania wśród społeczności data science i jest cały czas rozwijany przez „The R Foundation” oraz licznych programistów którzy udostępniają wyniki swojej pracy.
I tu właśnie leży siła R – niesłychanie aktywna społeczność użytkowników często akademickich i biznesowych, tworzy i udostępnia nowe rozwiązania w postaci pakietów funkcji z różnych dziedzin Data Science takich jak machine learning, analiza szeregów czasowych czy analiza predykcyjna. Jakość tych pakietów jest na bieżąco sprawdzana w aktualnych scenariuszach naukowych czy biznesowych przez licznych użytkowników i ekspertów z danej dziedziny i jeżeli wytrzyma próbę czasu staje się fundamentem nowych rozwiązań.
Twórcy Tableau dostrzegli potencjał płynący ze współpracy R i Tableau i już od wersji Tableau 8.1 wbudowali w silnik Tableau wsparcie dla R. Ta integracja miała trzy główne cele :
Po pierwsze było wzbogacenie możliwości analitycznych Tableau poprzez udostępnienie użytkownikom pomostu prowadzącego do bogatej (i ciągle wzbogacanej) bazy metod statystycznych i wielu innych obszarów Data Science (warto tu wspomnieć choćby o bardzo popularnym serwisie Stackoverflow)
Po drugie wykorzystanie zaawansowanych modeli R i możliwości pracy z nimi korzystając z interaktywnych wizualizacji Tableau bez konieczności znajomości języka R.
Po trzecie umożliwienie użytkownikom R korzystania z płynnej, przejrzystej eksploracji danych i łatwego dostępu do wielu typów baz danych, a także szybkiego udostępniania wyników w organizacji (włączając w mobilny dostęp do dashboardów) z wykorzystaniem np.: Tablau Server.
Co jest wiec potrzebne do rozpoczęcia pracy z Tableau i R?
Ze strony R do wygodnej pracy potrzebujemy trzy rzeczy
– Program R,
– wygodny edytor np.: RStudio
– niezbędne biblioteki dodatkowe;
Jeśli chodzi o R to obecnie najbardziej aktualną wersją jest 3.4.1. „Single Candle” którą można pobrać ze strony projektu R: https://www.r-project.org lub ze strony https://cran.r-project.org/. Dostępne są wersje dla różnych systemów operacyjnych –Windows, OSX i różnych dystrybucji Linuxa. Instalacja jest bezproblemowa i najczęściej sprowadza się do klikania next, next next . Program R jest udostępniany na licencji GNU GPL. To oznacza że jest całkowicie bezpłatny do wszystkich zastosowań edukacyjnych, przemysłowych, biznesowych, komercyjnych i innych.
RStudio to nie tylko prosty edytor ale raczej zintegrowane środowisko programistyczne (IDE), które umożliwia edytowanie, tworzenie pakietów, aplikacji, raportów. Zawiera również managera wersji i narzędzia wspierające debuggowanie kodu. RStudio Desktop można pobrać ze strony https://www.rstudio.com .
Dzieki skorzystania z RStudio mamy tuż pod ręką dostęp do:
– konsoli w której natychmiast możemy wykonywać polecenia R,
– edytora w którym możemy pisać bardziej złożone skrypty R,
– okien z pomocą , eksploratorem plików, wykresami, pomocą
– okien z historią wykonywanych poleceń i środowiskiem programistycznym wraz z używanymi aktualnie zmiennymi