Alteryx – na polu walki z danymi [artykuł]

Piotr Reszka

lip 3, 2017

Data Science

Alteryx

Większość przypadków tworzenia rozwiązań raportujących, z którymi się spotkałem, zaczynała się od przygody z danymi. Sytuacja, kiedy dane są poukładane w pięknym widoku z tabel SQL jest rzadkością. Nawet w najlepiej przygotowanych danych zawsze znajdzie się coś, co nie pasuje, co trzeba dopasować, używając kolejnych zewnętrznych danych. Raportowanie biznesowe charakteryzuje się szczególną zmiennością i różnorodnością danych, procesów, modeli. Klasyczne podejście do tego problemu, mówi: znajdź/zbuduj jedno źródło “prawdy”. Oznacza to zwykle centralną “hurtownię danych”, termin, który kojarzy się z czymś dużym, skomplikowanym, kosztującym masę $ i trwającym  wiele miesięcy. Biorąc pod uwagę zmienność sytuacji, często te parę miesięcy przekształca się w proces ciągły, który angażuje spore siły IT. W efekcie proces raportowania i przygotowania danych zamyka się w  “fabryce raportów”, do której ustawia się długa kolejka potrzebujących. Długi czas oczekiwania, produkt, który nie do końca jest zgodny z wymaganiami i wymaga poprawek, sprawiają, że biznes często odpowiada na pytania nie na podstawie danych (raportu brak, nie działa) ale… intuicji.

Narzędzia do zwinnej pracy z danymi takie jak Alteryx pozwalają uniknąć takiej sytuacji. Kilka lat temu nie bardzo wierzyłem, że da się uniknąć pisania SQLi. Ba, nawet napisawszy skomplikowaną kwerednę, po 8 godzinach z ulgą, że działa udawałem się do domu. Paradoksalnie nie miało to nic wspólnego z raportowaniem i odkrywaniem odpowiedzi w danych. Przygotowanie danych to dopiero początek. Alteryx pozwolił mi skupić się na warstwie biznesowej, a stworzone modele były łatwe w zmianie, zarządzaniu, oraz rozbudowie. Nagle połączenie kilku Exceli, z MS SQL, dołączenie danych z http i parametrów wpisywanych z formularza stało się bardzo proste, mogłem skupić się na tym co ważne. Z perspektywy czasu spędzonego z narzędziem Alteryx, mogę odpowiedzieć na kilka pytań, które pomogą Ci w starcie.

Czy potrzebuje Alteryx? Mam przecież Tableau (mam Qlik, mam PowerBI, …)

Tableau podobnie jak pozostałe narzędzia do budowy front endu wymieniane przez Gartnera, posiadają bardzo proste interfejsy do łączenia danych. Tworzenie źródła do raportowania polega na jednoetapowym (join, union) połączeniu obiektów z jednej lub kilku baz danych z wykorzystaniem filtrowania. W części przypadków to wystarcza. Nie pozwala jednak na budowę bardziej zaawansowanych modeli, wymagających procesu wieloetapowego na danych. Jeśli modele analizy przychodów, kosztów, zachowań klientów, działań marketingowych, analizy magazynowe, będą wymagały procesowego łączenia danych, łatwiej je zrobimy w Alteryx. Gotowy model można wyeksportować do formatu Tableau czy Qlikview.

Jaka jest przewaga Alteryx nad innymi narzędziami ETL?

Alteryx daje możliwość stworzenia procesu na danych w prosty sposób, nie wymagający wiedzy IT. Wykorzystując gotowe narzędzia i przeciągając je “drag & drop” do procesu uzyskujemy gotowe rozwiązanie w kilka chwil. Narzędzie przetwarza dane w pamięci “in-memory”, przez co praca z danymi jest szybka i komfortowa. Jeśli mamy źródła danych Big Data takie jak np. Hadoop, Amazon Redshift, Alteryx może przetwarzać dane używając tych silników i opcji “in-database”.

Narzędzie jest dostosowane do standardów korporacyjnych, posiada część serwerową, która dba bezpieczeństwo, wykonywanie przygotowanych procesów, pozwala je dokumentować i wersjonować.

Alteryx do nie tylko ETL, to narzędzie advanced analytics

Dzięki kilkudziesięciu gotowym modelom predykcyjnym możemy szybko przygotować model regresji logistycznej, drzew decyzyjnych czy sieci neuronowych na naszych danych. Wszystkie modele zbudowane są w oparciu o wbudowany kompilator R, można je dowolnie modyfikować. Alteryx ma również możliwość wzbogacania naszych modeli o dane zewnętrzne takie jak informacje gospodarcze z Dun&Bradstreed czy informacje geograficzne TomTom, które przychodzą z narzędziem. Dzięki temu będziesz mógł szybko zrobić scoring nowego klienta, czy obliczyć średni czas dostawy towarów w oparciu o historyczny ruch.

Jak zacząć korzystać z Alteryx?

Najbardziej przekonujący jest test na własnych danych. Wystarczy ściągnąć trial (link poniżej)i zbudować pierwszy proces. Można też skorzystać z wielu przykładów, webinarów, szkoleń, które są dostępne publicznie w sieci.

Link do Alteryx: http://tableau.astrafox.pl/Alteryx_download