Rosnące wolumeny danych gromadzonych przez organizację, a także chęć ich niemalże natychmiastowego „tłumaczenia” na rekomendacje biznesowe, zmusza wiodących dostawców narzędzi ETL do nieustannego doskonalenia swoich produktów i uzupełniania ich o kolejne funkcjonalności. Wśród narzędzi, które w najróżniejszych rankingach i zestawieniach cieszą się wysokimi oceanami i pozytywnymi opiniami użytkowników wymienia się m. in. Alteryx, Pentaho Data Integration oraz Informatica – Power Center. Co przesądza o ich wysokiej pozycji w niezależnych zestawieniach?
Alteryx
Zgodnie z cyklicznie przygotowywanym raportem Gartnera „Magic Quadrant” Alteryx w swojej kategorii klasyfikowany jest od dłuższego czasu jako “Challenger”, co tylko potwierdza jego silną pozycję rynkową i ogromne aspiracje twórców narzędzia. Alteryx pozwala na automatyzację wielu czasochłonnych procesów związanych z danymi niezwykle efektywnie i bez konieczności znajomości języków programowania. Przejrzysty interfejs opiera się na technologii drag & drop, dzięki czemu zaprojektowanie dowolnego procesu ETL nie jest czynnością zarezerwowaną wyłącznie dla analityków znających SQL-a czy Pythona. Z zadaniem tym doskonale poradzi sobie każdy przedstawiciel biznesu, a dzięki możliwości pominięcia pośrednika w osobie analityka, czas niezbędny na wyciągnięcie wniosków z analizowanych danych skraca się do niezbędnego minimum. Prostota i intuicyjna obsługa to jednak nie jedyne zalety narzędzia. Wspomnieć warto m. in. o ogromnej wydajności, możliwości łączenia się z wieloma źródłami danych jednocześnie, rozlicznymi konektorami umożliwiającymi szybkie łączenie się z arkuszami kalkulacyjnymi, hurtowniami danych czy aplikacjami chmurowymi. Co więcej, Alteryx posiada szereg wbudowanych narzędzi do tworzenia analiz predykcyjnych, statystycznych i przestrzennych, a ponadto doskonale współpracuje z narzędziami BI takimi jak chociażby Tableau. Więcej o możliwościach narzędzia oraz stawianiu w nim pierwszych kroków przeczytasz w jednym z naszych wcześniejszych artykułów (link).
Pentaho Data Integration
Pentaho Data Integration to kolejne warte uwagi narzędzie ETL, które podobnie jak Alteryx ma wiele do zaoferowania. Cel przyświecający twórcom narzędzia był dokładnie taki sam – stworzyć proste w obsłudze narzędzie, umożliwiające pracę na danych pochodzących z najróżniejszych źródeł, bez konieczności posiadania kompetencji technicznych w zakresie programowania. Efekt ten udało się osiągnąć dzięki wykorzystaniu graficznej metody projektowania procesu oraz technologii drag & drop. Pracę ułatwiają ponadto: bogata biblioteka gotowych komponentów, które doskonale łączą się różnymi źródłami danych, przejrzyste widoki służące do modelowania i wizualizowania danych w trakcie procesu przygotowywania danych oraz wbudowany debugger, wspierający testowanie i dostrajanie poszczególnych kroków tworzonego procesu. Zdaniem twórców intuicyjny zestaw narzędzi Pentaho przyspiesza projektowanie i wdrażanie analityki dużych zbiorów danych nawet piętnastokrotnie w porównaniu z technikami ręcznego kodowania.
Informatica – Power Center
Ostatnim wśród rekomendowanych, aczkolwiek nieustępującym konkurentom pod względem możliwości i efektywności, narzędziem ETL, o którym warto wspomnieć jest Informatica – Power Center. O jego popularności i funkcjonalności świadczyć może chociażby fakt, iż wykorzystywane jest przez wiele wiodących organizacji reprezentujących najróżniejsze branże. Podobnie jak konkurenci Informatica – Power Center zapewnia jasny i przejrzysty interfejs oraz intuicyjną obsługę, umożliwiającą tworzenie procesów ETL bez znajomości języków programowania. Graficzne, pozbawione kodów narzędzie oferuje ponadto całą paletę wbudowanych rozwiązań, dzięki którym możliwe jest szybkie prototypowanie, profilowanie czy sprawdzanie poprawności danych, a ponadto skuteczniejsza kontrola i zarządzanie zmianami. Pisząc o atutach narzędzia wspomnieć należy również o wysokiej wydajności, łączności z aplikacjami w chmurze oraz doskonałej współpracy z danymi nierelacyjnymi. Naturalnie przedstawione powyżej narzędzia stanowią niewielki wycinek oferty rynkowej.
Dostawców profesjonalnych rozwiązań w obszarze ETL jest znacznie więcej, dlatego też wybór optymalnego rozwiązania mocno utrudniony. Porównując dostępne możliwości warto wziąć pod uwagę także takie narzędzia jak: IBM – Infosphere Information Server, Oracle – Data Integrator, Microsoft – SQL Server Integrated Services, SAS – Data Integration Studio, SAP – BusinessObjects Data Integrator czy chociażby Talend – Talend Open Studio for Data Integration. Nie zawsze rynkowi liderzy oferują pożądaną jakość w cenie, którą organizacja jest gotowa zaakceptować, stąd też warto zainteresować się również nieco bardziej niszowymi podmiotami i dostępnymi w ich ofertach produktami.