Data Science – zawód przyszłości w przyszłości [artykuł]

sie 23, 2017

Analiza Danych

Data Science

Wizualizacja Danych

Big Data

banery data science

Data science to dziedzina nauki, która od kilku lat jest na językach wszystkich. Przedstawicieli biznesu, zaczynających dostrzegać potencjał Big Data, rekruterów, zmagających się z coraz większymi problemami z pozyskaniem odpowiednio wykwalifikowanych kandydatów, a także analityków danych, którzy chcieliby w niedługiej perspektywie czasu zostać badaczem danych. Jakie role oferuje dziś rynek dla ekspertów w dziedzinie danych? W jakim kierunku zmierza branża data science?

Rola data scientist w Polsce i na świecie

Dane stanowią dziś aktywa o ogromnej wartości biznesowej. Ich potencjał, a także znaczenie dla biznesu ekspertów potrafiących skutecznie je analizować, dostrzega coraz więcej organizacji. Mowa nie tylko o przedstawicielach branży finansowej, ubezpieczeniowej czy telekomunikacyjnej, ale również handlowej, medycznej czy chociażby prężnie rozwijającego się sektora e-commerce. Zmieniające się realia i otoczenie rynkowe oraz rozrastające się w zaskakującym tempie bazy danych zrodziły potrzebę pojawienia się zupełnie nowej dyscypliny naukowej – data science, zwanej równie często data-driven science.

Początkowo zapotrzebowanie na badaczy i wykwalifikowanych analityków zgłaszały przede wszystkim amerykańskie korporacje, które jako pierwsze dostrzegły wartość drzemiącą w data science i napotykały niemałe problemy z przetwarzania ogromnych i nieustannie narastających ilości danych (Big Data). Organizacje działające w innych krajach potencjał ten na tak dużą skalę dostrzegły nieco później i nieco później zdecydowały się na uzupełnienie swojej architektury stanowisk o wyspecjalizowane role analityczne. Między innymi z tego względu rynek szeroko rozumianej analizy danych w USA jest najbardziej rozwinięty i tym samym istotnie różni się od rynku polskiego.

Zdaniem ekspertów na nadrobienie tych zaległości polski rynek potrzebuje przynajmniej 3-4 lat. Czy rzeczywiście w takiej perspektywie czasu polski rynek stanie się dojrzały? Nie jest to tak oczywiste, jak mogłoby się wydawać. Problemem jest fakt, iż polski biznes nie rozumie data science i nie dostrzega jeszcze w danych tak dużej wartości jak korporacje z Ameryki czy Europy Zachodniej. Taki stan rzeczy potwierdza analiza dostępnych w Polsce ofert pracy w obszarze data science. Ekspertów od analizy danych poszukują dziś w głównej mierze banki, firmy telekomunikacyjne oraz liderzy rynku e-commerce. Katalizatorem rozwoju rynku są ponadto duże międzynarodowe korporacje, które nad Wisłą zdecydowały się ulokować swoje centra usług wspólnych. Dzięki ogromnej renomie, jaką na świecie cieszą się polscy informatycy, o przenoszeniu do Polski zaawansowanych procesów analitycznych decyduje coraz więcej międzynarodowych korporacji. Pozostaje tylko wierzyć, że w ślad za nimi pójdą wkrótce polskie firmy i przekują tym samym gromadzone dane na wymierne korzyści biznesowe.

 

Rodzaje stanowisk dostępnych dla badaczy danych

Rosnące wymagania rynku, odmienne wymagania zgłaszane przez poszczególne organizacje, a także postępująca specjalizacja sprawiają, że w obszarze analizy danych nieustannie powstają nowe role. Role wymagając nieco innych kompetencji i predyspozycji, a także znajomości odmiennych narzędzi i frameworków. Zjawisko to po części jest również pochodną ogromnego deficytu specjalistów skupiających w jednej osobie wiedzę i doświadczenie statystyka, informatyka, programisty i analityka biznesowego. W jakich rolach wybierać mogą analitycy danych? Jakie kompetencje są niezbędne do objęcia poszczególnych pozycji i z jakim wynagrodzeniem się wiążą?

 

Data Architect (Architekt Danych)
Przeciętne wynagrodzenie w USA: 113 tys. dolarów.
http://www.payscale.com/research/US/Job=Data_Architect/Salary

Zdecydowanie najwyżej w hierarchii, bazując na przeciętnym wynagrodzeniu, znajduje się architekt danych, którego rola niezwykle szybko zyskuje na znaczeniu. Przekłada się to na rosnącą liczbę ofert pracy, a także coraz bardziej konkurencyjne wynagrodzenia, będące efektem zaciekłej walki organizacji o pozyskanie najlepszych specjalistów na rynku. Od architekta danych wymaga się przede wszystkim doświadczenia w zakresie budowania architektury rozwiązań oraz wdrażania narzędzi w obszarze big data i hurtowni danych. W zarządzaniu architekturą, strategią i jakością zbieranych danych architektowi danych pomaga m. in. znajomość takich narzędzi i technologii jak: XML, SQL, Spark, Pig, Hive, ETL (ang. Extract, Transform and Load) oraz Business Intelligence.

 

Data and Analytics Manager (Manager Zespołu Analityków)
Przeciętne wynagrodzenie w USA: 93 tys. dolarów.
http://www.payscale.com/research/US/Job=Analytics_Manager/Salary

Coraz liczniejsze zespoły analityków, a także duża liczba realizowanych projektów sprawiają, że coraz częściej konieczne staje się zatrudnienie managera zespołu. Jego rolą jest nie tylko wskazywanie właściwego kierunku działania zespołowi, delegowanie zadań i nadawanie im priorytetów, ale też motywowanie i rozwijanie potencjału podwładnych, koordynowanie ich pracy oraz raportowanie wyników. Prócz kwalifikacji typowych dla managera, konieczne jest również posiadanie szeroko rozwiniętych zdolności analitycznych oraz technicznych. Wśród najczęstszych wymagań znajduje się m. in. znajomość takich technologii jak: SQL, ETL, SAS, R, Python, Java oraz Matlab.

 

Data Scientist (Badacz Danych)
Przeciętne wynagrodzenie w USA: 90 tys. dolarów. http://www.payscale.com/research/US/Job=Data_Scientist%2C_IT/Salary

Badacz danych to istny człowiek renesansu. Jego rolą jest bowiem skuteczne zidentyfikowanie problemu biznesowego, dobranie odpowiednich metod badawczych, przygotowanie surowych danych do analizy, analiza danych, a następnie atrakcyjne wizualizowanie efektów swojej pracy – wniosków i zaleceń. Biorąc pod uwagę powyższe, data scientist musi posiadać nie tylko szeroką wiedzę biznesową i wysoko rozwinięte zdolności komunikacyjne, ale też doskonale odnajdywać się w tematach związanych z modelowaniem, algorytmami, statystyką i Machine Learning. Konieczne są ponadto znajomość języków programowania, zwykle R lub Python, znajomość narzędzi BI do wizualizacji danych, do tego najczęściej SAS, Matlab, SQL, Pig, Hive, Spark czy Hadoop.

 

Data Engineer (Inżynier Danych)
Przeciętne wynagrodzenie w USA: 90 tys. dolarów.
http://www.payscale.com/research/US/Job=Data_Engineer/Salary

Zadaniem inżyniera danych jest tworzenie, rozwijanie, testowane oraz utrzymywanie architektury danych w organizacji. Sprawne poruszanie się po firmowym ekosystemie danych wymaga jednak dużego doświadczenia i znajomości wielu technologii. Między innymi z tego względu niezwykle cenieni przez potencjalnych pracodawców są eksperci posiadający wcześniejsze doświadczenie na stanowisku software engineer. Wśród wymagań stawianych inżynierom danych znajdują się m. in.: doświadczenie w pracy z dużymi bazami danych, modelowaniu danych, obsłudze narzędzi typu ETL, a także umiejętności programowania. Ubiegając się o pracę w charakterze Data Engineer’a konieczna jest najczęściej dobra znajomość takich technologii i języków jak: SAS, SQL, R, Python, Java, C++, Perl, Ruby, Matlab, Hive oraz Pig.

 

Database Administator (Administrator Baz Danych)
Przeciętne wynagrodzenie w USA: 72 tys. dolarów.
http://www.payscale.com/research/US/Job=Database_Administrator_(DBA)/Salary

Wyzwaniem stojącym przed administratorem baz danych jest zagwarantowanie prawidłowego działania firmowych baz danych, właściwego ich zabezpieczeni, a ponadto uczynienie ich dostępnymi dla każdego członka zespołu, uprawnionego do posiadania dostępu do danych. W realizowaniu swojego zadania administratorowi baz danych pomagają przede wszystkim: szeroka wiedza biznesowa, znajomość systemów ERP, systemów bazodanowych oraz tematów związanych z utrzymaniem bezpieczeństwa danych oraz ich odzyskiwaniem. Z tego względu potencjalnie pracodawcy wymagają od administratorów nie tylko znajomości SQL czy XLS, ale również takich języków programowania jak Python, C#, Java czy Ruby on Rails.

 

Statistician (Statystyk)
Przeciętne wynagrodzenie w USA: 71 tys. dolarów.
http://www.payscale.com/research/US/Job=Statistician/Salary

Posiadanie w zespole analitycznym statystyka to szereg korzyści dla organizacji. Dzięki swojej znajomości teorii i metod statystycznych, a także wysoko rozwiniętym umiejętnością logicznego myślenia, doskonale radzi on sobie z gromadzeniem, analizowaniem i interpretowaniem danych zarówno jakościowych jak i ilościowych. W realizowaniu owego zadania potrzebne są mu również doskonale rozwinięte umiejętności w zakresie pozyskiwania danych i ich przetwarzania, a nierzadko również znajomość zagadnień uczenia maszynowego. Ze względu na pracę na bazach danych od statystyków wymaga się znajomości takich języków i technologii jak: SQL, SAS, VBA, R, Python, Matlab, Perl, Pig, Spark czy Hive.

 

Business Analyst (Analityk Biznesowy)
Przeciętne wynagrodzenie w USA: 67 tys. dolarów.
http://www.payscale.com/research/US/Job=Business_Analyst%2C_IT/Salary

Rola analityka biznesowego w obszarze analizy danych odróżnia się nieco od ról pozostałych członków zespołu, gdyż umiejscowiona jest ona na pograniczu świata IT i świata biznesu. Pełni on tym samym rolę pośrednika, który zbiera wymagania i analizuje procesy biznesowe, a następnie wprowadza je w życie dzięki ścisłej współpracy z obszarami merytorycznymi. Z uwagi na fakt, iż analityk biznesowych nie stanowi roli typowo technicznej, wymaga się od niego przede wszystkim wiedzy na temat modelowania procesów biznesowych i analizy danych, doświadczenia w gromadzeniu wymagań, a także ponadprzeciętnych zdolności komunikacyjnych. Przydatne są ponadto znajomość SQL oraz narzędzi BI, w tym chociażby Tableau.

 

Data Analyst (Analityk Danych)
Przeciętne wynagrodzenie w USA: 58 tys. dolarów.
http://www.payscale.com/research/US/Job=Data_Analyst/Salary

Analityk danych to ostatnia z wiodących ról pojawiających się w obszarze data science. Wymagania staniane analitykom danych nie są zbyt wysokie, w porównaniu z pozostałymi specjalistami, stąd też proponowane na tym stanowisku wynagrodzenie jest najniższe – niemal dwukrotnie niższe aniżeli wynagrodzenie architekta danych. Wiele jednak zależy od organizacji i stosowanego w niej nazewnictwa poszczególnych stanowisk. Z reguły pośród kluczowych wymagań znajdują się: doskonała znajomość arkuszy kalkulacyjnych (Excel), baz danych (SQL) oraz narzędzi do komunikacji i wizualizacji danych (np. Tableau). Przydatne są ponadto: znajomość statystyki, uczenia maszynowego, a także języków programowania: Python, R, HTML, Javascript czy C/C++.

W jakim kierunku zmierza Data Science?

Pomimo faktu, iż data science jest stosunkowo nową dyscypliną naukową, zachodzące w jej obszarze zmiany są niezwykle dynamiczne. Prym naturalnie pod tym względem wiodą Stany Zjednoczone, które stanowią największy i najbardziej rozwinięty rynek analizy danych na świecie. Zachodzące na tamtejszym rynku zmiany oraz pojawiające się trendy szybko rozprzestrzeniają się po świecie i wyznaczają nowe kierunki zarówno dla firm wykorzystujących Big Data jak i specjalistów zainteresowanych rozwojem w tym obszarze.

Eksperci, a także specjaliści z obszaru human resources, którzy na co dzień rekrutują analityków i badaczy danych, co jakiś czas wskazują na coraz to nowe kierunki rozwoju i trendy w obszarze data science. Do najważniejszych z nich zaliczają się:

#1 Rosnące zapotrzebowanie na specjalistów

Eksperci nie mają wątpliwości co do tego, iż wolumeny danych nadal będą nieustannie rosły, co stanowi pochodną niezwykle szybko przyrastającej liczby urządzeń posiadających dostęp do Internetu. Ogromny przyrost cennych z biznesowego punktu widzenia danych, pociągnie za sobą jeszcze większe niż obecnie zapotrzebowanie na ekspertów zajmujących się ich szeroko rozumianą analizą. Według szacunków PwC w 2020 roku otwartych będzie aż 2,7 mln pozycji dla badaczy danych i analityków. Z kolei zdaniem International Data Corporation (IDC) niedobór wykwalifikowanych specjalistów w tym obszarze sięgnie do 2020 roku poziomu 23%.

#2 Postępująca specjalizacja

Kolejny zauważalny trend to postępująca specjalizacja. O ile firmy, które dopiero tworzą dział data science, zainteresowane są zwykle zatrudnieniem eksperta, który łączy w jednej osobie szereg interdyscyplinarnych kompetencji, o tyle firmy posiadające liczny zespół analityczny stawiają już pierwsze kroki prowadzące do specjalizacji. Poszukują ekspertów o nieco węższych kompetencjach, które będą odpowiadały bieżącemu zapotrzebowaniu zespołu i zapewniały tym samym bezproblemowe realizowanie rozpoczętych i planowanych projektów badawczych.

#3 Powstawanie zupełnie nowych ról

Rozrastanie się zespołów z jednej strony prowadzi do coraz większej specjalizacji ich członków, zaś z drugiej do pojawiania się zupełnie nowych ról, które niekoniecznie są rolami ściśle technicznymi. Doskonały przykład stanowić może chociażby Data Science Coordinator, którego zadaniem jest czuwanie nad prawidłowym i terminowym przebiegiem prac w ramach poszczególnych projektów analitycznych.

#4 Liberalizacja wymagań stawianych kandydatom

Ogromny i stale rosnący niedobór kandydatów już dziś przekłada się na obniżanie wymagań stawianych kandydatom. Po części jest to również efekt dojrzewania rynku, pojawiania się coraz większej liczby pozycji juniorskich, a także wspomnianej już specjalizacji. Co więcej, potencjalni pracodawcy coraz rzadziej wymagają od kandydatów posiadania tytułu doktora i jednocześnie coraz bardziej otwierają się na specjalistów posiadających szeroką wiedzę biznesową, doskonale rozwinięte umiejętności komunikacyjne oraz różnorodne wykształcenie – niekoniecznie w dziedzinie informatyki, matematyki czy statystyki.

#5 Rosnąca rola kompetencji miękkich

Bez posiadania odpowiedniego zaplecza technicznego rozwój w branży data science nie jest możliwy, aczkolwiek dostrzec można coraz większe znaczenie kompetencji miękkich. Wiele organizacji miało już okazję przekonać się, że pracy zespołowej, kreatywnego myślenia czy skutecznego rozwiązywania problemów znacznie trudniej nauczyć aniżeli kolejnego języka programowania czy obsługi nowego narzędzia. Łącząc  kompetencje miękkie z odpowiednim przygotowaniem technicznym można stosunkowo szybko w branży data science znaleźć się na szczycie.

#6 Rozwój metod i narzędzi do analizy danych

Dramatycznie przyrastająca liczba danych, skutkuje ciągłym rozwojem nowych narzędzi, frameworków i technologii. Ich wykorzystywanie pozwala skutecznie budować przewagę konkurencyjną, redukować koszty i czas niezbędny na rozwiązanie konkretnego problemu biznesowego. Wraz z dojrzewaniem rynku rola nowych kompetencji będzie tylko zyskiwać na znaczeniu, dlatego też od specjalistów w zakresie analizy danych wymagane będzie nieustanne samodoskonalenie i bieżące monitorowania branżowych nowości czy pojawiających się trendów.